GPT-5.5 vs GPT-5.4: брендовые цитирования упали на 10 п.п.

Что произошло

28 апреля Самани́у Гарг, основатель Writesonic, опубликовал сравнение поведения GPT-5.5, GPT-5.4 и GPT-5.3 Instant на 50 одинаковых промптах. В сумме — 150 диалогов, 1 821 fan-out запрос, 11 469 страниц веб-поиска и 1 257 цитирований. Тест проводился с одного американского аккаунта ChatGPT Plus, для контроля 30 промптов параллельно прогнали через Google и Bing.

Главное число: доля цитирований сайтов самих брендов упала с 56,8% (GPT-5.4) до 47,2% (GPT-5.5) — минус 10 процентных пунктов. Для контекста: GPT-5.3 Instant даёт всего 13,4%, то есть рассуждающие версии 5.4 и 5.5 по-прежнему сильно благосклонны к брендам, но новая модель явно сдвигается в сторону третьесторонних источников.

Под капотом — поведенческое изменение. GPT-5.4 в 40,5% случаев использовал оператор site:, заставляющий искать внутри домена бренда. GPT-5.5 делает это только в 12,6% случаев — в 3,2 раза реже. Дальше всё сходится: в среднем 7,3 fan-out запроса на промпт против 10,5 (минус 30%), 7,2 цитирования в финальном ответе против 9,4 (минус 23%), 102,7 прочитанных страницы против 114,6 (минус 10%). Контент стал свежее: медианный возраст цитируемой страницы — 88 дней против 108, доля материалов старше года — 16,8% против 34,2%. Совпадение цитирований с топ-10 Google выросло с 13% до 16%.

Самые громкие категорийные сдвиги: услуги минус 65 п.п. (с 83% до 19% брендовых цитирований), юриспруденция минус 56 п.п., образование минус 41 п.п., маркетинг минус 31 п.п. В обратную сторону: фитнес плюс 55 п.п., тревел плюс 26 п.п., e-commerce плюс 16 п.п. Топ-домены на GPT-5.5 — manduka.com, techradar.com, reuters.com, g2.com, flexispot.com — сочетание review-агрегаторов и нишевых вендоров.

Почему это важно для российского рынка

Прямого аналога этого исследования по Алисе и YandexGPT пока никто не публиковал, но вектор сдвига универсален и важен по трём причинам.

Во-первых, апдейт версии модели меняет ландшафт за один день. Команды, которые в 2025 году выстроили GEO-стратегию под поведение GPT-4o или GPT-5.0, после апдейта обнаружили, что промпты, по которым они были в выдаче, теперь возвращают совсем другой набор источников. То же будет происходить с Алисой и YandexGPT — Яндекс уже несколько раз за год обновлял свой генеративный стек, и каждый апдейт смещает цитирования. Любая стратегия, оптимизированная только под текущее поведение одной версии, имеет короткий срок годности.

Во-вторых, роль review-агрегаторов растёт ровно там, где её и ждёшь. Manduka, TechRadar, G2, Reuters, FlexiSpot — это классические аналоги «куда западный покупатель идёт за обзором». В RU-стеке это переводится так: B2B SaaS — vc.ru, Habr, Startpack; финтех — Banki.ru, Сравни.ру; CPG и образование — Дзен и нишевые обзорники. Бренды, которые игнорируют этот слой, в апдейтах теряют цитирования первыми, потому что модель раньше «дотягивалась» до них через site: к собственному домену, а теперь идёт сразу в сторонний обзор.

В-третьих, категорийные свинги показывают, что брендовая стратегия должна быть вертикальной, а не общей. Образование минус 41 п.п. в США означает, что цитировать сайты вузов и онлайн-школ модель стала на 41 пункт реже. Это прямой сигнал РФ-онлайн-образованию: проверьте, что про вас пишут на vc.ru и Хабре, а не только в собственном блоге. Услуги минус 65 п.п. — это про юристов, консалтинг и агентства: для них присутствие в категорийных обзорах перестаёт быть приятным дополнением и становится обязательным.

Экспертный комментарий

На мой взгляд, ключевая часть этого отчёта — не цифра минус 10 п.п., а механика, которая её объясняет. Падение использования оператора site: в три раза — это не «модель стала умнее», это смена презумпции: GPT-5.4 по умолчанию верил, что у бренда на собственном сайте есть наиболее релевантный ответ; GPT-5.5 этой веры лишился.

Я считаю, что в течение 2026 года мы увидим одну-две похожие смены поведения в каждой крупной модели — и обоснованной стратегией становится не «оптимизировать под GPT-5.X», а закладывать в план проверки видимости после каждого крупного апдейта. Бренды, у которых базовая публикационная инфраструктура — собственные сайты плюс 5–7 внешних RU-площадок, перенесут эти апдейты как лёгкую турбулентность. У всех остальных каждый второй апдейт будет ощущаться как «нас выкинуло из выдачи».

Что делать на этой неделе

Один апдейт модели уронил долю брендовых цитирований на 10 процентных пунктов. Любая GEO-стратегия, выстроенная под одну версию, требует повторной проверки после каждого крупного релиза.

— GEO Scout

Прогнать 30 категорийных промптов вашей ниши через ChatGPT (включая GPT-5.5 Thinking, если доступен) и зафиксировать список цитируемых доменов как baseline до следующего апдейта.
Сделать ту же проверку для Алисы и YandexGPT отдельно — поведение русскоязычных моделей расходится с ChatGPT, и брендовые цитирования здесь часто выше, что маскирует реальную проблему на категорийных запросах.
Для каждой вертикали бренда отдельно посчитать долю brand-owned vs сторонних цитирований. Не усреднять по бренду в целом — отчёт Writesonic показывает разброс от минус 65 п.п. до плюс 55 п.п. между категориями.
Если в шорт-листе для нейросети нет vc.ru, Habr, Banki.ru, Сравни.ру или профильных Дзен-блогов под вашу нишу — поставить минимум одну публикацию в месяц на каждой площадке в ближайший квартал.
Не убирать страницы цен из стратегии: даже у GPT-5.5 они дают 8,8% всех цитирований — устойчивый паттерн через все версии модели.

Частые вопросы

Что главное в исследовании Writesonic GPT-5.5 vs GPT-5.4?

На 50 идентичных промптах GPT-5.5 цитирует сайты самих брендов в 47,2% случаев, GPT-5.4 — в 56,8%. Падение в 10 процентных пунктов произошло из-за того, что новая модель в 3,2 раза реже использует оператор site: для поиска внутри домена бренда и активнее обращается к сторонним обзорам и агрегаторам.

Какие категории пострадали сильнее всего от апдейта GPT-5.5?

Услуги — минус 65 п.п. брендовых цитирований, юриспруденция — минус 56 п.п., образование — минус 41 п.п., маркетинг — минус 31 п.п. В обратную сторону пошли фитнес (плюс 55 п.п.), тревел (плюс 26 п.п.) и e-commerce (плюс 16 п.п.). Это означает, что усреднённая оценка по бренду маскирует реальные провалы по конкретным вертикалям.

Что делать, если бренд потерял цитирования после обновления модели?

Зафиксировать новый baseline на категорийных промптах в ChatGPT, Алисе и YandexGPT по отдельности. Дальше — закрыть пробелы внешними публикациями на профильных RU-площадках (vc.ru, Habr, Banki.ru, Сравни.ру, Дзен), потому что апдейт сместил вес именно в сторону сторонних источников и review-агрегаторов.

GPT-5.5 vs GPT-5.4: брендовые цитирования упали на 10 п.п. — разбор Writesonic

Что произошло

Почему это важно для российского рынка

Экспертный комментарий

Что делать на этой неделе

Частые вопросы

Ещё новости

GEO Scout запустил MCP-интеграцию: AI-стратег в команде через Claude, ChatGPT, Cursor и Claude Code

Яндекс Q1 2026: AI-ответы Алисы в поиске собрали 48,3 млн человек в месяц, чат Алисы — 24 млн в неделю

90% AI-цитирований не ведут на ваш сайт: разбор Foundation × AirOps для российских ниш