GPT-5.5 vs GPT-5.4: брендовые цитирования упали на 10 п.п. — разбор Writesonic
Исследование Writesonic по 150 ответам ChatGPT: GPT-5.5 цитирует сайты брендов в 47,2% случаев против 56,8% у GPT-5.4. Что это значит для GEO в России.
Что произошло
28 апреля Самани́у Гарг, основатель Writesonic, опубликовал сравнение поведения GPT-5.5, GPT-5.4 и GPT-5.3 Instant на 50 одинаковых промптах. В сумме — 150 диалогов, 1 821 fan-out запрос, 11 469 страниц веб-поиска и 1 257 цитирований. Тест проводился с одного американского аккаунта ChatGPT Plus, для контроля 30 промптов параллельно прогнали через Google и Bing.
Главное число: доля цитирований сайтов самих брендов упала с 56,8% (GPT-5.4) до 47,2% (GPT-5.5) — минус 10 процентных пунктов. Для контекста: GPT-5.3 Instant даёт всего 13,4%, то есть рассуждающие версии 5.4 и 5.5 по-прежнему сильно благосклонны к брендам, но новая модель явно сдвигается в сторону третьесторонних источников.
Под капотом — поведенческое изменение. GPT-5.4 в 40,5% случаев использовал оператор site:, заставляющий искать внутри домена бренда. GPT-5.5 делает это только в 12,6% случаев — в 3,2 раза реже. Дальше всё сходится: в среднем 7,3 fan-out запроса на промпт против 10,5 (минус 30%), 7,2 цитирования в финальном ответе против 9,4 (минус 23%), 102,7 прочитанных страницы против 114,6 (минус 10%). Контент стал свежее: медианный возраст цитируемой страницы — 88 дней против 108, доля материалов старше года — 16,8% против 34,2%. Совпадение цитирований с топ-10 Google выросло с 13% до 16%.
Самые громкие категорийные сдвиги: услуги минус 65 п.п. (с 83% до 19% брендовых цитирований), юриспруденция минус 56 п.п., образование минус 41 п.п., маркетинг минус 31 п.п. В обратную сторону: фитнес плюс 55 п.п., тревел плюс 26 п.п., e-commerce плюс 16 п.п. Топ-домены на GPT-5.5 — manduka.com, techradar.com, reuters.com, g2.com, flexispot.com — сочетание review-агрегаторов и нишевых вендоров.
Почему это важно для российского рынка
Прямого аналога этого исследования по Алисе и YandexGPT пока никто не публиковал, но вектор сдвига универсален и важен по трём причинам.
Во-первых, апдейт версии модели меняет ландшафт за один день. Команды, которые в 2025 году выстроили GEO-стратегию под поведение GPT-4o или GPT-5.0, после апдейта обнаружили, что промпты, по которым они были в выдаче, теперь возвращают совсем другой набор источников. То же будет происходить с Алисой и YandexGPT — Яндекс уже несколько раз за год обновлял свой генеративный стек, и каждый апдейт смещает цитирования. Любая стратегия, оптимизированная только под текущее поведение одной версии, имеет короткий срок годности.
Во-вторых, роль review-агрегаторов растёт ровно там, где её и ждёшь. Manduka, TechRadar, G2, Reuters, FlexiSpot — это классические аналоги «куда западный покупатель идёт за обзором». В RU-стеке это переводится так: B2B SaaS — vc.ru, Habr, Startpack; финтех — Banki.ru, Сравни.ру; CPG и образование — Дзен и нишевые обзорники. Бренды, которые игнорируют этот слой, в апдейтах теряют цитирования первыми, потому что модель раньше «дотягивалась» до них через site: к собственному домену, а теперь идёт сразу в сторонний обзор.
В-третьих, категорийные свинги показывают, что брендовая стратегия должна быть вертикальной, а не общей. Образование минус 41 п.п. в США означает, что цитировать сайты вузов и онлайн-школ модель стала на 41 пункт реже. Это прямой сигнал РФ-онлайн-образованию: проверьте, что про вас пишут на vc.ru и Хабре, а не только в собственном блоге. Услуги минус 65 п.п. — это про юристов, консалтинг и агентства: для них присутствие в категорийных обзорах перестаёт быть приятным дополнением и становится обязательным.
Экспертный комментарий
На мой взгляд, ключевая часть этого отчёта — не цифра минус 10 п.п., а механика, которая её объясняет. Падение использования оператора site: в три раза — это не «модель стала умнее», это смена презумпции: GPT-5.4 по умолчанию верил, что у бренда на собственном сайте есть наиболее релевантный ответ; GPT-5.5 этой веры лишился.
Я считаю, что в течение 2026 года мы увидим одну-две похожие смены поведения в каждой крупной модели — и обоснованной стратегией становится не «оптимизировать под GPT-5.X», а закладывать в план проверки видимости после каждого крупного апдейта. Бренды, у которых базовая публикационная инфраструктура — собственные сайты плюс 5–7 внешних RU-площадок, перенесут эти апдейты как лёгкую турбулентность. У всех остальных каждый второй апдейт будет ощущаться как «нас выкинуло из выдачи».
Что делать на этой неделе
Один апдейт модели уронил долю брендовых цитирований на 10 процентных пунктов. Любая GEO-стратегия, выстроенная под одну версию, требует повторной проверки после каждого крупного релиза.
- Прогнать 30 категорийных промптов вашей ниши через ChatGPT (включая GPT-5.5 Thinking, если доступен) и зафиксировать список цитируемых доменов как baseline до следующего апдейта.
- Сделать ту же проверку для Алисы и YandexGPT отдельно — поведение русскоязычных моделей расходится с ChatGPT, и брендовые цитирования здесь часто выше, что маскирует реальную проблему на категорийных запросах.
- Для каждой вертикали бренда отдельно посчитать долю brand-owned vs сторонних цитирований. Не усреднять по бренду в целом — отчёт Writesonic показывает разброс от минус 65 п.п. до плюс 55 п.п. между категориями.
- Если в шорт-листе для нейросети нет vc.ru, Habr, Banki.ru, Сравни.ру или профильных Дзен-блогов под вашу нишу — поставить минимум одну публикацию в месяц на каждой площадке в ближайший квартал.
- Не убирать страницы цен из стратегии: даже у GPT-5.5 они дают 8,8% всех цитирований — устойчивый паттерн через все версии модели.
Частые вопросы
Что главное в исследовании Writesonic GPT-5.5 vs GPT-5.4?
Какие категории пострадали сильнее всего от апдейта GPT-5.5?
Что делать, если бренд потерял цитирования после обновления модели?
Ещё новости
Яндекс Q1 2026: AI-ответы Алисы в поиске собрали 48,3 млн человек в месяц, чат Алисы — 24 млн в неделю
В отчёте за первый квартал 2026 Яндекс впервые развёл два независимых AI-канала: быстрые ответы Алисы AI в поисковой выдаче и standalone-чат Алисы. Что это значит для GEO-мониторинга в России.
90% AI-цитирований не ведут на ваш сайт: разбор Foundation × AirOps для российских ниш
Foundation × AirOps по 57,2 млн цитирований в LLM: только 10% ведут на сайты брендов, 90% — на Reddit, YouTube, обзорные блоги. Что это значит для рынка РФ с vc.ru, Habr и Дзеном.
Yandex Commerce Protocol против OpenAI ACP: что российским магазинам делать с агентной коммерцией
OpenAI пересобирает Instant Checkout в ChatGPT, Walmart показал конверсию втрое хуже сайта, Yandex Commerce Protocol уже подключил 3500 магазинов. Что это значит для рынка РФ.