GEO для Headless CMS: технический чеклист AI-ready content model

Headless CMS может как усилить, так и ухудшить AI-видимость. Если всё хранится как неструктурированный rich text, а фронтенд получает данные после client-side JavaScript, краулеры видят слабый сигнал. Если CMS моделирует entities, proof, dates, FAQ, authors и relationships, AI-системам проще понять сайт.

GEO Scout полезен тем, что связывает content operations с AI-видимостью. Если новая модель кейсов улучшает citations, это должно проявиться в geoscout.pro.

Поля content model

Для каждого публичного типа контента нужны:

title;
meta title;
meta description;
slug;
canonical URL override;
published date;
updated date;
author или reviewer;
summary;
FAQ items;
related pages;
primary entity;
target audience;
industry или category;
proof points;
schema type.

Так редакторы не прячут важные факты в длинном тексте, который шаблон не может переиспользовать.

Типы страниц

Content type	GEO fields
Feature page	use case, audience, benefits, integrations, FAQ
Case study	client profile, problem, solution, metrics, stack
Blog article	author, dates, summary, sources, FAQ
Comparison page	criteria, alternatives, limitations, table
Docs page	product area, version, prerequisites, steps
Partner page	integration category, capabilities, setup links

Рендеринг

CMS API может быть headless. Публичная страница не должна быть crawler-hostile.

Рекомендуемый поток:

CMS -> build или server fetch -> static HTML / SSR HTML -> CDN

Избегайте:

CMS -> browser fetch after hydration -> empty initial HTML

Для Next.js, Nuxt, Astro и похожих стеков используйте SSG, ISR, prerendering или SSR для публичного контента. Personalization и app dashboards держите отдельно.

robots.txt и preview URL

Блокируйте CMS preview и staging paths:

User-agent: *
Disallow: /preview/
Disallow: /drafts/
Disallow: /api/preview/
Disallow: /cms/
 
Sitemap: https://example.com/sitemap.xml

Не блокируйте:

/blog/
/docs/
/features/
/customers/
/compare/
/security/

Sitemap и llms.txt

Генерируйте sitemap из CMS entries, где status = published и noindex != true.

Добавьте root /llms.txt:

# Example Company
 
## Product
- https://example.com/features
- https://example.com/pricing
 
## Proof
- https://example.com/customers
- https://example.com/case-studies
 
## Knowledge
- https://example.com/docs
- https://example.com/blog

Это компактная карта контента, который вы хотите дать AI-системам.

Structured Data из CMS-полей

Не заставляйте редакторов вставлять JSON-LD вручную. Генерируйте schema из полей:

Article из title, dates, author, summary;
FAQPage из FAQ fields;
SoftwareApplication из product fields;
Article или CreativeWork из customer stories;
BreadcrumbList из hierarchy;
Organization из global settings.

Если в CMS нет нужных полей для schema, добавляйте поля, а не hardcode generic values.

Canonical governance

Headless setups часто создают дубли через locales, preview modes, tags, filters и legacy slugs. Зафиксируйте правила:

один canonical URL на entry;
redirects со старых slugs;
locale-specific canonical и hreflang;
noindex для thin tag pages при необходимости;
sitemap только для published canonical pages.

AI-системы могут цитировать неправильный URL, если canonical graph messy.

Workflow проверки

Опубликовать контент в CMS.
Проверить, что generated page попала в sitemap.
Проверить raw HTML с AI crawler user-agent.
Подтвердить status 200 в логах.
Убедиться, что schema есть server-side.
Отслеживать citations в GEO Scout.

Хорошая headless CMS не только удобна редакторам. Она достаточно структурирована, чтобы машины понимали контент.

Частые вопросы

Что делает headless CMS готовой к AI search?

AI-ready headless CMS хранит entities, FAQ, авторов, даты, canonical URL, related content, schema data и publishing status в структурированных полях, которые рендерятся в crawlable pages.

Content modeling относится к GEO?

Да. AI-системам проще извлекать факты, когда CMS хранит proof, категории и связи в отдельных полях, а не только в rich text.

Должны ли CMS preview pages быть crawlable?

Нет. Preview, draft, staging и personalization URL нужно блокировать или noindex. Published canonical pages должны быть доступны.

Как GEO Scout вписывается в процесс?

GEO Scout на geoscout.pro показывает, какие CMS-страницы цитируются в AI-ответах и где контент или schema создают пробелы видимости.