llms.txt для Next.js: технический чеклист AI crawler readiness
Как добавить llms.txt, robots.txt, sitemap, canonical, структурированные данные и серверный рендеринг в Next.js для AI-краулеров.
Next.js может быть удобной основой для AI crawler readiness, если публичные страницы действительно видны сервером. Краулер должен запросить homepage, features, docs, кейсы или блог и получить осмысленный HTML без запуска браузера.
GEO Scout помогает превратить это в измеримый процесс. После внедрения чеклиста отслеживайте промпты и источники на geoscout.pro, чтобы увидеть, начинают ли AI-системы цитировать нужные страницы.
Размещение файлов
Для статического варианта:
public/llms.txt
public/robots.txt
public/sitemap.xmlДля App Router и генерации:
app/llms.txt/route.ts
app/robots.txt/route.ts
app/sitemap.tsАдреса должны открываться напрямую:
https://example.com/llms.txt
https://example.com/robots.txt
https://example.com/sitemap.xmlМинимальный llms.txt
# Example SaaS
> Документация, pricing, кейсы и материалы по внедрению Example SaaS.
## Основные страницы
- https://example.com/
- https://example.com/features
- https://example.com/pricing
- https://example.com/customers
## Документация
- https://example.com/docs/getting-started
- https://example.com/docs/api
## Политики
- https://example.com/security
- https://example.com/privacyНе превращайте llms.txt в список ключевых слов. Это карта полезных canonical-ресурсов.
robots.txt
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: *
Disallow: /app/
Disallow: /api/
Disallow: /checkout/
Sitemap: https://example.com/sitemap.xmlБлокировать /api/ обычно нормально. Блокировать /docs/, /blog/, /customers/ и /features/ обычно вредно для GEO.
Sitemap
Пример app/sitemap.ts:
import type { MetadataRoute } from 'next'
export default function sitemap(): MetadataRoute.Sitemap {
return [
{
url: 'https://example.com/',
lastModified: new Date('2026-04-24'),
changeFrequency: 'weekly',
priority: 1,
},
{
url: 'https://example.com/features',
lastModified: new Date('2026-04-24'),
changeFrequency: 'weekly',
priority: 0.8,
},
]
}Используйте стабильные canonical URL. Для локалей добавляйте language alternates и hreflang там, где это поддерживает стек.
Чеклист рендеринга
- Blog, docs, features, pricing, comparisons и case studies переводите на SSG или ISR.
- SSR используйте для динамических публичных страниц.
- Закрытые dashboards держите за авторизацией и вне crawler-paths.
- H1, body copy, FAQ, таблицы и JSON-LD должны быть в первом HTML.
- Не прячьте критичный контент в пустые до hydration табы.
- Проверяйте через
curl -A "GPTBot/1.0" https://example.com/features.
Структурированные данные
Для SaaS добавляйте Organization, SoftwareApplication, FAQPage, BreadcrumbList, Article и Product там, где это уместно. JSON-LD должен попадать в серверный HTML.
Логи
Проверяйте Vercel, CDN или server logs по user-agent:
GPTBot
ClaudeBot
PerplexityBot
Google-Extended
Googlebot
BingbotСмотрите status code, blocked paths, redirects и страницы с тонким HTML.
Релизный чеклист
- Опубликовать
/llms.txt. - Проверить
robots.txtдля нужных AI-краулеров. - Добавить sitemap и canonical URL.
- Отдавать публичные страницы через SSG, ISR или SSR.
- Добавить server-visible schema.
- Проверить raw HTML bot user-agent.
- Отслеживать AI-упоминания и источники в GEO Scout.
Задача не в том, чтобы сделать отдельный сайт для ботов. Задача в том, чтобы лучшая публичная информация была доступна, понятна и цитируема.
Частые вопросы
Где разместить llms.txt в Next.js?
llms.txt заменяет robots.txt?
Нужен ли SSR для AI-краулеров в Next.js?
Как GEO Scout помогает проверить эффект?
Похожие статьи
Checklist AI Crawler Readiness: готов ли сайт к GPTBot, OAI-SearchBot и другим ботам
Технический чек-лист готовности сайта к AI-краулерам: robots.txt, sitemap, SSR, коды ответа, логи, CDN, rate limits, structured data и контент без блокировок.
IndexNow для Next.js: ускорение discovery для AI Search и Bing Copilot
Как внедрить IndexNow в Next.js для новых и обновлённых страниц: API routes, keys, sitemap, canonical URL и измерение GEO.
Schema для SaaS features page: structured data для AI-ответов
Технический чеклист schema для SaaS feature pages: SoftwareApplication, FAQPage, BreadcrumbList, Organization, Product-сигналы, canonical URL и server rendering.