llms.txt для Astro: статический GEO-чеклист для AI-краулеров
Как подготовить Astro-сайт к AI-краулерам: llms.txt, robots.txt, sitemap, canonical, structured data, static HTML и проверка логов.
Astro - один из самых удобных фреймворков для GEO, потому что краулеры часто получают полный HTML без выполнения JavaScript. Но это преимущество теряется, если сайт блокирует ботов, не имеет sitemap, плодит дубли URL или переносит важный контент в client-only компоненты.
Цель внедрения: AI-краулеры должны находить canonical-страницы, получать полный контент, понимать entities через structured data и цитировать правильные URL.
Корневые файлы
Статический вариант:
public/llms.txt
public/robots.txt
public/favicon.svgГенерируемые routes:
src/pages/llms.txt.ts
src/pages/sitemap.xml.tsИтоговые URL:
/llms.txt
/robots.txt
/sitemap.xmlШаблон llms.txt
# Example Astro Site
> Официальные product, docs, pricing и customer proof материалы.
## Product
- https://example.com/
- https://example.com/features/
- https://example.com/pricing/
## Learn
- https://example.com/blog/
- https://example.com/docs/
## Trust
- https://example.com/customers/
- https://example.com/security/Используйте URL, которые вы действительно хотите дать AI-системам для понимания и цитирования.
robots.txt
User-agent: GPTBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: *
Disallow: /admin/
Disallow: /preview/
Disallow: /api/
Sitemap: https://example.com/sitemap.xmlPreview, CMS и admin-маршруты лучше блокировать. Public docs, blog, customers и product pages должны быть доступны.
Чеклист static HTML
curl -A "GPTBot/1.0" -s https://example.com/features/ | sed -n '1,120p'Проверьте, что raw HTML содержит:
- один понятный H1;
- page-specific body text;
- internal links;
- canonical link;
- metadata;
- JSON-LD;
- FAQ, если он есть на странице;
- отсутствие зависимости critical content от hydration.
Astro Islands
Используйте islands для calculators, demos, forms, carousels и filters. Критичный контент держите вне client-only islands:
---
const faq = [
{ question: 'Кому подходит?', answer: 'B2B-командам, которые сравнивают vendors.' },
];
---
<h1>AI-ready product analytics</h1>
<p>Server-visible объяснение продукта для покупателей и AI-краулеров.</p>
<InteractiveDemo client:load />Демо может гидратироваться позже. Объяснение должно быть доступно сразу.
Canonical и collections
Astro content collections могут создавать много URL. Избегайте дублей с trailing slash, tag archives без canonical-стратегии и локалей без language links.
У каждой статьи, docs-страницы и case study должны быть:
- canonical URL;
- published и updated dates;
- author;
- breadcrumb;
- стабильный slug;
- related links.
Structured Data
Используйте Article для blog posts, FAQPage для FAQ, BreadcrumbList для навигации, Organization для бренда и SoftwareApplication для SaaS.
<script type="application/ld+json" set:html={JSON.stringify({
'@context': 'https://schema.org',
'@type': 'Article',
headline: Astro.props.title,
datePublished: Astro.props.publishedAt,
dateModified: Astro.props.updatedAt,
})} />Логи
Даже static hosting имеет логи через Cloudflare, Vercel, Netlify или CDN. Смотрите, получают ли AI-краулеры 200 для публичных URL и не тратят ли crawl budget на redirects, old slugs или blocked preview pages.
Astro GEO Checklist
- Опубликовать
/llms.txt. - Проверить, что
robots.txtне блокирует полезные страницы. - Сгенерировать sitemap из collections.
- Держать critical content в static HTML.
- Добавить canonical URL и schema.
- Проверить raw HTML bot user-agent.
- Мониторить citations в GEO Scout на geoscout.pro.
Astro уже даёт правильную модель рендеринга. GEO-задача - сделать результат структурированным, доступным и измеримым.
Частые вопросы
Astro подходит для AI crawler readiness?
Куда положить llms.txt в Astro?
Astro islands вредят GEO?
Как измерять изменения Astro GEO?
Похожие статьи
Checklist AI Crawler Readiness: готов ли сайт к GPTBot, OAI-SearchBot и другим ботам
Технический чек-лист готовности сайта к AI-краулерам: robots.txt, sitemap, SSR, коды ответа, логи, CDN, rate limits, structured data и контент без блокировок.
GEO для Headless CMS: технический чеклист AI-ready content model
Как настроить headless CMS для AI search: structured fields, canonical URL, sitemap, schema, SSR или static rendering и безопасный publishing workflow.
Schema для case studies: как сделать customer proof удобным для AI-цитирования
Как структурировать SaaS и B2B case studies через Article, Organization, FAQPage, BreadcrumbList, metrics, canonical URL и AI-crawler friendly rendering.