llms.txt：面向 AI 爬虫的提议标准

llms.txt 是一个提议中的文件，为 LLM 驱动的爬虫提供简洁、机器可读的站点摘要——类似 AI 时代的 robots.txt。

2026-06-19

·

1 分钟阅读

llms.txt

llms.txt 是一个提议中的标准文件，放在网站根目录，向 LLM 驱动的爬虫提供简洁、机器可读的站点摘要——它是什么、哪些页面最重要、如何消费其内容。它是 AI 时代的 robots.txt。

该提案（由 Jeremy Howard / Answer.AI 发起）很简单：在 /llms.txt 放置一个 Markdown 文件，列出你最想让 LLM 读取的页面，附带简短描述；可选地，再放一个 /llms-full.txt 把所有重要页面的全文集中到一份文档里。

llms.txt 为何存在

LLM 爬虫既嘈杂又昂贵。它们会重新抓取整个站点来寻找值得读的内容
一份干净、经过策划的索引能帮它们更快找到对的页面
它让发布者控制 LLM 可以读什么
通过确保对的页面易于检索，能提升你的引用率

如何写好 llms.txt

用一段话概述你的站点以及它服务的对象
列出你最希望 LLM 读取的 20–50 个 URL，按章节分组，每条配 1–2 句描述
跳过标签、归档与低价值页面
当你发布重要内容时及时更新
可选地，把最佳页面的全文发布到 /llms-full.txt

现在要采用吗？

要——如果你发布研究、文档或长篇参考内容。成本很低（一个 Markdown 文件），收益可观，并且在 LLM 提供商正式确立标准时你会先行一步。