GPTBot:OpenAI 的网页爬虫解析
GPTBot 是 OpenAI 的网页爬虫。它既可用于训练未来模型,也用于在 ChatGPT 搜索中呈现内容。决定如何处理它。
2026-06-19
·
1 分钟阅读
GPTBot
GPTBot 是 OpenAI 的网页爬虫。它既可用于训练未来模型,也用于在 ChatGPT 搜索中呈现内容。在 robots.txt 中决定如何处理它。
GPTBot 是被屏蔽最广的 AI 爬虫——也是使用最广的爬虫。屏蔽它已是 2026 年一个有意义的 SEO 决策。
如何控制 GPTBot
- 允许。 默认。让 OpenAI 在训练与 ChatGPT 搜索中使用你的内容
- 屏蔽。 加入 robots.txt:
User-agent: GPTBot Disallow: / - 仅屏蔽训练。 用 OAI-SearchBot 处理搜索,屏蔽 GPTBot 处理训练:
User-agent: GPTBot Disallow: / User-agent: OAI-SearchBot Allow: /
为什么允许
为什么屏蔽
- 你不想让你的内容被用于训练未来的 OpenAI 模型
- 你有付费墙或许可内容,不应被复述
- 你处于对内容有监管限制的行业
如何验证
- 在你的服务器日志中检查
User-Agent: GPTBot与User-Agent: OAI-SearchBot - 使用 OpenAI 公布的 IP 段进行确认
- 通过问 ChatGPT 能否找到你的最新页面来测试