PerplexityBot：Perplexity 如何抓取网页

PerplexityBot 是 Perplexity 的网页爬虫。与许多 AI 机器人不同，它的主要目的是在实时答案中呈现内容，而非训练模型。

2026-06-19

·

1 分钟阅读

PerplexityBot

PerplexityBot 是 Perplexity 的网页爬虫。与许多 AI 机器人不同，它的主要目的是在实时答案中呈现内容，而非训练模型。它是 AI 爬虫中最像搜索引擎的一个。

PerplexityBot 是最重要的允许爬取的 AI 爬虫之一。Perplexity 被知识工作者与开发者重度使用，那里的引用驱动高质量流量。

如何控制 PerplexityBot

允许。 默认。让 Perplexity 为实时答案抓取你的内容
屏蔽。 加入 robots.txt：
```
User-agent: PerplexityBot
Disallow: /
```
仅屏蔽训练。 Perplexity 对训练数据收集使用单独的 user agent。查阅他们文档获取最新名称

为什么允许

PerplexityBot 是 Perplexity 答案中引用的来源
Perplexity 中的引用驱动来自高价值受众的 AI 引荐流量
它是「模型为此答案读取了你的页面」的最清晰信号

为什么屏蔽

你不想让你的内容在 Perplexity 的答案中呈现
你有付费墙或内容许可限制
你处于受监管的行业

如何验证

在你的服务器日志中检查 User-Agent: PerplexityBot
使用 Perplexity 公布的 IP 段进行确认
在 Perplexity 中搜索你最重要的买家问题，看哪些 URL 被引用