Perplexity与哈佛商学院研究：AI Agent Computer相比Search使知识工作耗时降87%成本降94

meng shao@shao__meng

精选75

2026-06-10 08:27·5天前

精选理由

Perplexity和哈佛联手用真实数据第一个证明Agent对知识工作的效率提升，87%时间和94%成本不是口号，产品经理是该看一眼。

AI 摘要

Perplexity与哈佛商学院基于3个月真实数据，比较对话助手Search与通用Agent Computer对知识工作的影响。核心发现：①自主性：Computer平均执行26分钟（Search仅33秒），用户中断率相近（3.7% vs 3.4%），满意度不满降低55%；②效率：任务时间从269分钟降至36分钟（节省87%），成本降94%（约16倍），编程领域时间降92%成本降96%；③范围：Computer 59%查询超出主职业（Search 50%），76%为高阶认知（Search 55%），50%达创造层级（Search 26%）。用户角色从逐步指挥转向验收与迭代。

AI Agent 正在改变知识工作的方式

Perplexity 和哈佛商学院合作，基于 Perplexity Computer 和 Search 的真实使用数据，首次系统比较「对话助手」与「通用 Agent」对知识工作的实际影响。得出一个核心结论：Agent 提高任务自主性、降低成本、扩大工作边界--用户从「操作者」转向「监督者」。 https：//research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work

Agent 最新的分工：用户描述目标，系统跨工具规划、执行、必要时暂停确认，最终交付成品。Perplexity 的产品演进也沿这条线：Search（2022）→ Comet 浏览器 Agent（2025）→ Computer 通用编排器（2026）。

# 三点核心发现

1. 自主性：机器工作时间大幅拉长，质量未降

用「初始查询高度相似」的 1 万对会话做对照： · 机器执行时间：Computer 平均 26 分钟 vs Search 33 秒（约 48 倍）；中位数为 9 分钟 vs 14 秒（约 40 倍） · 用户中断率相近：约 3.7% vs 3.4%，长时自主并未带来更多放弃 · 人机协作点增加：13% 的 Computer 查询会暂停请求用户输入（审批、澄清），Search 仅 0.3%--符合 Agent「多数自主 + 关键检查点」的模式 · 跨工具调用：Computer 通过 MCP/API 连接外部服务，连接器调用频率约为 Search 的 4-12 倍 · 跟进行为变化：整体推进任务的倾向相近（约 53%），但 Computer 用户更多做扩展与审阅（24.6% 审阅修订），Search 用户更多做澄清与短指令（确认、重试、格式调整） · 满意度：有意义的下一轮不满，Computer 1.3% vs Search 2.9%（降约 55%）

要点：自主性提升不等于质量下降；用户角色从「逐步指挥」转向「验收与迭代」。

2. 效率：时间与人均成本显著下降

比较两种模式： · Search + 人：Search 检索综合，人手工执行 · Computer + 人：Computer 跑流程，人定范围、审结果

因无法直接观测人工耗时，研究用三种方法交叉验证： · 工具分类法：把 Computer 工具分为「Search 类」（检索综合）与「Do 类」（需人手工执行的步骤），估算熟练专业人士的等效时间 · LLM 估算法：让模型估算「有 Search 答案但仍需手工执行」的耗时 · 用户访谈：25 位活跃用户的半结构化访谈

主要结果（工具分类法）： · 平均任务时间：269 分钟 → 36 分钟（节省约 87%） · 综合模型成本与 BLS 行业时薪后，任务成本平均降约 94%（约 16 倍） · 18 个领域普遍有效：时间节省 79-92%，成本节省 87-96% · 编程最极端：596 分钟 → 48 分钟（时间 -92%，成本 -96%）

稳健性：即使假设人工步骤被高估 8 倍、或 Computer 监督时间被低估 12 倍，Computer 仍有优势。LLM 估算与访谈方向一致（访谈中位数约 25 倍加速）。

权衡：前期需更明确的目标设定与结果审阅，但单位工作的人工投入大幅下降，尤其适合长链路、多步骤流程。

3. 范围：横向跨界 + 纵向升维

横向（跨职业边界）： · 8 个职业集群、8000 用户样本中，Computer 用户 59% 的查询超出主职业，Search 为 50% · Search 的跨职业查询多集中在数字技术；Computer 则更多流向营销、管理、金融等需执行而非仅检索的领域

纵向（认知复杂度）： · 按 Bloom 修订分类：76% Computer 查询属高阶认知（Search 55%）；50% 为「创造」层级（Search 26%） · 抽象/非例行任务：Computer 71% vs Search 53% · 知识域广度（O*NET）：平均 2.40 vs 1.74 个领域（+38%）；需 3 个以上领域的比例 51% vs 17% · 工作活动广度同样右移；约 23-41% 的 Computer 查询涉及 Search 中从未出现过的任务类型，集中在软件开发、文档生产、数据可视化等「能产出」而非「能解释」的工作

要点：Agent 不只让旧任务更快，还让用户承担更广、更深的工作--单人可触达原本需多角色协作的流程。

PerplexityWe published new research with Harvard on the shift from chat interfaces to autonomous agents like Computer. Over 3 months, findings show workers using Computer...

智能体现象/趋势

在 X 查看原推

meng shao@shao__meng · X