Perplexity和哈佛联手用真实数据第一个证明Agent对知识工作的效率提升,87%时间和94%成本不是口号,产品经理是该看一眼。
Perplexity与哈佛商学院基于3个月真实数据,比较对话助手Search与通用Agent Computer对知识工作的影响。核心发现:①自主性:Computer平均执行26分钟(Search仅33秒),用户中断率相近(3.7% vs 3.4%),满意度不满降低55%;②效率:任务时间从269分钟降至36分钟(节省87%),成本降94%(约16倍),编程领域时间降92%成本降96%;③范围:Computer 59%查询超出主职业(Search 50%),76%为高阶认知(Search 55%),50%达创造层级(Search 26%)。用户角色从逐步指挥转向验收与迭代。
AI Agent 正在改变知识工作的方式
Perplexity 和哈佛商学院合作,基于 Perplexity Computer 和 Search 的真实使用数据,首次系统比较「对话助手」与「通用 Agent」对知识工作的实际影响。得出一个核心结论:Agent 提高任务自主性、降低成本、扩大工作边界--用户从「操作者」转向「监督者」。 https://research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work
Agent 最新的分工:用户描述目标,系统跨工具规划、执行、必要时暂停确认,最终交付成品。Perplexity 的产品演进也沿这条线:Search(2022)→ Comet 浏览器 Agent(2025)→ Computer 通用编排器(2026)。
# 三点核心发现
1. 自主性:机器工作时间大幅拉长,质量未降
用「初始查询高度相似」的 1 万对会话做对照: · 机器执行时间:Computer 平均 26 分钟 vs Search 33 秒(约 48 倍);中位数为 9 分钟 vs 14 秒(约 40 倍) · 用户中断率相近:约 3.7% vs 3.4%,长时自主并未带来更多放弃 · 人机协作点增加:13% 的 Computer 查询会暂停请求用户输入(审批、澄清),Search 仅 0.3%--符合 Agent「多数自主 + 关键检查点」的模式 · 跨工具调用:Computer 通过 MCP/API 连接外部服务,连接器调用频率约为 Search 的 4-12 倍 · 跟进行为变化:整体推进任务的倾向相近(约 53%),但 Computer 用户更多做扩展与审阅(24.6% 审阅修订),Search 用户更多做澄清与短指令(确认、重试、格式调整) · 满意度:有意义的下一轮不满,Computer 1.3% vs Search 2.9%(降约 55%)
要点:自主性提升不等于质量下降;用户角色从「逐步指挥」转向「验收与迭代」。
2. 效率:时间与人均成本显著下降
比较两种模式: · Search + 人:Search 检索综合,人手工执行 · Computer + 人:Computer 跑流程,人定范围、审结果
因无法直接观测人工耗时,研究用三种方法交叉验证: · 工具分类法:把 Computer 工具分为「Search 类」(检索综合)与「Do 类」(需人手工执行的步骤),估算熟练专业人士的等效时间 · LLM 估算法:让模型估算「有 Search 答案但仍需手工执行」的耗时 · 用户访谈:25 位活跃用户的半结构化访谈
主要结果(工具分类法): · 平均任务时间:269 分钟 → 36 分钟(节省约 87%) · 综合模型成本与 BLS 行业时薪后,任务成本平均降约 94%(约 16 倍) · 18 个领域普遍有效:时间节省 79-92%,成本节省 87-96% · 编程最极端:596 分钟 → 48 分钟(时间 -92%,成本 -96%)
稳健性:即使假设人工步骤被高估 8 倍、或 Computer 监督时间被低估 12 倍,Computer 仍有优势。LLM 估算与访谈方向一致(访谈中位数约 25 倍加速)。
权衡:前期需更明确的目标设定与结果审阅,但单位工作的人工投入大幅下降,尤其适合长链路、多步骤流程。
3. 范围:横向跨界 + 纵向升维