哈佛与Perplexity研究:AI智能体人机协作缩短87%任务时间、降低94%总成本
阅读原文· ithome.com哈佛大学与Perplexity基于10000组真实数据对比研究发现,AI智能体(Perplexity Computer)与人工协作比传统搜索(Perplexity Search)加人工效率更高。智能体单次会话平均执行26分钟,搜索仅33秒,本地任务差距达75倍;智能体有效不满率1.3%,低于搜索的2.9%。“Search+人工”每任务需269分钟,“Computer+人工”仅36分钟,时间缩短87%。虽然智能体单任务模型成本约4-10美元(搜索约0.05美元),但人力边际成本从2.05美元降至0.16美元,总成本下降94%。短单步问题适合搜索,多步需工具调用任务适合智能体。
IT之家 6 月 10 日消息,哈佛大学携手 Perplexity 公司,筛选 10000 组真实生产数据,指出 AI 智能体人机协作方式下,把任务时间缩短 87%、总成本下降 94%。
本次研究主要基于 Perplexity Search 和 Perplexity Computer 的生产环境数据。前者偏向对话式答案引擎,后者则是可规划、可执行、可调用外部工具的智能体系统。
研究时间窗口为 90 天,从 2026 年 2 月 27 日至 5 月 27 日。研究从两类产品中筛出 10000 组近乎相同的任务,此外为保证 Computer 确实在“做事”,样本只保留调用执行工具的会话,例如代码执行、浏览器操作、文件写入和连接器调用,从而对比更接近同一任务在两种模式下的真实差异。
在自主性方面,Computer 单次会话平均机器工作时长为 26 分钟,Search 只有 33 秒,达到 48 倍差距。不同领域差异并不完全一致,本地任务达到 75 倍,科学类任务为 26 倍。
值得注意的是,自主性提高并未带来质量下滑,Computer 的有效不满率为 1.3%,低于 Search 的 2.9%。
效率方面,研究估算了“Search+人工”和“Computer+人工”两种完成路径:前者平均每个匹配任务需要 269 分钟,后者只需 36 分钟,时间缩短 87%。