调查发现:AI 聊天机器人提升效率有限,AI普及速度惊人

作者:

CBISMB

责任编辑:

邹大斌

来源:

ISMB

时间:

2025-06-03 11:57

关键字:

AI GenAI Gartner

一项由经济学家进行的新研究分析了多种职位和员工后发现,AI 聊天机器人并未显著提高组织的生产力或效率。与此同时,行业分析师、经济学家和技术历史学家表示,人工智能(AI)的采用速度比历史上任何技术都要快。

生成式人工智能(GenAI)的普及速度尤其惊人。例如,OpenAI 的 ChatGPT 在 2022 年 11 月推出两个月后就达到了 1 亿用户,这一速度超过了 TikTok、Instagram 或其他任何应用的历史纪录。

然而,根据美国国家经济研究局(NBER)于 2025 年 5 月发布的一项研究,尽管企业投入巨大,但在更广泛的劳动力市场中,GenAI 所带来的实际收益却难以量化。研究人员调查了大量员工及其工作任务,发现 AI 聊天机器人仅平均节省了员工 2.8% 的工作时间。而且这些效率提升很少带来薪资增长(仅有 3% 到 7% 的改善)。

但并非所有结果都是负面的。研究人员指出,64% 到 90% 的用户确实通过使用聊天机器人节省了时间,只是对工作质量和满意度的影响因人而异。此外,AI 还为 8.4% 的员工创造了新的任务,甚至包括那些没有直接使用 AI 的员工。

报告指出,过去关于 AI 使用的随机对照实验记录显示的生产率提升往往超过 15%。但“这些提升如何转化为收入和工时变化仍不清楚,因为高质量的微观数据非常稀缺。”研究人员写道。

而且这些实验通常集中在那些最有可能从 AI 工具中获得最大收益的岗位上,在这些环境中,雇主积极鼓励并全力支持使用 AI 聊天机器人。而在更多样化、非理想环境中的广泛职业调查则显示出更温和的效果。

报告强调:“这些发现提醒我们,不能简单地将受控实验中的生产率提升直接推导到整个经济体。”

大规模调查揭示真实效果

研究人员利用了来自丹麦的两项大型调查数据,涵盖 7000 个工作场所的 2.5万 名员工,涉及 11 种职业,包括会计师、客服专员、金融顾问、人力资源专业人员、软件开发人员、IT 支持专家以及市场营销和法律专业人士。报告指出,丹麦工人在 GenAI 采纳、工作灵活性和薪资谈判方面与美国工人非常相似。

虽然研究发现 AI 使用广泛,且雇主通过内部模型和培训推动其应用,但该技术对员工的经济影响微乎其微。

报告明确表示:“AI 聊天机器人在任何职业中都没有对收入或工作时间产生显著影响。”“适度的效率提升(平均节省 3% 的时间),加上工资传导机制薄弱,解释了这些有限的劳动力市场效应。”

报告指出,目前还无法明确 GenAI 对劳动力市场的总体影响,主要基于三个原因:

企业可能尚未完全整合 AI 工具;

聊天机器人的效益因任务不同而异,有时甚至是负面的;

缺乏将效率提升与薪酬或工时直接联系的数据。

一把手推动,效果明显提升

雇主正通过鼓励、内部模型(38%)和培训(30% 的员工)推动 AI 聊天机器人的使用。研究人员发现,这些措施使使用率几乎翻倍,从 47% 提升至 83%。更重要的是,当雇主推广使用时,AI 聊天机器人的效益提升了 10% 至 40%,这表明企业主导的支持至关重要。

除了丹麦的研究,IBM 最近对 2000 名 CEO 的调查显示,只有 25% 的 AI 项目达到预期的投资回报率(ROI)。同时有 64% 的受访者表示,他们投资 AI 主要是为了避免落后于竞争对手。

IBM 的最新研究显示,企业的 AI 战略正变得更加聚焦,目前只有 6% 的组织是临时性使用 AI,而去年这一比例为 19%。

IBM 咨询公司全球 AI 与分析业务副总裁兼高级合伙人 Manish Goyal 表示,企业在部署 AI 时常常忽略三项最佳实践:第一,将 AI 应用与关键优先事项对齐;第二,建立强大的技术基础;第三,管理变革并培养技能以推动采用和增长。

他说:“客户在将 AI 应用于如软件开发、客户服务、市场营销、运营、IT 等需要人工参与的横向流程时,获得了最高的 ROI。从行业角度看,我们在电信、零售和银行业客户中看到他们在客户服务等领域成功使用 AI。”

Gartner:GenAI 正滑入“幻灭低谷”

去年,Gartner 研究指出,由于期望与现实之间的落差、企业在数据工程和 AI 治理方面的挑战,以及许多 GenAI 项目难以量化的 ROI,生成式 AI 正滑入“幻灭低谷”(Trough of Disillusionment)。

Gartner 的“幻灭低谷”描述了一个阶段:随着实验和实施未能兑现最初的炒作,人们对新技术的兴趣开始减弱。

Gartner 杰出副总裁分析师 Whit Andrews 表示:“我们认为‘传统 AI’已经开始爬出低谷。而 GenAI 仍在滑向低谷。‘代理型 AI’(Agentic AI)则处于较高位置——接近高峰。”

Gartner 自身的研究也显示,某些形式的 AI 对员工效率产生了显著影响。例如,最近一次 Gartner 调查显示,使用 AI 的员工每周平均节省了“5.4 小时”,相当于工作周的约 12%。Andrews 表示,这与丹麦研究的结果误差范围相近。他还指出,两份调查之间的差异也可能源于方法论的不同。

他说:“我们确实看到员工告诉我们他们正在通过 AI 节省时间。”

然而,Gartner 的研究也发现,相比其他技术(如 RPA 或区块链),实施传统 AI 和生成式 AI 的团队并不更有可能报告显著的生产率提升。

Gartner 报告指出:“虽然 AI 采用带来了显著的时间节省(每人每周 5.4 小时),但其中超过三分之二的时间被重新分配到了非增值活动中。”

随着各种形式的 GenAI 在组织中逐渐失宠,企业对 ROI 的关注可能会推动“代理型 AI”的采用,这种 AI 具备更强的潜在效率和生产力提升能力。

AI 代理潜力远超聊天机器人

埃森哲在其最新的 Technology Pulse Poll 中对超过 500 名科技高管的调查显示,AI 代理将在未来的 AI 部署中占据主流。调查显示,48% 的企业已经在采用或全面部署 AI 代理,其中一半的领导者表示,在未来 24 个月内,超过 50% 的 AI 部署将在其公司实现自动化。

AI 代理是一种软件程序,它能收集数据,并利用这些数据执行自主决定的任务,以实现预设目标。例如,一个 AI 代理可以充当客户服务代表,自动向客户提问、查找内部文档信息并提供解决方案。根据客户反馈,它会判断是否能自行解决问题,还是需转交给人类处理。

内容管理提供商 Box 最近发布的一项调查显示,企业之间出现了明显的分化:一部分已战略性拥抱 AI,另一部分仍处于初步采用阶段。

Box 对 1300 名 IT 领导者的调查显示,早期采用 AI 代理的企业已经看到显著的生产力提升,AI 成为其员工的重要工具。

Box 的研究指出:“早期采用 AI 代理的企业正在实现显著的投资回报,领先企业平均测量到 37% 的生产力提升。”

AI 代理从简单到复杂不等。Box 的数据显示,87% 的组织正在使用 AI 代理,其中 41% 的组织将其用于完全自主的任务。尽管高级代理提升了效率和创新力,但大多数公司仍在调整和培训员工,以弥补 AI 技能差距。

Gartner 的 Andrews 表示:“对于像 AI 这样具有强大维度力量的技术,真正的问题在于:你是想节省做现有事情的时间?还是想做更多同样的事?还是想做得更好?或者你想改变你所在行业的运作方式?”“你希望如何组合这些选项?”

他补充道:“如果企业只专注于效率提升,那可能是短视的。‘当公司将注意力孤立地放在效率上时,它们注定会变得越来越不重要,无法增强对客户的影响力。’”