这些公司正在用Agentic AI,太香了!
CBISMB
责任编辑:邹大斌
ISMB
时间:2025-05-13 11:31
GenAI 生成式AI AI OpenAI Cursor
还记得过去那些简单的日子吗?那时“生成式 AI”意味着向一个AI模型提出问题,然后得到答案。你可能会加上一个向量数据库来为问题提供上下文,并通过一些安全机制加以限制。当时这听起来已经很难了,但回过头来看,那简直是小菜一碟。
如今,趋势技术是“智能代理型 AI 系统(Agentic AI systems)”。它不再是一个简单的聊天机器人、一个向量数据库和一条安全规则那么简单。现在,你面对的是无尽的数据集选择、各种大小模型在不同环境中运行。不再是人类提一个问题、LLM 回答一个结果这种简单交互,而是由多个代理组成、通过复杂且动态变化的逻辑流程(或概率流程)连接起来的庞大系统。
这些代理之间有新的数据通信协议,代理与代理之间也有新的交互协议,整个系统还需要编排框架将它们串联在一起。
尽管如此复杂,你可能会认为企业会谨慎采用AgentAI。但你大错特错了。
什么是 AI 代理(Agent AI)?
目前市场营销部门中存在一种“代理洗白”现象:就像过去三年里所有产品都贴上“AI”的标签一样,现在只要带个聊天机器人的功能就被称作“代理”。
但从技术角度看,AI 代理与普通聊天机器人最大的区别在于它能够自主采取行动。
它不再只是回答问题,而是可以代表我们执行任务——有时是非常复杂的任务,需要与其他代理和系统进行多次交互。
根据 Cloudera 在今年4月中旬发布的调查报告——对14个国家的1500名企业IT领导者进行了调研——57% 的受访者表示他们已经在使用 AI 代理,而 96% 的人计划在未来12个月内扩大其应用范围。
其他调查也显示出类似的结果:根据 SnapLogic 于2月发布的对美国、英国、德国和澳大利亚超过1000名IT决策者的调查,50% 的企业已经在使用 AI 代理。
此外,92% 的受访者相信 AI 代理将在未来12至18个月内带来实质性的商业成果,79% 的企业计划在未来一年内投资超过100万美元用于 AI 代理项目。
Gartner 将AgentAI 列为2025年最重要的战略趋势之一。到2029年,80% 的常见客户服务问题将能实现自动解决,无需人工干预。Gartner 还预测,到2028年,33% 的企业软件应用将包含AgentAI 技术,15% 的日常工作中做出的决策将由 AI 自主完成。
Gartner 分析师 Sid Nag 表示:“这绝不仅仅是营销炒作。这是未来许多环境下自动化任务的重要推动力。”
以下是一些企业在实际中使用 AI 代理的方式。
典型场景1:软件开发
软件开发曾是生成式 AI 最早爆火的应用场景之一,如今也成为AgentAI 的核心用例之一。
GitHub 对巴西、德国、印度和美国2000名开发者的调查显示,截至2024年中,已有97% 的开发者在使用 AI 编程工具。HackerRank 对来自102个国家的13000多名开发者的调查显示,平均而言,AI 已经生成了29% 的代码。
开源代码库丰富,大型公司通常也有自己的代码仓库、变更日志、bug修复记录等信息,可用于训练或微调 AI 系统以适应公司内部编码规范。
随着 AI 模型的上下文窗口不断扩展,这些工具一次可以查看越来越多的代码,识别问题或提出修复建议。当开发者开始采用AgentAI 后,AI 编程工具的价值也在不断提升。
Gartner 预测,AI 代理可以帮助开发者完全自动化并卸载更多任务,彻底改变软件开发方式。这一变革将迫使到2027年时,80% 的工程师必须提升技能才能继续胜任工作。
目前,很多流行的AgentAI 系统和编码助手已经被集成到开发环境中,也有一些初创公司专注于打造AgentAI 开发平台。
当前最受欢迎的Agent编码平台包括:Cognition Labs 的 Devin、Cursor、Windsurf,此外还有一个免费的开源选项Cline。OpenAI 预计也将推出自己的Agent软件工程师平台 A-SWE(Agentic Software Engineer)。
传统厂商也纷纷加入战场:GitHub Copilot 在2月推出了Agent模式;Amazon 在3月为其 Q Developer 平台推出了增强版 CLI 代理;VS Code 在4月上线了Agent模式;Google 也在4月宣布了自己的AgentAI 开发平台 Firebase Studio。
与传统的聊天机器人相比,Agentic AI 代码开发平台是一个重大进步。聊天机器人只能回答问题并给出代码片段,而Agent AI 可以规划整个项目、编写组件、创建测试并验证代码是否正常运行,并持续迭代直到满足所有项目目标。
Abnormal AI 公司是一家网络安全公司,其机器学习负责人 Dan Shiebler 表示,该公司350名工程师中,有一半到四分之三的人正在使用AI工具。比如,Cursor,同时,也开发了一些内部工具。
他指出,并非每个用例都需要完整的 Agentic 系统。例如,在架构和设计方面,公司使用 ChatGPT 和推理模型,“我对这些模型的表现印象深刻。”
但是在软件开发方面,使用 ChatGPT 或 Claude 并手动复制粘贴代码并不是高效的方案。而像 Cursor 这样的系统,你可以输入指令,代理可以根据代码上下文做出修改,你可以审查结果。”
最新的发展是:编码系统可以完全自动生成整个应用程序,而无需人类触碰代码。它可以调用 API、配置基础设施。Abnormal 已经在使用这样的工具。
Shiebler 提到了三款此类工具:Bolt、v0 和 Lovable。他表示:“我个人喜欢 Lovable,但我们看到 v0 在界面设计方面非常成功,甚至在很多用户流程中取代了 Figma。”
典型场景2:客户服务
客服聊天机器人可以回答简单问题,而 AI 代理则能处理更复杂的问题,甚至主动解决问题。但这其中风险也不小。如果聊天机器人提供了错误信息,或者承诺了一个公司无法兑现的折扣,就已经是个问题。但如果 AI 能够自主操作,比如下单、取消订单、发放折扣或退款,那后果就更严重了。
因此,博世电动工具(Bosch Power Tools)在最初部署时选择让Agent AI 辅助人工客服人员,而不是取代他们,并保留“人在回路中”的机制作为安全保障。
该公司业务运营中的 GenAI 项目负责人 Victor Nguyen 表示:“最终使用者将是我们的客服人员。终端客户不会直接接触这些新Agent AI 系统。我们将由自主 AI 代理支持人工代理。”
博世(Bosch)正在使用 Cognigy.AI 作为其 AI 平台,该平台支持与多个后端 AI 模型集成。Nguyen 表示:“目前我们正在使用OpenAI 的 GPT 4.0 和 谷歌的 Gemini。我们的系统非常灵活。”
该平台还与公司的 CRM 系统和工单系统进行了集成。Nguyen 说:“我们还将其与一个翻译服务集成,因此我们可以翻译电子邮件正文或文档附件。”
他表示,该系统目前正处于第二阶段的试点运行中,并将于5月开始被人工客服代理用于处理真实客户案例。到6月,它将部署到公司23个客服中心中的第一个。
他说,最终的目标是让这个平台在整个博世集团广泛使用。“博世是一家庞大的公司,电动工具只是其中的一个部门。我们将与其他博世业务团队合作,打造可扩展的解决方案。我们正与公司中央 IT 部门密切协作,以确保这一系统能够在全球范围内扩展。”
他指出,最大的挑战并不是Agent技术本身,而是公司内部缺乏统一标准化的流程。
他说:“比如在德国,修改订单的流程可能与拉丁美洲的做法不同,而且使用的系统也不同。我们审查了各个界面,并尽可能地实现了标准化,尽管总会有一些国家特定的差异。”
Nguyen 建议那些希望在客户服务中部署AgentAI 的企业尽快开始数据和系统的标准化工作。
他说:“大多数人认为 AI 就是解决方案,能解决一切问题。但事实并非如此。第一步是要做好基础工作:获取高质量的数据,并确保数据持续维护。这不仅仅是一次性上传数据的任务。”
典型场景3:文档处理
多年来,企业一直在使用聊天机器人来处理文档。生成式 AI 擅长总结内容或提取特定信息。但借助Agent AI,整个以文档为中心的工作流程都可以实现自动化。
营销公司 Route Three Digital 最近为一位客户构建了一个 AI 代理,使用的是谷歌的 Vertex 平台和 Gemini GenAI 模型,用于自动化一个原本需要七天的提案制作流程——客户用户过去需要手动收集各种文档和信息。
该公司首席市场与运营官 Sharmilla Singh 表示:“我们编写了代码并设定了脚本,把所有关键信息整合进一份主文档,然后使用 Gemini 清理文本、提升可读性。”
她指出,这套系统仍然不是完全无误的,仍需人工参与最终审核和定制化调整。但她表示,当该工具于去年推出时,客户的多日流程已被缩短至几小时。
她说,下一步目标是让 AI 代理完成全部工作。“目标就是去除人类的参与。”她说。
Singh 表示,在市场营销领域使用AgentAI 是一个相对低风险的应用场景。“它不会让你的公司倒闭。”
其他在营销中使用 AI 的场景包括搜索引擎营销和在线广告。她说:“如果你不紧跟新的方法论,就可能会失去市场份额。”
Agentic AI 还处于早期
谷歌的 Vertex AI 只是众多试图简化 AI 代理构建和部署的平台之一。今年4月,谷歌还宣布其于去年12月推出的 Agentspace 平台现已新增“无代码代理设计器”以及针对深度研究和创意生成等任务的预置代理。
谷歌还推出了一个Agent市场,并向合作伙伴开放。目前该平台上已有来自德勤、VMware、Amdocs、Palo Alto、Wipro 和 邓白氏(Dun & Bradstreet)等公司的 138 个 AI 代理。
不过,谷歌才刚刚开始追赶微软 Copilot Studio 这头“800磅重的大猩猩”。微软商业与行业 Copilot 部门公司副总裁 Charles Lamanna 在今年3月的一次更新中表示,Copilot Studio 已被超过 16 万家组织用于构建 AI 代理。仅上一季度,就有超过 40 万个定制 AI 代理被创建出来。
其他提供 AI 代理技术的公司还包括:AWS 的 Bedrock Agents、Salesforce、ServiceNow、Workday、SAP等。
此外,AI 模型提供商也开始将Agent功能直接嵌入核心产品中。例如,OpenAI 最近发布了两个内置AgentAI 功能和工具调用能力的新推理模型。未来,企业甚至可能不再需要第三方代理或Agent平台。
Gartner 分析师 Nag 表示,Agentic AI 技术仍处于早期阶段,“现在还很难从企业那里获得关于实际体验的真实反馈。我认为它还没有真正成熟到可以全面推广的程度,即使已经接近成熟,人们也不会大规模采用。”
他说,目前业界对这项技术仍存在大量合理的怀疑。“但我相信随着时间推移,这种怀疑会减少,你会看到它在各种职能领域越来越普及——IT运维、采购、财务等等。”
他补充道:“它还没达到那个阶段。但它正在变得越来越真实。”