Agent时代,亚马逊云科技继续引领创新

作者: 邹大斌

责任编辑: 邹大斌

来源: CBISMB

时间: 2025-12-26 14:58

关键字: 亚马逊云科技,re:Invent, AI,Agent

浏览: 517

点赞: 27

收藏: 5

2025年堪称Agent元年,各类智能体(Agent)正加速在各行业落地,未来发展潜力无限。与此同时,围绕Agent的生态系统正在形成,相关开发工具及底层AI基础设施(AI Infra)也在快速演进。在此背景下,亚马逊云科技再次站到行业前沿,在人工智能基础设施、推理平台、企业数据与Agent构建工具等方面全面推进创新,助力企业自由探索下一代智能化转型。

"亚马逊云科技拥有全球最大的、部署最广泛的云基础设施和AI基础设施。我们覆盖全球38个区域,120个可用区,并且这个数字还在持续增长。不久还会再新增三个新的区域。我们致力于提供最高的性价比的云服务,并且能够在基础领域进行持续的创新。"亚马逊云科技大中华区产品部总经理陈晓建说。

构建智能体驱动的AI生态

谈及Agentic,大型模型是关键基础。当前,大模型已成为云服务商竞争的核心领域之一。亚马逊云科技一方面通过投资与Anthropic深度合作,另一方面积极研发自有大模型Nova。

在2025 re:Invent大会上,亚马逊云科技推出了新一代模型家族——Nova 2,涵盖多类场景化模型:

  • Nova 2 Lite:一款高效推理模型,适用于广泛工作负载,在性价比方面表现卓越,在指令跟随、工具调用、代码生成与文档理解等任务中媲美同类先进模型。
  • Nova 2 Pro:智能程度最高的推理模型,胜任高度复杂任务,如Agent协作与工作流自动化。
  • Nova 2 Sonic:语音到语音模型,支持类人实时对话,提升通话体验。
  • Nova 2 Omni:业界首个支持文本、图像、视频、音频多模态输入,并可输出文本与图像的推理模型。能够从复杂文档中提取关键信息,理解图像内容与空间关系,并支持图像生成与编辑,为创意与内容创作提供新可能。

当然,仅有大模型还不够,Agent的开发还需完整的Agent开发平台。为此,亚马逊云科技推出 Amazon Bedrock AgentCore,支持大规模、安全地开发、部署和运营Agent。

该平台提供八大核心能力:Runtime(运行环境)、AgentCore Memory(记忆)、Identity(身份)、Code Interpreter(代码解释)、Runtime(运行环境)、Observability(可观测性)、Policy(策略控制)与Evaluations(评估框架)。这些能力旨在降低开发门槛,屏蔽底层复杂性,尤其借助Amazon Lambda的microVM技术,提供安全、隔离且弹性伸缩的运行环境。

虽然推出不到半年,Amazon Bedrock AgentCore已经在很多大型企业得到应用,也广泛被ISV(独立软件开发商)和初创公司采用,帮助它们以最低成本、最快速度构建和上线Agent能力。

陈晓建表示,开发Amazon Bedrock AgentCore背后有两个原因。第一,它满足了开发Agentic AI的通用需求,为客户屏蔽底层复杂性,减少开发工作量。第二,这展现了亚马逊云科技作为一流云服务商,通过20年开发所积累的丰富底层核心能力。

值得一提的是,作为亚马逊云科技这几年着力打造的一个MaaS平台,Bedrock目前已集成18款模型,除自家Nova系列外,还包括Google Gemma、NVIDIA Nemotron、MiniMax M2、Kimi K2 Thinking、Qwen、DeepSeek等国内外领先模型。据统计,已有超过50家客户在平台上处理了超过1万亿tokens。

数据是Agent开发中的关键环节,尤其是向量数据,它是大模型应用的原材料。2025 re:Invent大会上,亚马逊云科技宣布Amazon S3 Vectors正式商用,提供高容量、低成本的向量存储服务,单个存储桶可容纳数万亿向量。同时,Amazon OpenSearch Service 通过GPU加速向量索引,使索引构建速度提升10倍,成本降至原来的四分之一。

在开发工具层面,Amazon Kiro平台集成Kiro Power,可智能辅助代码补全。结合已有的Amazon SageMaker AI,企业可构建覆盖全流程的Agent开发与部署能力。

打造面向AI的基础设施

Agentic AI的落地离不开强大算力。亚马逊云科技持续投入基础设施创新,尤其面向AI负载进行全方位优化,先后推出了多款自研芯片,包括Graviton(ARM CPU)、Inferentia(推理芯片)、Nitro(网络芯片)与Trainium(训练与推理芯片)。其中,Amazon Trainium已部署超100万片,Anthropic的Claude模型完全运行于该芯片之上。而Graviton系列在亚马逊云科技新增CPU中占比已连续三年超过50%,为客户持续降低云服务成本。

在2025 re:Invent大会上,亚马逊云科技发布了新一代Amazon Trainium4,相比前代提升6倍FP4计算性能、4倍内存带宽与2倍能效。

针对极致算力需求,亚马逊云科技还推出基于Trainium的超级计算节点Amazon EC2 Trn3 UltraServers,为大规模AI训练与推理提供业界领先的性价比。该实例单机配备144块Trainium 3芯片,提供362 PFlops的FP8性能与706 TB/s内存带宽,带来4.4倍计算能力、3.9倍内存带宽的提升,每兆瓦功耗可处理的tokens量增加至5倍。

除了AI专用芯片,2025 re:Invent上还发布了第五代Graviton——Graviton5。该处理器采用192核设计,缓存容量提升至前代的5倍,通过优化核心间数据传输路径,实现最高33%的通信延迟降低与带宽同步提升。

此外,亚马逊云科技还推出Amazon AI Factories,允许客户在自有数据中心内部署全套AI基础设施,包括最新GPU、Trainium芯片及云上AI平台,满足合规与数据主权需求。

推动企业级Agent落地与现代化改造

亚马逊云科技不仅提供工具与基础设施,也通过场景化产品推动Agent在实际业务中的应用:

  • Amazon Quick Suite:面向员工的无代码AI助手,可整合多源数据(如Microsoft 365、Salesforce等),实现研究、洞察与自动化流程,已在亚马逊内部服务数十万员工。
  • Amazon Connect:集成Agentic AI能力的客服平台,新增8项智能功能,包括基于Nova 2 Sonic的自然语音交互。
  • Amazon Transform:支持代码与应用现代化迁移,可自动分析工作负载与数据库关系,实现从SQL Server到Amazon Aurora PostgreSQL等平台的迁移。新推出的Transform Custom功能允许自定义代码转换模式,通过自然语言与Agent交互,完成代码升级与架构重构。

此外,亚马逊云科技还发布三款垂直场景Agent:Kiro自主编程Agent、Amazon安全Agent与Amazon DevOps Agent,进一步深耕专业领域。

毫无疑问,随着Agent逐渐从试验走向核心业务,其可靠性、安全性与合规性将成为关键。作为云计算市场的领头羊,亚马逊云科技正通过全栈式AI能力——从底层芯片、推理平台、开发工具到场景化应用——助力各类企业在Agent时代构建可持续的竞争优势,同时,也为自身赢得行业领先优势。

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。