阿里开源首个Agent模型“通义DeepResearch”，模型框架方案全面开源

作者： CBISMB

责任编辑：宋慧

来源： ISMB

时间： 2025-09-18 11:50

关键字： AI ，大模型，开源，Agent ，通义DeepResearch

点赞： 538

收藏： 61

9月17日，阿里开源旗下首个深度研究Agent模型——通义DeepResearch，并登顶开源第一。

该模型在HLE、BrowseComp-zh、GAIA等多个权威评测集上取得SOTA成绩(State-of-the-art)，超越OpenAI Deep Research、DeepSeek-V3.1等Agent模型。

目前，通义DeepResearch的模型、框架和方案均已全面开源，用户可在Github、Hugging Face和魔搭社区社区下载模型和代码。

作为当前研究热点，“深度研究”的现有方法通常是“单窗口、线性累加”的信息处理模式，所有中间思路和检索到的信息堆积在单一上下文中。

当处理长周期任务时，Agent会面临“认知空间窒息”和“不可逆的噪声污染”的挑战，导致推理能力下降，最终难以完成真正长程、复杂的研究任务。

为此，通义团队构建了一套以合成数据驱动、贯穿预训练与后训练的完整训练链路。

该链路以Qwen3-30B-A3B模型为基座进行优化，团队创新性地设计了覆盖真实环境与虚拟环境的RL算法验证与真实训练模块，并结合高效异步强化学习算法及自动化数据策展（Data Curation）流程，显著提升了模型的迭代速度和泛化能力。

在推理阶段，团队设计了ReAct和基于自研的IterResearch的Heavy两种模式。

前者用于精准考察模型的基础内在能力，后者则通过test-time scaling策略，充分挖掘并展现了模型所能达到的性能上限。

即使在长任务中，也能实现高质量的推理。

目前，在Humanity's Last Exam（HLE）、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA以及Frames等权威Agent评测集上，通义DeepResearch模型以3B激活参数，性能超越基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent。

今年以来，阿里已连续开源WebWalker、WebDancer和WebSailor等多款检索和推理智能体，并全部斩获开源SOTA成绩。

©本站发布的所有内容，包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等，除特别标明外，均来源于网络或用户投稿，版权归原作者或原出处所有。我们致力于保护原作者版权，若涉及版权问题，请及时联系我们进行处理。

阿里开源首个Agent模型“通义DeepResearch”，模型框架方案全面开源

相关推荐

智库专家

解决方案