深耕端侧与开发者生态,微软 Build 大会发布全新推理、代码 AI 模型

作者: CBISMB

责任编辑: 曹新玲

来源: CBISMB

时间: 2026-06-03 11:32

浏览: 0

点赞: 0

收藏: 0

在 2026 微软 Build 全球开发者大会上,微软自研 MAI 全系列 AI 模型迎来重磅扩容,微软旗下超级智能研发团队一次性推出通用推理大模型 MAI‑Thinking‑1、适配开发场景的专用代码模型 MAI‑Code‑1,同时迭代升级图像、语音、语音转写多款生成模型产品,补齐自身 AI 基础模型产品线,实现从图像、语音到复杂逻辑推理、编程开发的全场景技术布局。

近一年来微软持续迭代 MAI 自研模型体系,先后落地初代通用预览模型、语音生成、语音转写、两代图像生成产品。其中前代 MAI‑Image‑2.5 凭借画面细节、商用渲染、插画优化三大升级完成商用落地。本次新增推理与代码两大核心品类,叠加现有产品线版本更新,微软正式搭建起覆盖多模态生成、逻辑推理、编程开发的完整企业级模型生态。

作为微软首款原生从零训练的通用推理模型,MAI‑Thinking‑1 无任何外部模型蒸馏,训练素材全部选用经过合规清洗、具备商用授权的企业数据源,精准匹配政企客户的数据合规落地需求。该模型定位中等参数量规格,激活参数达 350 亿,最大上下文窗口拓展至 128K,擅长超长文本理解、多步骤链式逻辑运算、配套代码生成等硬核业务场景。


微软没有公开全套量化跑分数据,但引用第三方盲测结论:综合体验层面,业内评测人员实际使用偏好优于 Claude Sonnet 4.6;在 SWE‑bench Pro 专业代码测评中,编码实力对标 Claude Opus 4.6。现阶段该模型依托 Microsoft Foundry 平台,定向对受邀企业客户开启专属内测。

图像产品线方面,此前落地的 MAI‑Image‑2.5 以及极速轻量化版本已面向全量开发者开放调用。第三方权威生成模型排行榜 Arena 数据显示,该文生图产品综合实力超越谷歌 Nano Banana Pro,稳居行业前三。产品现已深度嵌入 PowerPoint,后续还将落地 OneDrive,赋能 Office 全家桶智能配图需求。

语音相关产品迎来双线迭代:此前 4 月上线的初代语音转写模型 MAI‑Transcribe‑1 仅覆盖 25 门高频语种,新版 MAI‑Transcribe‑1.5 识别精度实现行业领跑,支持语种扩容至 43 种,官方后续还会新增实时流式转写能力,适配直播、实时会议等刚需场景。语音合成产品线全新迭代 MAI‑Voice‑2 及其极速版,相较上一代新增 15 种以上语种音色,丰富的发声风格可覆盖智能客服、影视配音、终端助手等多元化商用场景。

聚焦程序员生态的 MAI‑Code‑1 专为 GitHub 开发环境定制优化,目前已经原生接入 GitHub Copilot 与 VS Code 编辑器,全程助力代码补全、项目重构、日常开发等工作。这款自研代码模型落地,标志着 GitHub Copilot 底层算力来源摆脱单一外部厂商依赖,微软开始大规模自研底座赋能自家开发工具。

分发布局上,MAI 全系除依托 Microsoft Foundry 自营渠道面向政企与开发者售卖服务,还将陆续入驻 Fireworks AI、Baseten、OpenRouter 等主流第三方模型平台;Fireworks AI 也完成在 Foundry 平台正式商用部署,丰富企业用户私有化、多云部署方案。多渠道合作进一步降低开发者接入成本,加速自研模型跨生态规模化落地。

依托全品类 MAI 产品,微软完成推理、编程、语音、转写、图像一站式企业 AI 能力闭环。两款全新模型落地之后,微软在复杂业务推理、开发者工具赛道的技术竞争力大幅提升,同时为 Office、GitHub 全系生态筑牢自研 AI 底层底座。

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。