“开放AI”模型正在迎头赶上大语言模型(LLMs)

作者: CBISMB

责任编辑: 邹大斌

来源: CBISMB

时间: 2026-05-20 14:09

关键字: AI 大模型 OpenAI

浏览: 0

点赞: 0

收藏: 0

虽然像OpenAI的ChatGPT和谷歌的Gemini这类专有AI模型依然流行,但随着IT领导者们开始寻求定制化AI并控制成本,风向可能正在转向开放模型。

分析人士指出,这些作为大语言模型(LLMs)替代方案的模型,有时也被称为“开放权重模型(open-weight models)”,能为决策者提供闭源模型所不具备的、对内部AI使用情况的更高透明度和掌控力。它们还能帮助IT领导者更好地把控组织内部AI的经济成本和治理规范。

Gartner的高级总监分析师Deepak Seth表示:“这就像现在提供了空白的画布,然后你可以自己在上面作画。你不必从零开始去制造这块画布。所以即使是在构建自己的模型时,你也并非完全白手起家。”

开放模型可以免费下载和使用。用户可以对其进行调整和部署,以满足自身需求,这类似于Linux操作系统可供任何人下载、修改和使用的方式。

AI工具公司Jozu的联合创始人兼首席运营官Jesse Williams表示,开放模型之所以越来越受青睐,是因为适用于它们的用例正在不断涌现。Williams说:“开源更加灵活,并且可以用在一些专有模型……在某些情况下无法被信任去运行的场景中。”

他补充道:“专有模型的使用率和普及速度比我们见过的任何技术都要快,并且没有任何放缓的迹象。”他强调,开放模型日益增长的流行度不应被简单地视为对大语言模型(LLMs)的一种反弹。

一些热门的开放模型包括Meta的Llama、Mistral、DeepSeek和Minimax。专有的生成式AI提供商也发布了他们大语言模型的开源版本:谷歌的Gemma是Gemini的衍生产品,OpenAI推出了GPT-OSS,微软则有Phi。

ManpowerGroup的数据科学与AI解决方案负责人Max Leaming表示,尽管这些模型可以进行微调以满足特定的企业需求,但它们并不会公开其训练所用的数据源。与专有LLM相比,谷歌和OpenAI提供的开放模型是在较少的数据量上进行训练的,可能没那么“聪明”。因此,开放模型需要通过实验来寻找合适的应用场景。“这个模型擅长什么?你必须自己弄清楚。它们没有一个是真正的通用模型。”

包括ServiceNow、微软、HubSpot和RWS在内的公司认为,开放模型更容易融入AI基础设施,能够降低计算成本,并且对AI智能体(agentic AI)的工作流程更加友好。

Gartner的高级研究总监Max Goss表示,Anthropic和OpenAI等闭源模型提供商最近发生的宕机事件,也迫使首席信息官(CIO)们开始思考供应商锁定(vendor lock-in)的问题,以及增加开放模型以构建AI韧性的必要性。他说:“AI竞赛仍处于早期阶段”,并补充道,“CIO们确实需要注意他们将AI用于什么用途,以及备选方案是什么,后备计划又是什么?”

由于成本更低且安全性更好,开放模型通常是本地化部署(on-premise deployment)的不错选择。ManpowerGroup的Leaming说:“我也不用担心将我们的数据暴露给提供商,因为他们可能会利用这些数据……字面意义上地,去训练模型来供我们的竞争对手使用。”

英伟达物理AI模拟副总裁Rev Lebaredian表示,这些模型还可以在机器人领域发挥作用,为机器人之间的通信提供一种通用语言。他在今年早些时候公司GTC贸易展前的媒体简报会上发表了这一观点。

Lebaredian称,英伟达的AI机器人技术栈在很大程度上是开源的,这“能够将整个机器人生态系统连接在一起”。

开放模型也在欧洲及其他地区推动数字主权的过程中扮演着重要角色。例如,法国正将其主权AI战略押注在Mistral上,而阿联酋则拥有K2 Think V2,该模型由穆罕默德·本·扎耶德人工智能大学(MBZUAI)、G42和芯片公司Cerebras Systems共同开发。

MBZUAI基础模型研究所的副总裁兼常务董事Richard Morton表示,开放模型对主权AI至关重要,这样各国才能理解、调整并掌控驱动其数字基础设施的系统。

MBZUAI的K2 Think V2赋予了各国构建符合自身优先事项、语言、价值观和安全需求的AI的能力。Morton说:“对我们而言,主权归根结底是关于对技术本身拥有实质性的所有权。”

尽管人们对开放模型的兴趣日益浓厚,但它们确实也带来了一些安全风险。根据英国科学、创新和技术部以及AI安全研究所发布的一项研究,恶意行为者可能会利用恶意提示词(malicious prompts)来黑入系统,或者利用AI技术发起攻击。

这项由深度学习先驱Yoshua Bengio主持的研究指出,存在漏洞的缺陷模型可能会成为黑客攻破企业系统的入口。该研究表示:“与主机可以统一推出修复补丁的闭源模型不同,开放权重模型的开发人员无法保证用户会采纳更新。”

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。