Databricks OpenSharing 直指企业 AI 的“集成税”

作者: CBISMB

责任编辑: 邹大斌

来源: CBISMB

时间: 2026-06-12 12:43

关键字: AI 数据 Databricks OpenSharing

浏览: 0

点赞: 0

收藏: 0

Databricks 本周推出了 OpenSharing,这是一项全新的开放协议,旨在让企业能够在不同平台之间共享 AI 模型、Agent Skill、仪表板和非结构化数据,而无需复制或移动这些资产。

这一共享功能由 OpenSharing 的“零复制凭证分发模型”(zero-copy credential vending model)实现。该公司在其 GitHub 页面上写道,该模型允许接收方使用临时的、有范围限制的凭证,直接从提供方的云存储中安全地访问共享资产,从而避免了资产本身被复制、移动或重复。

降低企业 AI 的“集成税”

HFS Research 的高管研究负责人 Ashish Chaturvedi 表示,能够在不创建重复副本的情况下共享 AI 资产有助于降低集成复杂性、改善治理并限制 CIO 在跨环境部署 AI 系统时面临的运营开销。

Chaturvedi 说道:“每个正在构建 AI 的组织,例如多代理系统(multi-agentic systems),都撞上了同一堵墙,即模型、技能和使用者位于三个不同的平台上。集成成本(Integration tax)是巨大的,并且随着每一个新合作伙伴、客户或内部团队的加入,这一成本会呈指数级增长。”

Futurum Group 的首席 CIO 实践分析师 Dion Hinchcliffe 附和了 Chaturvedi 的观点,他指出,运营开销的减少可以帮助 CIO 削减围绕 AI 部署的隐性集成成本:“如今,隐性成本不仅仅是模型开发。它还包括在组织边界之间部署 AI 资产所需的无休止的打包、转换、同步和治理工作。”

从数据共享到 AI 资产共享

HyperFRAME Research 的 AI 栈实践负责人 Stephanie Walter 表示,随着企业开始将 AI 资产视为需要共享的业务资产,这种成本降低变得尤为重要。

Walter 说:“企业很快意识到,价值不再仅仅在于数据集本身,而在于围绕数据集构建的受治理的上下文、逻辑和智能。现有的方法可以很好地共享数据集,但它们往往无法解决更广泛的 AI 套件问题。”

她补充道:“OpenSharing 与这一转变方向一致,因为它将共享模式从表和文件扩展到了为 AI 工作流提供动力的各类制品(artifacts)。”

对 Hinchcliffe 来说,这种一致性应该有利于试图在其系统中部署 AI 的 CIO:“CIO 越来越想要 AI 供应链,而不是像以前那样孤立的数据湖。”

此外,Chaturvedi 指出,新协议可以帮助 CIO 加速 AI 投资的货币化。

他说:“对于 CIO 来说,你能以多快的速度在合作伙伴、子公司和客户之间共享 AI 资产,决定了你能以多快的速度将 AI 投资变现。如果共享一个代理技能需要六周的集成工作,你就已经错失了窗口期。如果它只需要一个协议调用,你就把 AI 变成了一个分发生意。”

OpenSharing 如何简化 AI 开发

然而,要实现这些好处,需要开发者更高效地在不同平台之间移动 AI 资产。分析师指出,OpenSharing 降低集成复杂性的能力可以显著提高生产力。

Walter 表示:“开发者生产力取决于减少平台转换工作。开发者不希望为每一个使用环境重建同一个资产,企业也不希望每一次与合作伙伴或客户的互动都变成一场平台迁移对话。”

事实上,Chaturvedi 认为该协议在行业中是独一无二的,因为它“没有其他开放协议将代理技能和 AI 模型作为可共享、可治理的对象来覆盖”。

相比之下,Walter 认为该协议的开放性更具新意。他说:“更有趣的是这种组合:一个开放协议、跨平台互操作性、Linux 基金会的治理,以及一个超越数据集的更广泛的资产模型,它涵盖了 AI 模型、代理技能、仪表板、应用程序和非结构化数据。”

“新意不在于 Databricks 发明了共享、零复制访问或类似市场的分发。这些能力在市场上以各种形式已经存在,”Walter 说,并指出了 Snowflake 的 Zero-Copy 集成功能。

但他指出,区别在于,Snowflake 只有在提供方和接收方都在 Snowflake 平台上时才允许数据复制。

Walter 补充道,有了 Databricks 的 OpenSharing,数据就可以跨平台复制。

OpenSharing 是 Databricks 现有 Delta Sharing 协议的演进,目前是 Linux 基金会 AI & Data 基金会的一个沙盒项目,并已在 GitHub 上提供。

其当前可用的连接器列表包括 Python、Apache Spark、Tableau、PowerBI、Snowflake、DuckDB、Clojure、Node.js、Java、Arcurate、Rust、Go、C++ 和 R。

预计很快将有更多连接器全面上市,包括 Google Spreadsheet、Excel、Airflow 和 Lakehouse Sharing。

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。