从RAG到本体:Databricks押注上下文,打造可信AI智能体
作者: CBISMB
责任编辑: 邹大斌
来源: CBISMB
时间: 2026-06-18 12:23
浏览: 0
点赞: 0
收藏: 0
从向量数据库到检索增强生成(RAG),企业AI的下一个前沿正在成形:上下文层——它赋予自主智能体对企业业务的共享理解。Databricks正通过Genie Ontology推进这一愿景。
Genie Ontology目前处于预览阶段,能够从企业数据、仪表盘、查询、数据管道、文档和应用程序中自动提取业务上下文,并将其组织成一个动态图谱,供AI智能体理解组织的运作方式。该产品在Databricks Data + AI峰会上展示,采用了一套受Google PageRank启发的排名系统,用于识别组织内最具权威性的业务定义。
Databricks CEO Ali Ghodsi在演讲中解释,Genie Ontology并非平等对待所有数据源,而是综合考虑信息创建者、使用广泛程度、与认证数据集和资产之间的关联,以及信息最近更新时间等多种因素,然后判断AI智能体应当依据哪个答案。企业还可以通过Databricks现有的Unity Catalog Semantics平台,将自己的业务定义或本体上传到Genie Ontology。
本体承诺一致性,但就绪程度仍是障碍
对CIO而言,像Genie Ontology这样的统一上下文层将显著提升企业AI部署的一致性、可信度和治理水平。
Moor Insights and Strategy首席分析师Michael Leone表示:"一个定义驱动所有智能体,意味着你不再会因同一个问题得到三个不同的答案。RAG和向量搜索等早期方案只是拉回看起来与你的问题相似的内容,它们并不真正理解你的业务。本体赋予智能体的是目录无法提供的东西——你的术语含义,以及该信任哪个数据源。"
HFS Research执行研究负责人Ashish Chaturvedi认为,这种一致性的提升也能改善信任,而信任仍然是AI采用中最关键的障碍之一。他说:"企业AI采用最大的障碍是决策者对AI输出不够信任,不敢不经核对就据此行动。一个基于受治理的业务定义、可追溯数据血统的本体,直接攻击了这一信任赤字。"
不过,Leone对信任这个话题更加谨慎:"这是一个有前景的想法,但它还需要证明自己,我才会在任何重要事务上依赖它。"
HyperFRAME Research的AI栈实践负责人Stephanie Walter同样指出,本体存在一个缺失环节,那就是验证:"本体可以改善上下文,但并不能保证答案正确。智能体仍可能抓取不完整的数据、运用错误的逻辑、跳过数据行、误解工作流或采取错误行动。"
Leone认为,这个验证缺口变得更加关键,因为大多数企业并不具备实施AI部署本体层所需的数据和治理就绪度:"如果你的数据和治理还没理顺,这只会加速你现有的混乱。"
Walter也支持这一观点,指出本体本身无法修复混乱的定义、糟糕的血统、薄弱的归属权或碎片化的权限。此外,这位分析师指出,CIO面临的真正难题不是一次性创建本体,而是在业务变化时保持其准确性:"企业需要清晰的数据归属、指标归属、领域专业知识、治理流程,以及解决定义冲突的机制。否则,本体只会成为另一个冠以更复杂名称的陈旧元数据项目。"
CIO面临的困惑风险日益增加
除了数据和治理就绪度之外,分析师指出,随着多家技术厂商推出类似于Genie Ontology的方案来将企业AI扎根于业务上下文,CIO还面临着日益增长的困惑风险。
过去一年中,Snowflake、微软等公司纷纷推出了某种形式的本体、语义和上下文层产品。但Leone表示,问题在于这些产品的命名方式:"大家都在同一个理念上贴了不同的名字,这会拖慢进度,制造混乱。"
IT咨询公司Kanerika联合创始人兼CRO Bhupendra Chopra认为,这种困惑也可能反噬Databricks和其他厂商:"虽然营销已经围绕上下文构建产品收敛,但大多数企业会选择数据已经存放的平台。"
HFS Research的Chaturvedi进一步强调这一观点,指出CIO不应孤立地评估本体产品,而应该坚持'上下文层跟随数据重心'的原则:"如果你的数据在Databricks,Genie Ontology就是你的路径;如果在Snowflake,就是Horizon Context;如果你是微软阵营,就是IQ产品家族。"
此外,Chaturvedi敦促CIO超越功能层面,评估这些产品的开放性和可移植性,特别是在多平台环境中,业务定义可能需要在数据湖仓一体、分析工具和AI平台之间迁移。这也是Chaturvedi认为Snowflake区别于竞争对手的地方——Snowflake专注于开放语义互操作性,旨在降低企业演化数据和AI分析栈时面临的语义锁定风险。
AI控制面的争夺战
不过,分析师指出,Snowflake的差异化努力至少让CIO关注到了一场合更大的竞赛:包括Databricks在内的厂商正争夺企业AI的控制面。
Chaturvedi表示,Snowflake正试图通过Snowflake Intelligence、Horizon Catalog及其对开放语义互操作性的推动,将自己定位为AI控制层;而微软则通过Work IQ、Fabric IQ和Foundry IQ等产品,在其Copilot、Fabric和更广泛的AI栈中嵌入业务上下文和治理。
Chaturvedi指出,Databricks的Genie Ontology同样是类似战略的一部分,他敦促CIO将其置于公司整体战略的背景下看待——将湖仓一体平台定位为企业AI智能体构建、治理和最终部署的基础。"这绝对是一个控制面的布局。当你把Databricks本次峰会上的所有发布串联起来,包括LTAP、OpenSharing和Genie Ontology,你看到的是一个企业数据、治理、业务语义和智能体执行全部汇聚的单一平台。"
Chaturvedi进一步指出,这一控制面战略反映了Ghodsi更广泛的愿景——数据平台可以演化为一种"智能体系统记录",即AI智能体读取、推理和行动所依赖的权威来源。这一概念与早期平台变革相呼应:ERP系统成为业务交易的系统记录,数据仓库成为分析的系统记录。Chaturvedi认为,下一场争夺战将围绕哪个平台成为企业AI智能体的系统记录展开。
Moor Insights and Strategy的Leone也认同数据平台具备争夺这一角色的优势,因为它们已经拥有智能体大规模安全运行所需的数据、治理控制、数据血统和权限。
尽管如此,分析师们提醒,仅有上下文并不能决定哪家厂商最终胜出。Walter总结道:"下一个企业AI战场不仅仅是上下文,而是可验证的执行。"