Oracle 推出无需大语言模型的语义搜索方案
作者: CBISMB
责任编辑: 邹大斌
来源: CBISMB
时间: 2026-04-20 11:58
浏览: 0
点赞: 0
收藏: 0
Oracle 推出了一项名为“可信答案搜索”(Trusted Answer Search)的新服务,该服务优先考虑可控性、可审计性和结果的可预测性,而非生成式 AI 的灵活性。这种方式虽然节省了计算成本,但也增加了数据整理和治理方面的开销。
核心机制:向量搜索取代生成式 AI
Oracle 表示,其新的“可信答案搜索”能够通过向量搜索而非大语言模型和检索增强生成(RAG)技术,在受控的批准文档集中进行搜寻,从而在企业层面大规模地提供可靠结果。
这项服务可供下载或通过 API 访问。Oracle 关键任务数据与 AI 引擎高级副总裁 Tirthankar Lahiri 介绍,其工作原理是让企业定义一个由批准的报告、文档或应用程序端点及其元数据组成的精选“搜索空间”,然后使用基于向量的相似性匹配,将用户的自然语言查询与最相关的预批准目标进行匹配。
Lahiri 表示,与依赖大语言模型的 RAG 系统通常检索原始文本并生成回复不同,“可信答案搜索”的底层系统会以确定性的方式将查询映射到特定的“匹配文档”,提取任何所需参数,并返回一个结构化、可验证的结果,例如一份报告、一个 URL 或一个具体操作。
系统还包含一个反馈循环,允许用户标记不正确的匹配并指定预期结果。
权衡与挑战:可控性与维护成本
Lahiri 认为,企业越来越需要更具确定性的自然语言查询系统,以消除不一致的回复,并为合规目的提供可审计性。
独立顾问 David Linthicum 认同“可信答案搜索”存在潜在市场。他指出:“买家是任何重视可预测性胜过创造性并希望降低运营风险的企业,尤其是在金融和医疗保健等受监管的行业。”
然而,KramerERP 的管理合伙人 Robert Kramer 指出,这种方法也伴随着 CIO 们需要考虑的权衡。他表示,虽然“可信答案搜索”可以通过避免大量使用大语言模型来降低推理成本,但它会将支出转向数据整理、治理和持续维护。
Linthicum 也认为,采用该技术的企业必须在文档整理、分类法设计、审批、变更管理和持续调优上进行投入。
Info-Tech Research Group 的咨询研究员 Scott Bickley 警告了保持整理数据时效性的挑战。他指出:“随着源数据规模不断扩大,纳入更频繁更新的监管更新、供应商认证或市场动态等外部来源内容,且文档数量可能达到数千份时,风险也会随之增加。”
Bickley 补充道:“问题归结为能否在海量数据集中提供精确答案,尤其是在文档在不同版本间可能相互矛盾,或相似的语言在监管语境下含义不同时。提供看似合理但实则错误结果的风险会上升。”
动态数据与市场竞争
不过,Oracle 的 Lahiri 表示,“可信答案搜索”的检索方式可以缓解部分担忧。他表示,该系统并非仅仅依赖需要不断更新的大量静态整理文档,而是可以将“可信文档”视为参数化的 URL,从底层系统中拉取动态渲染的内容。
这使得它能够从企业应用程序、API 或定期更新的 Web 端点等实时数据源生成答案,从而减少对人工维护的文档库的依赖。
Linthicum 并未完全被 Lahiri 的论点说服,他只同意 Oracle 的方法有助于减少内容更新频率。他表示:“在快速发展的领域,保持描述、同义词和映射的时效性仍然需要有纪律的负责人、审批和反馈审查。它可以扩展到数千个目标,但语义重叠会增加维护的复杂性。”
“可信答案搜索”使 Oracle 能够与竞争对手超大规模云服务商的产品展开竞争。Amazon Kendra、Azure AI Search、Vertex AI Search 和 IBM Watson Discovery 等产品已经支持对企业数据进行语义搜索,通常还结合了访问控制和混合检索技术。
HFS Research 的执行研究负责人 Ashish Chaturvedi 指出,这些产品与 Oracle 的一个关键区别在于,竞争对手的产品通常会在其上叠加生成式 AI 功能来生成答案。
企业可以通过下载一个包含向量搜索、用于处理用户查询的嵌入模型以及用于集成到现有应用程序和用户界面的 API 等组件的软件包,来评估“可信答案搜索”。他们也可以通过 API 或内置的图形用户界面应用程序来运行它,该软件包中包含两个基于 APEX 的应用程序:一个用于管理系统的管理员界面和一个面向最终用户的门户。