位置:AI智能

微软推出可互动和生成多模态的人工智能模型 CoDi

作者:CBISMB 责任编辑:芳芳 2023-07-11 10:20:51 来源:ISMB 关键字:微软,人工智能

微软近日推出一款名为可组合扩散模型(CoDi),这是从声音、文字、图像到视频,所有模态被彻底打通,如同人脑一般,实现了真正意义上的任意输入,任意输出的技能,是一种独特的、基于可组合扩散的人工智能模型。

微软设计 CoDi 的目标,旨在解决传统单一模态 AI 模型的局限性。以同步视频和音频为例,独立生成的信息流拼接在一起时可能存在不一致和对齐的问题。

CoDi 采用了独特的可组合生成策略,在扩散过程中对齐多模态,从而生成相互交织的模式,更重要的是,CoDi 能够处理任意输入模式并生成任意模态的内容。

CoDi作为Microsoft项目i-Code的一部分,旨在利用人工智能增强人机交互体验。该项目由Microsoft Azure认知服务研究团队与北卡罗来纳大学教堂山分校共同开发,其设计目标是互动和生成多模态内容。


了解企业级IT资讯,欢迎订阅邮件资讯

IT专家

  • 刘知函

    刘知函

    盈科律师事务所

    北京知识产权研究中心主任

  • 黄雪松

    黄雪松

    戴尔科技集团

    戴尔商用终端解决方案资深产品经理

  • 郝广亮

    郝广亮

    英特尔

    英特尔商用客户端架构师

精彩专题

  • 戴尔丰富APEX

    在今年的DTW上,戴尔科技发布...

    查看详情
  • 数字化需要的UPS

    电力系统问题仍然是造成重大现场...

    查看详情
  • 新数据中心处理器

    至强处理器的安装量已超过一亿—...

    查看详情
  • 戴尔零信任体系

    在过去安全验证是可选的,不是必...

    查看详情

合作伙伴