微软推出人工智能模型 CoDi，可互动和生成多模态内容

20230725163554b2b68173937028a90de0265180b16a2ab6b4dd278

7 月 11 日消息，微软近日发布新闻稿，推出了名为可组合扩散模型（CoDi），这是一种独特的、基于可组合扩散的人工智能模型，其设计目标是互动和生成多模态内容。

微软设计 CoDi 的目标，旨在解决传统单一模态 AI 模型的局限性。以同步视频和音频为例，独立生成的信息流拼接在一起时可能存在不一致和对齐的问题。

2023072516295475d7ce7219575e74f57889aeb18af444e5e5dd383

CoDi 采用了独特的可组合生成策略，在扩散过程中对齐多模态，从而生成相互交织的模式，更重要的是，CoDi 能够处理任意输入模式并生成任意模态的内容。

微软推出人工智能模型 CoDi，可互动和生成多模态内容

CoDi 由 Microsoft Azure 认知服务研究团队与北卡罗来纳大学教堂山分校合作开发，也是 Microsoft 项目 i-Code 的一部分，该项目使用人工智能来增强人机交互。

IT之家在此附上 CoDi 项目官方介绍链接，感兴趣的用户可以深入阅读。

文章版权归作者所有，未经允许请勿转载。

没有相关内容!