中国投资网快讯研究人员研发首个视觉、语言、音频和动作多模态模型 Unified-IO 2

研究人员研发首个视觉、语言、音频和动作多模态模型 Unified-IO 2

作者: hao333 发布:2023-12-30 17:43:49 1163阅读 4771评论

据新智元 12 月 30 日报道，来自艾伦人工智能研究所、伊利诺伊大学厄巴纳 - 香槟分校、华盛顿大学的学者提出了 Unified-IO 2。据悉，Unified-IO 2 是首个具备理解和创造图像、文本、音频以及动作能力的自回归多模态模型。 Unified-IO 2 在 GRIT 基准测试中取得了 SOTA，在超过 30 个基准测试中展现出了卓越的性能，包括图像生成与理解、文本理解、视频和音频理解以及机器人操作等领域。研究人员会将这些模型开放给研究社区，共同推动科学研究的进展。

本文来自网络，不代表本站立场，转载请注明出处：https://news9.com.cn/n/a87649.html

4453赞

研究人员研发首个视觉、语言、音频和动作多模态模型,Unified-IO,2

中国投资网后续将为您提供丰富、全面的关于研究人员研发首个视觉、语言、音频和动作多模态模型,Unified-IO,2内容，让您第一时间了解到关于研究人员研发首个视觉、语言、音频和动作多模态模型,Unified-IO,2的热门信息。小编将持续从百度新闻、搜狗百科、微博热搜、知乎热门问答以及部分合作站点渠道收集和补充完善信息。

研究人员研发首个视觉、语言、音频和动作多模态模型,Unified-IO,2

相关文章