据站长之家 12 月 15 日 消息,阿里巴巴在 11 月份发布了论文,宣布将开源 I2 VGen-XL 图像生成视频模型。如今,他们终于发布了具体的代码和模型。这一模型可以生成没有大幅人物动作的视频演示。 I2 VGen-XL 模型分为两个阶段。首先是基础阶段,该阶段通过使用两个分层编码器来保证连贯的语义,并保留输入图像的内容。其次是优化阶段,该阶段通过整合额外的简短文本来增强视频的细节,并将分辨率提高到 1280 x720。 代码地址:https://github.com/damo-vilab/i2vgen-xl
阿里图像生成视频模型 I2VGen-XL 代码发布
本文来自网络,不代表本站立场,转载请注明出处:https://news9.com.cn/n/a80635.html