openai 和谷歌在ai领域持续发力,openai 推出sora,谷歌推出veo2,但sora的高昂价格和veo2的封闭测试引发热议。 与此同时,一家中国公司图森未来却选择开源其图生视频大模型——ruyi。
Ruyi-Mini-7B版本已可在Hugging Face平台下载:https://www.php.cn/link/5c6a2ff5001c13fb4b0425a45e5b8e11 GitHub代码链接:https://www.php.cn/link/a47cc7b881ce40bc6ba3e71d5d47fbf1 官方还提供部署说明和ComfyUI工作流,支持消费级显卡运行。
官方Demo展示了Ruyi强大的生成能力,包括逼真的写实人物、动画角色和自然风景等:
Ruyi性能测试:
Ruyi基于单张图片即可生成最高720P、时长5秒的视频,支持任意长宽比。 它支持多起始帧和结束帧,可生成任意长度视频,并提供运动幅度和镜头控制选项。
在写实风格、影视剧照、动画风格、动物和风景等方面,Ruyi展现了不错的生成能力,但仍存在一些不足,例如手部畸形和细节缺失。
图森未来转型:
图森未来,一家原智能驾驶公司,于今年8月进军ACG市场,并成立生成式AI部门。Ruyi的开源,体现了其将自动驾驶技术经验应用于AI生成领域的策略。
Ruyi基于DiT架构,参数量约7.1B,训练数据约200M个视频片段。 图森未来计划于2025年推出闭源模型Ruyi Standard及相关工具,2026年发布更强大的版本。
视频链接:https://www.php.cn/link/6863f2f626660f54ec03d557f9b79bd6
以上就是智驾公司下场搞AI视频生成,模型上线即开源的详细内容,更多请关注其它相关文章!