海印网
海印网

智驾公司下场搞AI视频生成,模型上线即开源

hao123数码00

openai 和谷歌在ai领域持续发力,openai 推出sora,谷歌推出veo2,但sora的高昂价格和veo2的封闭测试引发热议。 与此同时,一家中国公司图森未来却选择开源其图生视频大模型——ruyi。

智驾公司下场搞AI视频生成,模型上线即开源-第1张图片-海印网

Ruyi-Mini-7B版本已可在Hugging Face平台下载:https://www.php.cn/link/5c6a2ff5001c13fb4b0425a45e5b8e11 GitHub代码链接:https://www.php.cn/link/a47cc7b881ce40bc6ba3e71d5d47fbf1 官方还提供部署说明和ComfyUI工作流,支持消费级显卡运行。

智驾公司下场搞AI视频生成,模型上线即开源-第2张图片-海印网

官方Demo展示了Ruyi强大的生成能力,包括逼真的写实人物、动画角色和自然风景等:

智驾公司下场搞AI视频生成,模型上线即开源-第3张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第4张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第5张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第6张图片-海印网

Ruyi性能测试:

Ruyi基于单张图片即可生成最高720P、时长5秒的视频,支持任意长宽比。 它支持多起始帧和结束帧,可生成任意长度视频,并提供运动幅度和镜头控制选项。

智驾公司下场搞AI视频生成,模型上线即开源-第7张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第8张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第9张图片-海印网

在写实风格、影视剧照、动画风格、动物和风景等方面,Ruyi展现了不错的生成能力,但仍存在一些不足,例如手部畸形和细节缺失。

智驾公司下场搞AI视频生成,模型上线即开源-第10张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第11张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第12张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第13张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第14张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第15张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第16张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第17张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第18张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第19张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第20张图片-海印网

图森未来转型:

图森未来,一家原智能驾驶公司,于今年8月进军ACG市场,并成立生成式AI部门。Ruyi的开源,体现了其将自动驾驶技术经验应用于AI生成领域的策略。

Ruyi基于DiT架构,参数量约7.1B,训练数据约200M个视频片段。 图森未来计划于2025年推出闭源模型Ruyi Standard及相关工具,2026年发布更强大的版本。

智驾公司下场搞AI视频生成,模型上线即开源-第21张图片-海印网智驾公司下场搞AI视频生成,模型上线即开源-第22张图片-海印网

视频链接:https://www.php.cn/link/6863f2f626660f54ec03d557f9b79bd6

以上就是智驾公司下场搞AI视频生成,模型上线即开源的详细内容,更多请关注其它相关文章!

Tags: 图片开源

Sorry, comments are temporarily closed!