当 OpenAI Sora 一夜搅得 AI 视频生成界天翻地覆,Runway 等老牌 AI 视频生成巨头反倒有些「销声匿迹」。
昨天深夜,Runway 放出酝酿了半年的全新版本 Gen-3 Alpha,也让我们再次见证了这些巨头的底蕴。
Runway Gen-3 Alpha 特点如下:
高保真视频生成:能够生成接近真实世界质量的视频内容,具有高度的细节和清晰度。
精细动作控制:模型能够精确控制视频中对象的动作和过渡,实现复杂场景的流畅动画。
逼真人物生成:特别擅长生成具有自然动作、表情和情感的逼真人类角色。
多模态输入:支持文字转视频、图像转视频、文字转图像等多种创作方式。
先进工具:支持运动画笔、相机控制和导演模式等专业创作工具。
增强的安全措施:引入新的内部视觉审核系统和 C2PA 标准,确保内容的安全性和可靠性。
高质量训练:使用高描述性的、时间密集的字幕进行训练,使模型能够理解和生成具有丰富时间动态的视频。
Gen-3 Alpha 更懂物理世界,更少 Bug 了
不看广告,看疗效,先来感受一下全新版本带来的视觉冲击。
Prompt: Subtle reflections of a woman on the window of a train moving at hyper-speed in a Japanese city. 一位女士的身影在日本城市中疾驰的火车窗上轻轻映现。她的轮廓在灯光的映照下显得格外柔和。目光似乎穿透了玻璃,凝视着外面那个快速后退的世界。
Prompt: An astronaut running through an alley in Rio de Janeiro. 一条狭窄的小巷里,突然闯入了一位身穿太空服宇航员,奔跑在热情奔放的里约热内卢小巷中。
Prompt: FPV moving through a forest to an abandoned house to ocean waves.
镜头以第一人称视角,带领我们穿越茂密的森林,阳光透过树叶的缝隙,洒下斑驳的光影。 经过一座被岁月遗忘的荒废小屋,然后继续前行,直到视野突然开阔,一片波涛汹涌的大海展现在眼前,颇有几分「柳暗花明」的那股意味。
Runway 承诺上述所有视频均使用 Gen-3 Alpha 生成,未进行任何修改。
从官方分享的视频来看, 这些演示视频在质量上有了显著的提升,无论是对 AI 视频生成难以把控的夜景灯光,还是景别的流畅切换,Gen-3 Alpha 都称得上尽善尽美。
甚至在文字生成上也看得出来有下足了一番功夫。
更重要的是,据 @iamneubert 透露,Gen-3 Alpha 模型的生成速度非常之快。官方分享的演示视频普遍徘徊在 10 秒水平线上,而这 10 秒视频只需要 90 秒的时间就能快速生成。
另外,不用担心这个新版本只是一个光看不能用的「期货」,因为 Runway 官方表示,Gen-3 Alpha 将在未来几天内向所有人推出。
昨日的 AI 王者,今日的过客?
Gen-3 Alpha 是 Runway 即将发布的一系列新模型的先行军。
据官方介绍,这些模型是在专为大规模多模态训练量身定制的新基础设施上训练而成的。
相比于 Gen-2,它在逼真度、稳定性和动态表现上都有显著提升,并且朝着构建通用世界模型的方向迈进了一步。 |