资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

4月1日,Runway 推出了新视频模型:Gen-4

据官方介绍,Gen-4 与上一版本 Gen-3 Alpha 模型相比有显著改进。它能够生成具有逼真动作的高度动态视频,并且主题、对象和风格一致,具有出色的即时一致性和一流的世界理解能力。

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

4月8日,Runway再次宣布推出新版本 :Gen-4 Turbo。官方称Gen-4 Turbo是其迄今为止最强大的视频生成模型。Gen-4 Turbo 不仅延续了 Gen-4 系列的图像到视频生成优势,而且且速度比 Gen-4 快 5 倍。

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

不过,Gen-4和Gen-4 Turbo 目前均仅支持单图生成视频。那么今天,我们将使用国内的可灵Kling-1.6标准版与 Gen-4 、Gen-4与Gen-4 Turbo进行对比,让大家直观感受在单图生成方面哪个模型表现更为优越。

对比实测:

(以下实测统一使用英文提示词,且均取自第一次生成效果,实测结果仅供参考)

实测1:奇幻童话场景

提示词:The candy falls, the rabbit looks at the candy, and finally the candy drops and the rabbit jumps down, keeping the camera still

(参考翻译:糖果掉下来,兔子看着糖果,糖果掉完后兔子跳了下来,镜头保持不变)

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

Kling-1.6 VS Gen-4:

效果对比:Kling呈现的效果视频里两个兔子脸部出现了扭曲,而Runway主体脸部保持较高。从主体一致性以及场景流畅度综合看,本轮是Runway Gen-4略占优势。

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

Gen-4 VS Gen-4 Turbo:

效果对比:从糖果落下、兔子跳等综合效果看,Gen-4还是比Gen-4 Turbo更胜一筹。

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

实测2:电影级场景

提示词:At sunset, the man’s car slowly drives forward, and the camera gradually pulls away

(参考翻译:日落时分,男人的车缓缓向前开着,镜头逐渐移开)

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

Kling-1.6 VS Gen-4:

效果对比:Runway Gen-4呈现的效果主体、场景变化有所局限,尤其是车子和镜头需要同时运动变化的要求下,仅能看出镜头有变化。相比之下Kling表现更好,但其车子移动轨迹的流畅性仍需改进。

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

Gen-4 VS Gen-4 Turbo:

效果对比:镜头移动、画面布局等效果基本相似,这一轮平手

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

实测3:人物写实场景

提示词:The camera follows the girl as she stands up and walks forward

(参考翻译:女生站起来往前走,镜头跟随移动)

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

Kling-1.6 VS Gen-4:

效果对比:前半段Kling的表现相对稳定的,但在后半段突然来一个“闪现”转身。Runway则是一直未遵循提示词展现站立后走路的动作,两者在人物写实场景中的表现均显平平

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

Gen-4 VS Gen-4 Turbo:

效果对比:Gen-4 Turbo倒是遵循提示词站起来了,但是动作可以说很“怪异”,本轮只能算平手。

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

实测4:动漫场景

提示词:The camera zooms in as the girl picks up her bag and prepares to get off (参考翻译:女孩拿起书包,准备下车,镜头逐渐拉近)

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

Kling-1.6 VS Gen-4:

效果对比:Runway完全“崩”了,后半段人物主体从漫画风直接变成写实风。尽管在执行“女孩拿起书包”的提示词时,Kling的风格转换显得不够自然,但整体效果仍然保持了一定的风格一致性,因此这轮Kling更胜一筹。

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

Gen-4 VS Gen-4 Turbo:

效果对比:Gen-4 Turbo提示词遵循不足,两个模型的表现都不好,存在不同的问题。

资讯丨四大场景对比Gen-4/Gen-4 Turbo/Kling-1.6的图生视频效果,这次谁破防了?!

实测总结:

实测结果统计:

奇幻童话场景电影级场景人物写实场景动漫场景
Gen-4 VS Kling-1.6 VS Gen-4 Turbo
Runway Gen-4
(提示词遵循差)
Kling-1.6
(人物动作不合理)
Runway Gen-4 Turbo
(人物肢体不合理)

基于以上实测结果,可初步得出以下结论:

(1)图片素材若具备动态感,模型整体表现佳

如实测1所示,在图片素材本身具备动态感的情况下,三个模型的生成效果整体皆较理想,仅在细节上会有差异。

(2)Kling-1.6电影级场景遵循提示词表现更优

在氛围浓郁的电影级场景中,精准遵循提示词并始终保持场景氛围才能满足用户的实际需求。而在实测中首先所有模型均能保持日落的场景氛围,但在提示词遵循方面Kling表现更出色,而Runway两个版本模型效果几乎相似。

(3)人物写实场景中动作关键部分表现欠佳显局限

在人物写实场景里,人物的肢体动作与脸部表现无疑是非常重要的。然而在实测中,三个模型在这方面的表现都较差:Kling动作肢体变化不合理、Gen-4 未准确遵循提示词且动作不协调、Gen-4 Turbo人物动作怪异。这也表明图生模型在人物写实场景实际应用中的局限性。

(4)Gen-4 风格一致性能力差

风格的一致性是广大受众颇为关注的要点。但在实测的动漫场景中,Runway Gen-4 未能有效保持风格的一致性,而Gen-4 Turbo未遵循提示词,无法得出结论。Kling尽管人物动作切换上略显生硬,但总体保持了风格的一致性。

Like (0)
302.AI302.AI
Previous 2025 年 4 月 8 日 上午11:22
Next 4天前

相关推荐

  • 资讯丨QwQ-32B & DeepSeek-R1 & QwQ-Plus 神仙打架,到底谁更出色?看实测揭秘真相

    3月6日,阿里开源了新推理模型—— QwQ-32B。QwQ 是 Qwen 系列的推理模型,具备思考和推理能力。其优势是推理速度快,在数学、编程和通用任务推理方面表现出色,整体性能比肩DeepSeek-R1。 与此同时,阿里云开放平台还放出了一个名为 QwQ-Plus 的模型,官方描述这是基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提…

    2025 年 3 月 12 日
    38100
  • 什么是RAG?什么是GraphRAG?一文带你读懂知识库机器人原理

    在人工智能领域,知识库机器人已经成为推动智能化发展的重要力量。它们能够高效地处理海量信息,为用户提供精准、及时的知识服务。今天,我们将一起揭开知识库机器人的神秘面纱,探讨知识库机器人的原理。 什么是RAG? 知识库的整套技术在学术界有一个专业名词,叫RAG,即Retrieval-Augmented Generation,翻译成中文就是检索信息增强,是一种将信…

    2024 年 9 月 11 日
    77500
  • 资讯丨302.AI与硅基流动合作:用户可在302.AI平台直接使用硅基流动所有模型

    近日,302.AI与硅基流动官方正式达成合作!通过此次合作,用户可以在302.AI平台直接采购或使用硅基流动的模型,享受与硅基流动官方一致的价格,且能够直接使用302.AI平台上的余额进行支付,无需额外充值或支付任何附加费用。 302.AI是一个企业级的AI应用平台,提供按用量付费的服务模式,汇集了全球各类AI模型,开发出多种开箱即用的AI机器人和AI工具。…

    2025 年 1 月 15 日
    47500
  • 提升AI协作效率,国内用户如何使用Artifacts功能?

    最近,由于汉语新解prompt的爆火,让Claude模型再次受到广泛关注。 提到Claude,或许大多数用户都会联想到Claude Artifacts,Anthropic在官网宣布推出Claude 3.5 Sonnet的同时,也宣布将在 Claude.ai上推出Artifacts功能,这一功能在用户请求Claude生成代码、文档或网站设计时,能够将这些生成的…

    2024 年 9 月 19 日
    58400
  • 资讯丨不会PS也能秒做矢量图,用302 AI 矢量图生成工具卷翻设计圈!

    在设计领域,矢量图以其高清晰度和灵活性成为不可或缺的设计元素。但传统的矢量图制作过程不仅需要专业的设计工具,还需设计师具备一定的技术水平。 相比传统的矢量图制作方式,302.AI推出的 ⌈ AI矢量图生成 ⌋,不仅操作极其简单,生成的矢量图质量还可达到专业级别。 此外,302.AI还提供按需付费无订阅的服务模式,用户可以根据自身业务需求灵活选择使用,具备极高…

    2025 年 2 月 18 日
    27800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注