视频生成模型神仙打架?到底哪家更胜一筹

自从OpenAI发布了正在研发和测试中的文生视频大模型Sora后,AI视频生成工具接连“内卷”,开始”神仙打架“模式。

首先,在当地时间6月12日,Luma创始人官宣并发布新视频模型——Dream Machine。Dream Machine可以在120秒内生成120帧的视频,具备流畅的运动、电影摄影和戏剧效果。6月28日,Luma宣布首尾帧制作加入Dream Machine。

视频生成模型神仙打架?到底哪家更胜一筹

6月27日,Runway推出了新的视频生成基础模型Gen-3 Alpha。该模型可以创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。7月2日凌晨,Runway在官网宣布,其文生视频模型Gen-3 Alpha向所有用户开放使用。

视频生成模型神仙打架?到底哪家更胜一筹

真的可以说是神仙打架啊,既然同样作为视频生成模型,那肯定免不了拿来对比。看下Luma的Dream Machine和RunwayGen-3 Alpha生成的视频对比,均生成自302.AI的AI视频生成器。(prompt:黄昏时分篝火的电影广角镜头。周围是岩石,背景是日落时的森林。)

视频生成模型神仙打架?到底哪家更胜一筹

从以上对比的对比视频来看,可以说不相上下,各有各的优点。接下来再看下来自网络上网友将Gen-3 Alpha、Dream Machine与还未正式开放使用的Sora的对比:

视频生成模型神仙打架?到底哪家更胜一筹

(prompt:一位时尚女性走在东京的街道上,街道上到处都是温暖的霓虹灯和动画城市标识。她穿着黑色皮夹克、红色长裙和黑色靴子,手拿黑色手提包。她戴着太阳镜,涂着红色口红。她自信而随意地走着。街道潮湿而反光,五颜六色的灯光营造出镜面效果。许多行人走来走去。)

如果仅从上面的对比视频来看,三者中小编认为应该是Gen-3 Alpha更胜一筹,当然这并不是最客观的对比。

那Gen-3 Alpha和Dream Machine的价格是怎么样的呢?从Runway和Luma官网中了解到,想要使用Gen-3 Alpha可以选择年包和月包,最低是15美金一个月,只能生成15个视频;而Luma本来还宣称全程免费的但因为太多人登陆使用,限制了每个月只有30次的免费尝试,最关键的是,有可能等了一天都还在排队。如果想要不限制使用,也是有年包和月包选择,最低是30美金一个月。

有人问Gen-3 Alpha和Dream Machine只能选一个的话,会选择哪个呢?这时候小编想起了互联网上的一句话:“小孩子才做选择”,为什么不能都要啊!选择302.AI的AI视频生成器,两个模型一起拿下!(上述Runway与Luma的对比视频正是用这个视频生成器生成的。)

视频生成模型神仙打架?到底哪家更胜一筹

其次,302.AI的AI视频生成器有两种模型可以选择,分别是Luma和Runway,一下满足两种选择,且操作界面简洁易用,就算是小白也能快速上手。接下来看下两种使用方法:

1、文生视频

只需要输入你想要生成的视频内容,点击【生成视频】即可,这种方法不管选择Luma或者Runway模型都适用。

视频生成模型神仙打架?到底哪家更胜一筹

2、图生视频

除了可以通过提示词生成视频外,选择Luma模型还支持图生视频,用户只需要上传两张图片,默认第一张为首帧画面,第二张为尾帧画面,再输入想要生成的视频内容最后点击生成视频即可。

视频生成模型神仙打架?到底哪家更胜一筹

在这场”神仙打架”中,谁更胜一筹,不仅取决于当前的性能指标,更要看谁能持续引领行业发展,满足用户不断变化的需求。在这个快速变化的时代,今天的领先者可能明天就会被超越。据闻Sora将会在今年下半年推出,到时将会更加“内卷”,让我们共同期待,AI视频生成技术将如何开启下一个视觉艺术的新纪元。

Like (0)
302.AI302.AI
Previous 2024 年 7 月 17 日 下午3:36
Next 2024 年 7 月 22 日 下午5:34

相关推荐

  • 资讯丨xAI官宣Grok API开启公测,唯一模型grok-beta表现能否达到预期?

    11月6日,备受瞩目的2024年美国总统选举结果终于揭晓,马斯克公开支持的美国共和党总统候选人特朗普获得最终胜利。 作为特朗普的“榜一大哥”马斯克,是人工智能初创公司xAI的始人之一和主要投资者。在11月4日,xAI刚刚官宣Grok API正式开启公测。 根据xAI公司官方发布的文档,可以看到xAI的API目前只有一个模型——“grok-beta”。 从官方…

    2024 年 11 月 8 日
    7600
  • 当提示词使用”过去时”,就能突破各AI模型的安全防线?

    近日,洛桑联邦理工学院的研究人员发现,当使用AI模型的时候,只要在提示词中把时间设定成过去,就能突破大模型的安全防线。原本只有1%的攻击成功率飙升至88%,几乎达到了“有求必应”的境界。这项发现不仅在英文环境下有效,在中文语境中同样适用,让网友们惊叹于破解大模型漏洞的简便性。 实验中,研究人员从JBB-Behaviors数据集中挑选了100个有害行为,通过将…

    2024 年 8 月 1 日
    19300
  • Genmo推出全球最大开源视频生成模型Mochi V1,实测效果到底行不行?

    10月22日,Genmo在社交媒体平台发布消息,推出最新的开源视频生成模型 Mochi V1。Mochi V1采用创新的 Asymmetric Diffusion Transformer(AsymmDiT)架构,拥有高达100亿个参数,是迄今为止公开发布的最大视频生成模型。 根据Genmo官方介绍,Mochi V1模型在提示词遵循和动作质量方面表现十分出色:…

    2024 年 10 月 28 日
    9400
  • 302.AI带来实时语音便捷方案,让你快速体验AI语音通话

    在10月初,OpenAI在旧金山召开了开发者大会。在发布会中,OpenAI推出了Realtime API 的公开测试版。 Realtime API是一种实时多模态API,它允许开发人员构建低延迟、多模态的AI应用体验。这个API背后的技术是GPT-4o模型,它支持音频输入和输出,能够实现超越传统基于文本的AI对话的实时、自然的语音交互。 像Realtime这…

    2024 年 10 月 31 日
    17800
  • 资讯丨阿里发布长上下文模型Qwen2.5-Turbo,实测结果不达预期?

    继9月Qwen2.5发布后,11月18日,阿里巴巴通义千问团队再次发布新模型Qwen2.5-Turbo,大幅提升了上下文处理能力与推理速度。 据了解,Qwen2.5-Turbo上下文长度从 128k 显著增加到 1M 个 tokens,约相当于 100 万个英文单词或 150 万个中文字符。这一容量可容纳 10 部长篇小说、150 小时的语音记录或 3 万行…

    23小时前
    2200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注