可灵AI全面开放,引领视频创作新时代

7月下旬,可灵AI(Kling AI)宣布全面开放,曾经在国内外内测名额“一号难求”的可灵成为了历史。可灵AI是由快手科技自研的视频生成大模型,能够根据文本提示生成长达2分钟、帧率为30fps的高质量视频,支持1080p分辨率,并支持多种宽高比,陆续升级推出了图生视频等功能。

可灵AI全面开放,引领视频创作新时代

从上线到全面开放,可灵历经了一个多月的时间:

6月10日,快手科技宣布推出了可灵大模型,10天后,可灵官方宣布上线了两个新功能,分别是图生视频和视频续写

7月6日,正式上线可灵AI的网页端,所有功能限时免费开放给用户使用,这段时间国内外的用户都在求一个内测的名额,可谓是“一号难求”,非常有趣的是,在内测过程中,中外网友像互换身份,外网用户也终于体验了一把之前国内网友求手机号注册ChatGPT的辛酸。

7月24日,可灵AI宣布基础模型再次升级,并全面开放内测,同时正式上线了会员体系,针对不同类别的会员提供相应的专属功能服务。也是在同一天,快手可灵国际版1.0正式上线,国外用户注册只需要邮箱,无需中国手机号码。

据悉,可灵使用了与Sora一样的Diffusion Transformer架构,3D时空联合注意力机制等,该架构巧妙地融合了时间与空间的信息,对视频数据进行综合分析和处理。但很多国外网友认为,可灵AI超过了Sora。那可灵到底是厉害在哪里呢?

比如下面这个很火的吃汉堡案例,同样的提示词下,可灵生成的效果更加的生动、逼真:

可灵AI全面开放,引领视频创作新时代

Prompt:Une personne tapant son meilleur croc dans son hamburger

当然除了文生视频,可灵在图生视频上的表现也还不错,比如在衔接运动镜头上,整个画面都是比较流畅的合理的:

可灵AI全面开放,引领视频创作新时代

在动物为主体的文生视频中,画面整体还算可以,不过仔细看能看到,熊猫弹吉他的手指部分有点奇怪:

可灵AI全面开放,引领视频创作新时代

提示词:一只大熊猫在湖边弹吉他

短短的一个多月,可灵从出现到大众面前到登上世界的舞台,在这一过程中,不仅吸引了国内外技术爱好者和创作者的目光,也让很多开发人员蠢蠢欲动。但是可惜的是,可灵官方并不提供可灵的API,因此开发人员是无法直接从官网接入可灵API。然而!302.AI的API超市同在7月底,更新了可灵的API,如图所示:

可灵AI全面开放,引领视频创作新时代

302.AIAPI超市提供详细文档,能够帮助开发者快速上手,提高效率,减少在使用API时出现的错误,且支持在线调试,302.AI提供按需付费的付费方式,在提高效率的同时为用户降低开发成本,提供文生视频和图生视频的API:

可灵AI全面开放,引领视频创作新时代

302.AIAPI超市是一个提供丰富API的集市,涵盖了不同类型的大模型,除了可灵视频生成的API,还提供了图片生成的API,开发者可以通过302.AI的API超市快速接入想要的功能。

可灵AI全面开放,引领视频创作新时代

可灵AI全面开放,引领视频创作新时代

在这个信息爆炸的时代,视频内容已成为传递信息和表达创意的重要方式。作为来自中国的可灵,能够走到世界的舞台上,侧面代表着中国AI视频技术正在飞速发展,在这个崭新的时代,我们期待看到更多精彩的作品涌现,激发更多的灵感与想象。可灵AI的全面开放,正是这一切的起点,让我们共同迎接视频创作的美好未来。

(0)
302.AI302.AI
上一篇 2024 年 8 月 5 日 下午6:39
下一篇 2024 年 8 月 7 日 下午6:47

相关推荐

  • Claude新功能?小白如何体验交互式写编程?

    Anthropic公司在今年3月发布了新模型Claude 3后,同样在今年的6月21日又再次官宣上新Claude 3.5 Sonnet模型,这中间仅仅隔了三个月左右的时间! 但是就今天的主角并不是Claude 3.5 Sonnet,而是与Claude 3.5 Sonnet一同官宣推出的新功能——Artifacts。 Anthropic PBC,是一家美国的人…

    2024 年 7 月 12 日
    10500
  • “草莓”终于现真身了,OpenAI发布最新o1大模型!

    北京时间9月13日凌晨,OpenAI发布o1大模型,“草莓”终于现真身了,酝酿已久的“草莓”终于面世。 据了解,OpenAI o1模型经过强化学习训练可以执行复杂的推理,还能解决比以前更难的科学、编码和数学问题。官方称,OpenAI o1模型在美国数学奥林匹克 (AIME) 预选赛中跻身美国前 500 名学生之列,并在物理、生物和化学问题 (GPQA) 基准…

    2024 年 9 月 13 日
    19300
  • AI视力考验:各AI模型的视觉理解能力如何?

    近日,行业内有不少新模型涌现出大众的面前,我们会发现,有的模型会在其官方宣传中提到“多模态”一词,比如大家熟知的GPT-4o、Gemini 1.5 Pro等,在发布时都被定义为“原生多模态”,这些多模态LLM在相关的介绍中,都用到了“视觉能力”、“视觉理解”这样的表述。 简单的理解,就是这些模型能够“看得见,并看得懂”,仿佛人的眼睛。为此,很多人…

    2024 年 7 月 25 日
    9800
  • Coze正式开启付费计划!GPT-4白嫖时代结束?

    7月刚刚到来,Coze海外版就静悄悄开启付费计划,推出了Coze Premium Pricing Plans,得知这一消息的众多AI爱好者纷纷表示白嫖GPT-4的时代要结束了。 Coze是由字节跳动推出的AI聊天机器人构建平台,它允许用户快速创建、调试和优化AI聊天机器人的应用程序。这个平台特别适合对AI和机器人技术感兴趣的人,尤其是那些缺乏编程经验的用户。…

    2024 年 7 月 12 日
    22800
  • Runway Gen-3 Alpha图生视频上线,图片转视频只需要一步?!

    7月30日凌晨,Runway官方在社交媒体平台宣布,在6月中旬推出的视频模型Gen-3Alpha正式推出图生视频功能。官方表示,图生视频功能将极大提高了生成视频的艺术控制和一致性。 这一更新允许用户将任何图像用作视频生成的第一帧,可以单独使用,也可以与文本提示一起使用。 简单的说就是,用户上传一张图片可以单独生成一个视频,也可以在上传图片后搭配文字描述,再生…

    2024 年 8 月 2 日
    10700

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注