302.AI 基准实验室 | 可灵AI全面开放,引领视频创作新时代

7月下旬,可灵AI(Kling AI)宣布全面开放,曾经在国内外内测名额“一号难求”的可灵成为了历史。可灵AI是由快手科技自研的视频生成大模型,能够根据文本提示生成长达2分钟、帧率为30fps的高质量视频,支持1080p分辨率,并支持多种宽高比,陆续升级推出了图生视频等功能。

302.AI 基准实验室 | 可灵AI全面开放,引领视频创作新时代

从上线到全面开放,可灵历经了一个多月的时间:

6月10日,快手科技宣布推出了可灵大模型,10天后,可灵官方宣布上线了两个新功能,分别是图生视频和视频续写

7月6日,正式上线可灵AI的网页端,所有功能限时免费开放给用户使用,这段时间国内外的用户都在求一个内测的名额,可谓是“一号难求”,非常有趣的是,在内测过程中,中外网友像互换身份,外网用户也终于体验了一把之前国内网友求手机号注册ChatGPT的辛酸。

7月24日,可灵AI宣布基础模型再次升级,并全面开放内测,同时正式上线了会员体系,针对不同类别的会员提供相应的专属功能服务。也是在同一天,快手可灵国际版1.0正式上线,国外用户注册只需要邮箱,无需中国手机号码。

据悉,可灵使用了与Sora一样的Diffusion Transformer架构,3D时空联合注意力机制等,该架构巧妙地融合了时间与空间的信息,对视频数据进行综合分析和处理。但很多国外网友认为,可灵AI超过了Sora。那可灵到底是厉害在哪里呢?

比如下面这个很火的吃汉堡案例,同样的提示词下,可灵生成的效果更加的生动、逼真:

302.AI 基准实验室 | 可灵AI全面开放,引领视频创作新时代

Prompt:Une personne tapant son meilleur croc dans son hamburger

当然除了文生视频,可灵在图生视频上的表现也还不错,比如在衔接运动镜头上,整个画面都是比较流畅的合理的:

302.AI 基准实验室 | 可灵AI全面开放,引领视频创作新时代

在动物为主体的文生视频中,画面整体还算可以,不过仔细看能看到,熊猫弹吉他的手指部分有点奇怪:

302.AI 基准实验室 | 可灵AI全面开放,引领视频创作新时代

提示词:一只大熊猫在湖边弹吉他

短短的一个多月,可灵从出现到大众面前到登上世界的舞台,在这一过程中,不仅吸引了国内外技术爱好者和创作者的目光,也让很多开发人员蠢蠢欲动。但是可惜的是,可灵官方并不提供可灵的API,因此开发人员是无法直接从官网接入可灵API。然而!302.AIAPI超市同在7月底,更新了可灵的API,如图所示:

302.AI 基准实验室 | 可灵AI全面开放,引领视频创作新时代

302.AI的API超市提供详细文档,能够帮助开发者快速上手,提高效率,减少在使用API时出现的错误,且支持在线调试,302.AI提供按需付费的付费方式,在提高效率的同时为用户降低开发成本,提供文生视频和图生视频的API:

302.AI 基准实验室 | 可灵AI全面开放,引领视频创作新时代

302.AI的API超市是一个提供丰富API的集市,涵盖了不同类型的大模型,除了可灵视频生成的API,还提供了图片生成的API,开发者可以通过302.AI的API超市快速接入想要的功能。

302.AI 基准实验室 | 可灵AI全面开放,引领视频创作新时代

302.AI 基准实验室 | 可灵AI全面开放,引领视频创作新时代

在这个信息爆炸的时代,视频内容已成为传递信息和表达创意的重要方式。作为来自中国的可灵,能够走到世界的舞台上,侧面代表着中国AI视频技术正在飞速发展,在这个崭新的时代,我们期待看到更多精彩的作品涌现,激发更多的灵感与想象。可灵AI的全面开放,正是这一切的起点,让我们共同迎接视频创作的美好未来。


👉立即注册免费试用302.AI,开启你的AI之旅!👈

为什么选择302.AI?

● 灵活付费:无需月费,按需付费,成本可控
● 丰富功能:从文字、图片到视频,应有尽有,满足多种场景需求
● 开源生态:支持开发者深度定制,打造专属AI应用
● 易用性:界面友好,操作简单,快速上手

302.AI 新品发布 | 图像创意站:GPT-Image-1玩法全解析,轻松生成惊艳作品
All Rights Reserved by 302.AI
Like (0)
302.AI302.AI
Previous 2024 年 8 月 5 日 下午6:39
Next 2024 年 8 月 7 日 下午6:47

相关推荐

  • 302.AI 新品发布 | AI数字人生成应用上线:告别复杂流程,一站式打造专属虚拟 IP

    回想一下,你在社交平台上刷到过哪些让你眼前一亮的视频博主?TA可能是个知识渊博的专家,也可能是个风趣幽默的带货主播。而当你翻看TA的主页,被那些高质量的视频内容吸引时,有没有想过:这或许并非真人创作,而是来自AI数字人技术的虚拟形象?事实上,目前在互联网上流行的AI数字人作品数量远超你的想象。它们的容貌、声音乃至一举一动,都基本与真人无异,且正在以前所未有的…

    6天前 新品发布
    2790
  • 302.AI 赛博月刊丨Vol.8 攻守易形:当开源变成中国主场

    AI 行业大事记 2025 年 8 月 联合出品: Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心 说明: ①本文讨论了 2025 年7月 AI行业的 103 件大事,涵盖模型、图像、视频、音频、3D、机器人、应用、新闻/融资等多个领域。 ② 本文分类中的「模型」均指代语言模型; ③ 本文分类中的「融资」包含了融资、收购、团队成…

    2025 年 8 月 18 日 赛博月刊
    3550
  • 302.AI 基准实验室丨指令的艺术:深度评测JSON格式与自然语义提示词对于AI创作的影响

    一、引言 如今这时代,你打开电脑,随手敲下几行字,十来秒它就给你变出一幅栩栩如生的图像,或是一段流畅的视频,不带卡顿够高清的那种。这事以前听着像是魔术,现在已经成了日常。AI这几年在生成图像和视频方面飙得飞快,背后推动它起飞的燃料,其中一个重要因素就是提示词——Prompt。 你可能没太注意过,就是你跟AI说话的形式。别觉得这东西不起眼,它对最终生成效果的影…

    2025 年 8 月 5 日 基准实验室
    4280
  • 302.AI 基准实验室 | 开源之路更远行:Wan 2.2对决国产顶级视频模型评测

    7 月 28 日,阿里通义正式开源了其视频生成模型——通义万相 Wan2.2,该模型采用创新的 MoE(Mixture of Experts)架构,由高噪专家模型和低噪专家模型组成,能够根据去噪时间步进行专家模型划分,从而生成更高质量的视频内容。 Wan2.2 在 Wan2.1 的基础上实现了生成质量和模型能力的显著提升,其技术突破主要体现在三大核心领域:混…

    2025 年 8 月 4 日 基准实验室
    9571

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注