7月下旬,可灵AI(Kling AI)宣布全面开放,曾经在国内外内测名额“一号难求”的可灵成为了历史。可灵AI是由快手科技自研的视频生成大模型,能够根据文本提示生成长达2分钟、帧率为30fps的高质量视频,支持1080p分辨率,并支持多种宽高比,陆续升级推出了图生视频等功能。
从上线到全面开放,可灵历经了一个多月的时间:
6月10日,快手科技宣布推出了可灵大模型,10天后,可灵官方宣布上线了两个新功能,分别是图生视频和视频续写。
7月6日,正式上线可灵AI的网页端,所有功能限时免费开放给用户使用,这段时间国内外的用户都在求一个内测的名额,可谓是“一号难求”,非常有趣的是,在内测过程中,中外网友像互换身份,外网用户也终于体验了一把之前国内网友求手机号注册ChatGPT的辛酸。
7月24日,可灵AI宣布基础模型再次升级,并全面开放内测,同时正式上线了会员体系,针对不同类别的会员提供相应的专属功能服务。也是在同一天,快手可灵国际版1.0正式上线,国外用户注册只需要邮箱,无需中国手机号码。
据悉,可灵使用了与Sora一样的Diffusion Transformer架构,3D时空联合注意力机制等,该架构巧妙地融合了时间与空间的信息,对视频数据进行综合分析和处理。但很多国外网友认为,可灵AI超过了Sora。那可灵到底是厉害在哪里呢?
比如下面这个很火的吃汉堡案例,同样的提示词下,可灵生成的效果更加的生动、逼真:
Prompt:Une personne tapant son meilleur croc dans son hamburger
当然除了文生视频,可灵在图生视频上的表现也还不错,比如在衔接运动镜头上,整个画面都是比较流畅的合理的:
在动物为主体的文生视频中,画面整体还算可以,不过仔细看能看到,熊猫弹吉他的手指部分有点奇怪:
提示词:一只大熊猫在湖边弹吉他
短短的一个多月,可灵从出现到大众面前到登上世界的舞台,在这一过程中,不仅吸引了国内外技术爱好者和创作者的目光,也让很多开发人员蠢蠢欲动。但是可惜的是,可灵官方并不提供可灵的API,因此开发人员是无法直接从官网接入可灵API。然而!302.AI的API超市同在7月底,更新了可灵的API,如图所示:
302.AI的API超市提供详细文档,能够帮助开发者快速上手,提高效率,减少在使用API时出现的错误,且支持在线调试,302.AI提供按需付费的付费方式,在提高效率的同时为用户降低开发成本,提供文生视频和图生视频的API:
302.AI的API超市是一个提供丰富API的集市,涵盖了不同类型的大模型,除了可灵视频生成的API,还提供了图片生成的API,开发者可以通过302.AI的API超市快速接入想要的功能。
在这个信息爆炸的时代,视频内容已成为传递信息和表达创意的重要方式。作为来自中国的可灵,能够走到世界的舞台上,侧面代表着中国AI视频技术正在飞速发展,在这个崭新的时代,我们期待看到更多精彩的作品涌现,激发更多的灵感与想象。可灵AI的全面开放,正是这一切的起点,让我们共同迎接视频创作的美好未来。