AI video
影视级模型Wan 2.6 深度评测:做广告脚本的神器,但别用它拍电影丨302.AI 基准实验室
12 月 16 日,阿里正式发布了新一代万相 Wan 2.6 系列模型,面向专业影视制作和图像创作场景进行了全面升级。全新的 Wan 2.6 是国内首个支持角色扮演功能的视频模型,同时支持音画同步、多镜头生成及声音驱动等功能。 此次升级版本直接对标 Sora2,其核心功能亮点体现在以下几方面: 其中最值得关注的当属智能多镜头叙事能力。分镜是电影级创作的一个专…
Kling Video 2.6:让谷歌“嘴瓢”的中文视频,我不仅说得准,还能演得好!丨302.AI 基准实验室
继12月1日快手发布首个统一多模态视频模型可灵O1后,仅两天后,又火速上线了Kling Video 2.6——可灵系列首个实现原生音频的模型,能够单次生成包含画面、自然语音、匹配音效及环境氛围的完整视频,大幅简化创作流程。 Kling 2.6的核心突破在于其多模态的深度协同,技术特点十分鲜明: 基于这一技术赋能,Kling 2.6可适配多种应用场景: 在此前…
AIGC万字指南(下):从A到Z,打破技术词汇认知壁垒 | 302.AI大白话聊一聊
话不多说,文接上篇,让我们从字母L继续。 字母L: LLM (Large Language Model,大语言模型) 定义:一个在海量文本数据上进行预训练,规模巨大、参数量通常在十亿级别以上的深度学习模型,能够理解和生成人类语言。 通俗解释:把它想象成一个读完了人类历史上几乎所有书籍、网页和对话的“超级大脑”或“通天晓”。它不仅能和你聊天,更能扮演“世界模拟…
AIGC Ten Thousand Words Guide (Part 1): From A to Z, Breaking the Barriers to Technical Vocabulary Cognition | 302. Have a chat in AI vernacular
By the end of 2025, AIGC (AI-Generated Content) has long evolved from a cutting-edge concept to a powerful productivity that has profoundly changed the creative industry. In essence, AIGC uses machine learning, especially deep learning models, to automatically generate new forms of digital assets such as text, images, audio, video, 3D interactive content, and even code through the learning of massive amounts of data. It is not only a technical tool, but also regarded as reshaping the logic of content production and driving the economy and society.…
One-stop creation of explosive AI digital music videos,附两大主流数字人模型实测丨302.AI Practical tutorial
At the end of October, whether it was a long-video B station or a short-video platform, a large number of explosive videos emerged: using the classic IP characters we know well, such as the 86th edition of "Journey to the West", they were refreshed with the blessing of AI technology, and they went into the recording studio one after another to sing in line with their respective IPS.Original song. Its mouth shape and emotional expression are highly matched with music, and with realistic video footage, it has won “three in a row with one key” time and time again. With the help of Nano Banana and Seedream 4.0, which can achieve high-fidelity picture generation, he is proficient in various music…
当对手已冲入2.5时代,Minimax Hailuo 2.3却在踩倒车? 丨302.AI 基准实验室
在我们 9 月末的评测文章《国产AI视频“2.5时代”首战:Wan2.5的“电影感”与Kling 2.5的“稳定美学”,能否击败Veo 3?》中,曾提到国产 AI 视频模型正不约而同迈入 2.5 时代,而在一个多月后的 10 月 28 日,这一阵营中的又一员大将——来自 MiniMax 的 Hailuo 也正式迎来升级,推出 2.3 版本。 Hailuo 2…
不止于形,更在于神——Vidu Q2 实测:“演技派”领跑AI视频内卷新方向丨302.AI 基准实验室
随着 AI 视频生成技术从基础的提示词理解迈向电影级画面创作,模型的进化方向已不再局限于画质本身,而是延伸至具备导演思维的运镜逻辑与对用户深层意图的感知能力。“电影级”,正成为新一代 AI 视频模型的核心标签。 在九月末密集发布的 AI 视频模型中,Wan2.5 与 Sora 2 凭借音画同步能力的突破,将 AI 视频的叙事质感推向一个新高度。紧随其后,生数…
Veo 3.1评测:Google的0.1次迭代能否撬动Sora 2的王座?丨302.AI 基准实验室
10月16日,就在AI视频领域的军备竞赛仍聚焦于 Sora 2 音画同步所加入的高拟真度赛道时,Google 经过数日网上泄密与舆论发酵后,突然强势切入战局,公开释出其视频生成模型的全新迭代——Veo 3.1,此次升级旨在系统性地提升视频生成的几大重要维度:导演级的叙事控制能力、电影级的音频质量,以及更高的场景真实感。Veo 3.1的正式推出,无疑进一步拉高…
别再只谈电影级画质,Sora 2评测:当AI开始真正讲中文、做导演,真实感什么水平? 丨302.AI 基准实验室
国庆假期第一天,当AI视频领域的热度还聚焦在Kling 2.5拿下SOTA,Wan2.5大获好评之时,OpenAI再次以“核弹级”的发布,将视频生成技术推向了全新的叙事维度——Sora 2,一个不仅能看见“世界”,更能听懂“世界”的视频模型。 自Sora初次亮相以来,凭借对物理世界近乎“复刻”的模拟能力,彻底改写了AI视频生成的质量标杆。然而,在AIGC创作…
国产AI视频“2.5时代”首战:Wan2.5的“电影感”与Kling 2.5的“稳定美学”,能否击败Veo 3?丨302.AI 基准实验室
时值九月尾声,国产 AI 视频模型领域再度活跃,似乎正蓄势待发,欲在国庆之际交出一份令人瞩目的阶段性答卷。9 月 23 日至 24 日,可灵与阿里相继发布了其最新升级的视频生成模型——Kling 2.5 Turbo 与 Wan2.5-Preview。两款模型不约而同地将版本号锁定在“2.5”,似乎也预示着 AI 视频生成技术已正式迈入“2.5 时代”。 先来…