AI视频
影视级模型Wan 2.6 深度评测:做广告脚本的神器,但别用它拍电影丨302.AI 基准实验室
12 月 16 日,阿里正式发布了新一代万相 Wan 2.6 系列模型,面向专业影视制作和图像创作场景进行了全面升级。全新的 Wan 2.6 是国内首个支持角色扮演功能的视频模型,同时支持音画同步、多镜头生成及声音驱动等功能。 此次升级版本直接对标 Sora2,其核心功能亮点体现在以下几方面: 其中最值得关注的当属智能多镜头叙事能力。分镜是电影级创作的一个专…
Kling Video 2.6:让谷歌“嘴瓢”的中文视频,我不仅说得准,还能演得好!丨302.AI 基准实验室
继12月1日快手发布首个统一多模态视频模型可灵O1后,仅两天后,又火速上线了Kling Video 2.6——可灵系列首个实现原生音频的模型,能够单次生成包含画面、自然语音、匹配音效及环境氛围的完整视频,大幅简化创作流程。 Kling 2.6的核心突破在于其多模态的深度协同,技术特点十分鲜明: 基于这一技术赋能,Kling 2.6可适配多种应用场景: 在此前…
AIGC万字指南(下):从A到Z,打破技术词汇认知壁垒 | 302.AI大白话聊一聊
话不多说,文接上篇,让我们从字母L继续。 字母L: LLM (Large Language Model,大语言模型) 定义:一个在海量文本数据上进行预训练,规模巨大、参数量通常在十亿级别以上的深度学习模型,能够理解和生成人类语言。 通俗解释:把它想象成一个读完了人类历史上几乎所有书籍、网页和对话的“超级大脑”或“通天晓”。它不仅能和你聊天,更能扮演“世界模拟…
AIGC万字指南(上):从A到Z,打破技术词汇认知壁垒 | 302.AI大白话聊一聊
2025年末,AIGC(AI-Generated Content,人工智能生成内容)早已从前沿概念,演变为深刻改变创意产业的强大生产力。从本质上讲,AIGC是利用机器学习,特别是深度学习模型,通过对海量数据的学习,来自动化地生成全新的文本、图像、音频、视频、3D交互内容乃至代码等各种形式的数字资产。它不仅仅是一种技术工具,更被视为重塑内容生产逻辑、驱动经济社…
一站式打造爆火AI数字人音乐视频,附两大主流数字人模型实测丨302.AI 实战教程
10月末,无论是长视频的B站还是各短视频平台,都涌现出一大批爆火视频:用我们所熟知的比如86版《西游记》中的经典IP角色,在AI技术加持下焕新,纷纷走入录音棚演唱着符合各自IP的原创歌曲。其口型与情绪表达与音乐高度匹配,配以逼真的视频画面,赢得了一次次“一键三连”。 借助使用能够实现高拟真画面生成的Nano Banana与Seedream 4.0,精通各音乐…
当对手已冲入2.5时代,Minimax Hailuo 2.3却在踩倒车? 丨302.AI 基准实验室
在我们 9 月末的评测文章《国产AI视频“2.5时代”首战:Wan2.5的“电影感”与Kling 2.5的“稳定美学”,能否击败Veo 3?》中,曾提到国产 AI 视频模型正不约而同迈入 2.5 时代,而在一个多月后的 10 月 28 日,这一阵营中的又一员大将——来自 MiniMax 的 Hailuo 也正式迎来升级,推出 2.3 版本。 Hailuo 2…
不止于形,更在于神——Vidu Q2 实测:“演技派”领跑AI视频内卷新方向丨302.AI 基准实验室
随着 AI 视频生成技术从基础的提示词理解迈向电影级画面创作,模型的进化方向已不再局限于画质本身,而是延伸至具备导演思维的运镜逻辑与对用户深层意图的感知能力。“电影级”,正成为新一代 AI 视频模型的核心标签。 在九月末密集发布的 AI 视频模型中,Wan2.5 与 Sora 2 凭借音画同步能力的突破,将 AI 视频的叙事质感推向一个新高度。紧随其后,生数…
Veo 3.1评测:Google的0.1次迭代能否撬动Sora 2的王座?丨302.AI 基准实验室
10月16日,就在AI视频领域的军备竞赛仍聚焦于 Sora 2 音画同步所加入的高拟真度赛道时,Google 经过数日网上泄密与舆论发酵后,突然强势切入战局,公开释出其视频生成模型的全新迭代——Veo 3.1,此次升级旨在系统性地提升视频生成的几大重要维度:导演级的叙事控制能力、电影级的音频质量,以及更高的场景真实感。Veo 3.1的正式推出,无疑进一步拉高…
别再只谈电影级画质,Sora 2评测:当AI开始真正讲中文、做导演,真实感什么水平? 丨302.AI 基准实验室
国庆假期第一天,当AI视频领域的热度还聚焦在Kling 2.5拿下SOTA,Wan2.5大获好评之时,OpenAI再次以“核弹级”的发布,将视频生成技术推向了全新的叙事维度——Sora 2,一个不仅能看见“世界”,更能听懂“世界”的视频模型。 自Sora初次亮相以来,凭借对物理世界近乎“复刻”的模拟能力,彻底改写了AI视频生成的质量标杆。然而,在AIGC创作…
国产AI视频“2.5时代”首战:Wan2.5的“电影感”与Kling 2.5的“稳定美学”,能否击败Veo 3?丨302.AI 基准实验室
时值九月尾声,国产 AI 视频模型领域再度活跃,似乎正蓄势待发,欲在国庆之际交出一份令人瞩目的阶段性答卷。9 月 23 日至 24 日,可灵与阿里相继发布了其最新升级的视频生成模型——Kling 2.5 Turbo 与 Wan2.5-Preview。两款模型不约而同地将版本号锁定在“2.5”,似乎也预示着 AI 视频生成技术已正式迈入“2.5 时代”。 先来…