AI视频
AIGC万字指南(上):从A到Z,打破技术词汇认知壁垒 | 302.AI大白话聊一聊
2025年末,AIGC(AI-Generated Content,人工智能生成内容)早已从前沿概念,演变为深刻改变创意产业的强大生产力。从本质上讲,AIGC是利用机器学习,特别是深度学习模型,通过对海量数据的学习,来自动化地生成全新的文本、图像、音频、视频、3D交互内容乃至代码等各种形式的数字资产。它不仅仅是一种技术工具,更被视为重塑内容生产逻辑、驱动经济社…
一站式打造爆火AI数字人音乐视频,附两大主流数字人模型实测丨302.AI 实战教程
10月末,无论是长视频的B站还是各短视频平台,都涌现出一大批爆火视频:用我们所熟知的比如86版《西游记》中的经典IP角色,在AI技术加持下焕新,纷纷走入录音棚演唱着符合各自IP的原创歌曲。其口型与情绪表达与音乐高度匹配,配以逼真的视频画面,赢得了一次次“一键三连”。 借助使用能够实现高拟真画面生成的Nano Banana与Seedream 4.0,精通各音乐…
当对手已冲入2.5时代,Minimax Hailuo 2.3却在踩倒车? 丨302.AI 基准实验室
在我们 9 月末的评测文章《国产AI视频“2.5时代”首战:Wan2.5的“电影感”与Kling 2.5的“稳定美学”,能否击败Veo 3?》中,曾提到国产 AI 视频模型正不约而同迈入 2.5 时代,而在一个多月后的 10 月 28 日,这一阵营中的又一员大将——来自 MiniMax 的 Hailuo 也正式迎来升级,推出 2.3 版本。 Hailuo 2…
不止于形,更在于神——Vidu Q2 实测:“演技派”领跑AI视频内卷新方向丨302.AI 基准实验室
随着 AI 视频生成技术从基础的提示词理解迈向电影级画面创作,模型的进化方向已不再局限于画质本身,而是延伸至具备导演思维的运镜逻辑与对用户深层意图的感知能力。“电影级”,正成为新一代 AI 视频模型的核心标签。 在九月末密集发布的 AI 视频模型中,Wan2.5 与 Sora 2 凭借音画同步能力的突破,将 AI 视频的叙事质感推向一个新高度。紧随其后,生数…
Veo 3.1评测:Google的0.1次迭代能否撬动Sora 2的王座?丨302.AI 基准实验室
10月16日,就在AI视频领域的军备竞赛仍聚焦于 Sora 2 音画同步所加入的高拟真度赛道时,Google 经过数日网上泄密与舆论发酵后,突然强势切入战局,公开释出其视频生成模型的全新迭代——Veo 3.1,此次升级旨在系统性地提升视频生成的几大重要维度:导演级的叙事控制能力、电影级的音频质量,以及更高的场景真实感。Veo 3.1的正式推出,无疑进一步拉高…
别再只谈电影级画质,Sora 2评测:当AI开始真正讲中文、做导演,真实感什么水平? 丨302.AI 基准实验室
国庆假期第一天,当AI视频领域的热度还聚焦在Kling 2.5拿下SOTA,Wan2.5大获好评之时,OpenAI再次以“核弹级”的发布,将视频生成技术推向了全新的叙事维度——Sora 2,一个不仅能看见“世界”,更能听懂“世界”的视频模型。 自Sora初次亮相以来,凭借对物理世界近乎“复刻”的模拟能力,彻底改写了AI视频生成的质量标杆。然而,在AIGC创作…
国产AI视频“2.5时代”首战:Wan2.5的“电影感”与Kling 2.5的“稳定美学”,能否击败Veo 3?丨302.AI 基准实验室
时值九月尾声,国产 AI 视频模型领域再度活跃,似乎正蓄势待发,欲在国庆之际交出一份令人瞩目的阶段性答卷。9 月 23 日至 24 日,可灵与阿里相继发布了其最新升级的视频生成模型——Kling 2.5 Turbo 与 Wan2.5-Preview。两款模型不约而同地将版本号锁定在“2.5”,似乎也预示着 AI 视频生成技术已正式迈入“2.5 时代”。 先来…
视频版“一键换装”来了!动作生成模型Wan2.2-Animate测评丨302.AI 基准实验室
仅靠一张图片就能制作电影?通义万相于 9 月 19 日开源了其角色动画驱动模型 Wan2.2-Animate —— 一款能够实现一键迁移角色动态的强大模型。其核心能力就是把人物角色的动作、神态,精准迁移到任意角色身上,从而实现让一张静态图复刻任何视频里的动作,主演任何视频里的场景。 AI 视频生成技术普及以来,如何让作品中的角色动态叙事更完整、更真实,这一直…
302.AI 赛博月刊丨Vol.9 GPT-5,输给了香蕉
AI 行业大事记 2025 年 8 月 联合出品: Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心 说明: ①本文讨论了 2025 年8月 AI行业的大事,涵盖模型、图像、视频、音频、3D、机器人、应用、新闻/融资等多个领域。 ② 本文分类中的「模型」均指代语言模型; ③ 本文分类中的「融资」包含了融资、收购、团队成员吸收等多种…
原生音画 vs. 后期配音:AI视频“声”存之战,Veo 3 对比 Kling音频模型评测丨302.AI 基准实验室
AI 视频生成技术今年在以前所未有的速度进行迭代,当你惊叹于互联网上天马行空的视觉作品并尝试自己付诸实践时,却尴尬地发现,绝大数多数视频模型在画质与动效上表现力惊人,而其生成的世界却陷入了一种诡异的沉寂——大部分主流模型都无法实现音视频一体生成。这就意味着我们虽手握造梦的权力,却被迫成为了“无声电影时代”的遗民。不禁想到一句经典广告语,“没声音,再好的戏也出…