302.AI

谷歌的“普惠核弹”：Gemini 3 Flash 实测——更快、更强、更省可以兼得丨302.AI 基准实验室

12 月 18 日深夜，谷歌闪击式抛出一枚“重磅炸弹”——Gemini 3 Flash 发布。这次发布没有过多的预热，但其展现出的性能与成本组合，足以让整个 AI 领域重新审视现有的竞争格局。简而言之，Gemini 3 Flash 做了一件看似矛盾的事：它以一个“轻量版”模型的定位和极低的成本，提供了接近甚至部分超越旗舰模型的顶尖性能。性能：打破“轻量即…
2025 年 12 月 19 日 • Benchmark laboratory
1.6K00
影视级模型Wan 2.6 深度评测：做广告脚本的神器，但别用它拍电影丨302.AI 基准实验室

12 月 16 日，阿里正式发布了新一代万相 Wan 2.6 系列模型，面向专业影视制作和图像创作场景进行了全面升级。全新的 Wan 2.6 是国内首个支持角色扮演功能的视频模型，同时支持音画同步、多镜头生成及声音驱动等功能。此次升级版本直接对标 Sora2，其核心功能亮点体现在以下几方面：其中最值得关注的当属智能多镜头叙事能力。分镜是电影级创作的一个专…
2025 年 12 月 18 日 • Benchmark laboratory
1.2K00
图像模型SOTA易主？GPT-Image-1.5 对决Nano Banana Pro测评丨302.AI 基准实验室

12月16日晚，OpenAI 正式发布了全新的旗舰图像生成模型——GPT Image 1.5 这确实是一个久违的名字。时间回溯到今年3月26日，OpenAI 首次推出了基于 GPT-4o 的图像生成模型 GPT Image 1.0，那场发布会直接引爆了一波席卷全球的”万物皆可吉卜力”风格热潮。无论是社交媒体上的普通用户，还是专业设计师…
2025 年 12 月 17 日 • Benchmark laboratory
67200
OpenAI 十周年答卷 GPT-5.2 实测：颠覆神话不再，未来使命何往？丨302.AI 基准实验室

正值成立十周年之际，OpenAI 于12月12日突袭发布新一代大模型GPT-5.2 系列，而这距离上一代 GPT-5.1 的发布仅过去一个月。在此期间，Gemini 3 与 Claude Opus 4.5 轮番炸场的内卷周期里，行业竞争已陷入胶着，往日发布即颠覆的市场震撼力正在边际递减。 OpenAI 此次并未选择单纯堆砌参数，而是首次祭出了三版本细分的精准…
2025 年 12 月 15 日 • Benchmark laboratory
96800
GLM-4.6V 实测：当视觉模型学会“动手”，它离“顶尖”还差什么？丨302.AI 基准实验室

智谱 AI 于 12 月 8 日正式开源了其新一代多模态模型 GLM-4.6V 系列，包含面向高性能场景的 106B 版本与轻量本地部署的 9B Flash 版。此次升级不仅将训练上下文窗口一举推至 128K tokens，更在模型架构中做了一个关键变革：让工具调用（Function Call）成为视觉模型的原生能力。这意味着，模型不再止步于识别图像，而是能…
2025 年 12 月 12 日 • Benchmark laboratory
1.9K00
Kling Video 2.6：让谷歌“嘴瓢”的中文视频，我不仅说得准，还能演得好！丨302.AI 基准实验室

继12月1日快手发布首个统一多模态视频模型可灵O1后，仅两天后，又火速上线了Kling Video 2.6——可灵系列首个实现原生音频的模型，能够单次生成包含画面、自然语音、匹配音效及环境氛围的完整视频，大幅简化创作流程。 Kling 2.6的核心突破在于其多模态的深度协同，技术特点十分鲜明：基于这一技术赋能，Kling 2.6可适配多种应用场景：在此前…
2025 年 12 月 10 日 • Benchmark laboratory
1.1K00
年末开源图像模型决战：Z-Image-Turbo vs Flux.2 Dev 丨302.AI 基准实验室

在上篇《顶流开源模型Flux.2是否依然能打？硬钢Nano Banana Pro五轮实测》我们对Flux.2的两个闭源版本（Pro和Flex）进行了测试。而在同一周（11月27日），阿里通义紧随Flux的步伐，也发布了全新的开源图像模型：Z-Image-Turbo. Z-Image-Turbo 是 Z-Image 的蒸馏版本，仅使用 8 次函数评估（NFE）…
2025 年 12 月 8 日 • Benchmark laboratory
1.5K00
昔日顶流更新，Flux.2是否依然能打？硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

11月25日，Black Forest Labs终于将其2024年发布的图像模型Flux迭代至2.0版本。作为开源模型，Flux曾凭借其性价比与微调能力，一时风头无两，几乎取代了Stable Diffusion的生态。诸如腾讯混元针对人像微调的Flux-1-SRPO也获得过我们不错的评价。但近半年，随着谷歌Nano Banana和字节跳动SeeDance的问…
2025 年 12 月 5 日 • Benchmark laboratory
1.3K00
美学大师 vs 世界模拟器：Seedream 4.5对决Nano Banana Pro，SOTA能否易主？丨302.AI 基准实验室

12月3日，火山引擎正式发布了新一代 AI 图像模型 Seedream 4.5，又进入到了熟悉的中国模型后发制人的节奏：今年 8 月末 Nano Banana 横空出世不久，字节跳动便带着 Seedream 4.0 进行精准狙击。在我们当时的横评文章中，Seedream 4.0 六战五胜，实现了对 Nano Banana 的全面反超。回顾一下对于 4.0 版…
2025 年 12 月 4 日 • Benchmark laboratory
1.6K01
实测开源标杆 DeepSeek-V3.2：在“效率”与“深度”之间寻找新平衡丨302.AI 基准实验室

刚进入12月，DeepSeek 又一次无预告地发布了备受期待的 V3.2 系列模型—— DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale，距离上次9月末发布Deepseek-V3.2-Exp仅过去2个月。本次更新不仅是技术迭代的成果，更像是一次针对大模型能力天花板的主动探索。两款模型师出同门，却有着清晰的分工：一个追求高效实用的日…
2025 年 12 月 2 日 • Benchmark laboratory
3.6K00

2 / 27
1
2
3
4
5
6