302.AI
谷歌的“普惠核弹”:Gemini 3 Flash 实测——更快、更强、更省可以兼得丨302.AI 基准实验室
12 月 18 日深夜,谷歌闪击式抛出一枚“重磅炸弹”——Gemini 3 Flash 发布。这次发布没有过多的预热,但其展现出的性能与成本组合,足以让整个 AI 领域重新审视现有的竞争格局。 简而言之,Gemini 3 Flash 做了一件看似矛盾的事:它以一个“轻量版”模型的定位和极低的成本,提供了接近甚至部分超越旗舰模型的顶尖性能。 性能:打破“轻量即…
影视级模型Wan 2.6 深度评测:做广告脚本的神器,但别用它拍电影丨302.AI 基准实验室
12 月 16 日,阿里正式发布了新一代万相 Wan 2.6 系列模型,面向专业影视制作和图像创作场景进行了全面升级。全新的 Wan 2.6 是国内首个支持角色扮演功能的视频模型,同时支持音画同步、多镜头生成及声音驱动等功能。 此次升级版本直接对标 Sora2,其核心功能亮点体现在以下几方面: 其中最值得关注的当属智能多镜头叙事能力。分镜是电影级创作的一个专…
图像模型SOTA易主?GPT-Image-1.5 对决Nano Banana Pro测评丨302.AI 基准实验室
12月16日晚,OpenAI 正式发布了全新的旗舰图像生成模型——GPT Image 1.5 这确实是一个久违的名字。时间回溯到今年3月26日,OpenAI 首次推出了基于 GPT-4o 的图像生成模型 GPT Image 1.0,那场发布会直接引爆了一波席卷全球的”万物皆可吉卜力”风格热潮。无论是社交媒体上的普通用户,还是专业设计师…
OpenAI 十周年答卷 GPT-5.2 实测:颠覆神话不再,未来使命何往?丨302.AI 基准实验室
正值成立十周年之际,OpenAI 于12月12日突袭发布新一代大模型GPT-5.2 系列,而这距离上一代 GPT-5.1 的发布仅过去一个月。在此期间,Gemini 3 与 Claude Opus 4.5 轮番炸场的内卷周期里,行业竞争已陷入胶着,往日发布即颠覆的市场震撼力正在边际递减。 OpenAI 此次并未选择单纯堆砌参数,而是首次祭出了三版本细分的精准…
GLM-4.6V 实测:当视觉模型学会“动手”,它离“顶尖”还差什么?丨302.AI 基准实验室
智谱 AI 于 12 月 8 日正式开源了其新一代多模态模型 GLM-4.6V 系列,包含面向高性能场景的 106B 版本与轻量本地部署的 9B Flash 版。此次升级不仅将训练上下文窗口一举推至 128K tokens,更在模型架构中做了一个关键变革:让工具调用(Function Call)成为视觉模型的原生能力。这意味着,模型不再止步于识别图像,而是能…
Kling Video 2.6:让谷歌“嘴瓢”的中文视频,我不仅说得准,还能演得好!丨302.AI 基准实验室
继12月1日快手发布首个统一多模态视频模型可灵O1后,仅两天后,又火速上线了Kling Video 2.6——可灵系列首个实现原生音频的模型,能够单次生成包含画面、自然语音、匹配音效及环境氛围的完整视频,大幅简化创作流程。 Kling 2.6的核心突破在于其多模态的深度协同,技术特点十分鲜明: 基于这一技术赋能,Kling 2.6可适配多种应用场景: 在此前…
年末开源图像模型决战:Z-Image-Turbo vs Flux.2 Dev 丨302.AI 基准实验室
在上篇《顶流开源模型Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测》我们对Flux.2的两个闭源版本(Pro和Flex)进行了测试。而在同一周(11月27日),阿里通义紧随Flux的步伐,也发布了全新的开源图像模型:Z-Image-Turbo. Z-Image-Turbo 是 Z-Image 的蒸馏版本,仅使用 8 次函数评估(NFE)…
昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室
11月25日,Black Forest Labs终于将其2024年发布的图像模型Flux迭代至2.0版本。作为开源模型,Flux曾凭借其性价比与微调能力,一时风头无两,几乎取代了Stable Diffusion的生态。诸如腾讯混元针对人像微调的Flux-1-SRPO也获得过我们不错的评价。但近半年,随着谷歌Nano Banana和字节跳动SeeDance的问…
美学大师 vs 世界模拟器:Seedream 4.5对决Nano Banana Pro,SOTA能否易主?丨302.AI 基准实验室
12月3日,火山引擎正式发布了新一代 AI 图像模型 Seedream 4.5,又进入到了熟悉的中国模型后发制人的节奏:今年 8 月末 Nano Banana 横空出世不久,字节跳动便带着 Seedream 4.0 进行精准狙击。在我们当时的横评文章中,Seedream 4.0 六战五胜,实现了对 Nano Banana 的全面反超。回顾一下对于 4.0 版…
实测开源标杆 DeepSeek-V3.2:在“效率”与“深度”之间寻找新平衡丨302.AI 基准实验室
刚进入12月,DeepSeek 又一次无预告地发布了备受期待的 V3.2 系列模型—— DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale,距离上次9月末发布Deepseek-V3.2-Exp仅过去2个月。本次更新不仅是技术迭代的成果,更像是一次针对大模型能力天花板的主动探索。两款模型师出同门,却有着清晰的分工:一个追求高效实用的日…