Benchmark laboratory

AI图像模型2025年度测评：从视觉惊艳的玩具走向商业交付的生产力工具 | 302.AI 基准实验室

I. 引言：从“惊艳”走向“精准”的变革之年如果说2023年是AI绘画的“奇点”，2024年是百花齐放的“探索期”，那么刚刚过去的2025年，无疑是AI图像生成技术真正从“玩具”向“工具”蜕变的一年。站在2026年初的回望点上，我们不得不承认，行业格局的洗牌速度远超预期。在半年前，我们在半年度的测评中还在讨论“哪张图更拟真，具有摄影的质感”，而到了今天，…
5 day ago • Benchmark laboratory
59900
Qwen-Image-2512 实测：阿里开源闭源图像模型同台竞技，结果意想不到 | 302.AI 基准实验室

阿里通义团队于 12 月最后一天开源了 Qwen-Image-2512。作为对去年 8 月发布的 Qwen-Image 的全面进化，新版本致力于在图像真实性、纹理细腻度与复杂图文渲染三大维度实现跨越式进步，让生成内容无限贴近真实世界。去“AI 味”已经是 AI 生图领域老生常谈的一个话题，此次 2512 版本不仅显著削弱了生成图片的 AI 感，更在人物肌肤…
2026 年 1 月 6 日 • Benchmark laboratory
85500
把图片像PSD一样拆开？Qwen-Image-Layered：找到了AI修图的新路，却还没跨过“商用”门槛丨302.AI 基准实验室

阿里通义团队于 12 月 19 日推出了其新一代图像生成模型 Qwen-lmage-Layered。新模型采用自研创新架构，可将图片“拆解”成多个图层。这种分层表示赋予了图像内在的可编辑性：每个图层都可以独立操作，而不会影响其他内容。 Qwen-lmage-Layered 的核心突破在于其革命性的“智能分层”能力。与传统的、直接生成一张平面像素图的模型不同，…
2026 年 1 月 4 日 • Benchmark laboratory
1.1K00
懂交付，更懂质感：MiniMax M2.1 Vs. GLM 4.7 国产开源顶流对决丨302.AI 基准实验室

12 月 23 日，MiniMax 正式对外发布其新一代旗舰级 Coding & Agent 模型 MiniMax M2.1。与许多大模型发布会执着于罗列通用知识得分不同，M2.1 这次把所有的聚光灯都打在了“编程”与“智能体”这两个关键词上，官方定位直言不讳：为真实世界的复杂任务而生。显然，这不仅仅是一次常规的版本迭代，更像是 MiniMax 在…
2025 年 12 月 31 日 • Benchmark laboratory
1.7K01
谁才是前端Agent天花板？国产Agent & Manus与Claude Code实战对决丨302.AI 基准实验室

12 月 26 日，302.AI 发布了全新的多平台桌面客户端，凭借内置的 Claude Code 云端沙盒功能，进一步降低了Vibe Coding的门槛。发布后我们也收到了很多用户的咨询与反馈，比较有代表性的问题就是近几个月，Agent 与 Coding 已成为目前模型在垂直领域最热门的两大落地板块，国内各家模型厂商都在加强其大模型的“Agentic”工…
2025 年 12 月 30 日 • Benchmark laboratory
1.2K00
智谱压轴力作 GLM-4.7 实测：从基准刷榜到任务交付，稳坐开源第一丨302.AI 基准实验室

随着2025年接近尾声，大模型领域的竞争未见放缓，反而迎来了一波重磅更新。今日凌晨，智谱突袭发布了其新一代旗舰模型——GLM-4.7，以一系列 SOTA 表现，为今年的开源战场献上了堪称“压轴”的力作。此次更新将核心焦点投向了编码能力、长程任务规划与智能体协作，不仅在多项国际主流基准测试中横扫开源榜单，更以任务交付为核心，致力于成为开发者手中真正高效、可靠…
2025 年 12 月 23 日 • Benchmark laboratory
3.5K00
年终图像模型对局：加了联网搜索功能的Flux-2-Max，会是新霸主么？丨302.AI 基准实验室

12月16日，Black Forest Labs 毫无预兆地抛出了一枚重磅炸弹——Flux.2 [max] 正式发布。这次发布堪称一次彻底的突袭，因为在早期的官方路线图中，Flex 版本曾被定为旗舰，而 [max] 的横空出世，直接打破了既有的产品天花板，重新定义了 Flux 系列的最高标准。根据官方发布的最新模型矩阵，Flux.2 的生态布局已彻底清晰：…
2025 年 12 月 22 日 • Benchmark laboratory
63200
谷歌的“普惠核弹”：Gemini 3 Flash 实测——更快、更强、更省可以兼得丨302.AI 基准实验室

12 月 18 日深夜，谷歌闪击式抛出一枚“重磅炸弹”——Gemini 3 Flash 发布。这次发布没有过多的预热，但其展现出的性能与成本组合，足以让整个 AI 领域重新审视现有的竞争格局。简而言之，Gemini 3 Flash 做了一件看似矛盾的事：它以一个“轻量版”模型的定位和极低的成本，提供了接近甚至部分超越旗舰模型的顶尖性能。性能：打破“轻量即…
2025 年 12 月 19 日 • Benchmark laboratory
1.6K00
影视级模型Wan 2.6 深度评测：做广告脚本的神器，但别用它拍电影丨302.AI 基准实验室

12 月 16 日，阿里正式发布了新一代万相 Wan 2.6 系列模型，面向专业影视制作和图像创作场景进行了全面升级。全新的 Wan 2.6 是国内首个支持角色扮演功能的视频模型，同时支持音画同步、多镜头生成及声音驱动等功能。此次升级版本直接对标 Sora2，其核心功能亮点体现在以下几方面：其中最值得关注的当属智能多镜头叙事能力。分镜是电影级创作的一个专…
2025 年 12 月 18 日 • Benchmark laboratory
1.2K00
图像模型SOTA易主？GPT-Image-1.5 对决Nano Banana Pro测评丨302.AI 基准实验室

12月16日晚，OpenAI 正式发布了全新的旗舰图像生成模型——GPT Image 1.5 这确实是一个久违的名字。时间回溯到今年3月26日，OpenAI 首次推出了基于 GPT-4o 的图像生成模型 GPT Image 1.0，那场发布会直接引爆了一波席卷全球的”万物皆可吉卜力”风格热潮。无论是社交媒体上的普通用户，还是专业设计师…
2025 年 12 月 17 日 • Benchmark laboratory
67200

1 / 16
1
2
3
4
5
6