12月16日,Black Forest Labs 毫无预兆地抛出了一枚重磅炸弹——Flux.2 [max] 正式发布。这次发布堪称一次彻底的突袭,因为在早期的官方路线图中,Flex 版本曾被定为旗舰,而 [max] 的横空出世,直接打破了既有的产品天花板,重新定义了 Flux 系列的最高标准。

根据官方发布的最新模型矩阵,Flux.2 的生态布局已彻底清晰:

在 [max] 的众多升级点中——包括极致的性能、跨任务编辑的一致性、以及最强的提示词跟随能力——最吸引我注意的是“基础搜索(Grounding Search)”功能。从对比表中可见,这是 [max] 版本的独有功能。这意味着 Flux 不再只是基于训练数据回忆,而是能实时联网查阅。当用户要求生成即时新闻、流行单品或最新时尚趋势时,它能通过搜索获取实时信息进行可视化,极大地补全了“世界知识”这一短板。
在最新的 LMArena 榜单上,Flux-2-Max 目前位居文生图第 4 名,图像编辑第 11 名


302.AI 现已接入 Flux.2 [max] API。 随着这位超新星的登场,2025 年末的图像模型终局之战正式打响。能有资格站在 Flux.2 [max] 对面的,依然是那两位老对手:GPT-Image-1.5 与 Nano Banana Pro。究竟是搜索外挂更强,还是老牌霸主更稳?评测开始。
I. 实测模型基础信息
(1) The price of each real model at 302.AI:
| 模型名称 | clarification | 302.AI内的价格 | |
| Flux.2 [max] | Generations(生成图片) | 文字输出 | 输入$5/ 1M tokens输出$10/ 1M tokens |
| 图片输出 | 输入$5/ 1M tokens输出$32/ 1M tokens | ||
| Edit(修改图片) | 文字输入 | 输入$5/ 1M tokens输出$32/ 1M tokens | |
| 图片输入 | 输入$8/ 1M tokens输出$32/ 1M tokens | ||
| GPT-Image-1.5 | Generations(生成图片) | 图片输出 | 输入$5 / 1M tokens输出$32 / 1M tokens |
| 文字输出 | 输入$5 / 1M tokens输出$10 / 1M tokens | ||
| Edit(修改图片) | 图片输出 | 输入$5 / 1M tokens输出$32 / 1M tokens | |
| 文字输出 | 输入$8 / 1M tokens输出$32 / 1M tokens | ||
| Nano Banana Pro | 输入$2 / 1M Tokens输出$120 / 1M Tokens | ||
| (1K/2K)$0.14 / 次 | |||
(2)测评目标:
- 生成质量与真实感:评估各模型在图像生成和图像编辑后的视觉效果,包括提示词遵循、细节表现、以及是否存在伪影或失真等。
- 指令理解与执行准确性:测试模型对文本或图像指令的理解能力,检查编辑结果是否准确反映用户意图。
(3)测评工具:
- 所有模型均使用 302.AI 的 API 超市→在线调试功能
(4)测评方法:
各案例均使用统一的提示词和图片进行生成,均取第一次生成结果,评测结果仅供参考。
Ⅱ. 测评案例
案例 1:文生图-世界知识
测试点:世界知识,人物拟真,美学
clue:Realistic photo shot by Nikon FM2 taken at 52°31′N 13°23′E on Nov 9, 1989. Crowd perspective.
真实事件:推倒柏林墙
翻译:
拍摄于1989年11月9日,地点北纬52°31′东经13°23′,使用尼康FM2相机拍摄的现实主义风格照片。人群视角。
Flux-2-Max

GPT-Image-1.5


附现实参考:

| 测评点 | Flux-2-Max | GPT-Image-1.5 | Nano Banana Pro |
| 事件准确度 | ★★★★★ | ★★★★★ | ★★★★★ |
| 画面拟真度 | ★★★★★ | ★★★★★ | ★★★★★ |
| 画面美感 | ★★★★ | ★★★★★ | ★★★★ |
| 简评 | GPT-Image-1.5略胜。更多是主观审美的一场对比,哪张获胜都不算意外。结合史实照片,无论是墙体本身构造,背景的柏林登堡门,群众穿着,汽车型号,都符合当时历史。我选GPT是因为这张高噪点带来的粗粝质感更符合胶片摄影风格,具有年代感,构图规整,但人物动作丰富。 | ||
案例 2:文生图-信息图制作
测试点:世界知识,文字渲染,构图排版
clue:
迪士尼经典的平面手绘风格,制作疯狂动物城2的主要人物关系信息图,使用中文描述。
Flux-2-Max

GPT-Image-1.5

Nano Banana Pro

| 测评点 | Flux-2-Max | GPT-Image-1.5 | Nano Banana Pro |
| 信息准确度 | ★★ | ★★★ | ★★★★ |
| 风格准确度 | ★★ | ★★★★ | ★★★★★ |
| 中文文字生成 | ★★ | ★★★★ | ★★★★★ |
| 简评 | Nano Banana Pro胜。NBP的关系图处理非常聪明,将反派模糊泛化为一个不明形象,一并标记为主角团的“新威胁”,在基础的文字和风格准确性上发挥无误,但漏洞在于右下角生成了一个影片中不存在的角色,且第二部最重要的新角色“蛇盖瑞”也并未体现;GPT和Flux的作品分别出现了文字乱码、关系标注混乱和风格化不符的现象,尤其Flux甚至出现角色与名称不符的问题。 | ||
案例 3:文生图-人像摄影
测试点:世界知识,人像拟真
clue:
Masterpiece, best quality, historical photo, large format film photography (8×10 analog plate), The Beatles performing their famous rooftop concert in London, 1969.
Location: The rooftop of Apple Corps building, Savile Row, London.
Background: Overcast grey London sky, cold winter day, blurry London chimneys and brick rooftops in the distance.
Vibe: Raw, candid, documentary style, wind blowing their hair and coats.
Camera: Shot on a Linhof large format camera, Kodak Portra 400 film stock.
Quality: Incredible detail in fabric textures (fur, wool), realistic film grain, soft natural overcast lighting, depth of field slightly blurring the background buildings.
翻译:
大师级作品,最佳品质,历史照片,大画幅胶片摄影(8×10 模拟底片),1969年披头士乐队在伦敦进行著名的屋顶演唱会。
地点: 伦敦萨维尔街苹果公司大楼屋顶。
背景: 伦敦阴沉的灰色天空,寒冷的冬日,远处模糊的伦敦烟囱和砖砌屋顶。
氛围: 原始、自然、纪实风格,风吹动着他们的头发和外套。
相机: 使用Linhof大画幅相机,柯达 Portra 400 胶卷拍摄。
品质: 织物纹理(毛皮、羊毛)细节惊人,逼真的胶片颗粒感,柔和的自然阴天光线,景深使背景建筑略微模糊。
Flux-2-Max

GPT-Image-1.5

Nano Banana Pro

附现实参考:


社媒用户评论(社媒图片顺序为GPT, NBP, Flux)

| 测评点 | Flux-2-Max | GPT-Image-1.5 | Nano Banana Pro |
| 细节准确度 | ★★★ | ★★★ | ★★★★ |
| 人物拟真度 | ★★★ | ★★★★ | ★★★★★ |
| 画面美感 | ★★★ | ★★★★★ | ★★★★ |
| 简评 | Nano Banana Pro胜。在模型都能准确还原事件的人物,地点的基础上,是对细节的极致考量。这则案例我分享到了XHS,老乐迷不难识别出问题:列侬有无胡子,琴的颜色(3张都错),保罗是左手琴(NBP正确). Flux的人物相似度最差,GPT最具摄影质感,NBP细节最准确,像是当年照片的4K高清修复。 | ||
案例 4:图生图-营销物料
测试点:世界知识,摄影拟真
clue:
A bottle of Bombay Sapphire Gin submerged in crystal clear water, caustic light patterns dancing across surface, underwater photography, pristine clarity, suspended weightlessness, aquatic elegance, high-speed capture, refreshing aesthetic. Add the relevant brand logo and slogan for marketing use.
翻译:
一瓶孟买蓝宝石金酒沉入清澈透明的水中,水面跃动着焦散光影,水下摄影,极致纯净,悬浮的失重感,水中优雅,高速捕捉,清爽美学。添加相应品牌标识及宣传语以供市场营销使用。
Flux-2-Max
触发版权审核,“Bombay Sapphire Gin”这个注册商标产品,拒绝生成,去官网尝试亦然。这就比较迷了,上面案例迪士尼和Beatles可都是最头部的版权大户。

将提示词主体改为“A green glass bottle of beer ”,生成成功。

GPT-Image-1.5

logo方法参考:

Nano Banana Pro

现实参考:

| 测评点 | Flux-2-Max | GPT-Image-1.5 | Nano Banana Pro |
| 主体拟真度 | ★★★★★ | ★★★★ | ★★★★ |
| 文字渲染 | ★★★★ | ★★★★★ | ★★★★ |
| 画面美感 | ★★★★ | ★★★★★ | ★★★ |
| 简评 | GPT-Image-1.5胜。胜点:构图&文案排版合理,文字清晰,背景&色彩绚丽,独一档,但可惜商标Logo的人物细节崩坏,没能完美。NBP相比之下,色调,排版,以及生成的多余的水草,都在美学上稍逊一筹。 | ||
案例 5:图生图-人物一致性
测试点:特定角度,人像拟真,人物一致性
clue:
This high-resolution bird’s-eye view photograph was taken with a LOMO Ic-a. The ground is covered with countless black and white billboard advertisements of the actress Shuqi, and standing on top of the advertisements is the characters from the reference picture.
翻译:
高分辨率鸟瞰图,采用 LOMO Ic-a 拍摄。
地面上铺满了无数舒淇的黑白广告牌,参考图片中的角色正站在这些广告之上。

Flux-2-Max

GPT-Image-1.5

Nano Banana Pro

| 测评点 | Flux-2-Max | GPT-Image-1.5 | Nano Banana Pro |
| 人物一致性 | ★★★ | ★★★★★ | ★★★★ |
| 画面拟真度 | ★★★ | ★★★★★ | ★★★★ |
| 画面美感 | ★★★ | ★★★★ | ★★★ |
| 简评 | GPT-Image-1.5胜。依次来说:Flux人物肤色明显发生偏移,背景中海报上的舒淇出现各种“崩坏”;GPT的肤色偏冷白皮,视觉讨喜,人物表情高度还原参考图,不足就是背景的照片过于单一;NBP则明显想炫技,背景海报生成了大量不同造型的舒淇,但问题就在于随之而来的大量AI文字,破坏了氛围。 | ||
案例 6:图生图-多图编辑
测试点:多图融合,风格迁移,一致性
clue:
将图1的人物换为图2的人物,保持图1人物的动作;
将图3的印花置于图二人物的长袖卫衣上;
将图4的帽子和图5的裤子给图2的人物穿上;
最后将原始的黑白照片处理为彩色照片。


Flux-2-Max

GPT-Image-1.5

Nano Banana Pro

附模特面部放大参考:

| 测评点 | Flux-2-Max | GPT-Image-1.5 | Nano Banana Pro |
| 细节一致性 | ★★★★★ | ★★★ | ★★★ |
| 画面拟真度 | ★★★★★ | ★★★★★ | ★★★★★ |
| 画面美感 | ★★★★ | ★★★★★ | ★★★★★ |
| 简评 | Flux-2-Max胜。核心差异:1.图2模特身穿的是长袖(GPT,NBP错误);2.人物的姿势和角度(人物略侧身,歪头),Flux的一致性最佳(GPT改变了焦距,NBP人物为正面);3.上色处理,Flux背景墙片冷色调,视觉上略显单调,NBP处理得最好,美感最佳。 | ||
III. Flux.2 Max 图像模型实测结论

实测结果汇总:

在本轮与 GPT-Image-1.5 和 Nano Banana Pro 的年末决战中,Flux-2-Max 的表现称得上亮眼。作为Flux的旗舰模型,它在实战中的表现呈现出了比较鲜明的特性。
- 核心优势:优秀的结构一致性与细节还原
Flux-2-Max 在涉及多图编辑的任务中,展现了不俗的实力。在案例6,最考验模型逻辑的多图融合任务中,Flux-2-Max 表现亮眼:无论从人物服装细节,到姿势构图,在Feature Consistency(特征一致性)这一核心技术指标上,Flux-2-Max 完全不输甚至优于另两位天花板模型。
- 致命短板:还不够准的“世界观”与美学短板
与其卓越的结构能力形成鲜明对比的,是它在认知层面的不足。
世界知识的不足(案例2、3): 尽管有搜索功能,但在生成历史人物(如列侬)或复杂信息图时,Flux-2-Max 的表现并不尽如人意。人物相似度最低(案例3披头士),角色名称与图像不符(案例2动物城),出现大量文字乱码。这说明它的搜索功能并未有效转化为对画面内容的精准控制。
审美掉队(案例4、5): 在需要“网感”和美学设计的营销物料和人像任务中,Flux-2-Max 显得不够高级,讨喜。人物肤色偏移、背景元素崩坏、排版缺乏美感。相比 GPT 的美学和 NBP 的炫技,Flux 的画面显得生硬且缺乏吸引力。
按需求场景来说,如果需要极高精准度的图像编辑、多图融合、以及对人物姿态/服装特征有严格要求的工业级工作流,那么Flux-2-Max值得一试。
如果需要生成具体的历史名人、复杂信息图表、极具美感的营销海报,或者任何依赖“世界常识”的信息图表,尤其是涉及中文的信息,并不推荐这款模型。目前的 Flux-2-Max 更像是一个强大的后端渲染引擎,而非一个全能的创意总监。它适合作为生产管线中的一环(如一致性),而不适合独立完成从创意到交付的全流程。
Ⅳ. 如何在 302.AI 上使用
302.AI 提供按需付费无订阅的服务模式,用户可以根据自身业务需求灵活选择使用。
使用模型 API
步骤指引:API超市→图片生成→Flux→Flux-2-Max


点击【立即体验】在线调用 API

想即刻体验 Flux.2 [max] 模型?
👉立即注册免费试用302.AI,开启你的AI之旅!👈
为什么选择302.AI?
● 灵活付费:无需月费,按需付费,成本可控
● 丰富功能:从文字、图片到视频,应有尽有,满足多种场景需求
● 开源生态:支持开发者深度定制,打造专属AI应用
● 易用性:界面友好,操作简单,快速上手
