昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

11月25日,Black Forest Labs终于将其2024年发布的图像模型Flux迭代至2.0版本。作为开源模型,Flux曾凭借其性价比与微调能力,一时风头无两,几乎取代了Stable Diffusion的生态。诸如腾讯混元针对人像微调的Flux-1-SRPO也获得过我们不错的评价。但近半年,随着谷歌Nano Banana和字节跳动SeeDance的问世,图像模型早已成为巨头的天下,用户的期待阈值也变得越来越高。

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

一图概览本次发布的重点内容:

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

首先是3个版本:

版本[pro] 闭源[flex] 闭源[dev] 开源
适合用于生产工作流程最高质量,旗舰版本地开发
速度少于 10 秒更高的延迟取决于硬件
多重参考最多支持 8最多 10建议最多 6
控制标准可调节步数与引导完全自定义

其次是5项能力提升:

多参考图像支持,图像细节与照片级真实感,文本渲染,增强的提示遵循能力,世界知识。

讲真,这5点都不算新功能&黑科技,已是目前顶级图像模型基础能力。至于其世界知识的来源,是24B参数的Mistral-3视觉语言模型与rectified flow Transformer结合。去和背靠Gemini 3 ProNano Banana Pro对标,恐怕是心有余力不足。

302.AI现已接入Flux 3个版本的API。话不多说,到底新一代模型的能力如何,本次评测我们选择闭源版本的Flux ProFlux Flex直面Nano Banana Pro,进行全方位对比实测。(开源[dev]版本会另行测试)


I. 实测模型基础信息

(1)各实测模型在 302.AI 的价格:

模型名称302.AI内的价格说明
Flux.2 Pro输出像素≤1MP:$0.03/MP(百万像素)输入+输出像素>1MP的超出部分,$0.015/MP(百万像素)以1080*720尺寸计算,成本$0.03
Flux.2 Flex$0.06/MP(百万像素)以1080*720尺寸计算,成本$0.06
Gemini-3-pro-image-preview(Nano Banana Pro)按token:输入$2 / 1M Tokens;输出$120 / 1M Tokens按次:1K/2K画质:$0.15 / 次;4K画质:$0.24 / 次

(2)测评目标:

  • 生成质量与真实感:评估各模型在图像生成和图像编辑后的视觉效果,包括提示词遵循、细节表现、以及是否存在伪影或失真等。
  • 指令理解与执行准确性:测试模型对文本或图像指令的理解能力,检查编辑结果是否准确反映用户意图。

(3)测评工具:

  • Nano Banana Pro 使用 302.AI 应用超市→聊天机器人应用
  • Flux.2系列模型 使用 302.AI 的 API 超市→在线调试功能

(4)测评方法:

各案例均使用统一的英文提示词和图片进行生成,且均取第一次生成结果,评测结果仅供参考。


Ⅱ. 测评案例

案例 1:文生图-多主体&世界知识

测试点:世界知识,人物拟真,构图排版

提示词

Hyper-realistic digital art masterpiece. Max Verstappen is the central figure, wearing a detailed Red Bull racing kit, walking away from a smoking RB21 F1 car. The background is a dramatic sky filled with purple and sunset-orange haze. Rising from the smoke behind him is the colossal, metallic figure of Optimus Prime, rendered with intense realism and glowing blue eyes. The composition uses a layered collage style similar to sports tribute posters. Sparks, debris particles, and dynamic lighting create a high-impact visual. Metallic textures, reflections, vivid colors, unreal engine 5 render style, intense focus.

翻译:超写实数字艺术杰作。 麦克斯·维斯塔潘(Max Verstappen)是画面的中心人物,身穿细节丰富的红牛赛车服,正背对着一辆冒烟的RB21 F1赛车走开。 背景是极具戏剧性的天空,弥漫着紫色和日落橙色的雾气。 从他身后的烟雾中耸立而起的是巨大的金属擎天柱(Optimus Prime),渲染得极度写实,双眼闪烁着蓝光。 构图采用了类似于体育致敬海报的分层拼贴风格。 火花、碎片颗粒和动态光照营造出极具视觉冲击力的画面。 金属质感、反光、鲜艳的色彩、虚幻引擎5渲染风格、焦点清晰。

Flux.2 Pro

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

Flux.2 Flex

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

Nano Banana Pro

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

附现实中相关元素对比参考:

测评点Flux.2 ProFlux.2 FlexNano Banana Pro
主体一致性★★★★★★★★★
画面美感★★★★★★★★★★★
提示词遵循★★★★★★★★★★★★
简评Nano Banana Pro完胜。本案例的核心是对各模型世界知识的测试,是否能够高保真度地去还原现实中的各主体:人物,赛服,车辆以及擎天柱。Pro完败:规避了主体人物面孔,赛车服印花(细节如赛车鞋)和擎天柱的形象都不正确;Flex的整体一致性过关,饱和度过高,构图有裁切问题(擎天柱头部,维斯塔潘的脚),从摄影角度来讲是可以规避的错误;Nano Banana除了潘子的表情有点拉胯(不够帅),其他点无可挑剔,尤其出彩的是撕拉纸的排版设计,边角巧妙融入了红牛与变形金刚的元素。这要是PS传统方式做,图层工作量相当复杂。

案例 2:文生图-人物拟真

测试点:世界知识,人物拟真,指定艺术风格

提示词

Candid film photo, grainy texture, Fujicolor Superia style. David Beckham, age 27, standing over a football, preparing to take a crucial free kick for England. He is wearing the long-sleeved white England jersey. The camera captures a mid-shot, focusing on his determined gaze and furrowed brows, capturing the pressure of the moment. Soft, natural sunlight hitting his face, casting dramatic shadows. The background is the green pitch and blurred stands of Wembley Stadium. Retro aesthetic, authentic 90s/00s football vibe, detailed fabric texture, raw and unpolished look.

翻译:

抓拍胶片照片,颗粒质感,富士 Superia 胶卷风格。 27岁的大卫·贝克汉姆站在足球前,正准备为英格兰队主罚一记关键的任意球。 他身穿长袖白色英格兰球衣。 相机捕捉了一个中景镜头,聚焦于他坚定的注视和紧锁的眉头,捕捉到了当下的压力感。 柔和的自然光洒在他的脸上,投下富有戏剧性的阴影。 背景是绿茵场和温布利球场模糊的看台。 复古美学,纯正的90年代/00年代足球氛围,织物纹理细节丰富,原始且未经修饰的观感。

Flux.2 Pro

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

Flux.2 Flex

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

Nano Banana Pro

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

附同时期贝克汉姆参考:

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室
测评点Flux.2 ProFlux.2 FlexNano Banana Pro
人物一致性★★★★★
画面美感★★★★★★★★★
提示词遵循★★★★★★★★★
简评Nano Banana Pro完胜。这案例无需点评Flux了。我原本只想生成张贝克汉姆来点评人像质量,但谷歌生动演绎了什么叫做世界知识,一切源于图片的日期水印:2001年10月6日。贝克汉姆的生日为1975年5月2日 ,准确还原了提示词要求“27岁的大卫·贝克汉姆”。进一步检索该日期,结果令我叹服。见下图:英格蘭在1-2落後的情況下,在補時階段比賽中,貝克漢姆任意球扳平比分,使英格蘭隊進入世界杯決賽。以此拓展思路的话,可以衍生出类似“历史上的今天”这种创意玩法。
昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

案例 3:文生图-风格化&英文生成

测试点:指定风格,文字生成,构图排版

提示词

A classic 1950s-style hand-painted Christmas card illustration. Inside a cozy, warmly lit living room with a roaring fireplace and a glowing Christmas tree, a traditional, jolly Santa Claus in a red velvet suit stands in the center. He is holding a vintage sack of toys over his shoulder and smiling warmly at the viewer.

The typography is elegant and integrated into the design:

  1. At the top, in bold, gold-embossed serif letters, it reads: “Merry Christmas 2025”
  2. At the bottom, on a festive red ribbon banner, the text reads: “Peace & Joy to All”

The image features intricate details, a nostalgic atmosphere, golden lighting, and a textured canvas finish reminiscent of Norman Rockwell paintings. High resolution, festive colors.

翻译:

一张经典的1950年代风格手绘圣诞贺卡插图。 在一个温暖舒适、灯光柔和的客厅里,有熊熊燃烧的壁炉和发光的圣诞树。一位传统的、快乐的圣诞老人身穿红色天鹅绒套装站在中央。 他肩上扛着一个复古的玩具袋,正温暖地对着观众微笑。

排版优雅且融入设计之中: 1. 在顶部,用粗体、金色浮雕衬线字体写着:“Merry Christmas 2025” 2. 在底部,在一个节日红丝带横幅上,文字写着:“Peace & Joy to All”

画面具有复杂的细节、怀旧的氛围、金色的光照,以及让人联想到Norman Rockwell画作的纹理画布质感。高分辨率,节日色彩。

Flux.2 Pro

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

Flux.2 Flex

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

Nano Banana Pro

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

附Norman Rockwell作品风格参考:

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室
测评点Flux.2 ProFlux.2 FlexNano Banana Pro
画面美感★★★★★★★★★★★★★
文字美感★★★★★★★★★★★★
提示词遵循★★★★★★★★★★★★★★★
简评Flux.2 Pro胜。难得以下克上了一回,以个人审美解析下:1.画面色彩风格。前两个案例也能看出,Pro和Flex对于色彩处理有着显著差异,前者低饱和度,低明度,后者相反。在此案例中,我希望得到的是复古感更强的观感,可以对比我提供的原作者画作,Pro的色彩处理天然占优,画面边缘还增加了做旧的纹理;2.还是构图差异,Flex的圣诞老人截掉了小腿以下部分,Banana是半身像,Pro完整展示了圣诞老人全身,画面信息完整度更高;3.字体尤其是飘带的处理,Pro的复古风格与画面完美契合,后两者则明显有现代数码感,产生了一定割裂。

案例 4:文生图-中文生成

测试点:文字生成,构图排版

提示词

A close-up, photorealistic shot of an ancient textured rice paper scroll unrolling in the air. On the paper, bold and elegant black ink brush strokes (Wang Xizhi style running script). Background: A soft-focus, bokeh background of a busy street in Tang Dynasty Chang’an during the day. Hints of red lanterns, wooden towers, and sunlight filtering through willow trees. Lighting: Warm, golden sunlight hitting the paper texture, creating a sacred and cultural atmosphere. Composition: Minimalist center composition, leaving negative space for text. High definition, macro details of ink bleeding into paper.

The text shows: 《登科后》,作者:唐·孟郊 昔日龌龊不足夸,今朝放荡思无涯。 春风得意马蹄疾,一日看尽长安花。

翻译:

一张特写、照片级写实的镜头:一卷古老的、富有纹理的宣纸卷轴正在空中展开。纸上是苍劲优雅的黑色水墨笔触(王羲之行书风格)。

背景:大唐长安繁华街道的柔焦、虚化背景。依稀可见红灯笼、木制塔楼的轮廓,以及透过柳树洒下的阳光。

光照:温暖的金色阳光洒在纸张纹理上,营造出一种神圣且充满文化底蕴的氛围。

构图:极简主义的居中构图,留出负空间以便排版文字。高清画质,展现墨汁渗入纸张的微距细节。文字内容为:《登科后》,作者:唐·孟郊 昔日龌龊不足夸,今朝放荡思无涯。 春风得意马蹄疾,一日看尽长安花。

Flux.2 Pro

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

Flux.2 Flex

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

Nano Banana Pro

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

附王羲之字体参考:

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室
测评点Flux.2 ProFlux.2 FlexNano Banana Pro
文字准确性★★★★★
提示词遵循★★★★★★★★★★★★
简评Nano Banana Pro胜。胜点一目了然,准确,清晰的中文生成。背景,光照,纸张材质的渲染3款模型都准确遵循了提示词,但对于更具体的要求“王羲之行书风格”,即便Banana Pro目前也无法实现。对于字体的加强和丰富,相信是下一代模型升级的一个重要特性。

案例 5:图生图-多参考图

测试点:多图参考,人物拟真

提示词

让图1的人物穿上图2中所有服饰,注意墨镜要搭在额头,不要遮挡人物面部,处于图3的背景中,人物摆出图1的姿势。

共计元素8项:人物*1,服饰*6,背景*1

Flux.2 Pro

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

Flux.2 Flex

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

Nano Banana Pro

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室
测评点Flux.2 ProFlux.2 FlexNano Banana Pro
主体一致性★★★★★★★★★★
画面美感★★★★★★★★★★★
提示词遵循★★★★★★★★★★★★★
简评Nano Banana Pro胜。比较有代表性的一组测试。Pro的一致性问题:原图人物左手无戒指,Diesel皮带扣缺失,摩利臣街汉字出现错误;姿势完全还原图1,但头身比例差,导致观感不佳,模特有佝偻感;Flex版本美感不错,但还是老问题:饱和度太高,人物肌肤有AI感,表情有变化。最大问题是未生成全身图,缺失了袜子和鞋的生成,背景路人发生改变; Banana则是炫技:调整了人物方向,参考图的侧身调整为正面的同时保持了抱手的姿势,细节一致性高,还原了模特的黑色指甲。但一致性上也有问题:1.原图背景中牵手的行人位置发生了改变,最右边新生成了一名路人,但不影响整体观感;2.裤子下摆的处理有点尴尬,说一致性高是为了留空间展示袜子,说一致性变化是截短了裤长,导致参考图中喇叭裤的裤型发生变化。整体画面美感上略显平淡,缺乏光影带来的人物立体感。

III. Flux .2 Pro & Flux .2 Flex模型实测结论

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室
昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

如今的图像模型,但凡闭源,自然都需要直面Nano Banana Pro的对比,很容易沦为背景板:Nano Banana Pro完全就是个六边形战士,几无短板。审美在线,人物拟真度顶尖,指令遵循度准确,文字生成清晰以及非常惊艳的世界知识,无不彰显着谷歌的技术力。

如果需求是创作英文海报、艺术插画这类对视觉美感要求高、但逻辑复杂度相对较低,人物一致性要求低的内容,那么Flux.2 可以纳入工具箱作为选择——它能给你提供优秀的色彩控制、精致的文字渲染、多样的风格化表现,以及快速的出图时间。

但如果需求是:根据一段复杂的文字描述生成多主体场景、还原现实中人物形象、生成中文内容、处理需要世界知识支撑的创作任务,那么Flux.2 显然并无法满足。

换句话说,Flux.2系列是设计师,Nano Banana Pro则是创意总监。前者适合那些对视觉表现有一定追求、但场景相对简单的创作;后者适合那些需要AI真正理解你的意图、处理复杂逻辑、调用真实世界知识的应用场景。

AI生图工具的未来方向在哪里?

真正的突破方向,Nano Banana Pro已经树立了标杆:让AI生图工具具备”深度推理”和”世界知识调用”的能力。当一个生图模型不再是简单的”像素排列组合器”,而是成为一个”能够理解现实世界逻辑、调用海量知识库、进行复杂推理”的智能体时,它的应用边界就会被无限拓宽。

最后附上最新出炉的LMArena榜单:

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室
昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

Ⅳ. 如何在 302.AI 上使用

302.AI 提供按需付费无订阅的服务模式,用户可以根据自身业务需求灵活选择使用。

使用模型 API

相关文档:API→API超市→图片生成→Flux→Flux-2-Pro或Flex→立即体验;

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室
昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

点击【在线调试】调用 API

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室

想体验 Flux.2 系列模型?

👉立即注册免费试用302.AI,开启你的AI之旅!👈

为什么选择302.AI?

● 灵活付费:无需月费,按需付费,成本可控

● 丰富功能:从文字、图片到视频,应有尽有,满足多种场景需求

● 开源生态:支持开发者深度定制,打造专属AI应用

● 易用性:界面友好,操作简单,快速上手

昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室
All Rights Reserved by 302.AI
喜欢 (0)
302.AI302.AI
上一页 2天前
下一页 2024 年 10 月 31 日 下午6:39

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注