神秘的Nano Banana终现真身：Gemini-2.5-flash-image展示统治级实力丨302.AI 基准实验室

昨晚，Google 终于公开了其最新图像生成与编辑模型 gemini-2.5-flash-image-preview——这正是前段时间在 X 上爆火的 Nano Banana。早在 Google 还未出来“认领”时，Nano Banana 就因强大的主体一致性和闪电般的响应速度而广获好评，在社区圈粉无数。

出道即巅峰，此模型一经公开就在 Artificial Analysis 图像编辑排行榜上跻身第一位，获得了 1212 的 ELO 分数。Google 官方表示，这确实是一款 SOTA 级的图像编辑模型，其在角色一致性、自然语言定向编辑、多图像融合等方面表现出明显优势，玩法十分丰富。

302.AI 已在第一时间接入了 gemini-2.5-flash-image-preview 的 API，本期横评的对手将对比上周上线的阿里 Qwen-Image-Edit，GPT-Image-1 以及 Flux-Kontext-Max，为用户选择提供参考。

I. 实测模型基本信息

（1）各实测模型在 302.AI 的价格：

模型名称	302.AI内的价格
gemini-2.5-flash-image-preview	输入 3 PTC/1M Tokens；输出 30 PTC/1M Tokens，约合$0.03-0.05/次
Qwen-Image-Edit	$0.05/次
GPT-Image-1	$0.03/次
Flux-Kontext-Max	$0.03/次

（2）测评目标：

编辑质量与真实感：评估各模型在图像编辑后的视觉效果，包括细节保留、人物色彩一致性、光影自然度以及是否存在伪影或失真。
指令理解与执行准确性：测试模型对文本或图像指令的理解能力，检查编辑结果是否准确反映用户意图。

（3）测评工具：

gemini-2.5-flash-image-preview 和 Qwen-Image-Edit 使用 302.AI 的 API 超市→在线调试功能
GPT-Image-1 和 Flux-Kontext-Max 使用 302.AI 的应用超市→绘图机器人应用

（4）测评方法：

各案例均使用统一的英文提示词和图片进行生成，且均取第一次生成结果，评测结果仅供参考。

Ⅱ. 测评案例

案例1：视角转换

提示词：Change the perspective to a high angle, looking down from above as if from the ceiling.

将视角切换为高角度，从上方俯视，就像从天花板往下看。

gemini-2.5-flash-image-preview / Qwen-Image-Edit

GPT-Image-1 / Flux-Kontext-Max

测评点	gemini-2.5-flash	Qwen-Image-Edit	GPT-Image-1	Flux-Kontext-Max
角度切换	★★★★★	★★★★★	★★★★★	★
环境/人物一致性	★★★★	★★★	★	★★★★★
简评	gemini-2.5-flash 表现最佳，对原画色彩和质感的保留最为完整，唯一缺漏在于右上角人物的衣服还原错误；Qwen 表现尚可，但是画面细节出现多处扭曲失真。gpt 和 flux 均未能达成提示词要求。

案例2：重绘修改

提示词：Change the environment to a nighttime scene with realistic ambient lighting and visible illumination. Add sunglasses to the female model. Put a black baseball cap on the male model. Modify both models’ shoes to a red-and-black color scheme. Keep all other elements, details, and composition in the original image unchanged.

将环境改为夜景，具有真实的环境光照和可见的灯光。给女模特佩戴墨镜。给男模特戴上一顶黑色棒球帽。将两位模特的鞋子修改为红黑配色。保持原图中的其他元素、细节与构图不变。

gemini-2.5-flash-image-preview / Qwen-Image-Edit

GPT-Image-1 / Flux-Kontext-Max

测评点	gemini-2.5-flash	Qwen-Image-Edit	GPT-Image-1	Flux-Kontext-Max
人物一致性	★★★★★	★★★★	★★	★★★★★
环境修改	★★	★★★	★★★★	★★★
细节修改	★★★★	★★★★★	★★★★★	★★★★
简评	Qwen整体表现最佳。人物一致性保留准确，如戒指，纹身等细节；环境转换自然，人物补光合理。但语义遵循上“将鞋子修改为红黑配色”完成度还有待提升。

案例3：文字信息

提示词：Create a Lululemon ad with this image with text copy (include brand name, slogan).

用这张图片制作一则 Lululemon 广告，并添加文字文案（包括品牌名称和标语）。

gemini-2.5-flash-image-preview / Qwen-Image-Edit

GPT-Image-1 / Flux-Kontext-Max

测评点	gemini-2.5-flash	Qwen-Image-Edit	GPT-Image-1	Flux-Kontext-Max
环境/人物一致性	★★★★★	★★★★★	★	★★★★★
文本准确性	★★★★	★	★★	★
排版美感	★★★★★	★★★	★★★★	★★★★★
简评	gemini-2.5-flash最佳，保持/环境一致性的同时生成了准确的logo，与画面内容及品牌调性相关的文案。文字字号，字体，排版具有美感，达到可直接使用的水准。

案例4：风格迁移

提示词：Transform the banana in the image into the distinctive art style of Hajime Sorayama: sleek metallic surface, detailed and refined textures, with a strong futuristic and sci‑fi aesthetic. Ensure the object retains its banana shape but appears as a high‑gloss robot‑like artwork, reflecting Sorayama’s mechanical sensuality. Keep the surrounding elements unchanged.

将图中的香蕉转换为空山基独特的艺术风格：光滑的金属表面、细致精美的纹理，具有强烈的未来感和科幻美学。确保物体保持香蕉的形状，呈现为高光泽、类似机器人的艺术品，体现空山基的机械感官特质。保持周围元素不变。

gemini-2.5-flash-image-preview / Qwen-Image-Edit

GPT-Image-1 / Flux-Kontext-Max

*GPT-Image-1 生成失败，疑似为知名 IP 保护原因导致。

测评点	gemini-2.5-flash	Qwen-Image-Edit	GPT-Image-1	Flux-Kontext-Max
主体一致性	★★★★★	★★★★★	N/A	★★★★★
风格还原	★★★★★	★★★★	N/A	★★★
简评	gemini-2.5最佳。以空山基的平面插画风格进行了重绘，在主体一致性的基础上，合理且具有美感地将香蕉本身的纹路转绘为机械的纹路；保持了部分香蕉本身的黄色，正好是艺术家常用的配色。细节上的倒影，香蕉尾部的渐变色，都体现了极佳的质感。

案例5：多图融合

提示词：Take the person from Image 1 and dress them in all the clothing and accessories from Image 2. Generate a realistic OOTD-style photo set outdoors, with natural lighting, fashionable street-style vibes, and full‑body visibility. Keep the person’s identity and pose from Image 1, but showcase the complete outfit and accessories from Image 2 in a cohesive, stylish way.

从图片1中取出人物，并为其穿上图片2中的所有服装和配饰。在户外生成一张真实感的 OOTD 风格照片，具有自然光线、时尚街拍氛围，并呈现全身。保持图片1中人物的身份特征，以统一且时尚的方式展示图片2中的完整穿搭与配饰。

gemini-2.5-flash-image-preview / Qwen-Image-Edit

GPT-Image-1 / Flux-Kontext-Max

测评点	gemini-2.5-flash	Qwen-Image-Edit	GPT-Image-1	Flux-Kontext-Max
主体一致性	★★★★	★★★	★★★	★★
环境背景	★★★★★	★★★★	★★★★★	★★★★
融合效果	★★★★★	★★	★★★★	★
简评	gemini-2.5-flash最佳。Brad Pitt的面貌得以忠实还原，人物动作自然合理，服装面料质感逼真，与背景的融合几无破绽。挑刺的话，配饰（相机，耳机，背包）的造型与原图都发生了改变，一致性尚未达到完美。

III. Gemini-2.5-flash-image实测结论

经过本轮五个角度的实测案例，Nano Banana / Gemini-2.5-flash-image 不玩虚的，直接打出了一波 4 胜的成绩。简单说，这模型不是来参与竞赛的，更像是上来“宣示主权”的。

自从 Flux Kontext 横空出世，彻底解決了“人物一致性”这道长期难题之后，顶级生图模型的比拼已经从能不能识别清楚，进入了能不能识别得精准而克制。在这场新阶段的博弈中，Gemini不只是能稳稳把画面主体复刻出来，它还能将原图里的光线走向、画面色调、投影形状都尽可能忠实地复用，补强的并不仅是数据，而是质感，美学。

也就是说，Gemini 已经从“造人画像”的模型，变成了一个“能临摹现场”的视觉重构系统。尤其在风格迁移、多主体、多细节的复杂任务下，它的表现确实值得惊叹：

人物不崩；元素不丢；不对氛围，美感自作主张进行二创；局部细节像素级复现。

当然，测试中也不是无懈可击。唯一被“爆冷”的案例出现在测试 2 ——只有 Gemini 没能把环境切换为黑夜，说明它在部分需要强语义转变的场景下，还未做到完美程度。某种程度而言，它像是对原图信息的忠实度太强，反而会削弱对新Prompt的执行力。未来各模型需要追求的，即是在高保真和高自由创作的边界上，探索出最优解的平衡点。

Ⅳ. 如何在 302.AI 上使用

302.AI 提供按需付费无订阅的服务模式，用户可以根据自身业务需求灵活选择使用。

1. 聊天机器人中使用

步骤指引：在线使用→应用超市→机器人→聊天机器人

选择模型：Google模型→gemini-2.5-flash-image-preview→确认→创建

2. 使用模型 API

相关文档：API→API超市→图片生成→Google→gemini-2.5-flash-image-preview→查看文档；

点击【调试】在线调用 API

想体验 Nano Banana / gemini-2.5-flash-image-preview 模型？

👉立即注册免费试用302.AI，开启你的AI之旅！👈

为什么选择302.AI？

● 灵活付费：无需月费，按需付费，成本可控

● 丰富功能：从文字、图片到视频，应有尽有，满足多种场景需求

● 开源生态：支持开发者深度定制，打造专属AI应用

● 易用性：界面友好，操作简单，快速上手

神秘的Nano Banana终现真身：Gemini-2.5-flash-image展示统治级实力丨302.AI 基准实验室

I. 实测模型基本信息