
昨晚,Google 终于公开了其最新图像生成与编辑模型 gemini-2.5-flash-image-preview——这正是前段时间在 X 上爆火的 Nano Banana。早在 Google 还未出来“认领”时,Nano Banana 就因强大的主体一致性和闪电般的响应速度而广获好评,在社区圈粉无数。

出道即巅峰,此模型一经公开就在 Artificial Analysis 图像编辑排行榜上跻身第一位,获得了 1212 的 ELO 分数。Google 官方表示,这确实是一款 SOTA 级的图像编辑模型,其在角色一致性、自然语言定向编辑、多图像融合等方面表现出明显优势,玩法十分丰富。

302.AI 已在第一时间接入了 gemini-2.5-flash-image-preview 的 API,本期横评的对手将对比上周上线的阿里 Qwen-Image-Edit,GPT-Image-1 以及 Flux-Kontext-Max,为用户选择提供参考。
I. 实测模型基本信息
(1)各实测模型在 302.AI 的价格:
模型名称 | 302.AI内的价格 |
gemini-2.5-flash-image-preview | 输入 3 PTC/1M Tokens;输出 30 PTC/1M Tokens,约合$0.03-0.05/次 |
Qwen-Image-Edit | $0.05/次 |
GPT-Image-1 | $0.03/次 |
Flux-Kontext-Max | $0.03/次 |
(2)测评目标:
- 编辑质量与真实感:评估各模型在图像编辑后的视觉效果,包括细节保留、人物色彩一致性、光影自然度以及是否存在伪影或失真。
- 指令理解与执行准确性:测试模型对文本或图像指令的理解能力,检查编辑结果是否准确反映用户意图。
(3)测评工具:
- gemini-2.5-flash-image-preview 和 Qwen-Image-Edit 使用 302.AI 的 API 超市→在线调试功能
- GPT-Image-1 和 Flux-Kontext-Max 使用 302.AI 的应用超市→绘图机器人应用
(4)测评方法:
各案例均使用统一的英文提示词和图片进行生成,且均取第一次生成结果,评测结果仅供参考。
Ⅱ. 测评案例
案例1:视角转换
提示词:Change the perspective to a high angle, looking down from above as if from the ceiling.
将视角切换为高角度,从上方俯视,就像从天花板往下看。

gemini-2.5-flash-image-preview / Qwen-Image-Edit


GPT-Image-1 / Flux-Kontext-Max


测评点 | gemini-2.5-flash | Qwen-Image-Edit | GPT-Image-1 | Flux-Kontext-Max |
角度切换 | ★★★★★ | ★★★★★ | ★★★★★ | ★ |
环境/人物一致性 | ★★★★ | ★★★ | ★ | ★★★★★ |
简评 | gemini-2.5-flash 表现最佳,对原画色彩和质感的保留最为完整,唯一缺漏在于右上角人物的衣服还原错误;Qwen 表现尚可,但是画面细节出现多处扭曲失真。gpt 和 flux 均未能达成提示词要求。 |
案例2:重绘修改
提示词:Change the environment to a nighttime scene with realistic ambient lighting and visible illumination. Add sunglasses to the female model. Put a black baseball cap on the male model. Modify both models’ shoes to a red-and-black color scheme. Keep all other elements, details, and composition in the original image unchanged.
将环境改为夜景,具有真实的环境光照和可见的灯光。给女模特佩戴墨镜。给男模特戴上一顶黑色棒球帽。将两位模特的鞋子修改为红黑配色。保持原图中的其他元素、细节与构图不变。

gemini-2.5-flash-image-preview / Qwen-Image-Edit


GPT-Image-1 / Flux-Kontext-Max


测评点 | gemini-2.5-flash | Qwen-Image-Edit | GPT-Image-1 | Flux-Kontext-Max |
人物一致性 | ★★★★★ | ★★★★ | ★★ | ★★★★★ |
环境修改 | ★★ | ★★★ | ★★★★ | ★★★ |
细节修改 | ★★★★ | ★★★★★ | ★★★★★ | ★★★★ |
简评 | Qwen整体表现最佳。人物一致性保留准确,如戒指,纹身等细节;环境转换自然,人物补光合理。但语义遵循上“将鞋子修改为红黑配色”完成度还有待提升。 |
案例3:文字信息
提示词:Create a Lululemon ad with this image with text copy (include brand name, slogan).
用这张图片制作一则 Lululemon 广告,并添加文字文案(包括品牌名称和标语)。

gemini-2.5-flash-image-preview / Qwen-Image-Edit


GPT-Image-1 / Flux-Kontext-Max


测评点 | gemini-2.5-flash | Qwen-Image-Edit | GPT-Image-1 | Flux-Kontext-Max |
环境/人物一致性 | ★★★★★ | ★★★★★ | ★ | ★★★★★ |
文本准确性 | ★★★★ | ★ | ★★ | ★ |
排版美感 | ★★★★★ | ★★★ | ★★★★ | ★★★★★ |
简评 | gemini-2.5-flash最佳,保持/环境一致性的同时生成了准确的logo,与画面内容及品牌调性相关的文案。文字字号,字体,排版具有美感,达到可直接使用的水准。 |
案例4:风格迁移
提示词:Transform the banana in the image into the distinctive art style of Hajime Sorayama: sleek metallic surface, detailed and refined textures, with a strong futuristic and sci‑fi aesthetic. Ensure the object retains its banana shape but appears as a high‑gloss robot‑like artwork, reflecting Sorayama’s mechanical sensuality. Keep the surrounding elements unchanged.
将图中的香蕉转换为空山基独特的艺术风格:光滑的金属表面、细致精美的纹理,具有强烈的未来感和科幻美学。确保物体保持香蕉的形状,呈现为高光泽、类似机器人的艺术品,体现空山基的机械感官特质。保持周围元素不变。


gemini-2.5-flash-image-preview / Qwen-Image-Edit


GPT-Image-1 / Flux-Kontext-Max
*GPT-Image-1 生成失败,疑似为知名 IP 保护原因导致。

测评点 | gemini-2.5-flash | Qwen-Image-Edit | GPT-Image-1 | Flux-Kontext-Max |
主体一致性 | ★★★★★ | ★★★★★ | N/A | ★★★★★ |
风格还原 | ★★★★★ | ★★★★ | N/A | ★★★ |
简评 | gemini-2.5最佳。以空山基的平面插画风格进行了重绘,在主体一致性的基础上,合理且具有美感地将香蕉本身的纹路转绘为机械的纹路;保持了部分香蕉本身的黄色,正好是艺术家常用的配色。细节上的倒影,香蕉尾部的渐变色,都体现了极佳的质感。 |
案例5:多图融合
提示词:Take the person from Image 1 and dress them in all the clothing and accessories from Image 2. Generate a realistic OOTD-style photo set outdoors, with natural lighting, fashionable street-style vibes, and full‑body visibility. Keep the person’s identity and pose from Image 1, but showcase the complete outfit and accessories from Image 2 in a cohesive, stylish way.


从图片1中取出人物,并为其穿上图片2中的所有服装和配饰。在户外生成一张真实感的 OOTD 风格照片,具有自然光线、时尚街拍氛围,并呈现全身。保持图片1中人物的身份特征,以统一且时尚的方式展示图片2中的完整穿搭与配饰。
gemini-2.5-flash-image-preview / Qwen-Image-Edit


GPT-Image-1 / Flux-Kontext-Max


测评点 | gemini-2.5-flash | Qwen-Image-Edit | GPT-Image-1 | Flux-Kontext-Max |
主体一致性 | ★★★★ | ★★★ | ★★★ | ★★ |
环境背景 | ★★★★★ | ★★★★ | ★★★★★ | ★★★★ |
融合效果 | ★★★★★ | ★★ | ★★★★ | ★ |
简评 | gemini-2.5-flash最佳。Brad Pitt的面貌得以忠实还原,人物动作自然合理,服装面料质感逼真,与背景的融合几无破绽。挑刺的话,配饰(相机,耳机,背包)的造型与原图都发生了改变,一致性尚未达到完美。 |
III. Gemini-2.5-flash-image实测结论

经过本轮五个角度的实测案例,Nano Banana / Gemini-2.5-flash-image 不玩虚的,直接打出了一波 4 胜的成绩。简单说,这模型不是来参与竞赛的,更像是上来“宣示主权”的。
自从 Flux Kontext 横空出世,彻底解決了“人物一致性”这道长期难题之后,顶级生图模型的比拼已经从能不能识别清楚,进入了能不能识别得精准而克制。在这场新阶段的博弈中,Gemini不只是能稳稳把画面主体复刻出来,它还能将原图里的光线走向、画面色调、投影形状都尽可能忠实地复用,补强的并不仅是数据,而是质感,美学。
也就是说,Gemini 已经从“造人画像”的模型,变成了一个“能临摹现场”的视觉重构系统。尤其在风格迁移、多主体、多细节的复杂任务下,它的表现确实值得惊叹:
人物不崩;元素不丢;不对氛围,美感自作主张进行二创;局部细节像素级复现。
当然,测试中也不是无懈可击。唯一被“爆冷”的案例出现在测试 2 ——只有 Gemini 没能把环境切换为黑夜,说明它在部分需要强语义转变的场景下,还未做到完美程度。某种程度而言,它像是对原图信息的忠实度太强,反而会削弱对新Prompt的执行力。未来各模型需要追求的,即是在高保真和高自由创作的边界上,探索出最优解的平衡点。
Ⅳ. 如何在 302.AI 上使用
302.AI 提供按需付费无订阅的服务模式,用户可以根据自身业务需求灵活选择使用。
1. 聊天机器人中使用
步骤指引 :在线使用→应用超市→机器人→聊天机器人

选择模型:Google模型→gemini-2.5-flash-image-preview→确认→创建

2. 使用模型 API
相关文档:API→API超市→图片生成→Google→gemini-2.5-flash-image-preview→查看文档;


点击【调试】在线调用 API

想体验 Nano Banana / gemini-2.5-flash-image-preview 模型?
👉立即注册免费试用302.AI,开启你的AI之旅!👈
为什么选择302.AI?
● 灵活付费:无需月费,按需付费,成本可控
● 丰富功能:从文字、图片到视频,应有尽有,满足多种场景需求
● 开源生态:支持开发者深度定制,打造专属AI应用
● 易用性:界面友好,操作简单,快速上手
