302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

昨晚,Google 终于公开了其最新图像生成与编辑模型 gemini-2.5-flash-image-preview——这正是前段时间在 X 上爆火的 Nano Banana。早在 Google 还未出来“认领”时,Nano Banana 就因强大的主体一致性和闪电般的响应速度而广获好评,在社区圈粉无数。

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

出道即巅峰,此模型一经公开就在 Artificial Analysis 图像编辑排行榜上跻身第一位,获得了 1212 的 ELO 分数。Google 官方表示,这确实是一款 SOTA 级的图像编辑模型,其在角色一致性、自然语言定向编辑、多图像融合等方面表现出明显优势,玩法十分丰富。

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

302.AI 已在第一时间接入了 gemini-2.5-flash-image-preview 的 API,本期横评的对手将对比上周上线的阿里 Qwen-Image-Edit,GPT-Image-1 以及 Flux-Kontext-Max,为用户选择提供参考。


I. 实测模型基本信息

(1)各实测模型在 302.AI 的价格:

模型名称302.AI内的价格
gemini-2.5-flash-image-preview输入 3 PTC/1M Tokens;输出 30 PTC/1M Tokens,约合$0.03-0.05/次
Qwen-Image-Edit$0.05/次
GPT-Image-1$0.03/次
Flux-Kontext-Max$0.03/次

(2)测评目标:

  • 编辑质量与真实感:评估各模型在图像编辑后的视觉效果,包括细节保留、人物色彩一致性、光影自然度以及是否存在伪影或失真。
  • 指令理解与执行准确性:测试模型对文本或图像指令的理解能力,检查编辑结果是否准确反映用户意图。

(3)测评工具:

  • gemini-2.5-flash-image-preview 和 Qwen-Image-Edit 使用 302.AI 的 API 超市→在线调试功能
  • GPT-Image-1 和 Flux-Kontext-Max 使用 302.AI 的应用超市→绘图机器人应用

(4)测评方法:

各案例均使用统一的英文提示词和图片进行生成,且均取第一次生成结果,评测结果仅供参考。


Ⅱ. 测评案例

案例1:视角转换

提示词:Change the perspective to a high angle, looking down from above as if from the ceiling.

将视角切换为高角度,从上方俯视,就像从天花板往下看。

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

gemini-2.5-flash-image-preview / Qwen-Image-Edit

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

GPT-Image-1 / Flux-Kontext-Max

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
测评点gemini-2.5-flashQwen-Image-EditGPT-Image-1Flux-Kontext-Max
角度切换★★★★★★★★★★★★★★★
环境/人物一致性★★★★★★★★★★★★
简评gemini-2.5-flash 表现最佳,对原画色彩和质感的保留最为完整,唯一缺漏在于右上角人物的衣服还原错误;Qwen 表现尚可,但是画面细节出现多处扭曲失真。gpt 和 flux 均未能达成提示词要求。

案例2:重绘修改

提示词:Change the environment to a nighttime scene with realistic ambient lighting and visible illumination. Add sunglasses to the female model. Put a black baseball cap on the male model. Modify both models’ shoes to a red-and-black color scheme. Keep all other elements, details, and composition in the original image unchanged.

将环境改为夜景,具有真实的环境光照和可见的灯光。给女模特佩戴墨镜。给男模特戴上一顶黑色棒球帽。将两位模特的鞋子修改为红黑配色。保持原图中的其他元素、细节与构图不变。

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

gemini-2.5-flash-image-preview / Qwen-Image-Edit

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

GPT-Image-1 / Flux-Kontext-Max

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
测评点gemini-2.5-flashQwen-Image-EditGPT-Image-1Flux-Kontext-Max
人物一致性★★★★★★★★★★★★★★★★
环境修改★★★★★★★★★★★★
细节修改★★★★★★★★★★★★★★★★★★
简评Qwen整体表现最佳。人物一致性保留准确,如戒指,纹身等细节;环境转换自然,人物补光合理。但语义遵循上“将鞋子修改为红黑配色”完成度还有待提升。

案例3:文字信息

提示词:Create a Lululemon ad with this image with text copy (include brand name, slogan).

用这张图片制作一则 Lululemon 广告,并添加文字文案(包括品牌名称和标语)。

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

gemini-2.5-flash-image-preview / Qwen-Image-Edit

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

GPT-Image-1 / Flux-Kontext-Max

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
测评点gemini-2.5-flashQwen-Image-EditGPT-Image-1Flux-Kontext-Max
环境/人物一致性★★★★★★★★★★★★★★★
文本准确性★★★★★★
排版美感★★★★★★★★★★★★★★★★★
简评gemini-2.5-flash最佳,保持/环境一致性的同时生成了准确的logo,与画面内容及品牌调性相关的文案。文字字号,字体,排版具有美感,达到可直接使用的水准。

案例4:风格迁移

提示词:Transform the banana in the image into the distinctive art style of Hajime Sorayama: sleek metallic surface, detailed and refined textures, with a strong futuristic and sci‑fi aesthetic. Ensure the object retains its banana shape but appears as a high‑gloss robot‑like artwork, reflecting Sorayama’s mechanical sensuality. Keep the surrounding elements unchanged.

将图中的香蕉转换为空山基独特的艺术风格:光滑的金属表面、细致精美的纹理,具有强烈的未来感和科幻美学。确保物体保持香蕉的形状,呈现为高光泽、类似机器人的艺术品,体现空山基的机械感官特质。保持周围元素不变。

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

gemini-2.5-flash-image-preview / Qwen-Image-Edit

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

GPT-Image-1 / Flux-Kontext-Max

*GPT-Image-1 生成失败,疑似为知名 IP 保护原因导致。

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
测评点gemini-2.5-flashQwen-Image-EditGPT-Image-1Flux-Kontext-Max
主体一致性★★★★★★★★★★N/A★★★★★
风格还原★★★★★★★★★N/A★★★
简评gemini-2.5最佳。以空山基的平面插画风格进行了重绘,在主体一致性的基础上,合理且具有美感地将香蕉本身的纹路转绘为机械的纹路;保持了部分香蕉本身的黄色,正好是艺术家常用的配色。细节上的倒影,香蕉尾部的渐变色,都体现了极佳的质感。

案例5:多图融合

提示词:Take the person from Image 1 and dress them in all the clothing and accessories from Image 2. Generate a realistic OOTD-style photo set outdoors, with natural lighting, fashionable street-style vibes, and full‑body visibility. Keep the person’s identity and pose from Image 1, but showcase the complete outfit and accessories from Image 2 in a cohesive, stylish way.

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

从图片1中取出人物,并为其穿上图片2中的所有服装和配饰。在户外生成一张真实感的 OOTD 风格照片,具有自然光线、时尚街拍氛围,并呈现全身。保持图片1中人物的身份特征,以统一且时尚的方式展示图片2中的完整穿搭与配饰。

gemini-2.5-flash-image-preview / Qwen-Image-Edit

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

GPT-Image-1 / Flux-Kontext-Max

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
测评点gemini-2.5-flashQwen-Image-EditGPT-Image-1Flux-Kontext-Max
主体一致性★★★★★★★★★★★★
环境背景★★★★★★★★★★★★★★★★★★
融合效果★★★★★★★★★★★
简评gemini-2.5-flash最佳。Brad Pitt的面貌得以忠实还原,人物动作自然合理,服装面料质感逼真,与背景的融合几无破绽。挑刺的话,配饰(相机,耳机,背包)的造型与原图都发生了改变,一致性尚未达到完美。

III. Gemini-2.5-flash-image实测结论

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

经过本轮五个角度的实测案例,Nano Banana / Gemini-2.5-flash-image 不玩虚的,直接打出了一波 4 胜的成绩。简单说,这模型不是来参与竞赛的,更像是上来“宣示主权”的。

自从 Flux Kontext 横空出世,彻底解決了“人物一致性”这道长期难题之后,顶级生图模型的比拼已经从能不能识别清楚,进入了能不能识别得精准而克制。在这场新阶段的博弈中,Gemini不只是能稳稳把画面主体复刻出来,它还能将原图里的光线走向、画面色调、投影形状都尽可能忠实地复用,补强的并不仅是数据,而是质感,美学。

也就是说,Gemini 已经从“造人画像”的模型,变成了一个“能临摹现场”的视觉重构系统。尤其在风格迁移、多主体、多细节的复杂任务下,它的表现确实值得惊叹:

人物不崩;元素不丢;不对氛围,美感自作主张进行二创;局部细节像素级复现。

当然,测试中也不是无懈可击。唯一被“爆冷”的案例出现在测试 2 ——只有 Gemini 没能把环境切换为黑夜,说明它在部分需要强语义转变的场景下,还未做到完美程度。某种程度而言,它像是对原图信息的忠实度太强,反而会削弱对新Prompt的执行力。未来各模型需要追求的,即是在高保真和高自由创作的边界上,探索出最优解的平衡点。


Ⅳ. 如何在 302.AI 上使用

302.AI 提供按需付费无订阅的服务模式,用户可以根据自身业务需求灵活选择使用。

1. 聊天机器人中使用

步骤指引 :在线使用→应用超市→机器人→聊天机器人

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

选择模型:Google模型→gemini-2.5-flash-image-preview→确认→创建

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

2. 使用模型 API

相关文档:API→API超市→图片生成→Google→gemini-2.5-flash-image-preview→查看文档;

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

点击【调试】在线调用 API

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力

想体验 Nano Banana / gemini-2.5-flash-image-preview 模型?

👉立即注册免费试用302.AI,开启你的AI之旅!👈

为什么选择302.AI

● 灵活付费:无需月费,按需付费,成本可控

● 丰富功能:从文字、图片到视频,应有尽有,满足多种场景需求

● 开源生态:支持开发者深度定制,打造专属AI应用

● 易用性:界面友好,操作简单,快速上手

302.AI 基准实验室丨神秘的Nano Banana终现真身:Gemini-2.5-flash-image展示统治级实力
All Rights Reserved by 302.AI
Like (0)
302.AI302.AI
Previous 5天前
Next 2024 年 7 月 17 日 下午3:36

相关推荐

  • 302.AI 基准实验室丨从写实人像到超现实插画:快手Kling 2.1生图模型创作实测

    快手Kling AI近期开放了其图像生成模型 Kolors 2.1 的 API 接口,Kolors 2.1 自 7 月官宣发布以来,凭借卓越性能广受用户好评。近日 Artificial Analysis 官方也指出, Kolors 2.1 在图像生成领域的排名迅速跻身第五,表现出强劲势头。 Kolors 2.1 主要具备以下特点: 凭借出色的性价比与稳定的出…

    2025 年 8 月 19 日 基准实验室
    1620
  • 302.AI 赛博月刊丨Vol.8 攻守易形:当开源变成中国主场

    AI 行业大事记 2025 年 8 月 联合出品: Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心 说明: ①本文讨论了 2025 年7月 AI行业的 103 件大事,涵盖模型、图像、视频、音频、3D、机器人、应用、新闻/融资等多个领域。 ② 本文分类中的「模型」均指代语言模型; ③ 本文分类中的「融资」包含了融资、收购、团队成…

    2025 年 8 月 18 日 赛博月刊
    3450
  • 302.AI 基准实验室丨中文渲染新 SOTA!Qwen-Image 实测:多语言文本全面领先

    复杂文本渲染的准确性,一直是 AI 生图领域长期存在的技术瓶颈。即便顶尖的生图模型,在处理复杂文本时也难免出现乱码现象。就在上周,阿里开源了通义千问系列的首个图像生成基础模型——Qwen-Image,其核心突破便在于卓越的复杂文本渲染能力。 通义千问团队在多个公开基准上对 Qwen-Image 进行了全面评估,公开数据表明其在通用图像生成和图像编辑的所有基准…

    2025 年 8 月 13 日 基准实验室
    4831
  • 302.AI 基准实验室丨FLUX.1 Krea 实测:特立独行的平衡之道,如何破局 AI“塑料感”?

    在 AI 生图技术日趋成熟的当下,”去 AI 感”已成为各大开发者竞相突破的核心战场。Black Forest Lab 向来在拟真度方面持有绝对话语权,从我们往期的实测文章《302.AI 基准实验室丨实测对比 FLUX.1 Kontext 系列模型,“快、稳、准”三点能否问鼎?》当中可以看到,Flux 系列模型在保持主体一致性、画面拟…

    2025 年 8 月 11 日 基准实验室
    4351

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注