302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

要说近期AI圈里最红的,应该就是来自谷歌的Gemini-2.0-flash-exp-image-generation。我们可以简单理解它为是一个图像编辑模型,gemini-2.0-flash-exp-image-generation可以结合了多模态输入、增强版推理以及自然语言理解来进行图像生成,还能够通过自然语言对话直接对图像进行修改

这种把传统的语言大模型和图像生成模型结合的方式,让用户无需掌握复杂的图像处理软件,只需简单几句提示词即可完成对图片的修改,还能保持角色和图像场景的一致性。

但其实更早之前,国内就出现了类似的产品,那就是由 Doubao 团队开发doubao-seededit。doubao-seededit可以根据用户的文字指令直接对图像进行修改,包括更换图像内容、调整风格、光照或角度等,且操作简单易用。

而在近期 ,302.AI 引入了 gemini-2.0-flash-exp-image-generation 和 doubao-seededit 两个模型,并改造成了OpenAI兼容的API格式。这样用户不仅能够通过302.AI聊天机器人直接生成使用,还可以通过API接入到第三方程序里。

接下来就带大家实测对比看看哪一模型的效果更优!


Gemini-2.0-flash vs. Doubao-seededit实测效果对比

PS:以下所有案例均由302.AI聊天机器人生成。

实测1:一键生成图文博客

提示词:给我写一个做可乐鸡翅的教程,带图片

对比结果:gemini > doubao

虽然gemini生成的图文教程存在瑕疵,但是模型本身可以输出多张图片+文字,相当惊艳。而doubao模型没有这个功能,所以gemini更胜一筹。

gemini:成功生成了图文并茂的美食教程,但生成的教程配图出现的人物关节位置较不自然。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

doubao:doubao-seededit原并不支持生成图片,以下所呈现的效果是302.AI为自动调用即梦2.1模型后所生成的。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

实测2:消除路人

提示词:请帮我消除背后的路人

原图:

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

对比结果:gemini < doubao

主要对比消除后的场景细节以及主体变化,整体来说doubao消除后痕迹更小,所以doubao胜。

gemini:背景消除后细节处理较差,而且人物的脸部发生了改变,尤其眼睛明显不协调。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

doubao:消除后场景细节做得不错,脸部稍微有点变化,但没有出现五官不合理的现象。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

实测3:替换背景

提示词:请将背景换成海滩

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

对比结果:gemini < doubao

对比替换场景后与人物的融合度,doubao在保持人物一致性上不如gemini,但gemini替换后左侧脸部墨镜直接消失。

gemini:替换后场景与人物融合还可以,但物的衣服和太阳镜附近的元素没有处理干净左侧墨镜直接消失了。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

doubao:替换的背景和人物还算融合,但是脸部没能保持一致性。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

实测4:图片转线稿

提示词:将图片一比一转成手绘线稿

原图:

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

对比结果:gemini > doubao

这一实测效果高下立见,doubao转换线稿风失败。

gemini:转线稿效果还不错,但可以明显看到背景元素缺失,线稿人物主体效果。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

doubao:转线稿效果失败,输出的结果图片并不是线稿风。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

实测5:图片添加元素和文字

提示词:在图片上水瓶的瓶身上添加文字“302.AI”。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

对比结果:gemini > doubao

从字体艺术感方面,doubao会更好,但可惜生成了多余的文字内容,在遵循提示词方面不够准确。

gemini:文字位置摆放正确,文字生成准确,图片色调稍微有变化,但整体来说效果很不错。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

doubao:位置准确,文字也算是正确,而且字体更加有艺术感,但有多余文字内容出现,而且画面色调也轻微改变。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

实测6:替换指定物品

提示词:茶杯变成蛋糕

原图:

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

对比结论:gemini < doubao

对比替换后的整体画面协调度,gemini替换成蛋糕后阴影依旧不变,不太合理。而doubao替换后阴影形状大致与物品一致,效果整体会较好。

gemini:替换蛋糕后,画面的光影效果看起来不太协调,整体效果一般。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

doubao:局部替换成蛋糕后,画面的光影看起来较自然协调的,整体效果不错。

302.AI 基准实验室 | Gemini-2.0-flash & Doubao-seededit,最近火爆AI届的图像编辑功能到底谁更强?

实测总结:

综合以上实测,我们可以初步得出以下结论:

优势:

gemini-2.0-flash可将图片转化风格、或者上传多图指定替换的物品、能支持快速生成文字及图片内容。

doubao-seededit:更适合在原图上进行局部修改,比如消除人物、将图中的某一物品替换等。

存在的局限:

gemini-2.0-flash

(1)涉及人物五官、四肢方面的效果质量不太稳定,容易出现扭曲的情况。

(2)在图片上做局部修改细节较差,不如doubao。

doubao-seededit:

(1)替换图片的物品只能通过文字描述,无法像gemini一样通过指定替换物品图片进行。

(2)转换图片风格效果不稳定。

(3)在添加文字元素时会添加提示词外的文字。



👉立即注册免费试用302.AI,开启你的AI之旅!👈

为什么选择302.AI?

● 灵活付费:无需月费,按需付费,成本可控
● 丰富功能:从文字、图片到视频,应有尽有,满足多种场景需求
● 开源生态:支持开发者深度定制,打造专属AI应用
● 易用性:界面友好,操作简单,快速上手

302.AI 新品发布 | 图像创意站:GPT-Image-1玩法全解析,轻松生成惊艳作品

All Rights Reserved by 302.AI
Like (0)
302.AI302.AI
Previous 2025 年 3 月 21 日 上午11:45
Next 2025 年 3 月 26 日 上午11:24

相关推荐

  • 302.AI 新品发布 | 图像创意站:GPT-Image-1玩法全解析,轻松生成惊艳作品

    继 GPT-4o 图像生成功能上线,掀起全网吉卜力风潮后,OpenAI 于4月底再次震撼推出全新图像模型——GPT-Image-1. 这一模型不仅能够轻松驾驭多种艺术风格,还能精准捕捉用户的个性化需求,将创意与技术的边界推向新高度。 作为AI领域的先锋,302.AI 迅速响应,基于 GPT-Image-1 研发并上线了全新工具——AI 图像创意站。这款工具不…

    2天前 新品发布
    590
  • 302.AI 基准实验室 | Gemini-2.5-pro vs. Claude-3.7-Sonnet 前端编程能力实战对决

    近日,谷歌提前推出了Gemini 2.5 Pro的最新版:Gemini 2.5 Pro Preview (I/O edition) 05-06 。官方介绍,这一版本模型的编码能力更强,用户只需一个提示即可构建更丰富的 Web 应用程序、游戏、模拟等 而最新版 Gemini 2.5 Pro Preview 05-06 也在 WebDev Arena 排行榜上超…

    2025 年 5 月 9 日 基准实验室
    440
  • 302.AI 新品发布 | 卡片生成工具:一键打造社交媒体爆款内容

    近期,社交媒体平台涌现了众多“知识卡片”、“语录卡片”,它们凭借清晰明了的视觉化信息呈现,吸引了不少用户的关注。那这类AI卡片是怎么制作的呢? 302.AI捕捉到市场动态,推出了一款【AI卡片生成】工具。该工具与一般的AI卡片制作方式不同,工具中我们预设了不同类型的提示词,用户选择不同模板时会调用不同的提示词,并没有内置固定的HTML代码,所以生成的卡片视觉…

    2025 年 5 月 8 日 新品发布
    1051
  • 302.AI 新品发布 | AI绘图总翻车?绘图提示词专家帮你精准复刻图片,自由修改风格!

    许多人在使用AI绘图时,都会面临一些棘手的问题,比如想复刻某张图,但尝试了不同的关键词后生成效果依然货不对板;再比如想要对现有的图片进行风格调整使其更贴合自己的独特需求,但却难以维持画面元素的一致性。 针对以上痛点,302.AI 上新了一款AI绘图提示词专家工具,这一工具结合了“图片转提示词”和“风格修改”两大功能,用户不仅可以通过上传图片获得精准提示词复刻…

    2025 年 4 月 25 日 AI资讯
    1280

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注