Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

10月22日,Stability AI推出最新图像生成模型Stable Diffusion 3.5,其中包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo两个版本,并宣布预计在10月29日上线Medium版本。

10月29日,Stable Diffusion 3.5 Medium如期推出。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

Stable Diffusion 3.5的三个主要版本:Large、Large Turbo和Medium,各有特点,详细如下:

1、Stable Diffusion 3.5 Large:拥有80亿参数,是Stable Diffusion系列中最强大的模型,在图像质量和提示词准确性方面表现优异

2、Stable Diffusion 3.5 Large Turbo:Stable Diffusion 3.5 Large的蒸馏版本,速度远快于Stable Diffusion 3.5 Large。

3、Stable Diffusion 3.5 Medium:拥有25亿参数,采用改进的MMDiT-X架构和训练方法,能够生成分辨率在0.25到2百万像素之间的图像

根据StabilityAI官方提供的模型对比图,可以看到Stable Diffusion 3.5模型在提示词遵循性上比其他大多数中型模型好,但美学质量表现上还是不如Flux.1 dev:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

Stable Diffusion 3.5的推出,免不了被拿来跟Flux比较,而Flux系列模型中Flux.1 dev与Stable Diffusion 3.5 large同为开源模型,且性能效果接近。接下来就用302.AI的绘画机器人实测对比Stable Diffusion 3.5 large和Flux.1 dev模型的效果。

操作教程:

创建绘画机器人:进入302.AI,找到绘画机器人——模型选择——创建绘画机器人;

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

选择模型版本:以Stable Diffusion为例,选择Stable Diffusion模型后,进入绘画机器人,在输入框右侧点击设置,可以看到302.AI的绘画机器人中提供了多个版本的Stable Diffusion模型,按照本次的需求选择Stable Diffusion 3.5 large即可,选择Flux模型的操作方式与上述相同,只需在设置中选择版本即可:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

输入提示词:选择好模型版本后,便可在输入框中键入描述,等待片刻即可看到生成的图片。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

实测效果:SD 3.5 large VS Flux.1 dev

PS:以下所有案例由302.AI绘画机器人生成,且均是模型第一次生成的效果。

1、提示词:繁华街道上的大广告牌,广告牌上写着”302.AI”搭配着科技元素,天空很蓝有白云。

首先,两个模型的生成的场景都比较符合提示词的描述,文字生成也没有问题,但综合整体效果来看,Flux.1 dev似乎更胜一筹,Flux.1 dev整个生成的效果更具有美感,色彩也更和谐,反观SD 3.5 large的整个色彩饱和度很高,云层有点不真实:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

2、提示词:三个女孩在市中心街道上的合照,她们伸着双手比心并正对着镜头

这一对比效果Flux.1 dev更优,SD 3.5 large生成的人物肢体还是有比较明显的扭曲,比如,两个女生比心的手指,一个人一只手出现了7个手指,还有背景中出现的人物双腿也出现了比较明显的扭曲。而Flux.1 dev整体没有太明显的问题,只是在手指的细节上会有一点点瑕疵。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

3、提示词:magical realism photo portrait, morning light, 30 years old woman, hipster fashion, pensive,candid

参考翻译:魔幻现实主义照片肖像,晨光,30岁的女人,时髦时尚,沉思,坦率

人物脸部皮肤与光照效果对比,这一轮可以说是SD 3.5 large胜,从人物脸部皮肤来看,SD 3.5 large更加细腻真实,而Flux.1 dev皮肤没有细节,没有真实皮肤的纹理。在光照效果上看,SD 3.5 large的整体也更有氛围感:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

通过302.AI的绘画机器人,能够快速获得不同的图像生成模型,省去了各种繁琐的步骤,并直观对比各模型生成效果,此外,302.AI提供按需付费的服务方式,用户可以根据自己的需求和预算更灵活选择模型。

顺便提一句,以上模型的API,均可在302.AI的API超市获取哦!不仅如此,302.AI还提供了Stable Diffusion 3.5各版本的API,支持在线调试,开发者能够通过302.AI快速集成和使用API服务,非常便捷。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

总结:

通过对比,可以看到Stable Diffusion 3.5 large虽然在整体场景美感略输Flux.1 dev,但是在脸部皮肤和光照效果的细腻程度上对比Flux.1 de更真实,视觉效果更好。同时在实测中发现,Stable Diffusion 3出现的四肢扭曲问题在Stable Diffusion 3.5中没有得到太大的改善。

综上所述,两个模型各有优劣,用户可以根据不同应用场景来选择使用,同时希望通过302.AI的实测,可以为大家在选择这两个模型的时候提供有价值的参考和启示。

All Rights Reserved by 302.AI
Like (1)
302.AI302.AI
Previous 2024 年 11 月 4 日 下午6:52
Next 2024 年 11 月 6 日 下午7:06

相关推荐

  • 302.AI 新品发布 | AI绘图总翻车?绘图提示词专家帮你精准复刻图片,自由修改风格!

    许多人在使用AI绘图时,都会面临一些棘手的问题,比如想复刻某张图,但尝试了不同的关键词后生成效果依然货不对板;再比如想要对现有的图片进行风格调整使其更贴合自己的独特需求,但却难以维持画面元素的一致性。 针对以上痛点,302.AI 上新了一款AI绘图提示词专家工具,这一工具结合了“图片转提示词”和“风格修改”两大功能,用户不仅可以通过上传图片获得精准提示词复刻…

    2025 年 4 月 25 日 AI资讯
    1340
  • 资讯丨马斯克号称地表最强的Grok 3系列模型,在实测中到底能否超越R1和o3-mini?

    2月19日,马斯克旗下的大模型平台 xAI 推出了新的模型——Grok-3。官方宣称,Grok-3 在推理、数学、编码和指令遵循任务中均表现出色,并在一系列基准测试中表现出色。而马斯克更是称一模型为 ⌈ 地表最强 ⌋。 (非推理模式的Grok-3与其它大模型能力对比) 根据了解,grok-3 并非单一模型,而是一个包含多个版本的模型家族。其中包括了变体版本—…

    2025 年 2 月 24 日 AI资讯
    3040
  • 资讯丨通义万相2.1模型实测绝了!汉字竟在视频里“活”了

    继豆包图像模型攻克汉字生成的难题后,国内AI视频生成领域在中文生成方面再次来了新突破! 今年年初,阿里云推出了全新升级的的视频生成模型——通义万相2.1。据了解,这是⌈ 首个具备中文文字生成能力的视频生成模型 ⌋ 。 通义万相2.1视频模型一经推出,便以 84.70% 总分登顶权威评测榜单VBench榜首。除了中文文字生成的创新,该模型在复杂运动、大幅度动作…

    2025 年 2 月 21 日 AI资讯
    7680
  • 资讯丨302.AI 代码竞技场:大模型编程能力的“超级擂台”

    一个大模型能力强不强,我们常常会从多个维度去评估,其中编程能力是尤为关键的一项。 对于许多用户而言,想要准确测试大模型的代码能力却常常不知道该从何入手,或者不知道选择哪个平台进行测试。 为了帮助用户解决这一问题,302.AI最新上线了一款工具——代码竞技场,这一工具集结了多种先进模型,为用户提供了一个广阔、便捷、易用的代码测试平台。 工具界面展示: 302.…

    2025 年 2 月 19 日 AI资讯
    2720

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注