Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

10月22日,Stability AI推出最新图像生成模型Stable Diffusion 3.5,其中包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo两个版本,并宣布预计在10月29日上线Medium版本。

10月29日,Stable Diffusion 3.5 Medium如期推出。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

Stable Diffusion 3.5的三个主要版本:Large、Large Turbo和Medium,各有特点,详细如下:

1、Stable Diffusion 3.5 Large:拥有80亿参数,是Stable Diffusion系列中最强大的模型,在图像质量和提示词准确性方面表现优异

2、Stable Diffusion 3.5 Large Turbo:Stable Diffusion 3.5 Large的蒸馏版本,速度远快于Stable Diffusion 3.5 Large。

3、Stable Diffusion 3.5 Medium:拥有25亿参数,采用改进的MMDiT-X架构和训练方法,能够生成分辨率在0.25到2百万像素之间的图像

根据StabilityAI官方提供的模型对比图,可以看到Stable Diffusion 3.5模型在提示词遵循性上比其他大多数中型模型好,但美学质量表现上还是不如Flux.1 dev:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

Stable Diffusion 3.5的推出,免不了被拿来跟Flux比较,而Flux系列模型中Flux.1 dev与Stable Diffusion 3.5 large同为开源模型,且性能效果接近。接下来就用302.AI的绘画机器人实测对比Stable Diffusion 3.5 large和Flux.1 dev模型的效果。

操作教程:

创建绘画机器人:进入302.AI,找到绘画机器人——模型选择——创建绘画机器人;

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

选择模型版本:以Stable Diffusion为例,选择Stable Diffusion模型后,进入绘画机器人,在输入框右侧点击设置,可以看到302.AI的绘画机器人中提供了多个版本的Stable Diffusion模型,按照本次的需求选择Stable Diffusion 3.5 large即可,选择Flux模型的操作方式与上述相同,只需在设置中选择版本即可:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

输入提示词:选择好模型版本后,便可在输入框中键入描述,等待片刻即可看到生成的图片。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

实测效果:SD 3.5 large VS Flux.1 dev

PS:以下所有案例由302.AI绘画机器人生成,且均是模型第一次生成的效果。

1、提示词:繁华街道上的大广告牌,广告牌上写着”302.AI”搭配着科技元素,天空很蓝有白云。

首先,两个模型的生成的场景都比较符合提示词的描述,文字生成也没有问题,但综合整体效果来看,Flux.1 dev似乎更胜一筹,Flux.1 dev整个生成的效果更具有美感,色彩也更和谐,反观SD 3.5 large的整个色彩饱和度很高,云层有点不真实:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

2、提示词:三个女孩在市中心街道上的合照,她们伸着双手比心并正对着镜头

这一对比效果Flux.1 dev更优,SD 3.5 large生成的人物肢体还是有比较明显的扭曲,比如,两个女生比心的手指,一个人一只手出现了7个手指,还有背景中出现的人物双腿也出现了比较明显的扭曲。而Flux.1 dev整体没有太明显的问题,只是在手指的细节上会有一点点瑕疵。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

3、提示词:magical realism photo portrait, morning light, 30 years old woman, hipster fashion, pensive,candid

参考翻译:魔幻现实主义照片肖像,晨光,30岁的女人,时髦时尚,沉思,坦率

人物脸部皮肤与光照效果对比,这一轮可以说是SD 3.5 large胜,从人物脸部皮肤来看,SD 3.5 large更加细腻真实,而Flux.1 dev皮肤没有细节,没有真实皮肤的纹理。在光照效果上看,SD 3.5 large的整体也更有氛围感:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

通过302.AI的绘画机器人,能够快速获得不同的图像生成模型,省去了各种繁琐的步骤,并直观对比各模型生成效果,此外,302.AI提供按需付费的服务方式,用户可以根据自己的需求和预算更灵活选择模型。

顺便提一句,以上模型的API,均可在302.AI的API超市获取哦!不仅如此,302.AI还提供了Stable Diffusion 3.5各版本的API,支持在线调试,开发者能够通过302.AI快速集成和使用API服务,非常便捷。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

总结:

通过对比,可以看到Stable Diffusion 3.5 large虽然在整体场景美感略输Flux.1 dev,但是在脸部皮肤和光照效果的细腻程度上对比Flux.1 de更真实,视觉效果更好。同时在实测中发现,Stable Diffusion 3出现的四肢扭曲问题在Stable Diffusion 3.5中没有得到太大的改善。

综上所述,两个模型各有优劣,用户可以根据不同应用场景来选择使用,同时希望通过302.AI的实测,可以为大家在选择这两个模型的时候提供有价值的参考和启示。

Like (1)
302.AI302.AI
Previous 2024 年 11 月 4 日 下午6:52
Next 2024 年 11 月 6 日 下午7:06

相关推荐

  • AI PPT工具一键搞定PPT,帮你缓解职场”PPT恐惧症”

    在8月底的《脱口秀和Ta的朋友们》节目中,脱口秀演员赵晓卉的淘汰发言再次出圈,表现甚至比她在脱口秀比赛中的表现更为精彩,被观众称为“淘汰感言区的统治王者” ,在短短几分钟的淘汰感言中接连涌现出的金句,令人印象深刻: “上过班的人,都不会想做 PPT” “我对PPT已经 PPTSD 了” “昨天赢不了PPT、今天交不了 PPT” …… …

    2024 年 9 月 24 日
    35500
  • AI老照片修复功能,不止修复了画面也修复了记忆

    随着AI技术的发展,不断突破着传统界限。许多曾经存在想象中的事情变成了现实,这或许就是科技的意义。 最近看到了一个非常令人感动的文章“他用Luma和Suno复活了逝去11年的爱人,给我看破防了。” (参考原文:https://mp.weixin.qq.com/s/DIkPAA-P9P1AWveAFeNtqA) 原文是这样的,作者在X上看到了一个名为Koya …

    2024 年 7 月 17 日
    44100
  • 谷歌发布最新两款Gemini 1.5系列模型,与草莓o1模型对比谁表现更好?

    9月25日,Google旗下的Gemini 1.5系列模型迎来了最新版本的发布,分别是Gemini-1.5-Pro-002和Gemini-1.5-Flash-002两款模型。据了解,与之前的版本相比,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002在数学、上下文和视觉方面的能力得到了显著提升。 根据官方数据显示,两款模型在M…

    2024 年 9 月 26 日
    33000
  • 资讯丨xAI官宣Grok API开启公测,唯一模型grok-beta表现能否达到预期?

    11月6日,备受瞩目的2024年美国总统选举结果终于揭晓,马斯克公开支持的美国共和党总统候选人特朗普获得最终胜利。 作为特朗普的“榜一大哥”马斯克,是人工智能初创公司xAI的始人之一和主要投资者。在11月4日,xAI刚刚官宣Grok API正式开启公测。 根据xAI公司官方发布的文档,可以看到xAI的API目前只有一个模型——“grok-beta”。 从官方…

    2024 年 11 月 8 日
    22600
  • 资讯丨简单几步学会制作超真实的“毒液变身”特效,胆小慎进!

    最近,各社交媒体平台都被一种叫“毒液变身”的特效刷屏了,视频虽然仅有短短几秒钟,却通过生动的画面和动感的特效,给观众带来了强烈的视觉冲击,从而迅速吸引了大量网友的目光。甚至在某些短视频平台上,使用这一特效制作的视频获得了过万的点赞: “毒液变身”特效流行后,许多网友纷纷在线求教程,想要学习如何制作类似的视频。实际上,这些视频效果都是通过最新的视频生成模型——…

    2024 年 12 月 6 日
    20300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注