Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

10月22日,Stability AI推出最新图像生成模型Stable Diffusion 3.5,其中包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo两个版本,并宣布预计在10月29日上线Medium版本。

10月29日,Stable Diffusion 3.5 Medium如期推出。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

Stable Diffusion 3.5的三个主要版本:Large、Large Turbo和Medium,各有特点,详细如下:

1、Stable Diffusion 3.5 Large:拥有80亿参数,是Stable Diffusion系列中最强大的模型,在图像质量和提示词准确性方面表现优异

2、Stable Diffusion 3.5 Large Turbo:Stable Diffusion 3.5 Large的蒸馏版本,速度远快于Stable Diffusion 3.5 Large。

3、Stable Diffusion 3.5 Medium:拥有25亿参数,采用改进的MMDiT-X架构和训练方法,能够生成分辨率在0.25到2百万像素之间的图像

根据StabilityAI官方提供的模型对比图,可以看到Stable Diffusion 3.5模型在提示词遵循性上比其他大多数中型模型好,但美学质量表现上还是不如Flux.1 dev:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

Stable Diffusion 3.5的推出,免不了被拿来跟Flux比较,而Flux系列模型中Flux.1 dev与Stable Diffusion 3.5 large同为开源模型,且性能效果接近。接下来就用302.AI的绘画机器人实测对比Stable Diffusion 3.5 large和Flux.1 dev模型的效果。

操作教程:

创建绘画机器人:进入302.AI,找到绘画机器人——模型选择——创建绘画机器人;

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

选择模型版本:以Stable Diffusion为例,选择Stable Diffusion模型后,进入绘画机器人,在输入框右侧点击设置,可以看到302.AI的绘画机器人中提供了多个版本的Stable Diffusion模型,按照本次的需求选择Stable Diffusion 3.5 large即可,选择Flux模型的操作方式与上述相同,只需在设置中选择版本即可:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

输入提示词:选择好模型版本后,便可在输入框中键入描述,等待片刻即可看到生成的图片。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

实测效果:SD 3.5 large VS Flux.1 dev

PS:以下所有案例由302.AI绘画机器人生成,且均是模型第一次生成的效果。

1、提示词:繁华街道上的大广告牌,广告牌上写着”302.AI”搭配着科技元素,天空很蓝有白云。

首先,两个模型的生成的场景都比较符合提示词的描述,文字生成也没有问题,但综合整体效果来看,Flux.1 dev似乎更胜一筹,Flux.1 dev整个生成的效果更具有美感,色彩也更和谐,反观SD 3.5 large的整个色彩饱和度很高,云层有点不真实:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

2、提示词:三个女孩在市中心街道上的合照,她们伸着双手比心并正对着镜头

这一对比效果Flux.1 dev更优,SD 3.5 large生成的人物肢体还是有比较明显的扭曲,比如,两个女生比心的手指,一个人一只手出现了7个手指,还有背景中出现的人物双腿也出现了比较明显的扭曲。而Flux.1 dev整体没有太明显的问题,只是在手指的细节上会有一点点瑕疵。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

3、提示词:magical realism photo portrait, morning light, 30 years old woman, hipster fashion, pensive,candid

参考翻译:魔幻现实主义照片肖像,晨光,30岁的女人,时髦时尚,沉思,坦率

人物脸部皮肤与光照效果对比,这一轮可以说是SD 3.5 large胜,从人物脸部皮肤来看,SD 3.5 large更加细腻真实,而Flux.1 dev皮肤没有细节,没有真实皮肤的纹理。在光照效果上看,SD 3.5 large的整体也更有氛围感:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

通过302.AI的绘画机器人,能够快速获得不同的图像生成模型,省去了各种繁琐的步骤,并直观对比各模型生成效果,此外,302.AI提供按需付费的服务方式,用户可以根据自己的需求和预算更灵活选择模型。

顺便提一句,以上模型的API,均可在302.AI的API超市获取哦!不仅如此,302.AI还提供了Stable Diffusion 3.5各版本的API,支持在线调试,开发者能够通过302.AI快速集成和使用API服务,非常便捷。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

总结:

通过对比,可以看到Stable Diffusion 3.5 large虽然在整体场景美感略输Flux.1 dev,但是在脸部皮肤和光照效果的细腻程度上对比Flux.1 de更真实,视觉效果更好。同时在实测中发现,Stable Diffusion 3出现的四肢扭曲问题在Stable Diffusion 3.5中没有得到太大的改善。

综上所述,两个模型各有优劣,用户可以根据不同应用场景来选择使用,同时希望通过302.AI的实测,可以为大家在选择这两个模型的时候提供有价值的参考和启示。

Like (1)
302.AI302.AI
Previous 2024 年 11 月 4 日 下午6:52
Next 2024 年 11 月 6 日 下午7:06

相关推荐

  • Claude新功能?小白如何体验交互式写编程?

    Anthropic公司在今年3月发布了新模型Claude 3后,同样在今年的6月21日又再次官宣上新Claude 3.5 Sonnet模型,这中间仅仅隔了三个月左右的时间! 但是就今天的主角并不是Claude 3.5 Sonnet,而是与Claude 3.5 Sonnet一同官宣推出的新功能——Artifacts。 Anthropic PBC,是一家美国的人…

    2024 年 7 月 12 日
    48500
  • 13.8和13.11哪个大这都能吵起来?不如先来看看AI模型的数学能力怎么样

    7月13日,最新一期的《歌手》公布排名,孙楠得票13.8%,外国歌手香缇莫得票13.11%,以微小的分数差距引发网友热议:13.8和13.11哪个大? 看了一下评论,居然有不少网友认为是13.11比13.8大,顺带在评论区分析了一番。看到评论的小编,有那么一瞬间以为他们在玩抽象。怪不得网友戏称这一群认为13.11更大的人是“九年义务漏网之鱼”,毕竟这是小学的…

    2024 年 7 月 22 日
    43600
  • Midjourney新版本v6.1上线,人像逼真细节再升级

    7月的最后一天,Midjourney宣布推出最新版本v6.1,这一消息在创意和技术领域引起了广泛关注。那这一新版本对比前一版本对比有什么不同呢,下面一起来看看。 Midjourney v6.1做了一系列升级: 1、更好的生成一致性(人像的手臂、腿、身体,动植物等题材) 2、更高的图像质量(减少伪影、增强纹理等) 3、更准确、更多细节、更精确理解图像里边的细小…

    2024 年 8 月 5 日
    43300
  • DeepL推出新一代翻译编辑模型,翻译能力究竟如何?

    7 月 17 日,德国翻译技术公司DeepL宣布推出新一代大型语言模型(也称“LLM”),并宣称质量优于 ChatGPT-4、谷歌和微软。该模型基于专有的大规模语言模型技术和定制的训练数据集,旨在提供更精准的翻译服务。 DeepL官方宣称,通过盲测表明,语言专家通常更青睐 DeepL 的译文,结果显示,DeepL 的译文的首选度是谷歌翻译的 1.3 倍, C…

    2024 年 7 月 29 日
    53300
  • Meta号称最强的开源模型Llama3.1,却数不清strawberry有几个“r”?

    7月23日,Meta AI发布最新开源模型 —— Llama 3.1 !在多项测试中超越闭源模型,开源模型的时代要来了吗? Llama3.1共包含8b、70b和405b三种模型,支持八种语言包括英语,德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语,具备 128K 扩展上下文长度,该模型提供通用知识、数学计算、多语言翻译和工具使用等能力。 其中,8B、…

    2024 年 7 月 26 日
    47800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注