Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

10月22日,Stability AI推出最新图像生成模型Stable Diffusion 3.5,其中包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo两个版本,并宣布预计在10月29日上线Medium版本。

10月29日,Stable Diffusion 3.5 Medium如期推出。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

Stable Diffusion 3.5的三个主要版本:Large、Large Turbo和Medium,各有特点,详细如下:

1、Stable Diffusion 3.5 Large:拥有80亿参数,是Stable Diffusion系列中最强大的模型,在图像质量和提示词准确性方面表现优异

2、Stable Diffusion 3.5 Large Turbo:Stable Diffusion 3.5 Large的蒸馏版本,速度远快于Stable Diffusion 3.5 Large。

3、Stable Diffusion 3.5 Medium:拥有25亿参数,采用改进的MMDiT-X架构和训练方法,能够生成分辨率在0.25到2百万像素之间的图像

根据StabilityAI官方提供的模型对比图,可以看到Stable Diffusion 3.5模型在提示词遵循性上比其他大多数中型模型好,但美学质量表现上还是不如Flux.1 dev:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

Stable Diffusion 3.5的推出,免不了被拿来跟Flux比较,而Flux系列模型中Flux.1 dev与Stable Diffusion 3.5 large同为开源模型,且性能效果接近。接下来就用302.AI的绘画机器人实测对比Stable Diffusion 3.5 large和Flux.1 dev模型的效果。

操作教程:

创建绘画机器人:进入302.AI,找到绘画机器人——模型选择——创建绘画机器人;

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

选择模型版本:以Stable Diffusion为例,选择Stable Diffusion模型后,进入绘画机器人,在输入框右侧点击设置,可以看到302.AI的绘画机器人中提供了多个版本的Stable Diffusion模型,按照本次的需求选择Stable Diffusion 3.5 large即可,选择Flux模型的操作方式与上述相同,只需在设置中选择版本即可:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

输入提示词:选择好模型版本后,便可在输入框中键入描述,等待片刻即可看到生成的图片。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

实测效果:SD 3.5 large VS Flux.1 dev

PS:以下所有案例由302.AI绘画机器人生成,且均是模型第一次生成的效果。

1、提示词:繁华街道上的大广告牌,广告牌上写着”302.AI”搭配着科技元素,天空很蓝有白云。

首先,两个模型的生成的场景都比较符合提示词的描述,文字生成也没有问题,但综合整体效果来看,Flux.1 dev似乎更胜一筹,Flux.1 dev整个生成的效果更具有美感,色彩也更和谐,反观SD 3.5 large的整个色彩饱和度很高,云层有点不真实:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

2、提示词:三个女孩在市中心街道上的合照,她们伸着双手比心并正对着镜头

这一对比效果Flux.1 dev更优,SD 3.5 large生成的人物肢体还是有比较明显的扭曲,比如,两个女生比心的手指,一个人一只手出现了7个手指,还有背景中出现的人物双腿也出现了比较明显的扭曲。而Flux.1 dev整体没有太明显的问题,只是在手指的细节上会有一点点瑕疵。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

3、提示词:magical realism photo portrait, morning light, 30 years old woman, hipster fashion, pensive,candid

参考翻译:魔幻现实主义照片肖像,晨光,30岁的女人,时髦时尚,沉思,坦率

人物脸部皮肤与光照效果对比,这一轮可以说是SD 3.5 large胜,从人物脸部皮肤来看,SD 3.5 large更加细腻真实,而Flux.1 dev皮肤没有细节,没有真实皮肤的纹理。在光照效果上看,SD 3.5 large的整体也更有氛围感:

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

通过302.AI的绘画机器人,能够快速获得不同的图像生成模型,省去了各种繁琐的步骤,并直观对比各模型生成效果,此外,302.AI提供按需付费的服务方式,用户可以根据自己的需求和预算更灵活选择模型。

顺便提一句,以上模型的API,均可在302.AI的API超市获取哦!不仅如此,302.AI还提供了Stable Diffusion 3.5各版本的API,支持在线调试,开发者能够通过302.AI快速集成和使用API服务,非常便捷。

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?

总结:

通过对比,可以看到Stable Diffusion 3.5 large虽然在整体场景美感略输Flux.1 dev,但是在脸部皮肤和光照效果的细腻程度上对比Flux.1 de更真实,视觉效果更好。同时在实测中发现,Stable Diffusion 3出现的四肢扭曲问题在Stable Diffusion 3.5中没有得到太大的改善。

综上所述,两个模型各有优劣,用户可以根据不同应用场景来选择使用,同时希望通过302.AI的实测,可以为大家在选择这两个模型的时候提供有价值的参考和启示。

Like (1)
302.AI302.AI
Previous 2024 年 11 月 4 日 下午6:52
Next 2024 年 11 月 6 日 下午7:06

相关推荐

  • Reflection-Llama-3.1-70B发布短短几天,为何备受争议?

    9月6日,AI写作初创公司HyperWrite发布了Reflection-Llama-3.1-70B模型。该模型基于Meta的Llama 3.1-70B Instruct,并使用原始的 Llama Chat 格式,确保了与现有工具和 pipeline 的兼容性。 在发布当天,HyperWrite 公司的 CEO Matt Shumer 在社交媒体平台发文表示…

    2024 年 9 月 9 日
    15900
  • AI视力考验:各AI模型的视觉理解能力如何?

    近日,行业内有不少新模型涌现出大众的面前,我们会发现,有的模型会在其官方宣传中提到“多模态”一词,比如大家熟知的GPT-4o、Gemini 1.5 Pro等,在发布时都被定义为“原生多模态”,这些多模态LLM在相关的介绍中,都用到了“视觉能力”、“视觉理解”这样的表述。 简单的理解,就是这些模型能够“看得见,并看得懂”,仿佛人的眼睛。为此,很多人…

    2024 年 7 月 25 日
    19400
  • 资讯丨xAI官宣Grok API开启公测,唯一模型grok-beta表现能否达到预期?

    11月6日,备受瞩目的2024年美国总统选举结果终于揭晓,马斯克公开支持的美国共和党总统候选人特朗普获得最终胜利。 作为特朗普的“榜一大哥”马斯克,是人工智能初创公司xAI的始人之一和主要投资者。在11月4日,xAI刚刚官宣Grok API正式开启公测。 根据xAI公司官方发布的文档,可以看到xAI的API目前只有一个模型——“grok-beta”。 从官方…

    2024 年 11 月 8 日
    10500
  • OpenAI更新模型ChatGPT-4o-latest,与GPT-4o对比不同在哪里?

    8月12日,ChatGPT官方账号在社交媒体平台发文称ChatGPT推出了新的GPT-4o模型,但同时也明确,这次推出的GPT-4o模型是对GPT-4o的改进,而不是新的前沿模型。而且,ChatGPT官方表示这次的更新“难以明确说明”。 然而,这一最新的模型ChatGPT-4o-latest在LMSYS的LLM竞技场排行榜中,已经以1314的综合分数超越曾经…

    2024 年 8 月 20 日
    19500
  • Claude新功能?小白如何体验交互式写编程?

    Anthropic公司在今年3月发布了新模型Claude 3后,同样在今年的6月21日又再次官宣上新Claude 3.5 Sonnet模型,这中间仅仅隔了三个月左右的时间! 但是就今天的主角并不是Claude 3.5 Sonnet,而是与Claude 3.5 Sonnet一同官宣推出的新功能——Artifacts。 Anthropic PBC,是一家美国的人…

    2024 年 7 月 12 日
    23500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注