10月22日,Stability AI推出最新图像生成模型Stable Diffusion 3.5,其中包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo两个版本,并宣布预计在10月29日上线Medium版本。
10月29日,Stable Diffusion 3.5 Medium如期推出。
Stable Diffusion 3.5的三个主要版本:Large、Large Turbo和Medium,各有特点,详细如下:
1、Stable Diffusion 3.5 Large:拥有80亿参数,是Stable Diffusion系列中最强大的模型,在图像质量和提示词准确性方面表现优异
2、Stable Diffusion 3.5 Large Turbo:Stable Diffusion 3.5 Large的蒸馏版本,速度远快于Stable Diffusion 3.5 Large。
3、Stable Diffusion 3.5 Medium:拥有25亿参数,采用改进的MMDiT-X架构和训练方法,能够生成分辨率在0.25到2百万像素之间的图像
根据StabilityAI官方提供的模型对比图,可以看到Stable Diffusion 3.5模型在提示词遵循性上比其他大多数中型模型好,但美学质量表现上还是不如Flux.1 dev:
Stable Diffusion 3.5的推出,免不了被拿来跟Flux比较,而Flux系列模型中Flux.1 dev与Stable Diffusion 3.5 large同为开源模型,且性能效果接近。接下来就用302.AI的绘画机器人实测对比Stable Diffusion 3.5 large和Flux.1 dev模型的效果。
操作教程:
创建绘画机器人:进入302.AI,找到绘画机器人——模型选择——创建绘画机器人;
选择模型版本:以Stable Diffusion为例,选择Stable Diffusion模型后,进入绘画机器人,在输入框右侧点击设置,可以看到302.AI的绘画机器人中提供了多个版本的Stable Diffusion模型,按照本次的需求选择Stable Diffusion 3.5 large即可,选择Flux模型的操作方式与上述相同,只需在设置中选择版本即可:
输入提示词:选择好模型版本后,便可在输入框中键入描述,等待片刻即可看到生成的图片。
实测效果:SD 3.5 large VS Flux.1 dev
PS:以下所有案例由302.AI绘画机器人生成,且均是模型第一次生成的效果。
1、提示词:繁华街道上的大广告牌,广告牌上写着”302.AI”搭配着科技元素,天空很蓝有白云。
首先,两个模型的生成的场景都比较符合提示词的描述,文字生成也没有问题,但综合整体效果来看,Flux.1 dev似乎更胜一筹,Flux.1 dev整个生成的效果更具有美感,色彩也更和谐,反观SD 3.5 large的整个色彩饱和度很高,云层有点不真实:
2、提示词:三个女孩在市中心街道上的合照,她们伸着双手比心并正对着镜头
这一对比效果Flux.1 dev更优,SD 3.5 large生成的人物肢体还是有比较明显的扭曲,比如,两个女生比心的手指,一个人一只手出现了7个手指,还有背景中出现的人物双腿也出现了比较明显的扭曲。而Flux.1 dev整体没有太明显的问题,只是在手指的细节上会有一点点瑕疵。
3、提示词:magical realism photo portrait, morning light, 30 years old woman, hipster fashion, pensive,candid
参考翻译:魔幻现实主义照片肖像,晨光,30岁的女人,时髦时尚,沉思,坦率
人物脸部皮肤与光照效果对比,这一轮可以说是SD 3.5 large胜,从人物脸部皮肤来看,SD 3.5 large更加细腻真实,而Flux.1 dev皮肤没有细节,没有真实皮肤的纹理。在光照效果上看,SD 3.5 large的整体也更有氛围感:
通过302.AI的绘画机器人,能够快速获得不同的图像生成模型,省去了各种繁琐的步骤,并直观对比各模型生成效果,此外,302.AI提供按需付费的服务方式,用户可以根据自己的需求和预算更灵活选择模型。
顺便提一句,以上模型的API,均可在302.AI的API超市获取哦!不仅如此,302.AI还提供了Stable Diffusion 3.5各版本的API,支持在线调试,开发者能够通过302.AI快速集成和使用API服务,非常便捷。
总结:
通过对比,可以看到Stable Diffusion 3.5 large虽然在整体场景美感略输Flux.1 dev,但是在脸部皮肤和光照效果的细腻程度上对比Flux.1 de更真实,视觉效果更好。同时在实测中发现,Stable Diffusion 3出现的四肢扭曲问题在Stable Diffusion 3.5中没有得到太大的改善。
综上所述,两个模型各有优劣,用户可以根据不同应用场景来选择使用,同时希望通过302.AI的实测,可以为大家在选择这两个模型的时候提供有价值的参考和启示。