揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

近日,一个名为red_panda的模型在Hugging Face的文本生成图像模型排行榜中位居榜首, 这引起了许多网友对这一神秘“小熊猫”背后公司身份的种种讨论。

有网友猜测小熊猫会不会是Midjourney的新产物,也有网友猜测可能是来自OpenAI:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

甚至有网友猜测,因为熊猫生活在亚洲,而中国公司在视频生成方面表现卓越,所以猜测它来自像百度或腾讯这样的中国科技公司:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

就在10月的最后一天,谜底揭开了!

10月31日,Recraft AI在社交媒体上宣布,这一备受关注的神秘模型red_panda(小熊猫)正是他们推出的最新图像生成模型Recraft V3。

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

根据Recraft AI官方称,Recraft的新模型质量高于 Midjourney、OpenAI 和所有其他主要图像生成公司的模型。

Recraft V3的主要优势体现在:

1、能够遵循和理解提示词,并生成具有复杂场景的图像,包括提示中提到的物体的正确数量、颜色和位置,

2、在人物生成方面,能够确保手指、手和腿的数量适当、身体比例逼真、场景内的空间连贯性以及背景物体相对于主要主体的自然定位。

3、同时官方还宣称,Recraft V3在文本生成质量方面非常高,是世界上唯一一个能够生成带有长文本图像的模型。

新模型出现,按照惯例肯定要实测看看真实效果如何,302.AI的绘画机器人已经提供了最新的Recraft V3模型,用户可以进入302.AI快速使用Recraft V3模型,无需下载额外的软件。

302.AI的绘画机器人提供了多种图像生成模型,能够快速选择不同模型使用,满足用户不同的需求,更重要的是,能够轻松对比不同模型的效果。接下来 ,就使用302.AI实测对比下Recraft V3与其他模型的效果。

使用教程:

1、进入302.AI,在侧边栏找到绘画机器人,选择模型后点击【创建绘画机器人】,比如首先选择Recraft V3模型;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

2、进入绘画机器人的绘画页面,可以看到输入框右侧会有设置,这里可以设置图片比例、风格提示词等;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

3、完成设置后,即可在输入框输入提示词生成图片;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

多模型对比:

(以下所有案例均由302.AI绘画机器人生成)

1、长文字海报:

提示词:一张可爱的漫画风平面海报,有生日的元素,海报上方用艺术字体写着“302.AI” ,另外用正楷写着“Happy birthday to you!Happy every day, happy life, no worries.And all wishes come true!”

首先,从生成的海报中的文字准确性上来看,Ideogram和Recraft V3的表现非常出色,文字很准确,而Midjourney生成的海报中出现了一些多余的字母单词,Flux-Pro V1.1生成的海报只有两个单词:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

2、人物写实:

提示词:一位年轻女性微笑着在舞台上发言,来自大疆,白色背景,企业标志被模糊处理,科技会议

在人物写实方面,先看背景,可以看到Recraft V3生成的图片背景不仅有大疆的logo还出现了一个无人机的图案,是四个模型中表现最好的,但是在人物方面,Recraft V3的人物四肢都很真实,不过仔细看牙齿,就能看到人物的牙齿的结构并不像真实的牙齿结构,根据对比这次表现最好的是Ideogram,Midjourney虽然人物非常写实,但是背景并没有出现提示词中提到的大疆,Flux-Pro V1.1背景的logo则是出现了错误:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

3、复杂场景:

提示词:模仿产品拍摄,在一个非常干净的桌子上垫着一张浅色桌布,桌面放着三个红色的圆柱体,一个绿色长方体和两个黄色圆锥体

最后是复杂场景的对比,根据Recraft V3官网的介绍,Recraft V3能够准确遵循提示词,生成复杂场景。但在实测中,效果并没有达到预期,在生成的过程中,尝试了用中文和英文提示词生成,效果还是不理想,Recraft V3主要是把“三个红色圆柱体”和“两个黄色圆锥体”搞混了,而其他的模型,Midjourney、Flux-Pro V1.1和Ideogram的表现较差:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

PS:为更直观地评估每个模型在初始状态下的表现能力,以上模型展示的效果,均是模型第一次生成的效果。

API接入

最后,302.AI的API超市也上线了Recraft V3模型的API,能够自定义风格,支持在线调试,这使得开发者可以快速集成和使用API服务,并且大大节省了开发成本。

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

总结

综合来看,Recraft V3在长文本生成方面能够准确生成,表现十分不错。但在人物图像的生成上仿真准确度仍有提升空间,特别是在处理细微面部特征时,例如牙齿结构,这种细节的真实感有待进一步优化。

对于提示词生成复杂场景的能力,Recraft V3当前的表现尚未完全达到其官方声称的水平,特别是在物体数量和颜色的辨识上存在混淆,这可能与算法的训练数据相关,相信随着技术的迭代与优化,未来会有更好的表现。

总之,随着技术的进一步发展和用户反馈的不断改进,相信Recraft V3的潜力将会被不断挖掘和实现。

参考文章:https://www.recraft.ai/blog/recraft-introduces-a-revolutionary-ai-model-that-thinks-in-design-language

Like (1)
302.AI302.AI
Previous 2024 年 11 月 1 日 下午6:09
Next 2024 年 11 月 4 日 下午6:52

相关推荐

  • 资讯丨低成本实现虚拟模特换装,电商新神器——302 AI换衣

    随着AI技术的快速发展,市场上出现了一种新型AI工具——AI 换衣。这类工具提供了精确的虚拟试穿能力,且操作简单,逐渐成为电商商家们的新宠。 302.AI紧跟市场发展,近日在工具超市最新上线了一款AI 换衣工具。这一工具能够准确渲染服装细节,并且支持多种服装类别,包括上衣、下装、夹克、连衣裙等。更重要的是,302.AI提供按需付费的使用方式,用户只需要依据自…

    2025 年 1 月 13 日
    27100
  • 告别繁琐配置,来302.AI一键部署GraphRAG

    您是否遇到过这样的问题?大语言模型回答答非所问,或者直接在胡说八道。这种情况一般是因为大语言模型产生了幻觉。在开发和实际应用中,幻觉问题是一个常见且严重的问题,因为幻觉的存在,会导致回答的可信度大大降低。 幻觉出现的原因通常是模型对于某些特定领域或最新信息缺乏了解的情况下,而RAG(Retrieval-Augmented Generation)技术通过结合检…

    2024 年 10 月 23 日
    45200
  • Runway官宣上线Gen-3 Alpha!无门槛抢先体验

    7月2日凌晨,Runway在社交媒体正式宣布,Gen-3 Alpha全面开放使用! Runway是一家专注于AI视频生成的公司,其推出的Gen系列模型在视频创作领域引起了广泛关注。 据说最新推出的Gen-3 Alpha模型在保真度、一致性和动作表现方面都有重大改进! 都说Gen-3 Alpha很强,那我们先看下来自官网的一段视频: (Prompt:在日本城市…

    2024 年 7 月 12 日
    36500
  • 谷歌发布最新两款Gemini 1.5系列模型,与草莓o1模型对比谁表现更好?

    9月25日,Google旗下的Gemini 1.5系列模型迎来了最新版本的发布,分别是Gemini-1.5-Pro-002和Gemini-1.5-Flash-002两款模型。据了解,与之前的版本相比,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002在数学、上下文和视觉方面的能力得到了显著提升。 根据官方数据显示,两款模型在M…

    2024 年 9 月 26 日
    34200
  • 资讯丨Claude 3.7 Sonnet标准模式和推理模式实测对比

    在上一篇文章中,我们给大家介绍了 Claude 3.7 Sonnet 模型,同时对Claude 3.7 Sonnet的标准模式(Normal)进行了实测对比。 而现在,我们将会对Claude 3.7 Sonnet 推理模式(Extended)进行深入探讨。通过与Claude 3.5 Sonnet、Claude 3.7 Sonnet(标准模式)的对比,更全面地…

    2025 年 2 月 27 日
    46200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注