揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

近日,一个名为red_panda的模型在Hugging Face的文本生成图像模型排行榜中位居榜首, 这引起了许多网友对这一神秘“小熊猫”背后公司身份的种种讨论。

有网友猜测小熊猫会不会是Midjourney的新产物,也有网友猜测可能是来自OpenAI:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

甚至有网友猜测,因为熊猫生活在亚洲,而中国公司在视频生成方面表现卓越,所以猜测它来自像百度或腾讯这样的中国科技公司:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

就在10月的最后一天,谜底揭开了!

10月31日,Recraft AI在社交媒体上宣布,这一备受关注的神秘模型red_panda(小熊猫)正是他们推出的最新图像生成模型Recraft V3。

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

根据Recraft AI官方称,Recraft的新模型质量高于 Midjourney、OpenAI 和所有其他主要图像生成公司的模型。

Recraft V3的主要优势体现在:

1、能够遵循和理解提示词,并生成具有复杂场景的图像,包括提示中提到的物体的正确数量、颜色和位置,

2、在人物生成方面,能够确保手指、手和腿的数量适当、身体比例逼真、场景内的空间连贯性以及背景物体相对于主要主体的自然定位。

3、同时官方还宣称,Recraft V3在文本生成质量方面非常高,是世界上唯一一个能够生成带有长文本图像的模型。

新模型出现,按照惯例肯定要实测看看真实效果如何,302.AI的绘画机器人已经提供了最新的Recraft V3模型,用户可以进入302.AI快速使用Recraft V3模型,无需下载额外的软件。

302.AI的绘画机器人提供了多种图像生成模型,能够快速选择不同模型使用,满足用户不同的需求,更重要的是,能够轻松对比不同模型的效果。接下来 ,就使用302.AI实测对比下Recraft V3与其他模型的效果。

使用教程:

1、进入302.AI,在侧边栏找到绘画机器人,选择模型后点击【创建绘画机器人】,比如首先选择Recraft V3模型;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

2、进入绘画机器人的绘画页面,可以看到输入框右侧会有设置,这里可以设置图片比例、风格提示词等;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

3、完成设置后,即可在输入框输入提示词生成图片;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

多模型对比:

(以下所有案例均由302.AI绘画机器人生成)

1、长文字海报:

提示词:一张可爱的漫画风平面海报,有生日的元素,海报上方用艺术字体写着“302.AI” ,另外用正楷写着“Happy birthday to you!Happy every day, happy life, no worries.And all wishes come true!”

首先,从生成的海报中的文字准确性上来看,Ideogram和Recraft V3的表现非常出色,文字很准确,而Midjourney生成的海报中出现了一些多余的字母单词,Flux-Pro V1.1生成的海报只有两个单词:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

2、人物写实:

提示词:一位年轻女性微笑着在舞台上发言,来自大疆,白色背景,企业标志被模糊处理,科技会议

在人物写实方面,先看背景,可以看到Recraft V3生成的图片背景不仅有大疆的logo还出现了一个无人机的图案,是四个模型中表现最好的,但是在人物方面,Recraft V3的人物四肢都很真实,不过仔细看牙齿,就能看到人物的牙齿的结构并不像真实的牙齿结构,根据对比这次表现最好的是Ideogram,Midjourney虽然人物非常写实,但是背景并没有出现提示词中提到的大疆,Flux-Pro V1.1背景的logo则是出现了错误:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

3、复杂场景:

提示词:模仿产品拍摄,在一个非常干净的桌子上垫着一张浅色桌布,桌面放着三个红色的圆柱体,一个绿色长方体和两个黄色圆锥体

最后是复杂场景的对比,根据Recraft V3官网的介绍,Recraft V3能够准确遵循提示词,生成复杂场景。但在实测中,效果并没有达到预期,在生成的过程中,尝试了用中文和英文提示词生成,效果还是不理想,Recraft V3主要是把“三个红色圆柱体”和“两个黄色圆锥体”搞混了,而其他的模型,Midjourney、Flux-Pro V1.1和Ideogram的表现较差:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

PS:为更直观地评估每个模型在初始状态下的表现能力,以上模型展示的效果,均是模型第一次生成的效果。

API接入

最后,302.AI的API超市也上线了Recraft V3模型的API,能够自定义风格,支持在线调试,这使得开发者可以快速集成和使用API服务,并且大大节省了开发成本。

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

总结

综合来看,Recraft V3在长文本生成方面能够准确生成,表现十分不错。但在人物图像的生成上仿真准确度仍有提升空间,特别是在处理细微面部特征时,例如牙齿结构,这种细节的真实感有待进一步优化。

对于提示词生成复杂场景的能力,Recraft V3当前的表现尚未完全达到其官方声称的水平,特别是在物体数量和颜色的辨识上存在混淆,这可能与算法的训练数据相关,相信随着技术的迭代与优化,未来会有更好的表现。

总之,随着技术的进一步发展和用户反馈的不断改进,相信Recraft V3的潜力将会被不断挖掘和实现。

参考文章:https://www.recraft.ai/blog/recraft-introduces-a-revolutionary-ai-model-that-thinks-in-design-language

All Rights Reserved by 302.AI
Like (1)
302.AI302.AI
Previous 2024 年 11 月 1 日 下午6:09
Next 2024 年 11 月 4 日 下午6:52

相关推荐

  • 302.AI 新品发布 | AI绘图总翻车?绘图提示词专家帮你精准复刻图片,自由修改风格!

    许多人在使用AI绘图时,都会面临一些棘手的问题,比如想复刻某张图,但尝试了不同的关键词后生成效果依然货不对板;再比如想要对现有的图片进行风格调整使其更贴合自己的独特需求,但却难以维持画面元素的一致性。 针对以上痛点,302.AI 上新了一款AI绘图提示词专家工具,这一工具结合了“图片转提示词”和“风格修改”两大功能,用户不仅可以通过上传图片获得精准提示词复刻…

    2025 年 4 月 25 日 AI资讯
    1340
  • 资讯丨马斯克号称地表最强的Grok 3系列模型,在实测中到底能否超越R1和o3-mini?

    2月19日,马斯克旗下的大模型平台 xAI 推出了新的模型——Grok-3。官方宣称,Grok-3 在推理、数学、编码和指令遵循任务中均表现出色,并在一系列基准测试中表现出色。而马斯克更是称一模型为 ⌈ 地表最强 ⌋。 (非推理模式的Grok-3与其它大模型能力对比) 根据了解,grok-3 并非单一模型,而是一个包含多个版本的模型家族。其中包括了变体版本—…

    2025 年 2 月 24 日 AI资讯
    3040
  • 资讯丨通义万相2.1模型实测绝了!汉字竟在视频里“活”了

    继豆包图像模型攻克汉字生成的难题后,国内AI视频生成领域在中文生成方面再次来了新突破! 今年年初,阿里云推出了全新升级的的视频生成模型——通义万相2.1。据了解,这是⌈ 首个具备中文文字生成能力的视频生成模型 ⌋ 。 通义万相2.1视频模型一经推出,便以 84.70% 总分登顶权威评测榜单VBench榜首。除了中文文字生成的创新,该模型在复杂运动、大幅度动作…

    2025 年 2 月 21 日 AI资讯
    7680
  • 资讯丨302.AI 代码竞技场:大模型编程能力的“超级擂台”

    一个大模型能力强不强,我们常常会从多个维度去评估,其中编程能力是尤为关键的一项。 对于许多用户而言,想要准确测试大模型的代码能力却常常不知道该从何入手,或者不知道选择哪个平台进行测试。 为了帮助用户解决这一问题,302.AI最新上线了一款工具——代码竞技场,这一工具集结了多种先进模型,为用户提供了一个广阔、便捷、易用的代码测试平台。 工具界面展示: 302.…

    2025 年 2 月 19 日 AI资讯
    2730

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注