揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

近日,一个名为red_panda的模型在Hugging Face的文本生成图像模型排行榜中位居榜首, 这引起了许多网友对这一神秘“小熊猫”背后公司身份的种种讨论。

有网友猜测小熊猫会不会是Midjourney的新产物,也有网友猜测可能是来自OpenAI:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

甚至有网友猜测,因为熊猫生活在亚洲,而中国公司在视频生成方面表现卓越,所以猜测它来自像百度或腾讯这样的中国科技公司:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

就在10月的最后一天,谜底揭开了!

10月31日,Recraft AI在社交媒体上宣布,这一备受关注的神秘模型red_panda(小熊猫)正是他们推出的最新图像生成模型Recraft V3。

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

根据Recraft AI官方称,Recraft的新模型质量高于 Midjourney、OpenAI 和所有其他主要图像生成公司的模型。

Recraft V3的主要优势体现在:

1、能够遵循和理解提示词,并生成具有复杂场景的图像,包括提示中提到的物体的正确数量、颜色和位置,

2、在人物生成方面,能够确保手指、手和腿的数量适当、身体比例逼真、场景内的空间连贯性以及背景物体相对于主要主体的自然定位。

3、同时官方还宣称,Recraft V3在文本生成质量方面非常高,是世界上唯一一个能够生成带有长文本图像的模型。

新模型出现,按照惯例肯定要实测看看真实效果如何,302.AI的绘画机器人已经提供了最新的Recraft V3模型,用户可以进入302.AI快速使用Recraft V3模型,无需下载额外的软件。

302.AI的绘画机器人提供了多种图像生成模型,能够快速选择不同模型使用,满足用户不同的需求,更重要的是,能够轻松对比不同模型的效果。接下来 ,就使用302.AI实测对比下Recraft V3与其他模型的效果。

使用教程:

1、进入302.AI,在侧边栏找到绘画机器人,选择模型后点击【创建绘画机器人】,比如首先选择Recraft V3模型;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

2、进入绘画机器人的绘画页面,可以看到输入框右侧会有设置,这里可以设置图片比例、风格提示词等;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

3、完成设置后,即可在输入框输入提示词生成图片;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

多模型对比:

(以下所有案例均由302.AI绘画机器人生成)

1、长文字海报:

提示词:一张可爱的漫画风平面海报,有生日的元素,海报上方用艺术字体写着“302.AI” ,另外用正楷写着“Happy birthday to you!Happy every day, happy life, no worries.And all wishes come true!”

首先,从生成的海报中的文字准确性上来看,Ideogram和Recraft V3的表现非常出色,文字很准确,而Midjourney生成的海报中出现了一些多余的字母单词,Flux-Pro V1.1生成的海报只有两个单词:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

2、人物写实:

提示词:一位年轻女性微笑着在舞台上发言,来自大疆,白色背景,企业标志被模糊处理,科技会议

在人物写实方面,先看背景,可以看到Recraft V3生成的图片背景不仅有大疆的logo还出现了一个无人机的图案,是四个模型中表现最好的,但是在人物方面,Recraft V3的人物四肢都很真实,不过仔细看牙齿,就能看到人物的牙齿的结构并不像真实的牙齿结构,根据对比这次表现最好的是Ideogram,Midjourney虽然人物非常写实,但是背景并没有出现提示词中提到的大疆,Flux-Pro V1.1背景的logo则是出现了错误:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

3、复杂场景:

提示词:模仿产品拍摄,在一个非常干净的桌子上垫着一张浅色桌布,桌面放着三个红色的圆柱体,一个绿色长方体和两个黄色圆锥体

最后是复杂场景的对比,根据Recraft V3官网的介绍,Recraft V3能够准确遵循提示词,生成复杂场景。但在实测中,效果并没有达到预期,在生成的过程中,尝试了用中文和英文提示词生成,效果还是不理想,Recraft V3主要是把“三个红色圆柱体”和“两个黄色圆锥体”搞混了,而其他的模型,Midjourney、Flux-Pro V1.1和Ideogram的表现较差:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

PS:为更直观地评估每个模型在初始状态下的表现能力,以上模型展示的效果,均是模型第一次生成的效果。

API接入

最后,302.AI的API超市也上线了Recraft V3模型的API,能够自定义风格,支持在线调试,这使得开发者可以快速集成和使用API服务,并且大大节省了开发成本。

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

总结

综合来看,Recraft V3在长文本生成方面能够准确生成,表现十分不错。但在人物图像的生成上仿真准确度仍有提升空间,特别是在处理细微面部特征时,例如牙齿结构,这种细节的真实感有待进一步优化。

对于提示词生成复杂场景的能力,Recraft V3当前的表现尚未完全达到其官方声称的水平,特别是在物体数量和颜色的辨识上存在混淆,这可能与算法的训练数据相关,相信随着技术的迭代与优化,未来会有更好的表现。

总之,随着技术的进一步发展和用户反馈的不断改进,相信Recraft V3的潜力将会被不断挖掘和实现。

参考文章:https://www.recraft.ai/blog/recraft-introduces-a-revolutionary-ai-model-that-thinks-in-design-language

Like (1)
302.AI302.AI
Previous 2024 年 11 月 1 日 下午6:09
Next 2024 年 11 月 4 日 下午6:52

相关推荐

  • AI视力考验:各AI模型的视觉理解能力如何?

    近日,行业内有不少新模型涌现出大众的面前,我们会发现,有的模型会在其官方宣传中提到“多模态”一词,比如大家熟知的GPT-4o、Gemini 1.5 Pro等,在发布时都被定义为“原生多模态”,这些多模态LLM在相关的介绍中,都用到了“视觉能力”、“视觉理解”这样的表述。 简单的理解,就是这些模型能够“看得见,并看得懂”,仿佛人的眼睛。为此,很多人…

    2024 年 7 月 25 日
    16800
  • 资讯丨302.AI已支持Anthropic最新模型Claude 3.5 Haiku,与其他模型对比表现如何?

    11月5日,Anthropic在社交媒体平台宣布Claude 3.5 Haiku可以通过API访问。Claude 3.5 Haiku是Anthropic公司在10月22日发布的新模型,在许多评估中的性能与 Claude 3 Opus不相上下,而成本和速度却与上一代Haiku相当。 根据官方介绍,Claude 3.5 Haiku 在各种编码、工具使用和推理任务…

    2024 年 11 月 6 日
    9600
  • 当提示词使用”过去时”,就能突破各AI模型的安全防线?

    近日,洛桑联邦理工学院的研究人员发现,当使用AI模型的时候,只要在提示词中把时间设定成过去,就能突破大模型的安全防线。原本只有1%的攻击成功率飙升至88%,几乎达到了“有求必应”的境界。这项发现不仅在英文环境下有效,在中文语境中同样适用,让网友们惊叹于破解大模型漏洞的简便性。 实验中,研究人员从JBB-Behaviors数据集中挑选了100个有害行为,通过将…

    2024 年 8 月 1 日
    19000
  • 302.AI带来实时语音便捷方案,让你快速体验AI语音通话

    在10月初,OpenAI在旧金山召开了开发者大会。在发布会中,OpenAI推出了Realtime API 的公开测试版。 Realtime API是一种实时多模态API,它允许开发人员构建低延迟、多模态的AI应用体验。这个API背后的技术是GPT-4o模型,它支持音频输入和输出,能够实现超越传统基于文本的AI对话的实时、自然的语音交互。 像Realtime这…

    2024 年 10 月 31 日
    17300
  • Luma AI——引领AI行业进入高质量视频内容

    时隔不到一年,Luma AI又有新动作!!! Luma AI在当地时间6月12日官宣并发布新模型——Dream Machine。Dream Machine可以在120秒内生成120帧的视频,具备流畅的运动、电影摄影和戏剧效果。 去年11月,Luma AI在Discord服务器上推出了文生3D模型Genie,冲击了AI行业的一大突破口——3D生成。Luma A…

    2024 年 7 月 11 日
    24600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注