揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

近日,一个名为red_panda的模型在Hugging Face的文本生成图像模型排行榜中位居榜首, 这引起了许多网友对这一神秘“小熊猫”背后公司身份的种种讨论。

有网友猜测小熊猫会不会是Midjourney的新产物,也有网友猜测可能是来自OpenAI:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

甚至有网友猜测,因为熊猫生活在亚洲,而中国公司在视频生成方面表现卓越,所以猜测它来自像百度或腾讯这样的中国科技公司:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

就在10月的最后一天,谜底揭开了!

10月31日,Recraft AI在社交媒体上宣布,这一备受关注的神秘模型red_panda(小熊猫)正是他们推出的最新图像生成模型Recraft V3。

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

根据Recraft AI官方称,Recraft的新模型质量高于 Midjourney、OpenAI 和所有其他主要图像生成公司的模型。

Recraft V3的主要优势体现在:

1、能够遵循和理解提示词,并生成具有复杂场景的图像,包括提示中提到的物体的正确数量、颜色和位置,

2、在人物生成方面,能够确保手指、手和腿的数量适当、身体比例逼真、场景内的空间连贯性以及背景物体相对于主要主体的自然定位。

3、同时官方还宣称,Recraft V3在文本生成质量方面非常高,是世界上唯一一个能够生成带有长文本图像的模型。

新模型出现,按照惯例肯定要实测看看真实效果如何,302.AI的绘画机器人已经提供了最新的Recraft V3模型,用户可以进入302.AI快速使用Recraft V3模型,无需下载额外的软件。

302.AI的绘画机器人提供了多种图像生成模型,能够快速选择不同模型使用,满足用户不同的需求,更重要的是,能够轻松对比不同模型的效果。接下来 ,就使用302.AI实测对比下Recraft V3与其他模型的效果。

使用教程:

1、进入302.AI,在侧边栏找到绘画机器人,选择模型后点击【创建绘画机器人】,比如首先选择Recraft V3模型;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

2、进入绘画机器人的绘画页面,可以看到输入框右侧会有设置,这里可以设置图片比例、风格提示词等;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

3、完成设置后,即可在输入框输入提示词生成图片;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

多模型对比:

(以下所有案例均由302.AI绘画机器人生成)

1、长文字海报:

提示词:一张可爱的漫画风平面海报,有生日的元素,海报上方用艺术字体写着“302.AI” ,另外用正楷写着“Happy birthday to you!Happy every day, happy life, no worries.And all wishes come true!”

首先,从生成的海报中的文字准确性上来看,Ideogram和Recraft V3的表现非常出色,文字很准确,而Midjourney生成的海报中出现了一些多余的字母单词,Flux-Pro V1.1生成的海报只有两个单词:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

2、人物写实:

提示词:一位年轻女性微笑着在舞台上发言,来自大疆,白色背景,企业标志被模糊处理,科技会议

在人物写实方面,先看背景,可以看到Recraft V3生成的图片背景不仅有大疆的logo还出现了一个无人机的图案,是四个模型中表现最好的,但是在人物方面,Recraft V3的人物四肢都很真实,不过仔细看牙齿,就能看到人物的牙齿的结构并不像真实的牙齿结构,根据对比这次表现最好的是Ideogram,Midjourney虽然人物非常写实,但是背景并没有出现提示词中提到的大疆,Flux-Pro V1.1背景的logo则是出现了错误:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

3、复杂场景:

提示词:模仿产品拍摄,在一个非常干净的桌子上垫着一张浅色桌布,桌面放着三个红色的圆柱体,一个绿色长方体和两个黄色圆锥体

最后是复杂场景的对比,根据Recraft V3官网的介绍,Recraft V3能够准确遵循提示词,生成复杂场景。但在实测中,效果并没有达到预期,在生成的过程中,尝试了用中文和英文提示词生成,效果还是不理想,Recraft V3主要是把“三个红色圆柱体”和“两个黄色圆锥体”搞混了,而其他的模型,Midjourney、Flux-Pro V1.1和Ideogram的表现较差:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

PS:为更直观地评估每个模型在初始状态下的表现能力,以上模型展示的效果,均是模型第一次生成的效果。

API接入

最后,302.AI的API超市也上线了Recraft V3模型的API,能够自定义风格,支持在线调试,这使得开发者可以快速集成和使用API服务,并且大大节省了开发成本。

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

总结

综合来看,Recraft V3在长文本生成方面能够准确生成,表现十分不错。但在人物图像的生成上仿真准确度仍有提升空间,特别是在处理细微面部特征时,例如牙齿结构,这种细节的真实感有待进一步优化。

对于提示词生成复杂场景的能力,Recraft V3当前的表现尚未完全达到其官方声称的水平,特别是在物体数量和颜色的辨识上存在混淆,这可能与算法的训练数据相关,相信随着技术的迭代与优化,未来会有更好的表现。

总之,随着技术的进一步发展和用户反馈的不断改进,相信Recraft V3的潜力将会被不断挖掘和实现。

参考文章:https://www.recraft.ai/blog/recraft-introduces-a-revolutionary-ai-model-that-thinks-in-design-language

Like (1)
302.AI302.AI
Previous 2024 年 11 月 1 日 下午6:09
Next 2024 年 11 月 4 日 下午6:52

相关推荐

  • 资讯丨302 AI红包封面生成工具——1分钟定制出专属红包封面(附全攻略)

    距离春节还有不到半个月的时间,在这阖家团圆的传统佳节里,红包作为传递祝福、表达心意的传统载体,承载着浓厚的年味气息。当我们还在回味纸质红包带来的那份浓浓年味与祝福的温度时,线上红包早已成为人们日常社交、节日庆祝不可或缺的表达心意的方式。而其中,定制专属的线上红包封面更是能够承载个性化的祝福语和独特寓意,为节日增添一份特别的仪式感。 为了帮助用户能够简单、高效…

    2025 年 1 月 14 日
    21200
  • 资讯丨302.AI与硅基流动合作:用户可在302.AI平台直接使用硅基流动所有模型

    近日,302.AI与硅基流动官方正式达成合作!通过此次合作,用户可以在302.AI平台直接采购或使用硅基流动的模型,享受与硅基流动官方一致的价格,且能够直接使用302.AI平台上的余额进行支付,无需额外充值或支付任何附加费用。 302.AI是一个企业级的AI应用平台,提供按用量付费的服务模式,汇集了全球各类AI模型,开发出多种开箱即用的AI机器人和AI工具。…

    2025 年 1 月 15 日
    21700
  • 资讯丨实测MiniMax全新模型MiniMax-Text-01,数学、上下文理解、编程能力表现如何?

    1月15日,MiniMax发布并开源了全新MiniMax-01系列基础语言大模型——MiniMax-Text-01。 据了解,MiniMax-Text-01 是一个强大的语言模型,拥有 4560 亿个总参数,单次激活459 亿个参数 。为了解锁其长上下文功能,它采用了一种混合架构,集成了闪电注意力(Lightning Attention)、Softmax 注…

    2025 年 1 月 16 日
    46700
  • Live-portrait人像转视频模型,让照片中的脸都动起来

    7月6日,可灵网页版正式上线并且宣布了该网页端集成了文生图、文生视频相关能力,同时提供了一些新功能,如更加清晰的高画质版视频、首尾帧控制、镜头控制等全新编辑能力。 而在可灵网页版上线的前两天,快手发布了Live-portrait初始版本的推理代码和模型模型。此外,LivePortrait的官方网站也在同一天上线。 Live-portrait能够将静态照片转化…

    2024 年 7 月 25 日
    35000
  • 资讯丨OpenAI发布GPT-4o更新版本,竟能轻松拿捏《再见爱人4》经典语录?

    上周,OpenAI公司发布了GPT-4o的更新版本GPT-4o-2024-11-20。这一更新全面提升了模型的创意写作水平、让写作更加自然、引人入胜且量身定制,以提高相关性和可读性。此外,它还可以更好地处理上传的文件,提供更深入的见解和更全面的响应。 GPT-4o-2024-11-20具有128K个tokens 的上下文窗口,输入价格为每百万tokens 2…

    2024 年 11 月 25 日
    29600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注