揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

近日,一个名为red_panda的模型在Hugging Face的文本生成图像模型排行榜中位居榜首, 这引起了许多网友对这一神秘“小熊猫”背后公司身份的种种讨论。

有网友猜测小熊猫会不会是Midjourney的新产物,也有网友猜测可能是来自OpenAI:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

甚至有网友猜测,因为熊猫生活在亚洲,而中国公司在视频生成方面表现卓越,所以猜测它来自像百度或腾讯这样的中国科技公司:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

就在10月的最后一天,谜底揭开了!

10月31日,Recraft AI在社交媒体上宣布,这一备受关注的神秘模型red_panda(小熊猫)正是他们推出的最新图像生成模型Recraft V3。

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

根据Recraft AI官方称,Recraft的新模型质量高于 Midjourney、OpenAI 和所有其他主要图像生成公司的模型。

Recraft V3的主要优势体现在:

1、能够遵循和理解提示词,并生成具有复杂场景的图像,包括提示中提到的物体的正确数量、颜色和位置,

2、在人物生成方面,能够确保手指、手和腿的数量适当、身体比例逼真、场景内的空间连贯性以及背景物体相对于主要主体的自然定位。

3、同时官方还宣称,Recraft V3在文本生成质量方面非常高,是世界上唯一一个能够生成带有长文本图像的模型。

新模型出现,按照惯例肯定要实测看看真实效果如何,302.AI的绘画机器人已经提供了最新的Recraft V3模型,用户可以进入302.AI快速使用Recraft V3模型,无需下载额外的软件。

302.AI的绘画机器人提供了多种图像生成模型,能够快速选择不同模型使用,满足用户不同的需求,更重要的是,能够轻松对比不同模型的效果。接下来 ,就使用302.AI实测对比下Recraft V3与其他模型的效果。

使用教程:

1、进入302.AI,在侧边栏找到绘画机器人,选择模型后点击【创建绘画机器人】,比如首先选择Recraft V3模型;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

2、进入绘画机器人的绘画页面,可以看到输入框右侧会有设置,这里可以设置图片比例、风格提示词等;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

3、完成设置后,即可在输入框输入提示词生成图片;

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

多模型对比:

(以下所有案例均由302.AI绘画机器人生成)

1、长文字海报:

提示词:一张可爱的漫画风平面海报,有生日的元素,海报上方用艺术字体写着“302.AI” ,另外用正楷写着“Happy birthday to you!Happy every day, happy life, no worries.And all wishes come true!”

首先,从生成的海报中的文字准确性上来看,Ideogram和Recraft V3的表现非常出色,文字很准确,而Midjourney生成的海报中出现了一些多余的字母单词,Flux-Pro V1.1生成的海报只有两个单词:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

2、人物写实:

提示词:一位年轻女性微笑着在舞台上发言,来自大疆,白色背景,企业标志被模糊处理,科技会议

在人物写实方面,先看背景,可以看到Recraft V3生成的图片背景不仅有大疆的logo还出现了一个无人机的图案,是四个模型中表现最好的,但是在人物方面,Recraft V3的人物四肢都很真实,不过仔细看牙齿,就能看到人物的牙齿的结构并不像真实的牙齿结构,根据对比这次表现最好的是Ideogram,Midjourney虽然人物非常写实,但是背景并没有出现提示词中提到的大疆,Flux-Pro V1.1背景的logo则是出现了错误:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

3、复杂场景:

提示词:模仿产品拍摄,在一个非常干净的桌子上垫着一张浅色桌布,桌面放着三个红色的圆柱体,一个绿色长方体和两个黄色圆锥体

最后是复杂场景的对比,根据Recraft V3官网的介绍,Recraft V3能够准确遵循提示词,生成复杂场景。但在实测中,效果并没有达到预期,在生成的过程中,尝试了用中文和英文提示词生成,效果还是不理想,Recraft V3主要是把“三个红色圆柱体”和“两个黄色圆锥体”搞混了,而其他的模型,Midjourney、Flux-Pro V1.1和Ideogram的表现较差:

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

PS:为更直观地评估每个模型在初始状态下的表现能力,以上模型展示的效果,均是模型第一次生成的效果。

API接入

最后,302.AI的API超市也上线了Recraft V3模型的API,能够自定义风格,支持在线调试,这使得开发者可以快速集成和使用API服务,并且大大节省了开发成本。

揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果

总结

综合来看,Recraft V3在长文本生成方面能够准确生成,表现十分不错。但在人物图像的生成上仿真准确度仍有提升空间,特别是在处理细微面部特征时,例如牙齿结构,这种细节的真实感有待进一步优化。

对于提示词生成复杂场景的能力,Recraft V3当前的表现尚未完全达到其官方声称的水平,特别是在物体数量和颜色的辨识上存在混淆,这可能与算法的训练数据相关,相信随着技术的迭代与优化,未来会有更好的表现。

总之,随着技术的进一步发展和用户反馈的不断改进,相信Recraft V3的潜力将会被不断挖掘和实现。

参考文章:https://www.recraft.ai/blog/recraft-introduces-a-revolutionary-ai-model-that-thinks-in-design-language

Like (1)
302.AI302.AI
Previous 2024 年 11 月 1 日 下午6:09
Next 2024 年 11 月 4 日 下午6:52

相关推荐

  • 资讯丨302.AI正式上线客户端!三个版本可供选择

    随着技术的发展,AI正一点一点融入到我们的日常和生活中,成为我们工作和生活的重要辅助工具。为了给用户带来多样的AI服务体验,11月14日,302.AI正式上线桌面客户端,并提供了以下三个版本给用户选择: 主账户版:支持Windows、Mac系统 子账户版:支持Windows、Mac系统 极简版:仅支持Mac系统 版本介绍: 主账号版: (展示的界面以Wind…

    2024 年 11 月 14 日
    19000
  • Stable Diffusion原班人马打造FLUX.1模型,推出的三个版本有什么不同?

    就在不久前,Stable Diffusion开源图像模型推出后,在网络上引发了热烈的讨论和广泛关注。后来,Stable Diffusion 部分创始成员创建了新公司Black Forest Labs,8月1日,Black Forest Labs推出了新研发的图像生成模型FLUX.1 。 FLUX.1 拥有12B参数,是迄今为止参数最多图像生成模型之一。该模型…

    2024 年 8 月 13 日
    20900
  • Luma AI——引领AI行业进入高质量视频内容

    时隔不到一年,Luma AI又有新动作!!! Luma AI在当地时间6月12日官宣并发布新模型——Dream Machine。Dream Machine可以在120秒内生成120帧的视频,具备流畅的运动、电影摄影和戏剧效果。 去年11月,Luma AI在Discord服务器上推出了文生3D模型Genie,冲击了AI行业的一大突破口——3D生成。Luma A…

    2024 年 7 月 11 日
    28000
  • 开发故事丨302.AI新工具:AI头像制作的过程和原理解析

    最近302.AI上线了一款新的AI工具——AI头像制作,这一工具能够根据用户提供的人物照片,生成人物一致的多种风格的头像。这些风格包括但不限于复古风、未来感、卡通化、艺术抽象等,还可以自定义风格。今天就给大家分享一下这个工具开发背后的故事,希望可以对相关方向的开发者有一些启发和帮助。 试用一下: 先来看下如何获取并使用这一工具,以下是具体的步骤: 1、进入3…

    2024 年 11 月 13 日
    15100
  • 什么是RAG?什么是GraphRAG?一文带你读懂知识库机器人原理

    在人工智能领域,知识库机器人已经成为推动智能化发展的重要力量。它们能够高效地处理海量信息,为用户提供精准、及时的知识服务。今天,我们将一起揭开知识库机器人的神秘面纱,探讨知识库机器人的原理。 什么是RAG? 知识库的整套技术在学术界有一个专业名词,叫RAG,即Retrieval-Augmented Generation,翻译成中文就是检索信息增强,是一种将信…

    2024 年 9 月 11 日
    28100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注