资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

12月,字节跳动豆包大模型团队推出文生图模型 v2.1版本,这次的升级对比通用 2.0和通用 2.0 PRO版本,除了结构准确和美感明显提升外,重点支持了中英文字符渲染。

据了解,豆包文生图模型v2.1通过打通 LLM 和 DiT 构架,构建了高质量文字渲染能力,大幅提升文字生成准确率。这种原生的文字渲染能力,让文字与整体画面的融合更为自然和实用。

> 在302.AI上使用

按照惯例,302.AI在第一时间更新了Doubao的图像生成模型,用户可以通过302.AI的绘画机器人以及API超市获取模型使用,302.AI提供按需付费的服务方式,用户只需为实际使用的资源和服务付费,提供了高度的灵活性。

【绘画机器人】

302.AI的绘画超市涵盖市面上多种图像模型,用户可以根据需要选择模型合适的使用。在使用过程中,还可以根据创作需求随意按需切换模型,且无需复杂繁琐的流程,非常便捷。以下是在绘画机器人中获得Doubao模型的步骤

1、进入302.AI——点击使用机器人——找到绘画机器人——这里模型可以默认All模型或者直接选择Doubao模型——然后创建绘画机器人

资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

2、点击输入框右侧的设置——选择模型版本——选择风格,设置中还可以选择图片比例等;

资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

【API超市】

302.AI的API超市中的API种类丰富且分类明晰,企业用户可以快速找到所需的API的获取接入方式和文档支持,并能够根据特定项目需求进行定制化开发,加快AI应用的研发与部署流程以下是豆包模型的获取方式:

1、进入302.AI后——点击使用API——选择API超市——分类中点击图片生成——选择Doubao

资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

2、点击查看文档后即可进入。

资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

> 模型测评:

以下测评会生成纯中文、纯英文、中英的文字内容并搭配三种不同类型风格的图片,由于对比模型无法生成中文内容,因此在只会在实测2中会对比模型的表现,实测1与实测3中不作对比,对比模型为:Midjourney V6.1、Ideogram v2。

实测1:中文内容生成

分析1:Doubao v2.1提示词理解准确,中文内容生成正确。图片的色彩非常明亮和鲜艳,细节和构图都处理得非常出色。

资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

提示词2:节日海报,在画面中央是一个巨大的白色饺子,它的皮巧妙地打开,露出里面温暖的室内场景。里面有五个微型人物,围坐在一个装满小饺子的小圆桌旁,似乎在享受丰盛的晚餐。室内光线温暖柔和,营造出温馨的家庭氛围。在饺子皮的外面,可以看到一双木筷子夹着饺子皮,好像准备吃这个巨大的饺子皮。背景中有几个模糊的饺子,暗示着一场饺子盛宴。整幅画采用微缩山水的艺术手法,巧妙地将日常融入其中,海报的下方写着“团圆,新年”。

分析2:对于复杂的提示词生成效果也不错,文字生成非常准确,但唯一不足的提示词中的“五个微型人物”实际生成了六个。

资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

提示词3:超写实电影海报,大标题文字“冰雪未来”,超广角镜头,哑光绘画,电影海报,撕裂的地平线沐浴在暮色中。英雄出现在前景,背景是巨大的机器,未来的交通工具塑造了天际线。一个视觉史诗,每个元素都唤起了惊奇和兴奋。电影海报,3D哑光绘画。

分析3:提示词理解准确,生成的文字准确。

资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

实测2:英文内容生成

提示词:现代科技风,傍晚日落时分,在高楼林立市中心,车水马龙,路边挂着一个大大的广告牌,上面写着“Happy New Year, wish everyone happy!”

资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

分析:

Doubao v2.1:英文生成也没问题,提示词理解也不错,整体图片色彩搭配也很和谐。广告牌的黄色与周围的城市景观形成了鲜明的对比,使得文字更加醒目。但还是有一些不足的小细节,比如在生成的单词“wish”看起来不够清晰。

资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

Midjourney V6.1:整体的画面色彩搭配还不错,但还是出现了老问题,生成的文字不够准确,出现重复单词或者字母的情况。

资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

Ideogram v2:文字生成准确,图片的色彩搭配非常和谐且细节非常丰富,可以看到街道上的车辆、建筑物的外观以及天空的变化,整体非常出色。

资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

实测3:中英内容生成

提示词:一个20岁的帅气年轻男孩,站在火车站门口,周围人很多,他手里举着一个牌写着:“Welcome to you 欢迎你”,写实风

分析:

Doubao v2.1:即使是写实风的中英文内容生成也是没有问题,单词的大小写能够也准确生成。但美中不足的是,除了提示词中提到的文字内容,还出现了其他内容。比如在牌子的右下角出现不明文字。

资讯丨实测Doubao文生图模型v2.1版本,中英文内容生成竟轻松拿捏!

> 总结:

通过以上实测,可以初步得出以下结论:

1、中文内容的生成:豆包文生图模型v2.1生成文字是准确的,但对于复杂的场景生成上有小错误,不过实测中大部分任务都能够遵循提示词,并通过自然的文字与画面融合,提升整体的视觉效果。

2、英文内容的生成:总体生成的内容是准确的,但在某些细节上仍有改进空间,比如个别单词的清晰度方面。

3、中英文内容生成:内容生成准确,但生成的图片会出现了一些小瑕疵,比如出现不必要的附加内容方面,从而影响整体画面的效果。

除了在文字生成准确性方面表现不错,通过实测还可以看到,模型能够准确理解提示词并遵循,生成的图片在构图、色彩搭配、细节上都毫不逊色对比模型。

未来,我们期待豆包团队能够持续优化模型,改进目前出现的瑕疵,进一步提升生成内容的准确性与美观性。

Like (0)
302.AI302.AI
Previous 2024 年 12 月 27 日 下午7:17
Next 2天前

相关推荐

  • Reflection-Llama-3.1-70B发布短短几天,为何备受争议?

    9月6日,AI写作初创公司HyperWrite发布了Reflection-Llama-3.1-70B模型。该模型基于Meta的Llama 3.1-70B Instruct,并使用原始的 Llama Chat 格式,确保了与现有工具和 pipeline 的兼容性。 在发布当天,HyperWrite 公司的 CEO Matt Shumer 在社交媒体平台发文表示…

    2024 年 9 月 9 日
    20500
  • 资讯丨FLUX 1.1 Pro推出Ultra模式,来302.AI实测揭秘真实效果

    11月6日,BlackForestLabs宣布推出FLUX1.1 pro的Ultra模式,添加了新的高分辨率功能,还增加了一个RAW参数,这一参数提升了生成图片的拟真度,让生成的图片摆脱了“AI味”,为用户带来了新的视觉体验。 据官网介绍,FLUX 1.1 Pro Ultra支持高达4兆像素(4MP)的图像生成,这是标准模式的四倍。这一提升使得生成的图像更加…

    2024 年 11 月 11 日
    32800
  • 可灵AI全面开放,引领视频创作新时代

    7月下旬,可灵AI(Kling AI)宣布全面开放,曾经在国内外内测名额“一号难求”的可灵成为了历史。可灵AI是由快手科技自研的视频生成大模型,能够根据文本提示生成长达2分钟、帧率为30fps的高质量视频,支持1080p分辨率,并支持多种宽高比,陆续升级推出了图生视频等功能。 从上线到全面开放,可灵历经了一个多月的时间: 6月10日,快手科技宣布推出了可灵大…

    2024 年 8 月 6 日
    25300
  • 资讯丨“Thinking Claude”prompt真的这么神?302带你实测揭秘看看

    最近,又一个prompt在网上火了起来,这一prompt名为“ Thinking Claude”,有网友称它为Claude3.5的神级prompt,而更让人意想不到的的是,这个prompt背后的作者,居然是一个十七岁的少年! “Thinking Claude”的核心在于它引导Claude进行一种更为“人性化”的思考方式,强调思维过程的自然流动,而非简单的结构…

    2024 年 11 月 15 日
    29200
  • 时隔两月Meta再发布新模型Llama 3.2,视觉理解方面媲美GPT-4o-mini?!

    距离7月23日Llama 3.1发布才刚刚过去 2 个月,Meta公司在9月26日又官宣推出最新AI模型系列Llama 3.2,此次Llama 3.2系列包括四个版本:1B、3B、11B和90B。 Llama 3.2 1B和Llama 3.2 3B都是轻量级的模型,适合边缘和移动设备的轻量级纯文本模型。而Llama 3.2 11B和Llama 3.2 90B…

    2024 年 9 月 27 日
    24500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注