Ideogram推出2.0版本,连Midjourney都感受到了压力?看看到底有多厉害?!

8月21日,由Ideogram团队倾力打造的创新型文本生成图像模型 Ideogram 2.0正式发布。

其实早在今年2月,Ideogram团队就发布了Ideogram模型1.0版本,但是其在AI生图领域并未引起太大波澜,但在这一次 Ideogram 2.0版本发布后,Ideogram官方直接在社交媒体平台自信宣称,这一版本比FLUX Pro和DALL·E3要强。

Ideogram推出2.0版本,连Midjourney都感受到了压力?看看到底有多厉害?!

根据Ideogram官网介绍,这一版本是全新前沿文本转图像模型,具有业界领先的生成逼真图像、图形设计、排版等功能,Ideogram 2.0 是从头开始训练的,在许多质量指标(包括图像-文本对齐、总体主观偏好和文本渲染准确度)方面,其表现都远超其他文本转图像模型。

准确的文本渲染可以说一直是图像生成领域的一个重大挑战,很多图像生成模型都没能攻克这一难题,生成的文本出现扭曲或模糊不清的问题,难以满足专业品质的要求。而Ideogram 2.0官方宣传主打的优势恰恰是将文字信息精确融合于图像之中,其次是多样化创作风格和色彩控制功能。同时,官方还提到Ideogram 2.0 版本的写实风格就像真实照片一样,纹理得到显著增强,人类的皮肤和头发看起来栩栩如生。

Ideogram推出2.0版本,连Midjourney都感受到了压力?看看到底有多厉害?!

当然,以上都是官方的说法,是不是在真的这么强,要试过对比才能知道,然而,小编发现Ideogram官网的注册方式只提供了两种谷歌账号和Apple ID,这对于没有或不使用这两种服务的用户来说,十分不友好,同时会带来不便。此外,尽管Ideogram提供了少量的慢生成免费额度用于生成图片,但用户在此额度下仅能使用基础功能来生成图片,并且生成后的图片只能以压缩的JPG格式下载。如果用户希望使用更多高级功能或服务,就不得不选择开通月费,这可能会使得用户的预算成本变得难以控制。

而302.AI的绘画机器人目前已经更新了Ideogram模型,302.AI提供按需付费的使用方式,无月费和捆绑套餐,用户可以更好控制成本预算,并且能够直接下载高清PNG格式图片,且302.AI提供手机注册、邮箱注册、谷歌注册三种注册方式,用户能够根据自身需求选择最为便捷的注册方式。

Ideogram推出2.0版本,连Midjourney都感受到了压力?看看到底有多厉害?!

有趣的是,或许是感受到了压力,在Ideogram2.0版本推出后的一天,8月22日,Midjourney网页版居然开放了免费试用!到底Ideogram2.0是不是真的这么厉害呢?那接下来,小编就用302.AI的绘画机器人对比一下Ideogram2.0Midjourney V6.1这两个图像生成模型的效果:

广告创意设计+文字生成:仔细看可以看到,首先Midjourney的顶部文字生成有一点错误单词中的“a”字母出现了重复,而Ideogram对于提示词中的文字生成是非常准确的,其次,对比这两张海报图片整体氛围,Ideogram生成的汽车+上灯光更有质感。

Ideogram推出2.0版本,连Midjourney都感受到了压力?看看到底有多厉害?!

prompt:一辆豪华跑车停在光线昏暗的高端车库中,光束突出跑车的曲线和光泽饰面。汽车的前灯发出强烈的光芒。顶部用粗体字写着“Unleash the Beast”。标语“Engineered for Excellence”位于下方。

漫画风海报+提示词理解:可以看到对比两张图片,从风格上来说,两个模型生成的风格都是漫画风,从提示词理解方面看,Midjourney生成的图片标语内容部分后面紧接着出现重复文字且扭曲模糊不清,而Ideogram提示词理解文字生成的优势非常明显,另外,整体的图片海报感觉,小编认为不相上下。

Ideogram推出2.0版本,连Midjourney都感受到了压力?看看到底有多厉害?!

prompt:一张可爱的漫画风平面海报,有生日的元素,海报上方用艺术字体写着“302.AI” ,标语用正楷写着“The freedom and happiness”

写实风格:最后是写实风的比较,整体感觉两张照片都很不错,但是细细对比看两张图片中人物的皮肤纹理、头发,可以看得出Ideogram生成的图片人物皮肤、头发稍微会更真实一点,整体的光影也十分的自然。

Ideogram推出2.0版本,连Midjourney都感受到了压力?看看到底有多厉害?!

prompt:一位白发的男性,在室外,身着褐色方格衬衫,色彩丰富,焦点清晰

另外,302.AIAPI超市也提供了Ideogram的API,且价格和Ideogram官网的一致,302.AI的API超市一个是丰富的API集市,提供了多种模型的API,且分类明晰,开发者能够快速地找到所需的API,并且获取接入方式和文档支持。比如Ideogram的API,打开API列表——找到图片生成类目——选择Ideogram进入,如图:

Ideogram推出2.0版本,连Midjourney都感受到了压力?看看到底有多厉害?!

更重要的是,302.AIAPI超市更新速度很快,且API类型全面。目前提供了Ideogram多种功能的API,用户可以根据自己的需求选择不同的API接口,进行个性化的集成和开发,支持在线调试,可以减少在本地环境设置和配置调试工具的时间,提高开发效率,降低开发成本。

Ideogram推出2.0版本,连Midjourney都感受到了压力?看看到底有多厉害?!

从1.0版本到2.0版本,Ideogram仅仅用了短短半年的时间,就实现了质的飞跃。尤其在文字生成准确性方面,它展现出了强大的实力。随着这一版本的发布,Ideogram不仅进一步巩固了其在AI图像生成领域的竞争力,还为未来的技术发展和应用场景开辟了全新的可能性,最后我们期待未来图像生成模型带来更多的惊喜。

参考文章:

https://about.ideogram.ai/2.0

https://mp.weixin.qq.com/s/KJaZls2rAQ3t3ayBB8itOQ

(0)
302.AI302.AI
上一篇 2024 年 8 月 26 日 下午2:52
下一篇 2024 年 8 月 27 日 下午6:18

相关推荐

  • 中国专利数量远超其他国家,用户如何实现高效的专利搜索?

    7月初,世界知识产权组织(WIPO)发布了一份引人注目的报告。该报告揭示了:中国发明人申请的生成式人工智能专利数量不仅位居全球榜首,而且大幅领先于其他国家。 世界知识产权组织(WIPO)最新发布的《WIPO Patent Landscape Report on Generative AI》显示:在2014年至2023年的这一段将近10年的时间里,中国的生成式…

    2024 年 8 月 1 日
    6100
  • 百度发布的升级版Ernie4.0 Turbo模型将与GPT-4竞争?

    6月28日百度WAVE SUMMIT峰会上发布了最新的文心大模型 4.0 Turbo即Ernie 4.0 turbo。 Ernie 4.0 turbo 是2023年10月推出的 Ernie 4.0 模型的升级版,这一新版本在反应速度和性能上有了显著提升。 Ernie 4.0 Turbo的全称为“Enhanced Representation through …

    2024 年 7 月 22 日
    13800
  • 视频太长不想看怎么办?来试一试AI音视频总结工具

    7月,夸克推出AI搜索并升级“超级搜索框”,在搜索框中加入了多个强大并实用的AI功能。其中的AI视频总结工具,这一工具不仅可以基于视频生成文稿,还能分段总结、生成思维导图以及智能生成课件,辅助用户高效学习。来看看官网的演示: 然而,目前小编只在夸克移动端找到了AI视频总结工具,而且根据页面提示,这一AI视频总结工具仅支持:上传视频和网盘视频两种方式,这意味着…

    2024 年 8 月 7 日
    5700
  • 阿里千问发布数学模型Qwen2-Math,最好的数学模型出现了?!

    8月9日,阿里通义团队发布新一代数学模型Qwen2-Math,据官方称,Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型,其数学能力显著超越了开源模型,甚至超过了闭源模型(如 GPT-4o),Qwen2-Math包含1.5B、7B、72B三个参数的基础模型和指令微调模型。 在一系列数学基准评测上,Qwen2-Math-…

    2024 年 8 月 19 日
    8500
  • 模型竞技场:中秋国庆调休来了,哪个AI能算明白?

    不知不觉中,2024年的时光已悄然流逝了三分之二。 许多打工人和学生党即将迎来中秋和国庆两个假期。放假是件开心的事情,然而,有网友发现,今年的中秋国庆假期放假和调休时间安排颇为复杂,这一话题因此登上了社交平台热搜榜,引发了广泛关注,阅读量激增至4亿,讨论量也高达11.3万。 对于接下来从九月第二周开始到十月“上6休3上3休2上5休1上2休7再上5休1”的放假…

    2024 年 8 月 29 日
    7800

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注