当FLUX结合LoRA技术,你还分得清现实和AI吗?

8月初,由Stability AI 前创始成员创立的新公司Black Forest Labs推出了图像生成模型FLUX.1,而FLUX.1模型不仅在生成效果上超越Stable Diffusion,还能与 Midjourney 直接对打。如果想了解FLUX.1模型的朋友可以翻阅小编往期作品,因为今天的主角,不止是FLUX.1。

AI领域一直被形容为“内卷王者”,昨天的开源宝座可能今天就会易主,所以当以为FLUX的热度会随着更多新模型出现就此慢慢减退的时候,海外社交媒体平台上的一组照片的出现,再次让FLUX备受瞩目。

当FLUX结合LoRA技术,你还分得清现实和AI吗?

当你以为这只是一组发布会上平平无奇的实拍图的时候,那你就错了!因为以上四张照片,没有一张是真人!全是由AI生成!如此逼真,几乎看不出破绽,让网友们纷纷表示不可思议。

而网友们发现,首先分享照片的帖子作者是Stable Diffusion团队的前成员Leo Kadieff。Leo Kadieff说,这些TEDx演讲者,都是用最新的Flux真实版LoRA制作的。

当FLUX结合LoRA技术,你还分得清现实和AI吗?

Flux真实版LoRA制作是指利用Flux这一AI绘画模型结合LoRA(Low-Rank Adaptation)技术来生成具有高度真实感的图像的过程。LoRA技术是一种模型微调技术,它允许在不改变预训练模型参数的情况下,通过添加少量的可训练参数来适应特定的任务或数据集,从而实现对模型的快速定制和优化。

以往再真实的AI生成图片,仔细看都能看出来自AI,区别于真实的实拍照,而靠LoRA技术改进了模型,大大增加了真实感。

怪不得很多网友评论,“这就是真的”,“很难确信这是AI吧”

当FLUX结合LoRA技术,你还分得清现实和AI吗?

甚至有网友评论:“这看起来比我还真实”

当FLUX结合LoRA技术,你还分得清现实和AI吗?

更有网友发现,这居然骗过了AI检测。

当FLUX结合LoRA技术,你还分得清现实和AI吗?

当然,还是那句话:实践出真知。那从哪里可以快速使用这一模型的效果呢?首先,找到302.AI的绘画机器人,选择FLUX模型后点击添加机器人,302.AI提供按需付费的付费方式,没有月费,无需担心有捆绑套餐,而且302.AI的绘画机器人还能够一键分享给朋友使用,朋友只需进入分享链接输入分享码即可使用,无需登录注册。

当FLUX结合LoRA技术,你还分得清现实和AI吗?

进入操作页面后,点击右下角提示词图标,可以看到提供了多种版本,其中就包括了上文提到最新的Flux-Realism(超真实Lora)版本。

当FLUX结合LoRA技术,你还分得清现实和AI吗?

那接下来,小编就用302.AI的绘画机器人给大家展示一下Flux-Realism(超真实Lora)使用效果。

不得不说,小编真的有被惊艳到,非常像是一张实拍照片,人物手背的血管和青筋都能清楚看清楚,背后的logo也都正确。

当FLUX结合LoRA技术,你还分得清现实和AI吗?

提示词:一位女士在谷歌的舞台上发言,白色背景的公司,商标模糊了,科技会议。

再来把logo换成国内的品牌大疆,然后对比下用LoRA和不用LoRA的效果。

首先可以看到,两张图片的logo都是正常的,但是左侧不用LoRA的图片手指是明显看到不太协调的,能看出是AI生成的图片,而右侧的手部明显是更真实,更像一张照片:

当FLUX结合LoRA技术,你还分得清现实和AI吗?

提示词:一位年轻女性微笑着在舞台上发言,来自大疆,白色背景,企业标志被模糊处理,科技会议

但其实Flux-Realism(超真实Lora)模型也并不是完美的,小编发现当提示词中的换成了百度后,其logo识别能力就出现了宕机状态,但是人物方面质量还是依旧不错的:

当FLUX结合LoRA技术,你还分得清现实和AI吗?

最后,302.AI除了能够快速简单地使用到Flux-Realism(超真实Lora)模型的效果外,302.AI的API超市还提供了Flux-Realism(超真实Lora)的API,用户可以通过302.AI的API超市快速接入这一功能,而且免除下载代码、配置环境、推理等一系列繁琐步骤,支持在线调试,提供按需付费的付费方式,有效降低开发成本,更好控制预算。

当FLUX结合LoRA技术,你还分得清现实和AI吗?

从FLUX模型结合LoRA技术的效果来看,LoRA技术在图像生成模型的应用中展现出了巨大的潜力和价值,这种技术的融合不仅提升了图像生成的质量,也推动了AI图像生成模型的边界。随着技术的不断进步,我们站在了一个全新的时代门槛,现实与虚拟之间的界限愈发模糊,而这正是AI技术为我们带来的无限可能。

参考文章: https://36kr.com/p/2900175547783815

Like (0)
302.AI302.AI
Previous 2024 年 8 月 16 日 下午6:50
Next 2024 年 8 月 19 日 下午7:09

相关推荐

  • Reflection-Llama-3.1-70B发布短短几天,为何备受争议?

    9月6日,AI写作初创公司HyperWrite发布了Reflection-Llama-3.1-70B模型。该模型基于Meta的Llama 3.1-70B Instruct,并使用原始的 Llama Chat 格式,确保了与现有工具和 pipeline 的兼容性。 在发布当天,HyperWrite 公司的 CEO Matt Shumer 在社交媒体平台发文表示…

    2024 年 9 月 9 日
    14500
  • 资讯丨xAI官宣Grok API开启公测,唯一模型grok-beta表现能否达到预期?

    11月6日,备受瞩目的2024年美国总统选举结果终于揭晓,马斯克公开支持的美国共和党总统候选人特朗普获得最终胜利。 作为特朗普的“榜一大哥”马斯克,是人工智能初创公司xAI的始人之一和主要投资者。在11月4日,xAI刚刚官宣Grok API正式开启公测。 根据xAI公司官方发布的文档,可以看到xAI的API目前只有一个模型——“grok-beta”。 从官方…

    2024 年 11 月 8 日
    7600
  • AI视力考验:各AI模型的视觉理解能力如何?

    近日,行业内有不少新模型涌现出大众的面前,我们会发现,有的模型会在其官方宣传中提到“多模态”一词,比如大家熟知的GPT-4o、Gemini 1.5 Pro等,在发布时都被定义为“原生多模态”,这些多模态LLM在相关的介绍中,都用到了“视觉能力”、“视觉理解”这样的表述。 简单的理解,就是这些模型能够“看得见,并看得懂”,仿佛人的眼睛。为此,很多人…

    2024 年 7 月 25 日
    16900
  • Glif生成的meme图瞎说什么大实话!如何免注册无次数限制使用?

    近日,在国外社交媒体平台上,一款叫做“Glif”的AI应用迅速蹿红,Glif有点类似国内的Coze,通过低代码或无代码的方式,并提供了非常多的工具作为节点,搭建工作流。 接下来先说一下Glif是什么,Glif是一个有趣的低代码平台,在基本层面上,Glif接受用户输入(文本、图像或点击按钮),并使用强大的AI模型生成输出(文本、图像、视频或这些的组合)。 概括…

    2024 年 7 月 17 日
    28200
  • 智谱清影AI视频还在内测阶段,背后的模型CogVideoX 突然宣布开源?!

    近日,国外的AI视频生成模型竞争依然在不断升温,国内的AI视频模型赛道也迎来了前所未有的“内卷”潮。 7月26日,智谱清影(Ying)AI视频生成工具正式上线,这款由智谱AI推出的视频生成工具,允许用户通过输入文本描述或上传图片,在大约30秒内生成一段6秒长的视频。 而在8月6日,智谱AI宣布清影背后的视频生成模型——CogVideoX正式开源。 或许很多人…

    2024 年 8 月 12 日
    15200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注