导读:2026年的AI抠图发展到了什么水平?302.AI深度实测Photoroom、Qwen与Nano Banana Pro三大路径。有的效率高但“脑筋死”,有的懂意图但“手活差”。我们拆解了背后的底层逻辑,并大胆预测:2026年将出现结合精准识别与语义分层的“终极模型”。看清工具演进的真相,别在低效操作上浪费时间。
在图片编辑领域里,抠图绝对算得上是那种“操作下限很低,上限极高”的费力活。不管是你要做个PPT需要素材,或是电商卖家做海报,第一步往往需要从乱七八糟的背景中“摘”出主体。
在传统的PS时代,手动抠图简直是每一个设计师的噩梦。如果背景干净、边界清晰倒还好说,套索,钢笔工具划拉两下也就出来了。但要是碰上那种“地狱级难度”的场景——比如模特在风中凌乱的纤细发丝,或是产品颜色跟背景几乎混在一起、对比度低到挨个扣像素的情况,当真拼的是耐心和眼力。
但到了AI时代,事情有了转机。
这事儿说白了,就是AI通过海量的学习,已经能看懂什么是人,什么是物,什么是背景。无数AI模型/产品都希望原本属于手艺活的门槛,直接降到一键解决的地步。
本周302.AI接入了一个抠图领域的知名选手:来自法国的Photoroom公司的Remove Background API.
Photoroom这公司笔者之前还确实未曾听闻。搜集了一番信息,了解到是2019 年在法国巴黎创立的公司,专注图像编辑领域,特别是抠图堪称看家本领。

Photoroom Remove Background核心优势:
最佳精度:特别擅长精细边缘处理(如发丝、毛发),有效去除颜色溢出和光晕;2023 年第三方评估(Velebit AI)显示准确率达 70.8%,显著高于 Remove.bg 的 41.7%。
产品摄影专项训练:对复杂形状、小细节(如自行车辐条、包装文字)、低对比度场景有更好语义理解,避免“吞噬”主体或留下伪影。
速度与规模:支持批量处理数百上千张图像,API 响应快速;集成手动编辑工具(如 Edit Cutout、Magic Brush 类似功能)提供精细控制。
额外集成:移除后可一键替换为 AI 生成背景、添加阴影、虚拟模特、扩图等,形成完整电商视觉工作流。
与其他工具对比:官方基准测试显示,在精度、颜色去污、控制性和速度上领先 Remove.bg、Clipdrop、SAM 等竞品,尤其适合电商高体积场景。
官方宣传视频:
那么,这个名头够大的Photoroom,抠图表现是否能够一骑绝尘?我将选择两个模型作为横评对手:
1.之前评测过的,来自阿里通义的Qwen-Image-Layered,使用prompt来进行图层分离,输出多张图片;
2.图像模型的SOTA王牌,Nano Banana Pro,使用prompt来进行主体分离,输出单张图片。
以上,三种不同抠图模式,今日没有营销话术,实战见功力。
I. 实测模型基础信息
(1)各实测模型在 302.AI 的价格:
| 模型名称 | 302.AI内的价格 |
| Remove Background | $0.022/次 |
| Qwen-Image-Layered | $0.05/次 |
| Gemini-3-pro-image-preview(Nano Banana Pro) | 按Token:输入$2 / 1M Tokens;输出$120 / 1M Tokens按次:1K/2K画质:$0.15 / 次;4K画质:$0.24 / 次 |
(2)测评目标:
- 编辑质量与真实感:评估模型在背景移除后的视觉效果以及可用性,包括细节保留、元素一致性及是否存在伪影或失真。
- 指令理解与执行准确性:测试模型对文本或图像指令的理解能力,检查编辑结果是否准确反映用户意图。
(3)测评工具:
使用 302.AI 的 API 超市→在线调试功能
(4)测评方法:
各案例均使用统一的图片及对应提示词进行生成,且均取第一次生成结果,评测结果仅供参考。
Ⅱ. 测评案例
💡Photoroom-Remove Background 使用说明:
该API支持自定义输出背景颜色,缺省bg_color参数,勾选输出格式为PNG,即可输出透明背景的PNG图像。
该API不支持Prompt输入,模型会自动判断并分离画面主体。
为展示细节保留效果,以下案例添加了背景颜色,方便辨识。

案例1:人像-低对比度背景测试
测试点:区分主体与背景的理解能力,而非单纯依赖颜色/对比度
原图:

放大头发细节,与背景对比度极低,会是这张抠图的难点

Photoroom


Nano Banana Pro
提示词:抠出主体人物并将其置于白色背景上

| 测评点 | Photoroom | Qwen-Layered | Nano Banana Pro |
| 主体识别 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 细节保留 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 简评 | Nano BananaPro略胜一筹。三者主体识别水平相当,在较难处理的发型以及鞋子部分有较明显的差异,Qwen的头发明显多出一大缕。NBP的背景图并非纯白,但再进行二次抠图就会容易很多。 | ||
案例2:人像-含遮盖文字背景测试
测试点:区分主体人物,文字遮罩与背景的理解与分割能力
原图:

Photoroom

Qwen-Layered
提示词:分离主体人物,文字,背景三个图层

Nano Banana Pro
提示词:抠出主体人物并将其置于白色背景上

| 测评点 | Photoroom | Qwen-Layered | Nano Banana Pro |
| 主体识别 | ⭐⭐⭐ | ⭐ | ⭐⭐⭐⭐⭐ |
| 细节保留 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 简评 | Nano BananaPro胜。三组之中只有nbp精准抠出了主体并将文字图层去除,Qwen同样是去除了文字部分补全了人物主体,但人物并未与背景做分层,而Photoroom是将人物与文字一起保留下来了。 | ||
案例3:透明/半透明物体测试
测试点:对透明度、折射、叠加关系的保留能力(很多模型直接把透明部分当背景移除)
原图:

Photoroom

Qwen-Layered
提示词:分离出主体的水母,背景2个图层

Nano Banana Pro
提示词:抠出水母并将其置于白色背景上

| 测评点 | Photoroom | Qwen-Layered | Nano Banana Pro |
| 主体识别 | ⭐⭐⭐⭐⭐ | ⭐ | ⭐⭐⭐⭐⭐ |
| 细节保留 | ⭐⭐⭐⭐⭐ | ⭐ | ⭐⭐⭐⭐ |
| 简评 | Photoroom胜。这案例传统PS抠图我属实不知道该怎么抠。Photoroom在面对这种复杂纹理、对抠图精度要求极高的场景下优势凸显,水母外伞和触手的半透明状态得到极佳的保留,颜色去污处理十分专业,呈现在绿色背景上效果直观;相比之下,nbp虽然也实现了细节输出,但在透明度保留上无法完全摆脱原图背景图层的黑色部分。 | ||
案例4:多主体测试
测试点:对前景多主体的理解
原图:

Photoroom

Qwen-Layered
提示词:分离出2位主体人物,背景,2个图层

Nano Banana Pro
提示词:抠出2位主体人物并将其置于白色背景上

| 测评点 | Photoroom | Qwen-Layered | Nano Banana Pro |
| 主体识别 | ⭐⭐⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐⭐⭐ |
| 细节保留 | ⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐⭐ |
| 简评 | Nano BananaPro胜。NBP和Photoroom都准确识别到了2个主体人物,在细节保留方面NBP更胜一筹,Photoroom未能保留诸如麦克风、弦钮、鞋子之类的高精度细节;Qwen则只识别到了一个主体人物。 | ||
案例5:文字&Logo测试
测试点:对文字细节,图形线条的保护能力
原图:

Photoroom

Qwen-Layered
提示词:分离出品牌Logo和文字,背景环境2个图层

Nano Banana Pro
提示词:抠出Apple logo以及文字部分,并将其置于黑色背景上

| 测评点 | Photoroom | Qwen-Layered | Nano Banana Pro |
| 文本/图形识别 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 细节保留 | ⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 简评 | Nano Banana Pro胜。显而易见,只有NBP输出了完整干净的logo和文本;Qwen的问题在于未能完整保留文本,而Photoroom的问题在于保留大量背景元素,且二级文字也被部分抹除。 | ||
III. Photoroom Remove Background 抠图实测结论

实测结果汇总:
| 序号 | 测试案例 | 胜者 | Photoroom得分 | Qwen-Layered得分 | Nano Banana Pro得分 |
| 案例1 | 人像-低对比度背景测试 | Nano Banana Pro | 9 | 9 | 10 |
| 案例2 | 人像-含遮盖文字背景测试 | Nano Banana Pro | 8 | 6 | 10 |
| 案例3 | 透明/半透明物体测试 | Photoroom | 10 | 2 | 9 |
| 案例4 | 多主体测试 | Nano Banana Pro | 8 | 4 | 9 |
| 案例5 | 文字&Logo测试 | Nano Banana Pro | 7 | 9 | 10 |
测完本轮五个案例,AI抠图这事儿的底层逻辑就非常清晰了。现在的AI抠图,说白了有“三个流派”,但目前还没有一个完美的“六边形战士”,大家各有各的杀手锏,也各有各的短板。
第一种,是以Photoroom为代表的“纯自动化流派”。 这公司的路径非常明确:追求极致的效率。它的算法是完全基于模型的自主判断,你把图扔进去,它帮你决定什么是主体。从实测看,Photoroom的精度确实很稳,处理发丝和复杂背景非常老道。 但它的软肋也在这儿——它太死板了,缺乏灵活性。比如遇到案例2那种文字遮盖的情况,它觉得文字和人是一体的,于是便一起输出。你给它什么,它按照它的逻辑输出,没有沟通余地。
第二种,是以Qwen-Image-Layered为代表的“语义理解+图层分离流派”。 说实话,虽然包括之前测试,Qwen这款模型的表现都有点拉胯,分数并不好看,但我个人反而是最看好这条技术路径的。 为什么?因为它的底层逻辑最符合用户直觉于习惯,它不再是瞎猜,而是听你的指令。你想分出哪些主体,需要几个图层,你跟它说明白。这种基于意图的图像分离才是真正的解决痛点。现在的效果差,显然是模型训练和调教还不够好,属于“脑子想到了,手还没跟上”的阶段。
第三种,是以Nano Banana Pro(NBP)为代表的“生成式标杆”。 从结果来看,5战4胜,NBP的地位堪称抠图界的天花板。它的识别能力确实惊人,稳定且精准。但它也有个它的痛点——使用&操作成本太高。它虽然能识别出主体,但还没法像流水线一样直接一次性输出各个图层的多张图片。需要4个图层的话,就意味着写4次提示词,4次等待,4次token消耗。
如果让我给2026年的抠图路径做个预测,那会是:拥有Photoroom和Nano Banana Pro这种级别的精准“硬实力”,同时结合Qwen-Image-Layered这种通过提示词进行多层分离的“软逻辑”。
简单说:既能读懂人话、又能像素级精准、还能一键分层的“终极抠图模型”。
如果这两者能合二为一,什么繁琐的PS路径、蒙版、选区,全都可以扔进历史的垃圾堆了。
而在那之前,如果你追求稳健,快速,批量化,Photoroom API依然是首选;如果你不介意操作成本和使用成本,追求极致精度,NBP值得信赖。
Ⅳ. 如何在 302.AI 上使用
302.AI 提供按需付费无订阅的服务模式,用户可以根据自身业务需求灵活选择使用。
使用模型 API
相关文档:API→API超市→图片处理→Photoroom→Remove Background→立即体验;


点击【调试】在线调用 API

想体验移除背景模型?
👉立即注册免费试用302.AI,开启你的AI之旅!👈
为什么选择302.AI?
● 灵活付费:无需月费,按需付费,成本可控
● 丰富功能:从文字、图片到视频,应有尽有,满足多种场景需求
● 开源生态:支持开发者深度定制,打造专属AI应用
● 易用性:界面友好,操作简单,快速上手
