问题
对人类来说看似简单的事情——识别照片的“主要主题”——对计算机来说却异常复杂。图像只是彩色像素的网格。没有固有的标签说“这个像素是人”和“这个像素是他们后面的墙”。
传统方法使用颜色阈值处理(删除某种颜色的所有像素)或边缘检测(查找对象之间的边界)等技术。这些方法适用于简单的情况,但不适用于复杂的场景、主题和背景之间的相似颜色或复杂的细节。
进入机器学习
现代人工智能背景去除使用深度学习——特别是图像分割模型。这是其工作原理的简化版本:
1. 培训
向神经网络显示数百万张图像,其中主题已被手动识别(标记)。随着时间的推移,模型会学习模式:人的样子、物体的形状、主体与背景的不同。它学习识别边缘、纹理和上下文。
2. 推理(使用模型)
当你给训练好的模型一个它以前从未见过的新图像时,它会分析像素数据并生成一个“掩模”——一张为每个像素分配前景(主体)或背景概率的地图。保留高置信度的前景像素;高置信度背景像素被删除。
3. 边缘处理
前景和背景之间的过渡至关重要。现代模型生成软边缘(部分透明)而不是硬二元切割。这会产生看起来自然的结果,尤其是在复杂的边缘周围。
为什么 GPU 很重要
神经网络同时通过数千个数学运算处理图像。 GPU(图形处理单元)正是为这种并行计算而设计的。在 CPU 上可能需要 30 秒的任务在 GPU 上只需 2-3 秒即可完成。
这就是 QuickRemove 等工具支持 NVIDIA、AMD 和 Intel GPU 加速的原因。 AI 模型直接在 GPU 上运行以实现快速处理。如果没有兼容的 GPU 可用,软件就会退回到 CPU 处理——它仍然可以工作,只是需要更长的时间。
AI擅长什么
- 人物和肖像——这是最常见的用例,模型在这方面训练有素
- 动物和宠物——模型可以很好地处理皮毛和动物形状
- 产品和对象——边界清晰、定义明确的对象
- 车辆——汽车、自行车和类似物体
- 复杂的背景——人工智能可以将主题与复杂、详细的背景分开
人工智能面临的挑战
- 透明物体 - 玻璃、水和其他透明材料很棘手(QuickRemove 对此进行了特殊处理)
- 颜色相似度——当主体和背景的颜色非常相似时,边界更难检测
- 极其复杂的场景 - 多个重叠的主题或模糊的前景/背景
后处理
人工智能生成初始掩模后,后处理会完善结果。 QuickRemove 等工具提供:
- 边缘羽化——柔化主体和背景之间的过渡
- 平滑——减少锯齿状边缘
- 颜色去污 - 去除原始背景颜色渗入主题边缘的颜色溢出
- 手动画笔/橡皮擦——人工智能可能会错过的精细修正
底线
人工智能背景去除已经达到了可以在几秒钟内产生专业质量结果的程度。虽然它并非在每种情况下都是完美的,但它能够以令人印象深刻的准确性处理绝大多数常见用例 - 使每个人都可以进行背景去除,而不仅仅是 Photoshop 专家。