문제
인간에게는 간단해 보이는 것, 즉 사진의 "주요 피사체"를 식별하는 것이 컴퓨터에게는 놀라울 정도로 복잡합니다. 이미지는 단지 컬러 픽셀의 격자일 뿐입니다. "이 픽셀은 사람이다", "이 픽셀은 그 뒤에 있는 벽이다"라고 말하는 고유한 라벨은 없습니다.
기존 접근 방식에서는 색상 임계값(특정 색상의 모든 픽셀 제거) 또는 가장자리 감지(객체 간의 경계 찾기)와 같은 기술을 사용했습니다. 단순한 경우에는 효과가 있었지만 복잡한 장면, 피사체와 배경의 유사한 색상 또는 복잡한 세부 사항에서는 실패했습니다.
머신러닝을 입력하세요
최신 AI 배경 제거는 딥 러닝, 특히 이미지 분할 모델을 사용합니다. 작동 방식의 단순화된 버전은 다음과 같습니다.
1. 훈련
신경망에는 피험자가 이미 수동으로 식별(라벨 지정)된 수백만 개의 이미지가 표시됩니다. 시간이 지남에 따라 모델은 사람의 모습, 물체의 모양, 피사체가 배경과 어떻게 다른지 등의 패턴을 학습합니다. 가장자리, 질감, 맥락을 인식하는 방법을 학습합니다.
2. 추론(모델 활용)
훈련된 모델에 이전에 본 적이 없는 새로운 이미지를 제공하면 픽셀 데이터를 분석하고 각 픽셀에 전경(주체) 또는 배경이 될 확률을 할당하는 맵인 "마스크"가 생성됩니다. 신뢰도가 높은 전경 픽셀이 유지됩니다. 신뢰도가 높은 배경 픽셀이 제거됩니다.
3. 가장자리 처리
전경과 배경 사이의 전환이 중요합니다. 최신 모델은 하드 바이너리 컷이 아닌 부드러운 가장자리(부분 투명도)를 생성합니다. 이는 특히 복잡한 가장자리 주변에서 자연스러운 결과를 만들어냅니다.
GPU가 중요한 이유
신경망은 수천 가지 수학적 연산을 통해 이미지를 동시에 처리합니다. GPU(그래픽 처리 장치)는 바로 이러한 종류의 병렬 계산을 위해 설계되었습니다. CPU에서는 30초가 걸릴 수 있는 작업이 GPU에서는 2~3초 안에 완료될 수 있습니다.
이것이 QuickRemove와 같은 도구가 NVIDIA, AMD 및 Intel GPU의 GPU 가속을 지원하는 이유입니다. AI 모델은 빠른 처리를 위해 GPU에서 직접 실행됩니다. 호환되는 GPU를 사용할 수 없는 경우 소프트웨어는 CPU 처리로 대체됩니다. 여전히 작동하지만 시간이 더 오래 걸립니다.
AI가 잘하는 것
- 사람과 인물 사진 - 가장 일반적인 사용 사례이며 모델은 이에 대해 잘 훈련되어 있습니다.
- 동물 및 애완동물 - 모델은 모피와 동물 모양을 잘 처리합니다.
- 제품 및 개체 — 명확한 경계가 있는 잘 정의된 개체
- 차량 - 자동차, 자전거 및 이와 유사한 물체
- 복잡한 배경 - AI는 복잡하고 상세한 배경에서 피사체를 분리할 수 있습니다.
AI를 위한 과제
- 투명한 물체 - 유리, 물 및 기타 투명한 물질은 까다롭습니다(QuickRemove에는 이에 대한 특수 처리가 포함되어 있습니다).
- 색상 유사성 — 피사체와 배경의 색상이 매우 유사한 경우 경계를 감지하기가 더 어렵습니다.
- 매우 복잡한 장면 - 여러 개의 피사체가 겹치거나 전경/배경이 모호함
후처리
AI가 초기 마스크를 생성한 후 후처리를 통해 결과가 구체화됩니다. QuickRemove와 같은 도구는 다음을 제공합니다.
- 가장자리 페더링 — 피사체와 배경 사이의 전환을 부드럽게 합니다.
- 스무딩 - 들쭉날쭉한 가장자리 줄이기
- 색상 오염 제거 - 원래 배경 색상이 피사체 가장자리에 번지는 색상 유출 제거
- 수동 브러시/지우개 — AI가 놓칠 수 있는 미세한 수정을 위해
결론
AI 배경 제거는 몇 초 만에 전문가 수준의 결과를 생성하는 수준에 도달했습니다. 모든 시나리오에서 완벽하지는 않지만 대부분의 일반적인 사용 사례를 매우 정확하게 처리하므로 Photoshop 전문가뿐만 아니라 모든 사람이 배경 제거에 액세스할 수 있습니다.