Jak funguje odstranění pozadí AI

Netechnický pohled na technologii, která umožňuje automatické odstranění pozadí.

Problém

Co se lidem zdá jednoduché — identifikace "hlavního předmětu" fotografie — je pro počítače překvapivě složitý. Obrázek je pouze mřížka barevných pixelů. Neexistuje žádný vlastní štítek, který by říkal „tento pixel je osoba“; a "tento pixel je zeď za nimi."

Tradiční přístupy používaly techniky jako prahování barev (odstranění všech pixelů určité barvy) nebo detekce hran (nalézání hranic mezi objekty). Ty fungovaly v jednoduchých případech, ale selhaly u složitých scén, podobných barev mezi objektem a pozadím nebo složitých detailů.

Vstupte do strojového učení

Moderní odstraňování pozadí AI využívá hluboké učení – konkrétně modely segmentace obrázků. Zde je zjednodušená verze, jak to funguje:

1. Školení

Neuronová síť zobrazuje miliony obrázků, na kterých byl subjekt již ručně identifikován (označen). Postupem času se model učí vzory: jak lidé vypadají, jak jsou tvarovány předměty, jak se předměty liší od pozadí. Učí se rozpoznávat hrany, textury a kontext.

2. Vyvození (pomocí modelu)

Když trénovanému modelu dáte nový obrázek, který nikdy předtím neviděl, analyzuje data pixelů a vytvoří "masku"; — mapa, která každému pixelu přiřazuje pravděpodobnost, že bude v popředí (předmětu) nebo pozadí. Vysoce spolehlivé pixely v popředí jsou zachovány; vysoce spolehlivé pixely pozadí jsou odstraněny.

3. Manipulace s hranami

Přechod mezi popředím a pozadím je zásadní. Moderní modely generují měkké okraje (částečná průhlednost) spíše než tvrdé binární řezy. To vytváří přirozeně vypadající výsledky, zejména kolem složitých hran.

Proč na GPU záleží

Neuronové sítě zpracovávají obrazy prostřednictvím tisíců matematických operací současně. GPU (Graphics Processing Units) jsou navrženy přesně pro tento druh paralelních výpočtů. Úloha, která může trvat 30 sekund na CPU, může být dokončena za 2-3 sekundy na GPU.

To je důvod, proč nástroje jako QuickRemove podporují akceleraci GPU z GPU NVIDIA, AMD a Intel. Model AI běží přímo na vašem GPU pro rychlé zpracování. Pokud není k dispozici kompatibilní GPU, software se vrátí ke zpracování CPU – stále funguje, jen to trvá déle.

V čem je AI dobrá

Lidé a portréty — to je nejběžnější případ použití a modelky jsou v tom dobře vyškoleny
Zvířata a mazlíčci — modely dobře zvládají srst a zvířecí tvary
Produkty a objekty — dobře definované objekty s jasnými hranicemi
Vozidla — auta, kola a podobné předměty
Komplexní pozadí – AI dokáže oddělit předměty od rušných, detailních pozadí

Výzvy pro AI

Průhledné předměty – sklo, voda a další průhledné materiály jsou složité (QuickRemove pro to zahrnuje speciální manipulaci)
Barevná podobnost — když mají objekt a pozadí velmi podobnou barvu, je obtížnější zjistit hranice
Extrémně složité scény — více překrývajících se předmětů nebo nejednoznačné popředí/pozadí

Post-processing

Poté, co AI vygeneruje počáteční masku, následné zpracování zpřesní výsledek. Nástroje jako QuickRemove nabízejí:

Prolnutí okrajů — změkčení přechodu mezi objektem a pozadím
Vyhlazení — snížení zubatých okrajů
Barevná dekontaminace – odstranění rozlití barev v místech, kde původní barva pozadí stéká na okraje objektu
Ruční štětec/guma — pro jemné opravy může AI chybět

Sečteno a podtrženo

Odstraňování pozadí umělé inteligence dosáhlo bodu, kdy poskytuje výsledky v profesionální kvalitě během několika sekund. I když to není dokonalé ve všech scénářích, zvládá naprostou většinu běžných případů použití s působivou přesností – odstranění pozadí je tak dostupné všem, nejen odborníkům na Photoshop.