Problém
Co se lidem zdá jednoduché — identifikace "hlavního předmětu" fotografie — je pro počítače překvapivě složitý. Obrázek je pouze mřížka barevných pixelů. Neexistuje žádný vlastní štítek, který by říkal „tento pixel je osoba“; a "tento pixel je zeď za nimi."
Tradiční přístupy používaly techniky jako prahování barev (odstranění všech pixelů určité barvy) nebo detekce hran (nalézání hranic mezi objekty). Ty fungovaly v jednoduchých případech, ale selhaly u složitých scén, podobných barev mezi objektem a pozadím nebo složitých detailů.
Vstupte do strojového učení
Moderní odstraňování pozadí AI využívá hluboké učení – konkrétně modely segmentace obrázků. Zde je zjednodušená verze, jak to funguje:
1. Školení
Neuronová síť zobrazuje miliony obrázků, na kterých byl subjekt již ručně identifikován (označen). Postupem času se model učí vzory: jak lidé vypadají, jak jsou tvarovány předměty, jak se předměty liší od pozadí. Učí se rozpoznávat hrany, textury a kontext.
2. Vyvození (pomocí modelu)
Když trénovanému modelu dáte nový obrázek, který nikdy předtím neviděl, analyzuje data pixelů a vytvoří "masku"; — mapa, která každému pixelu přiřazuje pravděpodobnost, že bude v popředí (předmětu) nebo pozadí. Vysoce spolehlivé pixely v popředí jsou zachovány; vysoce spolehlivé pixely pozadí jsou odstraněny.
3. Manipulace s hranami
Přechod mezi popředím a pozadím je zásadní. Moderní modely generují měkké okraje (částečná průhlednost) spíše než tvrdé binární řezy. To vytváří přirozeně vypadající výsledky, zejména kolem složitých hran.
Proč na GPU záleží
Neuronové sítě zpracovávají obrazy prostřednictvím tisíců matematických operací současně. GPU (Graphics Processing Units) jsou navrženy přesně pro tento druh paralelních výpočtů. Úloha, která může trvat 30 sekund na CPU, může být dokončena za 2-3 sekundy na GPU.
To je důvod, proč nástroje jako QuickRemove podporují akceleraci GPU z GPU NVIDIA, AMD a Intel. Model AI běží přímo na vašem GPU pro rychlé zpracování. Pokud není k dispozici kompatibilní GPU, software se vrátí ke zpracování CPU – stále funguje, jen to trvá déle.
V čem je AI dobrá
- Lidé a portréty — to je nejběžnější případ použití a modelky jsou v tom dobře vyškoleny
- Zvířata a mazlíčci — modely dobře zvládají srst a zvířecí tvary
- Produkty a objekty — dobře definované objekty s jasnými hranicemi
- Vozidla — auta, kola a podobné předměty
- Komplexní pozadí – AI dokáže oddělit předměty od rušných, detailních pozadí
Výzvy pro AI
- Průhledné předměty – sklo, voda a další průhledné materiály jsou složité (QuickRemove pro to zahrnuje speciální manipulaci)
- Barevná podobnost — když mají objekt a pozadí velmi podobnou barvu, je obtížnější zjistit hranice
- Extrémně složité scény — více překrývajících se předmětů nebo nejednoznačné popředí/pozadí
Post-processing
Poté, co AI vygeneruje počáteční masku, následné zpracování zpřesní výsledek. Nástroje jako QuickRemove nabízejí:
- Prolnutí okrajů — změkčení přechodu mezi objektem a pozadím
- Vyhlazení — snížení zubatých okrajů
- Barevná dekontaminace – odstranění rozlití barev v místech, kde původní barva pozadí stéká na okraje objektu
- Ruční štětec/guma — pro jemné opravy může AI chybět
Sečteno a podtrženo
Odstraňování pozadí umělé inteligence dosáhlo bodu, kdy poskytuje výsledky v profesionální kvalitě během několika sekund. I když to není dokonalé ve všech scénářích, zvládá naprostou většinu běžných případů použití s působivou přesností – odstranění pozadí je tak dostupné všem, nejen odborníkům na Photoshop.