Problém
To, čo sa ľuďom zdá jednoduché – identifikácia „hlavného predmetu“ fotografie – je pre počítače prekvapivo zložité. Obrázok je len mriežka farebných pixelov. Neexistuje žiadne inherentné označenie, ktoré by hovorilo „tento pixel je osoba“ a „tento pixel je stena za ňou“.
Tradičné prístupy využívali techniky ako prahovanie farieb (odstránenie všetkých pixelov určitej farby) alebo detekcia hrán (nájsť hranice medzi objektmi). Tieto fungovali v jednoduchých prípadoch, ale zlyhali pri zložitých scénach, podobných farbách medzi objektom a pozadím alebo zložitých detailoch.
Zadajte strojové učenie
Moderné odstraňovanie pozadia AI využíva hlboké učenie – konkrétne modely segmentácie obrázkov. Tu je zjednodušená verzia toho, ako to funguje:
1. Školenie
Neurónová sieť zobrazuje milióny obrázkov, na ktorých už bol subjekt manuálne identifikovaný (označený). Postupom času sa model učí vzory: ako ľudia vyzerajú, ako sú tvarované predmety, ako sa predmety líšia od pozadia. Učí sa rozpoznávať hrany, textúry a kontext.
2. Inferencia (pomocou modelu)
Keď trénovanému modelu dáte nový obrázok, ktorý nikdy predtým nevidel, analyzuje údaje o pixeloch a vytvorí „masku“ – mapu, ktorá každému pixelu priradí pravdepodobnosť, že bude v popredí (predmet) alebo v pozadí. Zachovajú sa vysoko spoľahlivé pixely v popredí; sú odstránené vysoko spoľahlivé pixely pozadia.
3. Manipulácia s okrajmi
Prechod medzi popredím a pozadím je rozhodujúci. Moderné modely generujú skôr mäkké okraje (čiastočná priehľadnosť) než tvrdé binárne rezy. To vytvára prirodzene vyzerajúce výsledky, najmä okolo zložitých hrán.
Prečo na GPU záleží
Neurónové siete spracúvajú obrázky prostredníctvom tisícok matematických operácií súčasne. Presne na tento druh paralelných výpočtov sú navrhnuté GPU (Graphics Processing Units). Úloha, ktorá môže trvať 30 sekúnd na CPU, môže byť dokončená za 2-3 sekundy na GPU.
To je dôvod, prečo nástroje ako QuickRemove podporujú akceleráciu GPU z GPU NVIDIA, AMD a Intel. Model AI beží priamo na vašom GPU pre rýchle spracovanie. Ak nie je k dispozícii žiadny kompatibilný GPU, softvér sa vráti k spracovaniu CPU – stále funguje, len to trvá dlhšie.
V čom je AI dobrá
- Ľudia a portréty – toto je najbežnejší prípad použitia a modelky sú na to dobre vyškolené
- Zvieratá a domáce zvieratá — modely dobre zvládajú srsť a zvieracie tvary
- Produkty a objekty — dobre definované objekty s jasnými hranicami
- Vozidlá — autá, bicykle a podobné predmety
- Komplexné pozadie – AI dokáže oddeliť predmety od rušných a detailných pozadí
Výzvy pre AI
- Priehľadné predmety – sklo, voda a iné priehľadné materiály sú zložité (QuickRemove na to zahŕňa špeciálnu manipuláciu)
- Farebná podobnosť — keď majú objekt a pozadie veľmi podobné farby, hranice sa zisťujú ťažšie
- Mimoriadne zložité scény – viaceré prekrývajúce sa objekty alebo nejednoznačné popredie/pozadie
Post-processing
Keď AI vygeneruje počiatočnú masku, následné spracovanie spresní výsledok. Nástroje ako QuickRemove ponúkajú:
- Prekrytie okrajov — zjemnenie prechodu medzi objektom a pozadím
- Vyhladzovanie — zníženie zubatých hrán
- Farebná dekontaminácia — odstránenie rozliatej farby tam, kde pôvodná farba pozadia preteká na okraje objektu
- Manuálna kefa/guma – na jemné opravy môže AI chýbať
Zrátané a podčiarknuté
Odstraňovanie pozadia AI dosiahlo bod, kedy prináša výsledky profesionálnej kvality za pár sekúnd. Aj keď nie je dokonalý v každom scenári, zvláda veľkú väčšinu bežných prípadov použitia s pôsobivou presnosťou – vďaka čomu je odstránenie pozadia dostupné každému, nielen expertom na Photoshop.