Problem
Ono što se ljudima čini jednostavnim - identificiranje "glavnog subjekta" fotografije - iznenađujuće je složeno za računala. Slika je samo mreža obojenih piksela. Ne postoji inherentna oznaka koja kaže "ovaj piksel je osoba" i "ovaj piksel je zid iza njih".
Tradicionalni pristupi koristili su se tehnikama kao što je određivanje praga boja (uklanjanje svih piksela određene boje) ili otkrivanje rubova (pronalaženje granica između objekata). To je funkcioniralo u jednostavnim slučajevima, ali nije uspjelo kod složenih scena, sličnih boja između subjekta i pozadine ili zamršenih detalja.
Unesite strojno učenje
Moderno AI uklanjanje pozadine koristi duboko učenje — točnije, modele segmentacije slike. Evo pojednostavljene verzije kako to funkcionira:
1. Trening
Neuronska mreža prikazuje milijune slika na kojima je subjekt već ručno identificiran (označen). S vremenom model uči obrasce: kako ljudi izgledaju, kako su objekti oblikovani, kako se subjekti razlikuju od pozadine. Uči prepoznati rubove, teksture i kontekst.
2. Zaključivanje (upotrebom modela)
Kada uvježbanom modelu date novu sliku koju nikada prije nije vidio, on analizira podatke o pikselima i proizvodi "masku" — karta koja svakom pikselu dodjeljuje vjerojatnost da bude u prvom planu (subjekt) ili u pozadini. Zadržavaju se pikseli prednjeg plana visoke pouzdanosti; uklanjaju se pozadinski pikseli visoke pouzdanosti.
3. Rukovanje rubovima
Prijelaz između prednjeg i pozadinskog plana je ključan. Moderni modeli stvaraju meke rubove (djelomičnu prozirnost) umjesto tvrdih binarnih rezova. To stvara rezultate prirodnog izgleda, osobito oko složenih rubova.
Zašto su grafički procesori važni
Neuronske mreže obrađuju slike kroz tisuće matematičkih operacija istovremeno. GPU-ovi (Graphics Processing Units) dizajnirani su upravo za ovu vrstu paralelnog računanja. Zadatak koji može trajati 30 sekundi na CPU-u može se izvršiti za 2-3 sekunde na GPU-u.
Zbog toga alati kao što je QuickRemove podržavaju GPU ubrzanje NVIDIA, AMD i Intel GPU-a. AI model radi izravno na vašem GPU-u za brzu obradu. Ako nije dostupan kompatibilni GPU, softver se vraća na CPU obradu — i dalje radi, samo traje dulje.
U čemu je AI dobra
- Ljudi i portreti — ovo je najčešći slučaj upotrebe, a modeli su dobro obučeni za to
- Životinje i kućni ljubimci — modeli dobro podnose krzno i oblike životinja
- Proizvodi i objekti — dobro definirani objekti s jasnim granicama
- Vozila — automobili, bicikli i slični predmeti
- Složene pozadine — AI može odvojiti subjekte od užurbanih, detaljnih pozadina
Izazovi za AI
- Prozirni predmeti — staklo, voda i drugi prozirni materijali su nezgodni (QuickRemove uključuje posebno rukovanje za ovo)
- Sličnost boja — kada su subjekt i pozadina vrlo slične boje, granice je teže uočiti
- Izuzetno složene scene — više subjekata koji se preklapaju ili dvosmislen prednji plan/pozadina
Naknadna obrada
Nakon što AI generira početnu masku, naknadna obrada dorađuje rezultat. Alati poput QuickRemove nude:
- Pero ruba — omekšavanje prijelaza između subjekta i pozadine
- Zaglađivanje — smanjenje nazubljenih rubova
- Dekontaminacija boje — uklanjanje izlijevanja boje gdje se izvorna boja pozadine prelijeva na rubove predmeta
- Ručni kist/gumica — za fine ispravke koje AI može promašiti
Suština
Uklanjanje pozadine pomoću umjetne inteligencije doseglo je točku u kojoj daje rezultate profesionalne kvalitete u nekoliko sekundi. Iako nije savršen u svakom scenariju, obrađuje veliku većinu uobičajenih slučajeva upotrebe s impresivnom preciznošću — čineći uklanjanje pozadine dostupnim svima, a ne samo stručnjacima za Photoshop.