Problem
Ono što se ljudima čini jednostavnim — identificiranje "glavnog subjekta" fotografije — je iznenađujuće složen za računare. Slika je samo mreža obojenih piksela. Ne postoji inherentna oznaka koja kaže "ovaj piksel je osoba"; i "ovaj piksel je zid iza njih."
Tradicionalni pristupi koristili su tehnike kao što je postavljanje praga boje (uklanjanje svih piksela određene boje) ili detekcija ivica (pronalaženje granica između objekata). Oni su radili za jednostavne slučajeve, ali nisu uspjeli sa složenim scenama, sličnim bojama između subjekta i pozadine ili zamršenim detaljima.
Uđite u mašinsko učenje
Moderno uklanjanje pozadine umjetne inteligencije koristi duboko učenje – konkretno, modele segmentacije slika. Evo pojednostavljene verzije kako to funkcionira:
1. Obuka
Neuronskoj mreži se prikazuju milioni slika na kojima je subjekt već ručno identificiran (obilježen). Vremenom, model uči obrasce: kako ljudi izgledaju, kako su objekti oblikovani, kako se subjekti razlikuju od pozadine. Uči da prepozna ivice, teksture i kontekst.
2. Zaključak (koristeći model)
Kada obučenom modelu date novu sliku koju nikada ranije nije vidio, on analizira podatke o pikselima i proizvodi "masku" — mapa koja svakom pikselu dodjeljuje vjerovatnoću da bude u prvom planu (subjekt) ili u pozadini. Zadržavaju se pikseli prednjeg plana visoke pouzdanosti; pozadinski pikseli visoke pouzdanosti se uklanjaju.
3. Rukovanje ivicama
Prijelaz između prednjeg plana i pozadine je ključan. Moderni modeli stvaraju meke ivice (djelimičnu transparentnost) umjesto tvrdih binarnih rezova. Ovo stvara rezultate prirodnog izgleda, posebno oko složenih ivica.
Zašto su GPU-ovi važni
Neuronske mreže obrađuju slike kroz hiljade matematičkih operacija istovremeno. GPU-ovi (Graphics Processing Units) su dizajnirani za upravo ovu vrstu paralelnog računanja. Zadatak koji može trajati 30 sekundi na CPU-u može se završiti za 2-3 sekunde na GPU-u.
Zbog toga alati poput QuickRemove podržavaju GPU ubrzanje od NVIDIA, AMD i Intel GPU-a. AI model radi direktno na vašem GPU-u za brzu obradu. Ako kompatibilni GPU nije dostupan, softver se vraća na CPU obradu — i dalje radi, samo traje duže.
U čemu je AI dobra
- Ljudi i portreti — ovo je najčešći slučaj upotrebe, a modeli su dobro obučeni za to
- Životinje i kućni ljubimci — modeli dobro nose krzno i životinjske oblike
- Proizvodi i objekti — dobro definisani objekti sa jasnim granicama
- Vozila — automobili, bicikli i slični objekti
- Složene pozadine — AI može odvojiti subjekte od zauzetih, detaljnih pozadina
Izazovi za AI
- Prozirni predmeti — staklo, voda i drugi providni materijali su nezgodni (QuickRemove uključuje posebno rukovanje za ovo)
- Sličnost boja — kada su subjekt i pozadina vrlo slični u boji, granice je teže otkriti
- Ekstremno složene scene — više subjekata koji se preklapaju ili dvosmisleni prvi plan/pozadina
Naknadna obrada
Nakon što AI generiše početnu masku, naknadna obrada precizira rezultat. Alati poput QuickRemove nude:
- Perje ivica — ublažavanje prijelaza između subjekta i pozadine
- Zaglađivanje — smanjenje nazubljenih ivica
- Dekontaminacija boje — uklanjanje izlivene boje gdje originalna boja pozadine krvari na rubove subjekta
- Ručna četkica/gumica — za fine korekcije AI može propustiti
Bottom Line
Uklanjanje AI pozadine dostiglo je tačku u kojoj proizvodi rezultate profesionalnog kvaliteta u sekundi. Iako nije savršen u svakom scenariju, obrađuje veliku većinu uobičajenih slučajeva upotrebe sa impresivnom preciznošću – čineći uklanjanje pozadine dostupnim svima, a ne samo stručnjacima za Photoshop.