Problem
Kar se ljudem zdi preprosto - prepoznavanje "glavnega motiva" fotografije - je za računalnike presenetljivo zapleteno. Slika je le mreža barvnih slikovnih pik. Ni lastne oznake, ki bi rekla "ta piksel je oseba" in "ta piksel je stena za njimi."
Tradicionalni pristopi so uporabljali tehnike, kot je barvni prag (odstrani vse slikovne pike določene barve) ali zaznavanje robov (iskanje meja med predmeti). Ti so delovali v preprostih primerih, vendar niso uspeli pri zapletenih prizorih, podobnih barvah med subjektom in ozadjem ali zapletenih podrobnostih.
Vnesite strojno učenje
Sodobno odstranjevanje ozadja z umetno inteligenco uporablja globoko učenje – natančneje modele segmentacije slike. Tukaj je poenostavljena različica, kako deluje:
1. Usposabljanje
Nevronska mreža prikaže na milijone slik, kjer je subjekt že ročno identificiran (označen). Sčasoma se model nauči vzorcev: kakšni so ljudje, kako so oblikovani predmeti, kako se subjekti razlikujejo od ozadja. Nauči se prepoznati robove, teksture in kontekst.
2. Sklepanje (uporaba modela)
Ko izurjenemu modelu daste novo sliko, ki je še nikoli ni videl, analizira slikovne podatke in izdela "masko" — zemljevid, ki vsaki slikovni piki dodeli verjetnost, da bo v ospredju (subjekt) ali v ozadju. Ohranijo se slikovne pike ospredja z visoko stopnjo zaupanja; slikovne pike ozadja z visoko stopnjo zaupanja so odstranjene.
3. Ravnanje z robovi
Prehod med ospredjem in ozadjem je ključnega pomena. Sodobni modeli ustvarjajo mehke robove (delna prosojnost) namesto trdih binarnih rezov. To ustvari naravne rezultate, zlasti okoli kompleksnih robov.
Zakaj so grafični procesorji pomembni
Nevronske mreže obdelujejo slike skozi tisoče matematičnih operacij hkrati. GPU-ji (grafične procesne enote) so zasnovani za točno to vrsto vzporednega računanja. Opravilo, ki lahko na CPE-ju traja 30 sekund, se lahko na GPE-ju opravi v 2-3 sekundah.
Zato orodja, kot je QuickRemove, podpirajo pospeševanje grafičnih procesorjev NVIDIA, AMD in Intel. Model AI deluje neposredno na vašem GPE za hitro obdelavo. Če združljiva GPE ni na voljo, se programska oprema vrne k obdelavi CPE - še vedno deluje, le traja dlje.
V čem je AI dober
- Ljudje in portreti — to je najpogostejši primer uporabe in modeli so na njem dobro usposobljeni
- Živali in hišni ljubljenčki — modeli dobro prenašajo krzno in oblike živali
- Izdelki in predmeti — dobro definirani predmeti z jasnimi mejami
- Vozila — avtomobili, kolesa in podobni predmeti
- Kompleksna ozadja — umetna inteligenca lahko loči predmete od živahnih, podrobnih ozadij
Izzivi za AI
- Prozorni predmeti – steklo, voda in drugi prozorni materiali so zapleteni (QuickRemove vključuje posebno ravnanje za to)
- Barvna podobnost — ko sta si motiv in ozadje zelo podobna po barvi, je meje težje zaznati
- Izjemno zapleteni prizori — več prekrivajočih se subjektov ali dvoumno ospredje/ozadje
Naknadna obdelava
Ko AI ustvari začetno masko, naknadna obdelava izboljša rezultat. Orodja, kot je QuickRemove, ponujajo:
- Preoblikovanje robov — zmehčanje prehoda med subjektom in ozadjem
- Glajenje — zmanjšanje nazobčanih robov
- Barvna dekontaminacija – odstranitev razlitja barve, kjer se prvotna barva ozadja preliva na robove predmeta
- Ročni čopič/radirka — za natančne popravke lahko umetna inteligenca zgreši
Bottom Line
Odstranjevanje ozadja z umetno inteligenco je doseglo točko, ko v nekaj sekundah ustvari rezultate profesionalne kakovosti. Čeprav ni popoln v vseh scenarijih, z izjemno natančnostjo obravnava veliko večino običajnih primerov uporabe – tako da je odstranjevanje ozadja dostopno vsem, ne le strokovnjakom za Photoshop.