Problēma
Tas, kas cilvēkiem šķiet vienkāršs — fotoattēla "galvenā objekta" noteikšana — datoriem ir pārsteidzoši sarežģīti. Attēls ir tikai krāsainu pikseļu režģis. Nav raksturīgas etiķetes, kas teiktu "šis pikselis ir persona" un "šis pikselis ir siena aiz viņiem".
Tradicionālās pieejas izmantoja tādas metodes kā krāsu slieksnis (noņemt visus noteiktas krāsas pikseļus) vai malu noteikšana (atrast robežas starp objektiem). Tie darbojās vienkāršos gadījumos, bet neizdevās ar sarežģītām ainām, līdzīgām krāsām starp objektu un fonu vai sarežģītām detaļām.
Ieejiet mašīnmācībā
Mūsdienu mākslīgā intelekta fona noņemšanai tiek izmantota dziļa apmācība, jo īpaši attēlu segmentācijas modeļi. Tālāk ir sniegta tā darbības vienkāršotā versija.
1. Apmācība
Neironu tīklā tiek parādīti miljoniem attēlu, kur objekts jau ir manuāli identificēts (marķēts). Laika gaitā modelis apgūst modeļus: kā izskatās cilvēki, kā tiek veidoti objekti, kā objekti atšķiras no fona. Tā mācās atpazīt malas, faktūras un kontekstu.
2. Secinājumi (izmantojot modeli)
Kad jūs apmācītajam modelim piešķirat jaunu attēlu, ko tas nekad iepriekš nav redzējis, tas analizē pikseļu datus un izveido "masku" — karti, kas katram pikselim piešķir varbūtību, ka tas ir priekšplānā (objektā) vai fonā. Tiek saglabāti augstas ticamības priekšplāna pikseļi; augstas ticamības fona pikseļi tiek noņemti.
3. Malu apstrāde
Pāreja starp priekšplānu un fonu ir ļoti svarīga. Mūsdienu modeļi rada mīkstas malas (daļēju caurspīdīgumu), nevis cietus bināros griezumus. Tas rada dabiskus rezultātus, īpaši ap sarežģītām malām.
Kāpēc GPU ir svarīgi?
Neironu tīkli apstrādā attēlus, vienlaikus veicot tūkstošiem matemātisku darbību. GPU (Graphics Processing Units) ir paredzēti tieši šāda veida paralēliem aprēķiniem. Uzdevums, kas ar CPU var aizņemt 30 sekundes, ar GPU var tikt izpildīts 2–3 sekundēs.
Tāpēc tādi rīki kā QuickRemove atbalsta GPU paātrinājumu no NVIDIA, AMD un Intel GPU. AI modelis darbojas tieši jūsu GPU ātrai apstrādei. Ja nav pieejams saderīgs GPU, programmatūra atgriežas pie CPU apstrādes — tā joprojām darbojas, tikai aizņem ilgāku laiku.
Kas AI ir labs
- Cilvēki un portreti — tas ir visizplatītākais lietošanas gadījums, un modeļi ir labi apmācīti
- Dzīvnieki un mājdzīvnieki — modeļi labi tiek galā ar kažokādām un dzīvnieku formām
- Produkti un objekti — skaidri definēti objekti ar skaidrām robežām
- Transportlīdzekļi — automašīnas, velosipēdi un līdzīgi priekšmeti
- Sarežģīti foni — AI var atdalīt objektus no aizņemtiem, detalizētiem foniem
Izaicinājumi AI
- Caurspīdīgi objekti — stikls, ūdens un citi caurspīdīgi materiāli ir sarežģīti (QuickRemove šim nolūkam ir paredzēta īpaša apstrāde)
- Krāsu līdzība — ja objekta un fona krāsa ir ļoti līdzīga, robežas ir grūtāk noteikt
- Īpaši sarežģītas ainas — vairāki objekti, kas pārklājas, vai neskaidrs priekšplāns/fons
Pēcapstrāde
Pēc tam, kad AI ģenerē sākotnējo masku, pēcapstrāde precizē rezultātu. Tādi rīki kā QuickRemove piedāvā:
- Malu apspalvošana — mīkstina pāreju starp objektu un fonu
- Izlīdzināšana — samazina robainās malas
- Krāsu dekontaminācija — krāsas noplūdes noņemšana, kur sākotnējā fona krāsa izplūst uz objekta malām
- Manuāla birste/dzēšgumija — smalkiem labojumiem AI var palaist garām
Bottom Line
AI fona noņemšana ir sasniegusi punktu, kurā tiek iegūti profesionālas kvalitātes rezultāti dažu sekunžu laikā. Lai gan tas nav ideāls visos gadījumos, tas apstrādā lielāko daļu izplatīto lietošanas gadījumu ar iespaidīgu precizitāti — padarot fona noņemšanu pieejamu ikvienam, ne tikai Photoshop ekspertiem.