Problema
Ceea ce pare simplu pentru oameni – identificarea „subiectului principal” al unei fotografii – este surprinzător de complex pentru computere. O imagine este doar o grilă de pixeli colorați. Nu există o etichetă inerentă care să spună „acest pixel este persoana” și „acest pixel este peretele din spatele lor”.
Abordările tradiționale au folosit tehnici precum limitarea culorilor (eliminarea tuturor pixelilor de o anumită culoare) sau detectarea marginilor (găsirea granițelor dintre obiecte). Acestea au funcționat pentru cazuri simple, dar au eșuat cu scene complexe, culori similare între subiect și fundal sau detalii complicate.
Introduceți învățare automată
Eliminarea modernă a fundalului AI folosește învățarea profundă - în special, modelele de segmentare a imaginii. Iată versiunea simplificată a modului în care funcționează:
1. Antrenament
O rețea neuronală este afișată milioane de imagini în care subiectul a fost deja identificat manual (etichetat). De-a lungul timpului, modelul învață modele: cum arată oamenii, cum sunt modelate obiectele, cum diferă subiectele de fundal. Învață să recunoască marginile, texturile și contextul.
2. Inferență (folosind modelul)
Când oferiți modelului antrenat o nouă imagine pe care nu a mai văzut-o până acum, acesta analizează datele pixelilor și produce o „mască” - o hartă care atribuie fiecărui pixel o probabilitate de a fi în prim-plan (subiect) sau fundal. Se păstrează pixelii din prim-plan de mare încredere; pixelii de fundal cu încredere ridicată sunt eliminați.
3. Manipularea marginilor
Tranziția dintre prim-plan și fundal este crucială. Modelele moderne generează margini moi (transparență parțială) mai degrabă decât tăieturi binare dure. Acest lucru creează rezultate cu aspect natural, în special în jurul marginilor complexe.
De ce contează GPU-urile
Rețelele neuronale procesează imagini prin mii de operații matematice simultan. GPU-urile (Graphics Processing Units) sunt proiectate exact pentru acest tip de calcul paralel. O sarcină care ar putea dura 30 de secunde pe un procesor se poate finaliza în 2-3 secunde pe un GPU.
Acesta este motivul pentru care instrumente precum QuickRemove acceptă accelerarea GPU de la GPU-urile NVIDIA, AMD și Intel. Modelul AI rulează direct pe GPU pentru o procesare rapidă. Dacă nu este disponibil un GPU compatibil, software-ul revine la procesarea CPU - încă funcționează, doar durează mai mult.
La ce este bun AI
- Oameni și portrete - acesta este cel mai frecvent caz de utilizare, iar modelele sunt bine instruite în acest sens
- Animale și animale de companie — modelele abordează bine blana și formele animalelor
- Produse și obiecte — obiecte bine definite, cu limite clare
- Vehicule — mașini, biciclete și obiecte similare
- Fundaluri complexe — AI poate separa subiectele de fundalurile ocupate și detaliate
Provocări pentru IA
- Obiectele transparente — sticla, apa și alte materiale transparente sunt dificile (QuickRemove include o manipulare specială pentru aceasta)
- Similitudinea culorilor — atunci când subiectul și fundalul sunt foarte asemănătoare ca culoare, limitele sunt mai greu de detectat
- Scene extrem de complexe — subiecte suprapuse multiple sau prim plan/fond ambiguu
Post-procesare
După ce AI generează masca inițială, post-procesarea rafinează rezultatul. Instrumente precum QuickRemove oferă:
- Feathering margini — atenuează tranziția dintre subiect și fundal
- Netezire — reducerea marginilor zimțate
- Decontaminarea culorii — eliminarea scurgerii de culoare în cazul în care culoarea originală de fundal curge pe marginile subiectului
- Pensula manuală/rama de șters - pentru corecții fine, AI-ul poate rata
Concluzia
Eliminarea fundalului AI a atins un punct în care produce rezultate de calitate profesională în câteva secunde. Deși nu este perfect în fiecare scenariu, se ocupă de marea majoritate a cazurilor de utilizare obișnuite cu o acuratețe impresionantă - făcând eliminarea fundalului accesibilă tuturor, nu doar experților Photoshop.