Probleem
Inimestele lihtne näib — "põhiteema" fotost — on arvutite jaoks üllatavalt keeruline. Pilt on lihtsalt värviliste pikslite ruudustik. Puudub olemuslik silt, mis ütleks "see piksel on inimene". ja "see piksel on nende taga asuv sein."
Traditsioonilised lähenemisviisid kasutasid selliseid tehnikaid nagu värvilävi (eemaldage kõik teatud värvi pikslid) või servade tuvastamist (objektide vaheliste piiride leidmine). Need toimisid lihtsate juhtumite puhul, kuid ebaõnnestusid keerukate stseenide, sarnaste värvide objekti ja tausta vahel või keerukate detailidega.
Sisenege masinõppesse
Kaasaegne tehisintellekti tausta eemaldamine kasutab sügavat õppimist – täpsemalt piltide segmenteerimismudeleid. Siin on selle toimimise lihtsustatud versioon:
1. Koolitus
Närvivõrgule näidatakse miljoneid pilte, kus objekt on juba käsitsi tuvastatud (sildiga märgitud). Aja jooksul õpib mudel mustreid: millised inimesed välja näevad, kuidas objekte kujundatakse, kuidas erinevad subjektid taustast. See õpib ära tundma servi, tekstuure ja konteksti.
2. Järeldus (mudelit kasutades)
Kui annate koolitatud mudelile uue pildi, mida ta pole kunagi varem näinud, analüüsib see piksliandmeid ja loob "maski". — kaart, mis määrab igale pikslile tõenäosuse olla esiplaanil (objektil) või taustal. Säilitatakse kõrge usaldusväärsusega esiplaani pikslid; kõrge usaldusväärsusega taustapikslid eemaldatakse.
3. Serva käsitsemine
Üleminek esiplaani ja tausta vahel on ülioluline. Kaasaegsed mudelid loovad pigem pehmed servad (osaline läbipaistvus), mitte kõvad binaarsed lõiked. See loob loomulikud tulemused, eriti keeruliste servade ümber.
Miks GPU-d on olulised?
Närvivõrgud töötlevad pilte tuhandete matemaatiliste operatsioonide kaudu samaaegselt. GPU-d (Graphics Processing Units) on loodud täpselt selliseks paralleelseks arvutamiseks. Ülesande, mis võib protsessoril kuluda 30 sekundit, saab GPU-ga lõpule viia 2–3 sekundiga.
Seetõttu toetavad sellised tööriistad nagu QuickRemove NVIDIA, AMD ja Inteli GPU-de GPU kiirendust. AI-mudel töötab kiireks töötlemiseks otse teie GPU-s. Kui ühilduvat GPU-d pole saadaval, lülitub tarkvara tagasi CPU-töötlusele – see töötab endiselt, vaid võtab kauem aega.
Milles AI hea on
- Inimesed ja portreed – see on kõige levinum kasutusjuht ja modellid on selle jaoks hästi koolitatud
- Loomad ja lemmikloomad — mudelid saavad karusnaha ja loomakujudega hästi hakkama
- Tooted ja objektid — täpselt määratletud objektid, millel on selged piirid
- Sõidukid – autod, jalgrattad jms esemed
- Keeruline taust – tehisintellekt suudab eraldada objektid hõivatud ja üksikasjalikust taustast
AI väljakutsed
- Läbipaistvad objektid – klaas, vesi ja muud läbipaistvad materjalid on keerulised (QuickRemove sisaldab selleks spetsiaalset käsitsemist)
- Värvi sarnasus – kui objekti ja tausta värvus on väga sarnane, on piire raskem tuvastada
- Äärmiselt keerulised stseenid – mitu kattuvat objekti või ebaselge esiplaan/taust
Järeltöötlus
Pärast seda, kui AI loob esialgse maski, täpsustab järeltöötlus tulemust. Sellised tööriistad nagu QuickRemove pakuvad:
- Serva sulgemine — objekti ja tausta vahelise ülemineku pehmendamine
- Silumine – sakiliste servade vähendamine
- Värvi dekontaminatsioon – värvilekke eemaldamine, kus algne taustavärv voolab objekti servadele
- Käsitsi pintsel/kustutuskumm – peente paranduste jaoks võib tehisintellekt puududa
Alumine rida
AI tausta eemaldamine on jõudnud punkti, kus see annab professionaalse kvaliteediga tulemusi sekunditega. Kuigi see pole iga stsenaariumi puhul täiuslik, käsitleb see enamikku levinud kasutusjuhtumeid muljetavaldava täpsusega – muutes tausta eemaldamise kättesaadavaks kõigile, mitte ainult Photoshopi asjatundjatele.