A Probléma
Ami az emberek számára egyszerűnek tűnik – a fénykép „fő témájának” meghatározása – meglepően bonyolult a számítógépek számára. A kép csak egy színes pixelrács. Nincs benne rejlő címke, amely azt mondaná, hogy „ez a pixel a személy” és „ez a képpont a fal mögöttük”.
A hagyományos megközelítések olyan technikákat használtak, mint a színküszöb (egy bizonyos szín összes képpontjának eltávolítása) vagy az élérzékelés (az objektumok közötti határok keresése). Ezek egyszerű esetekben működtek, de kudarcot vallottak bonyolult jelenetekkel, hasonló színekkel a téma és a háttér között, vagy bonyolult részletekkel.
Lépjen be a gépi tanulásba
A modern AI-háttéreltávolítás mély tanulást használ – konkrétan a képszegmentációs modelleket. Íme a működésének egyszerűsített változata:
1. Képzés
Egy neurális hálózat több millió képet mutat, ahol az alanyt már manuálisan azonosították (felcímkézték). Idővel a modell megtanulja a mintákat: hogyan néznek ki az emberek, hogyan formálódnak a tárgyak, miben térnek el az alanyok a háttértől. Megtanulja felismerni az éleket, a textúrákat és a kontextust.
2. Következtetés (a modell használatával)
Amikor a betanított modellnek egy olyan új képet ad, amelyet még soha nem látott, elemzi a képpontadatokat, és egy "maszkot" — egy térkép, amely minden pixelhez hozzárendeli annak valószínűségét, hogy előtérben (témában) vagy háttérben van. A nagy megbízhatóságú előtér pixelek megmaradnak; a nagy megbízhatóságú háttérpixelek eltávolításra kerülnek.
3. Élkezelés
Az előtér és a háttér közötti átmenet kulcsfontosságú. A modern modellek lágy éleket (részleges átlátszóságot) hoznak létre a kemény bináris vágások helyett. Ez természetes hatású eredményeket hoz létre, különösen az összetett élek körül.
Miért számítanak a GPU-k?
A neurális hálózatok egyidejűleg több ezer matematikai műveleten keresztül dolgozzák fel a képeket. A GPU-kat (Graphics Processing Units) pontosan erre a fajta párhuzamos számításra tervezték. A CPU-n 30 másodpercig tartó feladat 2-3 másodperc alatt elvégezhető GPU-n.
Ez az oka annak, hogy az olyan eszközök, mint a QuickRemove, támogatják az NVIDIA, AMD és Intel GPU-k GPU-gyorsítását. Az AI modell közvetlenül a GPU-n fut a gyors feldolgozás érdekében. Ha nem áll rendelkezésre kompatibilis GPU, a szoftver visszatér a CPU-feldolgozáshoz – továbbra is működik, csak tovább tart.
Miben jó az AI
- Emberek és portrék – ez a leggyakoribb használati eset, és a modellek jól képzettek rá
- Állatok és házi kedvencek – a modellek jól kezelik a szőrzetet és az állatformákat
- Termékek és tárgyak – jól meghatározott objektumok világos határokkal
- Járművek – autók, kerékpárok és hasonló tárgyak
- Összetett hátterek – az AI el tudja választani a témákat az elfoglalt, részletes hátterektől
Kihívások az AI számára
- Az átlátszó tárgyak – üveg, víz és más átlátszó anyagok – bonyolultak (a QuickRemove speciális kezelést is tartalmaz ehhez)
- Színhasonlóság – ha a téma és a háttér színe nagyon hasonló, a határokat nehezebb felismerni
- Rendkívül összetett jelenetek – több egymást átfedő téma vagy kétértelmű előtér/háttér
Utófeldolgozás
Miután az AI létrehozta a kezdeti maszkot, az utófeldolgozás finomítja az eredményt. Az olyan eszközök, mint a QuickRemove, a következőket kínálják:
- Edge feathering — a téma és a háttér közötti átmenet lágyítása
- Simítás – csökkenti a szaggatott éleket
- Színes dekontamináció – a színfolt eltávolítása ott, ahol az eredeti háttérszín a téma szélére ömlik
- Kézi ecset/radír – a finom korrekciók érdekében az AI esetleg kimarad
A lényeg
Az AI háttér eltávolítása elérte azt a pontot, ahol másodpercek alatt professzionális minőségű eredményeket produkál. Bár nem minden esetben tökéletes, a gyakori használati esetek túlnyomó többségét lenyűgöző pontossággal kezeli – így a háttér eltávolítása mindenki számára elérhető, nem csak a Photoshop-szakértők számára.