Ongelma
Mikä näyttää ihmisille yksinkertaiselta - "pääaiheen" tunnistaminen; valokuvasta — on yllättävän monimutkainen tietokoneille. Kuva on vain ruudukko värillisiä pikseleitä. Ei ole luontaista etikettiä, jossa sanottaisiin "tämä pikseli on henkilö". ja "tämä pikseli on niiden takana oleva seinä".
Perinteisissä lähestymistavoissa käytettiin tekniikoita, kuten värikynnys (poistaa kaikki tietyn värin pikselit) tai reunan havaitseminen (objektien välisten rajojen etsiminen). Nämä toimivat yksinkertaisissa tapauksissa, mutta epäonnistuivat monimutkaisissa kohtauksissa, samanlaisissa väreissä kohteen ja taustan välillä tai monimutkaisissa yksityiskohdissa.
Siirry koneoppimiseen
Nykyaikainen tekoälyn taustan poisto käyttää syvää oppimista – erityisesti kuvan segmentointimalleja. Tässä on yksinkertaistettu versio sen toiminnasta:
1. Koulutus
Hermoverkko näyttää miljoonia kuvia, joissa kohde on jo tunnistettu (merkitty) manuaalisesti. Ajan myötä malli oppii kuvioita: miltä ihmiset näyttävät, miten esineet muotoillaan, miten kohteet eroavat taustoista. Se oppii tunnistamaan reunat, tekstuurit ja kontekstin.
2. Päätelmä (käyttäen mallia)
Kun annat koulutetulle mallille uuden kuvan, jota se ei ole koskaan ennen nähnyt, se analysoi pikselitiedot ja tuottaa "maskin"; — kartta, joka määrittää kullekin pikselille todennäköisyyden olla etualalla (kohde) tai taustalla. Korkealuokkaiset etualan pikselit säilytetään; korkean luotettavuuden taustapikselit poistetaan.
3. Reunojen käsittely
Siirtyminen etualan ja taustan välillä on ratkaisevan tärkeää. Nykyaikaiset mallit luovat pehmeät reunat (osittainen läpinäkyvyys) kovien binäärileikkausten sijaan. Tämä luo luonnollisen näköisiä tuloksia erityisesti monimutkaisten reunojen ympärillä.
Miksi GPU:lla on väliä
Neuroverkot käsittelevät kuvia tuhansien matemaattisten operaatioiden kautta samanaikaisesti. GPU:t (Graphics Processing Units) on suunniteltu juuri tällaista rinnakkaislaskentaa varten. Tehtävä, joka saattaa kestää 30 sekuntia suorittimella, voidaan suorittaa 2–3 sekunnissa GPU:lla.
Tästä syystä työkalut, kuten QuickRemove, tukevat NVIDIA-, AMD- ja Intel-grafiikkasuorittimien GPU-kiihdytystä. Tekoälymalli toimii suoraan grafiikkasuorittimessasi nopeaa käsittelyä varten. Jos yhteensopivaa GPU:ta ei ole saatavilla, ohjelmisto palaa prosessorikäsittelyyn – se toimii edelleen, kestää vain kauemmin.
Missä tekoäly on hyvä
- Ihmiset ja muotokuvat – tämä on yleisin käyttötapa, ja mallit ovat hyvin koulutettuja siihen
- Eläimet ja lemmikit – mallit käsittelevät turkista ja eläinten muotoja hyvin
- Tuotteet ja esineet – hyvin määriteltyjä esineitä, joilla on selkeät rajat
- Ajoneuvot – autot, polkupyörät ja vastaavat esineet
- Monimutkaiset taustat – tekoäly voi erottaa kohteet kiireisistä, yksityiskohtaisista taustoista
Tekoälyn haasteita
- Läpinäkyvät esineet – lasi, vesi ja muut läpinäkyvät materiaalit ovat hankalia (QuickRemove sisältää erityiskäsittelyn tätä varten)
- Värien samankaltaisuus – kun kohteen ja taustan värit ovat hyvin samankaltaisia, rajoja on vaikea havaita
- Erittäin monimutkaiset kohtaukset – useita päällekkäisiä kohteita tai epäselvä etuala/tausta
Jälkikäsittely
Kun tekoäly on luonut alkuperäisen maskin, jälkikäsittely tarkentaa tulosta. Työkalut, kuten QuickRemove, tarjoavat:
- Reunojen höyhennys — pehmentää kohteen ja taustan välistä siirtymää
- Tasoitus – vähentää rosoisia reunoja
- Värien dekontaminointi — poistaa väriroiskeet, joissa alkuperäinen taustaväri vuotaa kohteen reunoihin
- Manuaalinen harja/pyyhekumi – hienoja korjauksia varten tekoäly saattaa jäädä huomaamatta
Bottom Line
Tekoälyn taustan poisto on saavuttanut pisteen, jossa se tuottaa ammattilaatuisia tuloksia sekunneissa. Vaikka se ei ole täydellinen kaikissa skenaarioissa, se käsittelee suurimman osan tavallisista käyttötapauksista vaikuttavalla tarkkuudella – tekee taustan poistamisesta kaikkien, ei vain Photoshop-asiantuntijoiden, käytettävissä.