Проблемот
Она што на луѓето им изгледа едноставно - идентификувањето на „главниот предмет“ на фотографијата - е изненадувачки сложено за компјутерите. Сликата е само мрежа од обоени пиксели. Не постои својствена етикета која вели „овој пиксел е личноста“ и „овој пиксел е ѕидот зад нив“.
Традиционалните пристапи користеа техники како праг на боја (отстранете ги сите пиксели со одредена боја) или откривање на рабовите (најдете граници помеѓу објектите). Тие работеа за едноставни случаи, но не успеаја со сложени сцени, слични бои помеѓу темата и позадината или сложените детали.
Влезете во Машинско учење
Модерното отстранување на позадината со вештачка интелигенција користи длабоко учење - конкретно, модели за сегментација на слики. Еве ја поедноставената верзија за тоа како функционира:
1. Обука
На невронската мрежа и се прикажани милиони слики каде предметот е веќе рачно идентификуван (означен). Со текот на времето, моделот учи модели: како изгледаат луѓето, како се обликуваат предметите, како предметите се разликуваат од позадините. Учи да препознава рабови, текстури и контекст.
2. Заклучок (со користење на моделот)
Кога на обучениот модел ќе му дадете нова слика каква што досега не била видена, тој ги анализира податоците за пиксели и произведува „маска“ - мапа што на секој пиксел му доделува веројатност да биде преден план (тема) или заднина. Пикселите во преден план со висока доверба се чуваат; Пикселите во позадина со висока доверба се отстранети.
3. Ракување со рабовите
Преминот помеѓу преден план и позадина е клучен. Модерните модели генерираат меки рабови (делумна транспарентност) наместо тврди бинарни сечења. Ова создава резултати со природен изглед, особено околу сложените рабови.
Зошто графичките процесори се важни
Невронските мрежи обработуваат слики преку илјадници математички операции истовремено. Графичките процесори (Графички процесорски единици) се дизајнирани токму за овој вид на паралелно пресметување. Задачата што може да трае 30 секунди на процесорот може да се заврши за 2-3 секунди на графичкиот процесор.
Ова е причината зошто алатките како QuickRemove поддржуваат забрзување на графичкиот процесор од NVIDIA, AMD и Intel графички процесори. Моделот со вештачка интелигенција работи директно на вашиот графички процесор за брза обработка. Ако не е достапен компатибилен графички процесор, софтверот се враќа на процесорската обработка - сè уште работи, само трае подолго.
Во што е добра вештачката интелигенција
- Луѓе и портрети - ова е најчеста употреба, а моделите се добро обучени за тоа
- Животни и домашни миленици — моделите добро се справуваат со крзното и животинските форми
- Производи и објекти — добро дефинирани објекти со јасни граници
- Возила - автомобили, велосипеди и слични предмети
- Комплексни позадини - вештачката интелигенција може да ги одвои субјектите од зафатените, детални позадини
Предизвици за вештачката интелигенција
- Транспарентните предмети - стакло, вода и други проѕирни материјали се незгодни (QuickRemove вклучува специјално ракување за ова)
- Сличност на боите - кога предметот и позадината се многу слични по боја, границите е потешко да се откријат
- Исклучително сложени сцени - повеќе теми кои се преклопуваат или двосмислена преден/заднина
Пост-обработка
Откако вештачката интелигенција ќе ја генерира почетната маска, постобработката го усовршува резултатот. Алатки како QuickRemove понуда:
- Пердуви на рабовите — ја ублажува транзицијата помеѓу предметот и позадината
- Измазнување - намалување на назабените рабови
- Деконтаминација на боја - отстранување на излевање на бојата каде што оригиналната боја на позадината протекува на рабовите на предметот
- Рачна четка/гума - за фини корекции што вештачката интелигенција може да ја пропушти
Крајна линија
Отстранувањето на позадината со вештачка интелигенција достигна точка каде што дава резултати со професионален квалитет за неколку секунди. Иако не е совршен во секое сценарио, тој се справува со огромното мнозинство на случаи за вообичаена употреба со импресивна точност - правејќи го отстранувањето на позадината достапно за секого, не само за експертите на Photoshop.