Проблемът
Това, което изглежда просто за хората - идентифициране на "основния предмет" на снимка — е изненадващо сложно за компютрите. Изображението е просто мрежа от цветни пиксели. Няма присъщ етикет, който да казва "този пиксел е човекът" и "този пиксел е стената зад тях."
Традиционните подходи използват техники като цветови праг (премахване на всички пиксели от определен цвят) или откриване на ръбове (намиране на граници между обекти). Те работеха за прости случаи, но се проваляха при сложни сцени, подобни цветове между обект и фон или сложни детайли.
Въведете машинно обучение
Съвременното премахване на фона на AI използва задълбочено обучение - по-специално модели за сегментиране на изображения. Ето опростената версия на това как работи:
1. Обучение
На невронна мрежа се показват милиони изображения, където обектът вече е идентифициран ръчно (маркиран). С течение на времето моделът научава модели: как изглеждат хората, как са оформени обектите, как обектите се различават от фона. Научава се да разпознава ръбове, текстури и контекст.
2. Извод (използване на модела)
Когато дадете на обучения модел ново изображение, което той никога не е виждал преди, той анализира пикселните данни и създава "маска" — карта, която присвоява на всеки пиксел вероятност да бъде на преден план (обект) или на заден план. Пикселите на преден план с висока степен на сигурност се запазват; фоновите пиксели с висока степен на сигурност се премахват.
3. Обработка на ръбове
Преходът между преден и заден план е от решаващо значение. Модерните модели генерират меки ръбове (частична прозрачност), а не твърди двоични изрезки. Това създава естествено изглеждащи резултати, особено около сложните ръбове.
Защо GPU имат значение
Невронните мрежи обработват изображения чрез хиляди математически операции едновременно. GPU (Graphics Processing Units) са проектирани точно за този вид паралелни изчисления. Задача, която може да отнеме 30 секунди на CPU, може да бъде изпълнена за 2-3 секунди на GPU.
Ето защо инструменти като QuickRemove поддържат GPU ускорение от NVIDIA, AMD и Intel GPU. AI моделът работи директно на вашия GPU за бърза обработка. Ако няма наличен съвместим графичен процесор, софтуерът се връща към обработка на процесора — все още работи, но отнема повече време.
В какво е добър AI
- Хора и портрети — това е най-честият случай на използване и моделите са добре обучени на него
- Животни и домашни любимци — моделите се справят добре с козината и животинските форми
- Продукти и обекти — добре дефинирани обекти с ясни граници
- Превозни средства — коли, велосипеди и подобни предмети
- Сложни фонове — изкуственият интелект може да разделя обектите от натоварените, детайлни фонове
Предизвикателства за AI
- Прозрачни предмети - стъкло, вода и други прозрачни материали са трудни (QuickRemove включва специална обработка за това)
- Цветово сходство — когато обектът и фонът са много сходни по цвят, границите са по-трудни за откриване
- Изключително сложни сцени — множество припокриващи се обекти или двусмислен преден/заден план
Постобработка
След като AI генерира първоначалната маска, последващата обработка прецизира резултата. Инструменти като QuickRemove предлагат:
- Edge feathering — омекотяване на прехода между обект и фон
- Изглаждане — намаляване на назъбените ръбове
- Обеззаразяване на цвета — премахване на разливане на цвят, където оригиналният цвят на фона се разлива върху краищата на обекта
- Ръчна четка/гума — за фини корекции AI може да пропусне
Долната линия
Премахването на фона с изкуствен интелект достигна точка, в която дава резултати с професионално качество за секунди. Въпреки че не е перфектен във всеки сценарий, той се справя с огромното мнозинство от обичайните случаи на употреба с впечатляваща точност – правейки премахването на фона достъпно за всички, не само за експертите по Photoshop.