Problem
İnsanlara sadə görünən şey - "əsas mövzunu" bir fotoşəkil - kompüterlər üçün təəccüblü dərəcədə mürəkkəbdir. Şəkil sadəcə rəngli piksellərdən ibarət şəbəkədir. "bu piksel şəxsdir" deyən özünəməxsus etiket yoxdur; və "bu piksel onların arxasındakı divardır"
Ənənəvi yanaşmalar rəng həddi (müəyyən rəngin bütün piksellərini silmək) və ya kənar aşkarlama (obyektlər arasında sərhədləri tapmaq) kimi üsullardan istifadə edirdi. Bunlar sadə hallar üçün işlədi, lakin mürəkkəb səhnələr, mövzu və fon arasında oxşar rənglər və ya mürəkkəb detallar ilə uğursuz oldu.
Maşın Öyrənməsinə daxil olun
Müasir süni intellekt fonunun silinməsi dərin öyrənmədən, xüsusən də görüntü seqmentasiya modellərindən istifadə edir. Bunun necə işlədiyinin sadələşdirilmiş versiyası budur:
1. Təlim
Neyroşəbəkə obyektin artıq əl ilə müəyyən edildiyi (etiketləndiyi) milyonlarla şəkil göstərilir. Zaman keçdikcə model nümunələri öyrənir: insanların necə göründüyünü, obyektlərin necə formalaşdığını, subyektlərin fonlardan necə fərqləndiyini. O, kənarları, fakturaları və konteksti tanımağı öyrənir.
2. Nəticə (Modeldən istifadə etməklə)
Təlim edilmiş modelə əvvəllər görmədiyi yeni bir şəkil verdiyiniz zaman o, piksel məlumatlarını təhlil edir və "maska" — hər pikselə ön plan (mövzu) və ya arxa plan olma ehtimalını təyin edən xəritə. Yüksək etibarlı ön plan pikselləri saxlanılır; yüksək inamlı fon pikselləri silinir.
3. Kənarla işləmə
Ön plan və arxa plan arasında keçid çox vacibdir. Müasir modellər sərt ikili kəsiklərdən daha çox yumşaq kənarlar (qismən şəffaflıq) yaradır. Bu, xüsusilə mürəkkəb kənarların ətrafında təbii görünən nəticələr yaradır.
Niyə GPU-lar vacibdir
Neyron şəbəkələri eyni vaxtda minlərlə riyazi əməliyyat vasitəsilə şəkilləri emal edir. GPU-lar (Qrafik Emalı Birlikləri) məhz bu cür paralel hesablamalar üçün nəzərdə tutulmuşdur. CPU-da 30 saniyə çəkə bilən tapşırıq GPU-da 2-3 saniyəyə tamamlana bilər.
Buna görə QuickRemove kimi alətlər NVIDIA, AMD və Intel GPU-larından GPU sürətləndirməsini dəstəkləyir. AI modeli sürətli emal üçün birbaşa GPU-da işləyir. Uyğun GPU mövcud deyilsə, proqram yenidən CPU emalına keçir - o, hələ də işləyir, sadəcə daha uzun çəkir.
AI nədə yaxşıdır
- İnsanlar və portretlər - bu, ən çox yayılmış istifadə halıdır və modellər bu barədə yaxşı öyrədilir
- Heyvanlar və ev heyvanları - modellər xəz və heyvan formalarını yaxşı idarə edir
- Məhsullar və obyektlər - aydın sərhədləri olan yaxşı müəyyən edilmiş obyektlər
- Nəqliyyat vasitələri — avtomobillər, velosipedlər və oxşar obyektlər
- Mürəkkəb fonlar — AI subyektləri məşğul, ətraflı fonlardan ayıra bilər
AI üçün problemlər
- Şəffaf obyektlər - şüşə, su və digər şəffaf materiallar çətin olur (QuickRemove bunun üçün xüsusi idarəetmə daxildir)
- Rəng oxşarlığı — mövzu və fon rəng baxımından çox oxşar olduqda, sərhədləri aşkar etmək daha çətindir
- Son dərəcə mürəkkəb səhnələr — çoxlu üst-üstə düşən subyektlər və ya qeyri-müəyyən ön plan/fon
Post-Emal
Süni intellekt ilkin maskanı yaratdıqdan sonra, sonrakı emal nəticəni dəqiqləşdirir. QuickRemove təklifi kimi alətlər:
- Kənarların tüklənməsi — mövzu ilə fon arasında keçidi yumşaltmaq
- Hamarlama — əyri kənarların azaldılması
- Rəngin dekontaminasiyası — orijinal fon rənginin obyektin kənarlarına axdığı yerdə rəng tökülməsinin aradan qaldırılması
- Əl ilə fırça/silgi — incə düzəlişlər üçün AI əldən verə bilər
Alt xətt
Süni intellekt fonunun silinməsi o yerə çatıb ki, saniyələr ərzində peşəkar keyfiyyətli nəticələr verir. Hər bir ssenaridə mükəmməl olmasa da, o, ümumi istifadə hallarının böyük əksəriyyətini təsirli dəqiqliklə idarə edir - fonun silinməsini təkcə Photoshop mütəxəssisləri üçün deyil, hamı üçün əlçatan edir.