مشکل
آنچه برای انسان ها ساده به نظر می رسد - شناسایی «موضوع اصلی» یک عکس - برای کامپیوترها به طرز شگفت آوری پیچیده است. یک تصویر فقط شبکه ای از پیکسل های رنگی است. هیچ برچسب ذاتی وجود ندارد که بگوید "این پیکسل همان شخص است". و "این پیکسل دیوار پشت آنهاست.»
روشهای سنتی از تکنیکهایی مانند آستانه رنگ (حذف تمام پیکسلهای یک رنگ خاص) یا تشخیص لبه (پیدا کردن مرز بین اشیا) استفاده میکردند. اینها برای موارد ساده کار می کردند اما با صحنه های پیچیده، رنگ های مشابه بین سوژه و پس زمینه یا جزئیات پیچیده شکست خوردند.
وارد یادگیری ماشین شوید
حذف پسزمینه هوش مصنوعی مدرن از یادگیری عمیق استفاده میکند – بهویژه، مدلهای تقسیمبندی تصویر. در اینجا نسخه ساده شده نحوه کار آن آمده است:
1. آموزش
یک شبکه عصبی میلیون ها تصویر را نشان می دهد که سوژه قبلاً به صورت دستی شناسایی شده است (برچسب گذاری شده است). با گذشت زمان، مدل الگوهایی را یاد میگیرد: افراد چگونه به نظر میرسند، اشیا چگونه شکل میگیرند، سوژهها چگونه با پسزمینه متفاوت هستند. یاد می گیرد لبه ها، بافت ها و زمینه را تشخیص دهد.
2. استنتاج (با استفاده از مدل)
وقتی به مدل آموزشدیده تصویر جدیدی میدهید که قبلاً ندیده است، دادههای پیکسل را تجزیه و تحلیل میکند و یک "ماسک" - نقشه ای که به هر پیکسل احتمال پیش زمینه (موضوع) یا پس زمینه را اختصاص می دهد. پیکسل های پیش زمینه با اطمینان بالا حفظ می شوند. پیکسل های پس زمینه با اطمینان بالا حذف می شوند.
3. Edge Handling
انتقال بین پیش زمینه و پس زمینه بسیار مهم است. مدل های مدرن به جای برش های دودویی سخت، لبه های نرم (شفافیت جزئی) ایجاد می کنند. این باعث ایجاد نتایج طبیعی به خصوص در اطراف لبه های پیچیده می شود.
چرا GPU ها مهم هستند
شبکه های عصبی تصاویر را از طریق هزاران عملیات ریاضی به طور همزمان پردازش می کنند. GPU ها (واحدهای پردازش گرافیکی) دقیقاً برای این نوع محاسبات موازی طراحی شده اند. کاری که ممکن است 30 ثانیه در یک CPU طول بکشد، می تواند در 2-3 ثانیه در یک GPU انجام شود.
به همین دلیل است که ابزارهایی مانند QuickRemove از شتاب GPU از پردازندههای گرافیکی NVIDIA، AMD و Intel پشتیبانی میکنند. مدل هوش مصنوعی برای پردازش سریع مستقیماً روی GPU شما اجرا می شود. اگر هیچ GPU سازگاری در دسترس نباشد، نرم افزار به پردازش CPU بازمی گردد - همچنان کار می کند، فقط زمان بیشتری می برد.
هوش مصنوعی در چه چیزی خوب است
- افراد و پرتره ها - این رایج ترین مورد استفاده است و مدل ها به خوبی روی آن آموزش دیده اند
- حیوانات و حیوانات خانگی - مدلها به خوبی با شکل خز و حیوانات برخورد میکنند
- محصولات و اشیاء - اشیاء کاملاً مشخص با مرزهای واضح
- وسایل نقلیه - اتومبیل، دوچرخه و اشیاء مشابه
- پس زمینه های پیچیده – هوش مصنوعی می تواند سوژه ها را از پس زمینه های شلوغ و دقیق جدا کند
چالش های هوش مصنوعی
- اشیاء شفاف - شیشه، آب و سایر مواد شفاف دشوار هستند (QuickRemove شامل کنترل ویژه برای این کار است)
- شباهت رنگ - زمانی که سوژه و پس زمینه از نظر رنگ بسیار شبیه به هم باشند، تشخیص مرزها سخت تر می شود
- صحنه های بسیار پیچیده - سوژه های متعدد با هم تداخل دارند یا پیش زمینه/پس زمینه مبهم
پس پردازش
پس از اینکه هوش مصنوعی ماسک اولیه را تولید کرد، پس از پردازش نتیجه را اصلاح می کند. ابزارهایی مانند QuickRemove پیشنهاد می کنند:
- پر کردن لبه - انتقال بین سوژه و پسزمینه را نرم میکند
- صاف کردن - کاهش لبه های ناهموار
- آلودگیزدایی رنگ - از بین بردن ریزش رنگ در جایی که رنگ پسزمینه اصلی روی لبههای موضوع میریزد
- قلم مو/پاک کن دستی - برای اصلاحات دقیق ممکن است هوش مصنوعی از دست بدهد
خط پایین
حذف پسزمینه هوش مصنوعی به نقطهای رسیده است که در چند ثانیه نتایجی با کیفیت حرفهای ایجاد میکند. در حالی که در هر سناریویی کامل نیست، اکثریت قریب به اتفاق موارد استفاده رایج را با دقت قابل توجهی کنترل میکند - حذف پسزمینه را برای همه، نه فقط برای کارشناسان فتوشاپ، در دسترس قرار میدهد.