المشكلة
ما يبدو بسيطًا للبشر — تحديد "الموضوع الرئيسي" للصورة - أمر معقد بشكل مدهش بالنسبة لأجهزة الكمبيوتر. الصورة هي مجرد شبكة من البكسلات الملونة. لا توجد تسمية متأصلة تقول "هذا البكسل هو الشخص". و"هذا البكسل هو الجدار الذي يقف خلفهم."
تستخدم الأساليب التقليدية تقنيات مثل عتبة اللون (إزالة جميع وحدات البكسل ذات لون معين) أو اكتشاف الحواف (العثور على الحدود بين الكائنات). وقد نجح هذا الأمر في الحالات البسيطة، لكنه فشل مع المشاهد المعقدة، أو الألوان المتشابهة بين الموضوع والخلفية، أو التفاصيل المعقدة.
أدخل التعلم الآلي
تستخدم عملية إزالة الخلفية الحديثة بتقنية الذكاء الاصطناعي التعلم العميق - على وجه التحديد، نماذج تجزئة الصورة. إليك النسخة المبسطة لكيفية عملها:
1. التدريب
يتم عرض ملايين الصور على الشبكة العصبية حيث تم بالفعل تحديد الموضوع يدويًا (تسميته). بمرور الوقت، يتعلم النموذج الأنماط: كيف يبدو الأشخاص، وكيف تتشكل الأشياء، وكيف تختلف الموضوعات عن الخلفيات. يتعلم التعرف على الحواف والأنسجة والسياق.
2. الاستدلال (باستخدام النموذج)
عندما تعطي النموذج المدرّب صورة جديدة لم يسبق له رؤيتها من قبل، فإنه يقوم بتحليل بيانات البكسل وينتج "قناعًا". - خريطة تحدد احتمالية أن يكون كل بكسل في المقدمة (الموضوع) أو الخلفية. يتم الاحتفاظ بالبكسلات الأمامية عالية الثقة؛ تتم إزالة وحدات البكسل الخلفية عالية الثقة.
3. التعامل مع الحواف
يعد الانتقال بين المقدمة والخلفية أمرًا بالغ الأهمية. تولد النماذج الحديثة حوافًا ناعمة (شفافية جزئية) بدلاً من القطع الثنائي الصلب. وهذا يخلق نتائج ذات مظهر طبيعي، خاصة حول الحواف المعقدة.
لماذا تعتبر وحدات معالجة الرسومات مهمة
تقوم الشبكات العصبية بمعالجة الصور من خلال آلاف العمليات الحسابية في وقت واحد. تم تصميم وحدات معالجة الرسومات (GPUs) خصيصًا لهذا النوع من الحساب المتوازي. يمكن للمهمة التي قد تستغرق 30 ثانية على وحدة المعالجة المركزية أن تكتمل خلال 2-3 ثوانٍ على وحدة معالجة الرسومات.
ولهذا السبب تدعم أدوات مثل QuickRemove تسريع وحدة معالجة الرسومات من وحدات معالجة الرسومات NVIDIA وAMD وIntel. يعمل نموذج الذكاء الاصطناعي مباشرة على وحدة معالجة الرسومات الخاصة بك للمعالجة السريعة. في حالة عدم توفر وحدة معالجة رسومات متوافقة، يعود البرنامج إلى معالجة وحدة المعالجة المركزية - فهو لا يزال يعمل، ولكنه يستغرق وقتًا أطول.
ما هو جيد في الذكاء الاصطناعي
- الأشخاص والصور الشخصية - هذه هي حالة الاستخدام الأكثر شيوعًا، ويتم تدريب العارضات جيدًا عليها
- الحيوانات والحيوانات الأليفة - تتعامل العارضات مع الفراء وأشكال الحيوانات بشكل جيد
- المنتجات والأشياء - كائنات محددة جيدًا ذات حدود واضحة
- المركبات - السيارات والدراجات والأشياء المماثلة
- الخلفيات المعقدة – يستطيع الذكاء الاصطناعي فصل الموضوعات عن الخلفيات المزدحمة والمفصلة
التحديات التي تواجه الذكاء الاصطناعي
- تعتبر الأشياء الشفافة - الزجاج، والماء، والمواد الشفافة الأخرى أمرًا صعبًا (يتضمن QuickRemove معالجة خاصة لهذا الأمر)
- تشابه الألوان - عندما يكون الهدف والخلفية متشابهين جدًا في اللون، يصعب اكتشاف الحدود
- مشاهد معقدة للغاية — موضوعات متداخلة متعددة أو مقدمة/خلفية غامضة
مرحلة ما بعد المعالجة
بعد أن يقوم الذكاء الاصطناعي بإنشاء القناع الأولي، تقوم المعالجة اللاحقة بتحسين النتيجة. أدوات مثل عرض QuickRemove:
- تدرج الحواف — تسهيل الانتقال بين الموضوع والخلفية
- التنعيم - تقليل الحواف الخشنة
- إزالة التلوث بالألوان — إزالة تسرب اللون حيث ينزف لون الخلفية الأصلي على حواف الموضوع
- فرشاة/ممحاة يدوية - لإجراء التصحيحات الدقيقة التي قد يفوتها الذكاء الاصطناعي
الخط السفلي
وصلت إزالة الخلفية بالذكاء الاصطناعي إلى نقطة حيث تنتج نتائج بجودة احترافية في ثوانٍ. على الرغم من أنها ليست مثالية في كل السيناريوهات، إلا أنها تتعامل مع الغالبية العظمى من حالات الاستخدام الشائعة بدقة مذهلة - مما يجعل إزالة الخلفية في متناول الجميع، وليس فقط خبراء Photoshop.