مسئلہ
جو چیز انسانوں کے لیے آسان معلوم ہوتی ہے - تصویر کے "اصل موضوع" کی شناخت کرنا - کمپیوٹر کے لیے حیرت انگیز طور پر پیچیدہ ہے۔ ایک تصویر صرف رنگین پکسلز کا ایک گرڈ ہے۔ اس میں کوئی موروثی لیبل نہیں ہے کہ "یہ پکسل وہ شخص ہے" اور "یہ پکسل ان کے پیچھے دیوار ہے۔"
روایتی نقطہ نظر استعمال شدہ تکنیک جیسی رنگین تھریشولڈنگ (کسی خاص رنگ کے تمام پکسلز کو ہٹا دیں) یا کنارے کا پتہ لگانے (اشیاء کے مابین حدود تلاش کریں)۔ انھوں نے آسان معاملات کے لئے کام کیا لیکن پیچیدہ مناظر ، موضوع اور پس منظر کے مابین اسی طرح کے رنگ ، یا پیچیدہ تفصیلات کے ساتھ ناکام رہے۔
مشین لرننگ درج کریں
جدید AI پس منظر کو ہٹانا گہری سیکھنے کا استعمال کرتا ہے - خاص طور پر ، تصویری طبقہ کے ماڈل۔ یہ کس طرح کام کرتا ہے اس کا آسان ورژن یہ ہے:
1. تربیت
ایک اعصابی نیٹ ورک کو لاکھوں تصاویر دکھائی گئی ہیں جہاں موضوع کو پہلے ہی دستی طور پر شناخت کیا گیا ہے (لیبل لگا ہوا)۔ وقت گزرنے کے ساتھ ، ماڈل پیٹرن سیکھتا ہے: لوگ کس طرح کی نظر آتے ہیں ، کس طرح اشیاء کی شکل دی جاتی ہے ، مضامین پس منظر سے کس طرح مختلف ہوتے ہیں۔ یہ کناروں ، بناوٹ اور سیاق و سباق کو پہچاننا سیکھتا ہے۔
2. اندازہ (ماڈل کا استعمال کرتے ہوئے)
جب آپ تربیت یافتہ ماڈل کو ایک نئی تصویر دیتے ہیں جو اس نے پہلے کبھی نہیں دیکھی ہو، تو یہ پکسل ڈیٹا کا تجزیہ کرتا ہے اور ایک "ماسک" تیار کرتا ہے — ایک ایسا نقشہ جو ہر پکسل کو پیش منظر (موضوع) یا پس منظر ہونے کا امکان فراہم کرتا ہے۔ اعلیٰ اعتماد والے پیش منظر کے پکسلز رکھے گئے ہیں۔ اعلی اعتماد والے پس منظر کے پکسلز کو ہٹا دیا گیا ہے۔
3. ایج ہینڈلنگ
پیش منظر اور پس منظر کے مابین منتقلی بہت ضروری ہے۔ جدید ماڈل سخت بائنری کٹوتیوں کے بجائے نرم کناروں (جزوی شفافیت) پیدا کرتے ہیں۔ اس سے قدرتی نظر آنے والے نتائج پیدا ہوتے ہیں ، خاص طور پر پیچیدہ کناروں کے آس پاس۔
GPUs کیوں اہمیت رکھتا ہے۔
اعصابی نیٹ ورک بیک وقت ہزاروں ریاضی کی کارروائیوں کے ذریعے تصاویر پر کارروائی کرتے ہیں۔ جی پی یو (گرافکس پروسیسنگ یونٹ) بالکل اس طرح کے متوازی حساب کے لئے ڈیزائن کیا گیا ہے۔ ایک کام جس میں سی پی یو پر 30 سیکنڈ لگ سکتے ہیں وہ جی پی یو پر 2-3 سیکنڈ میں مکمل ہوسکتا ہے۔
یہی وجہ ہے کہ QuickRemove جیسے ٹولز NVIDIA، AMD، اور Intel GPUs سے GPU ایکسلریشن کی حمایت کرتے ہیں۔ AI ماڈل تیز رفتار پروسیسنگ کے لیے براہ راست آپ کے GPU پر چلتا ہے۔ اگر کوئی مطابقت پذیر GPU دستیاب نہیں ہے تو، سافٹ ویئر واپس CPU پروسیسنگ پر آجاتا ہے - یہ اب بھی کام کرتا ہے، بس زیادہ وقت لگتا ہے۔
AI کس چیز میں اچھا ہے۔
- لوگ اور پورٹریٹ — یہ سب سے عام استعمال کا معاملہ ہے، اور ماڈلز اس پر اچھی طرح سے تربیت یافتہ ہیں۔
- جانور اور پالتو جانور - ماڈل کھال اور جانوروں کی شکلیں اچھی طرح سے سنبھالتے ہیں
- مصنوعات اور اشیاء — واضح حدود کے ساتھ اچھی طرح سے متعین اشیاء
- گاڑیاں - کاریں ، بائک اور اسی طرح کی اشیاء
- پیچیدہ پس منظر - AI مضامین کو مصروف ، تفصیلی پس منظر سے الگ کرسکتا ہے
AI کے لیے چیلنجز
- شفاف اشیاء-شیشے ، پانی اور دیگر دیکھنے والے مواد مشکل ہیں (کوئیک ریمو میں اس کے لئے خصوصی ہینڈلنگ شامل ہے)
- رنگ کی مماثلت - جب موضوع اور پس منظر رنگ میں بہت ملتے جلتے ہیں، حدود کا پتہ لگانا مشکل ہوتا ہے۔
- انتہائی پیچیدہ مناظر — متعدد اوورلیپنگ مضامین یا مبہم پیش منظر/پس منظر
پوسٹ پروسیسنگ
AI کے ابتدائی ماسک تیار کرنے کے بعد، پوسٹ پروسیسنگ نتیجہ کو بہتر بناتی ہے۔ ٹولز جیسے QuickRemove پیشکش:
- کنارے کی پنکھ - موضوع اور پس منظر کے درمیان منتقلی کو نرم کرنا
- ہموار - جگڈ کناروں کو کم کرنا
- رنگین آلودگی - رنگ کے پھیلاؤ کو ہٹانا جہاں اصل پس منظر کا رنگ موضوع کے کناروں پر بہہ جاتا ہے۔
- دستی برش/ صافی — ٹھیک ٹھیک تصحیح کے لیے AI چھوٹ سکتا ہے۔
نیچے کی لکیر
AI پس منظر کو ہٹانا اس مقام پر پہنچ گیا ہے جہاں یہ سیکنڈوں میں پیشہ ورانہ معیار کے نتائج پیدا کرتا ہے۔ اگرچہ یہ ہر منظر نامے میں کامل نہیں ہے، لیکن یہ عام استعمال کے زیادہ تر معاملات کو متاثر کن درستگی کے ساتھ ہینڈل کرتا ہے — پس منظر کو ہٹانے کو ہر کسی کے لیے قابل رسائی بناتا ہے، نہ صرف فوٹوشاپ کے ماہرین۔