ปัญหา
สิ่งที่ดูเหมือนง่ายสำหรับมนุษย์ - การระบุ "ตัวแบบหลัก" ของภาพถ่าย - มีความซับซ้อนอย่างน่าประหลาดใจสำหรับคอมพิวเตอร์ รูปภาพเป็นเพียงตารางพิกเซลสี ไม่มีป้ายกำกับว่า "พิกเซลนี้คือบุคคล" และ "พิกเซลนี้คือกำแพงด้านหลัง"
วิธีการแบบดั้งเดิมใช้เทคนิคต่างๆ เช่น การกำหนดเกณฑ์สี (ลบพิกเซลทั้งหมดของสีใดสีหนึ่งออก) หรือการตรวจจับขอบ (ค้นหาขอบเขตระหว่างวัตถุ) สิ่งเหล่านี้ใช้ได้กับกรณีง่ายๆ แต่ล้มเหลวกับฉากที่ซับซ้อน สีที่คล้ายคลึงกันระหว่างวัตถุและพื้นหลัง หรือมีรายละเอียดที่ซับซ้อน
เข้าสู่การเรียนรู้ของเครื่อง
การลบพื้นหลัง AI สมัยใหม่ใช้การเรียนรู้เชิงลึก — โดยเฉพาะโมเดลการแบ่งส่วนรูปภาพ นี่คือวิธีการทำงานเวอร์ชันที่เรียบง่าย:
1. การฝึกอบรม
โครงข่ายประสาทเทียมจะแสดงภาพหลายล้านภาพซึ่งมีการระบุวัตถุด้วยตนเองแล้ว (ติดป้ายกำกับ) เมื่อเวลาผ่านไป โมเดลจะเรียนรู้รูปแบบ เช่น ผู้คนมีรูปร่างหน้าตาอย่างไร วัตถุมีรูปร่างอย่างไร วัตถุแตกต่างจากพื้นหลังอย่างไร เรียนรู้ที่จะจดจำขอบ พื้นผิว และบริบท
2. การอนุมาน (การใช้แบบจำลอง)
เมื่อคุณมอบรูปภาพใหม่ที่ไม่เคยเห็นมาก่อนให้กับโมเดลที่ได้รับการฝึก โมเดลจะวิเคราะห์ข้อมูลพิกเซลและสร้าง "มาสก์" — แผนที่ที่กำหนดความน่าจะเป็นให้แต่ละพิกเซลเป็นเบื้องหน้า (หัวเรื่อง) หรือพื้นหลัง พิกเซลเบื้องหน้าที่มีความมั่นใจสูงจะถูกเก็บไว้ พิกเซลพื้นหลังที่มีความมั่นใจสูงจะถูกลบออก
3. การจัดการขอบ
การเปลี่ยนระหว่างพื้นหน้าและพื้นหลังเป็นสิ่งสำคัญ โมเดลสมัยใหม่จะสร้างขอบอ่อน (โปร่งใสบางส่วน) แทนที่จะเป็นการตัดไบนารีแบบแข็ง ซึ่งจะสร้างผลลัพธ์ที่ดูเป็นธรรมชาติ โดยเฉพาะบริเวณขอบที่ซับซ้อน
ทำไม GPU จึงมีความสำคัญ
โครงข่ายประสาทเทียมจะประมวลผลภาพผ่านการดำเนินการทางคณิตศาสตร์หลายพันรายการพร้อมกัน GPU (หน่วยประมวลผลกราฟิก) ได้รับการออกแบบมาเพื่อการคำนวณแบบขนานประเภทนี้ทุกประการ งานที่อาจใช้เวลา 30 วินาทีบน CPU สามารถทำให้เสร็จภายใน 2-3 วินาทีบน GPU
นี่คือสาเหตุที่เครื่องมืออย่าง QuickRemove รองรับการเร่งความเร็ว GPU จาก NVIDIA, AMD และ Intel GPU โมเดล AI ทำงานบน GPU ของคุณโดยตรงเพื่อการประมวลผลที่รวดเร็ว หากไม่มี GPU ที่เข้ากันได้ ซอฟต์แวร์จะกลับไปใช้การประมวลผลของ CPU ซึ่งยังคงใช้งานได้ แต่ใช้เวลานานกว่านั้น
AI มีดีอะไร
- ผู้คนและภาพบุคคล — นี่เป็นกรณีการใช้งานที่พบบ่อยที่สุด และโมเดลต่างๆ ได้รับการฝึกอบรมมาเป็นอย่างดี
- สัตว์และสัตว์เลี้ยง - โมเดลสามารถจับขนและรูปร่างสัตว์ได้ดี
- ผลิตภัณฑ์และวัตถุ — วัตถุที่กำหนดไว้อย่างดีและมีขอบเขตชัดเจน
- ยานพาหนะ — รถยนต์ จักรยาน และวัตถุที่คล้ายกัน
- พื้นหลังที่ซับซ้อน — AI สามารถแยกวัตถุออกจากพื้นหลังที่มีรายละเอียดยุ่งวุ่นวายได้
ความท้าทายสำหรับ AI
- วัตถุโปร่งใส เช่น แก้ว น้ำ และวัสดุที่ทะลุผ่านได้อื่นๆ ถือเป็นเรื่องยุ่งยาก (QuickRemove มีการจัดการพิเศษสำหรับสิ่งนี้)
- ความคล้ายคลึงกันของสี — เมื่อวัตถุและพื้นหลังมีสีคล้ายกันมาก ขอบเขตจะตรวจจับได้ยากขึ้น
- ฉากที่ซับซ้อนมาก — มีวัตถุซ้อนทับกันหลายชิ้นหรือพื้นหน้า/พื้นหลังที่ไม่ชัดเจน
หลังการประมวลผล
หลังจากที่ AI สร้างมาสก์เริ่มต้นแล้ว ขั้นตอนหลังการประมวลผลจะปรับแต่งผลลัพธ์ เครื่องมือเช่นข้อเสนอ QuickRemove:
- ขนนกตามขอบ — ทำให้การเปลี่ยนระหว่างวัตถุและพื้นหลังนุ่มนวลขึ้น
- ปรับให้เรียบ — ลดขอบหยัก
- การขจัดการปนเปื้อนของสี — ขจัดสีที่หกซึ่งสีพื้นหลังเดิมตกไปที่ขอบของวัตถุ
- แปรง/ยางลบแบบแมนนวล — เพื่อการแก้ไขอย่างละเอียดที่ AI อาจพลาดไป
บรรทัดล่าง
การลบพื้นหลัง AI มาถึงจุดที่ให้ผลลัพธ์คุณภาพระดับมืออาชีพภายในไม่กี่วินาที แม้ว่าจะไม่ได้สมบูรณ์แบบในทุกสถานการณ์ แต่ก็จัดการกับกรณีการใช้งานทั่วไปส่วนใหญ่ด้วยความแม่นยำที่น่าประทับใจ — ทำให้ทุกคนสามารถเข้าถึงการลบพื้นหลังได้ ไม่ใช่แค่ผู้เชี่ยวชาญ Photoshop เท่านั้น