Խնդիրը
Այն, ինչ մարդկանց համար պարզ է թվում՝ լուսանկարի «հիմնական թեմայի» նույնականացումը, զարմանալիորեն բարդ է համակարգիչների համար: Պատկերը պարզապես գունավոր պիքսելների ցանց է: Ոչ մի բնորոշ պիտակ չկա, որն ասում է «այս պիքսելը մարդն է» և «այս պիքսելը նրանց հետևի պատն է»:
Ավանդական մոտեցումներն օգտագործում էին այնպիսի մեթոդներ, ինչպիսիք են գունային շեմը (հեռացնել որոշակի գույնի բոլոր պիքսելները) կամ եզրերի հայտնաբերումը (գտնել օբյեկտների միջև սահմանները): Սրանք աշխատեցին պարզ դեպքերի համար, բայց ձախողվեցին բարդ տեսարանների, առարկայի և ֆոնի միջև նմանատիպ գույների կամ բարդ մանրամասների դեպքում:
Մուտքագրեք Machine Learning
Ժամանակակից AI-ի ֆոնի հեռացումը օգտագործում է խորը ուսուցում, մասնավորապես՝ պատկերների սեգմենտավորման մոդելներ: Ահա այն պարզեցված տարբերակը, թե ինչպես է այն աշխատում.
1. Ուսուցում
Նեյրոնային ցանցին ցուցադրվում են միլիոնավոր պատկերներ, որտեղ առարկան արդեն ձեռքով նույնականացվել է (պիտակավորված): Ժամանակի ընթացքում մոդելը սովորում է օրինաչափություններ՝ ինչպիսին են մարդիկ, ինչպես են ձևավորվում առարկաները, ինչպես են առարկաները տարբերվում ծագումից: Այն սովորում է ճանաչել եզրերը, հյուսվածքները և համատեքստը:
2. Եզրակացություն (օգտագործելով մոդելը)
Երբ վարժեցված մոդելին տալիս եք նոր պատկեր, որը նախկինում երբեք չի տեսել, նա վերլուծում է պիքսելային տվյալները և ստեղծում «դիմակ»՝ քարտեզ, որը յուրաքանչյուր պիքսելին տալիս է առաջին պլան (թեմա) կամ հետին պլան լինելու հավանականությունը: Բարձր վստահության առաջին պլանի պիքսելները պահպանվում են. բարձր վստահությամբ ֆոնային պիքսելները հեռացվում են:
3. Edge Handling
Առաջին պլանի և հետին պլանի միջև անցումը կարևոր է: Ժամանակակից մոդելները ստեղծում են փափուկ եզրեր (մասնակի թափանցիկություն), այլ ոչ թե կոշտ երկուական կտրվածքներ: Սա բնական արդյունքներ է ստեղծում, հատկապես բարդ եզրերի շուրջ:
Ինչու են կարևոր GPU-ները
Նյարդային ցանցերը պատկերները մշակում են հազարավոր մաթեմատիկական գործողությունների միջոցով միաժամանակ: GPU-ները (Գրաֆիկական մշակման միավորները) նախատեսված են հենց այս տեսակի զուգահեռ հաշվարկների համար: Առաջադրանքը, որը կարող է տևել 30 վայրկյան պրոցեսորի վրա, կարող է ավարտվել 2-3 վայրկյանում GPU-ում:
Ահա թե ինչու QuickRemove-ի նման գործիքներն աջակցում են GPU-ի արագացումը NVIDIA, AMD և Intel GPU-ներից: AI մոդելն աշխատում է անմիջապես ձեր GPU-ի վրա՝ արագ մշակման համար: Եթե որևէ համատեղելի GPU հասանելի չէ, ծրագրաշարը վերադառնում է պրոցեսորի մշակմանը. այն դեռ աշխատում է, պարզապես ավելի երկար է տևում:
Ինչում է AI-ն լավ
- Մարդիկ և դիմանկարներ. սա ամենատարածված օգտագործման դեպքն է, և մոդելները լավ պատրաստված են դրա վրա
- Կենդանիներ և ընտանի կենդանիներ. մոդելները լավ են վարվում մորթի և կենդանիների ձևերի հետ
- Ապրանքներ և առարկաներ՝ հստակ սահմաններով հստակ սահմանված օբյեկտներ
- Տրանսպորտ - մեքենաներ, հեծանիվներ և նմանատիպ առարկաներ
- Բարդ նախապատմություններ. AI-ն կարող է առանձնացնել առարկաները զբաղված, մանրամասն ֆոնից
Մարտահրավերներ AI-ի համար
- Թափանցիկ առարկաները՝ ապակին, ջուրը և այլ թափանցիկ նյութերը բարդ են (QuickRemove-ը ներառում է հատուկ մշակում դրա համար)
- Գույնի նմանություն. երբ առարկան և ֆոնը գույներով շատ նման են, սահմաններն ավելի դժվար է հայտնաբերել
- Չափազանց բարդ տեսարաններ. բազմաթիվ համընկնող առարկաներ կամ երկիմաստ առաջին պլան/ֆոն
Հետմշակում
Այն բանից հետո, երբ AI-ն ստեղծում է նախնական դիմակը, հետմշակումը ճշգրտում է արդյունքը: Գործիքներ, ինչպիսիք են QuickRemove-ի առաջարկը.
- Եզրերի փետուրավորում — մեղմացնում է անցումը թեմայի և ֆոնի միջև
- Հարթեցում — կրճատում է ատամնավոր եզրերը
- Գույնի ախտահանում. հեռացնելով գույնի արտահոսքը, որտեղ սկզբնական ֆոնի գույնը հոսում է առարկայի եզրերին
- Ձեռքով խոզանակ/ջնջիչ – նուրբ ուղղումների համար AI-ն կարող է բաց թողնել
Ներքեւի գիծ
AI-ի ֆոնի հեռացումը հասել է մի կետի, երբ այն վայրկյանների ընթացքում տալիս է պրոֆեսիոնալ որակի արդյունքներ: Թեև այն կատարյալ չէ բոլոր սցենարներում, այն գործածում է ընդհանուր օգտագործման դեպքերի ճնշող մեծամասնությունը տպավորիչ ճշգրտությամբ՝ ֆոնի հեռացումը հասանելի դարձնելով բոլորին, ոչ միայն Photoshop-ի փորձագետներին: