Ինքնավար մեքենաները շուտով կդառնան առօրյա, և մենք դեռ սկզբում ենք: Եթե մենք ուզում ենք հասկանալ, թե ինչպես ստեղծել այս ֆուտուրիստական շարժիչները, մենք պետք է հասկանանք ամենահարմար տեխնիկան, որը հնարավոր դարձրեց ամեն ինչ. > Ինչպե՞ս ընկալել միջավայրը տեսախցիկով: Ի՞նչ է համակարգչային տեսլականը ինքնակառավարվող մեքենաներում:
Ստորև նկարը ցույց է տալիս չորս հիմնական քայլեր ինքնավար մեքենայի շահագործման մեջ:
- Համակարգչային տեսողությունը և սենսորային միաձուլումը կոչվում են ընկալում:
Խոսքը շրջակա միջավայրը հասկանալու մասին է: Computer Vision-ն օգտագործում է տեսախցիկ: Սա թույլ է տալիս նույնականացնել մեքենաները, հետիոտները, ճանապարհները, … Sensor Fusion-ն օգտագործում և միավորում է այլ սենսորների տվյալները, ինչպիսիք են Radar-ը և Lidar-ը, որպեսզի լրացնեն տեսախցիկի ստացած տվյալները:
Սա հնարավորություն է տալիս գնահատել սենսորների դիրքերն ու արագությունները: տեսախցիկի կողմից հայտնաբերված առարկաները. - Տեղայնացումն այն քայլն է, որը կարող է մեքենան գտնել ավելի ճշգրիտ, քան GPS-ը:
- Ճանապարհի պլանավորումն իրականացնում է ինքնավար մեքենայի ուղեղը:
Ճանապարհի պլանավորողն օգտագործում է առաջին երկու քայլերի տվյալները՝ կանխատեսելու, թե ինչ կանեն տրանսպորտային միջոցները, հետիոտները և նրանց շրջապատող առարկաները՝ A կետից հետագիծ առաջացնելու համար: Բ կետին. - Control-ն օգտագործում է կարգավորիչներ՝ մեքենան գործարկելու համար:
Համակարգչային տեսլական
Computer Vision-ը կարգապահություն է, որը թույլ է տալիս տեսախցիկով հագեցած համակարգչին հասկանալ իր միջավայրը:
Համակարգչային տեսողության տեխնիկան օգտագործվում է ինքնավար մեքենաներում՝ հետիոտներին կամ այլ առարկաներ հայտնաբերելու համար, բայց կարող են օգտագործվել նաև քաղցկեղի ախտորոշման համար՝ պատկերներում աննորմալություններ փնտրելով:
Նրանք կարող են անցնել գծերի և գույների հայտնաբերումից շատ դասական եղանակով մինչև արհեստական բանականություն:
Համակարգչային տեսլականը սկսվել է 50-ական թվականներին՝ որոշակի առարկաների ձևերի արտագրման ժամանակ։ Դարի վերջը մեզ հանգեցրեց այնպիսի տեխնիկայի մշակմանը, ինչպիսին է Canny-edge detection-ը, որը թույլ է տալիս տարբերակել պատկերի գույնի էվոլյուցիան:
2001 թվականին Վիոլա-Ջոնսի ալգորիթմը ցույց տվեց համակարգչի դեմքը ճանաչելու ունակությունը:
Հետագա տարիներին մեքենայական ուսուցումը հայտնի դարձավ օբյեկտների հայտնաբերման համար՝ կողմնորոշված գրադիենտների հիստոգրամի (HOG) և դասակարգիչների լայն կիրառմամբ: Նպատակն է սովորեցնել մոդելին ճանաչել օբյեկտի ձևերը՝ ճանաչելով նրա տարբեր կողմնորոշումները (գրադիենտները): Կողմնորոշված գրադիենտների հիստոգրամները պահպանում են յուրաքանչյուր պիքսելի ձևերն ու ուղղությունները. ապա միջինը ավելի լայն տարածքում:
Այնուհետև Deep Learning-ը շատ տարածված դարձավ իր կատարողականությամբ՝ շնորհիվ հզոր GPU-ների (Գրաֆիկական պրոցեսորային միավորներ, որոնք թույլ են տալիս զուգահեռ գործողություններ կատարել, ոչ մեկը մյուսի հետևից) և տվյալների կուտակման շնորհիվ: Մինչ GPU-ները, Deep Learning ալգորիթմները չէին աշխատում մեր մեքենաների վրա:
Համակարգչային տեսլականը կարող է իրականացվել երեք մոտեցումներով.
- Առանց արհեստական ինտելեկտի, ձևերի և գույների վերլուծության միջոցով
- Մեքենայի ուսուցման մեջ՝ սովորելով առանձնահատկություններից
- Deep Learning-ում` միայնակ սովորելով:
Մեքենայի ուսուցում
Մեքենայական ուսուցումը մի առարկա է, որն օգտագործվում է Computer Vision-ում՝ սովորելու, թե ինչպես ճանաչել ձևերը:
Ուսուցման երկու տեսակ կա.
- Վերահսկվող ուսուցումը մեզ թույլ է տալիս ավտոմատ կերպով ստեղծել կանոններ ուսումնական տվյալների բազայից:
Մենք տարբերակում ենք.
ա. Դասակարգում. կանխատեսել՝ արդյոք տվյալը պատկանում է այս կամ այն դասին: (օրինակ՝ շուն կամ կատու):
բ. Ռեգրեսիա. կանխատեսել մեկ տվյալ՝ հիմնվելով մյուսի վրա: (Օրինակ. Տան գինը իր չափսերով կամ փոստային ինդեքսով)
2. Չվերահսկվող ուսուցումը նշանակում է, որ նմանատիպ տվյալները ավտոմատ կերպով խմբավորվում են միասին:
Մեքենաների հայտնաբերման համար վերահսկվող ուսուցման գործընթացում կա չորս քայլ
- Առաջինը մեքենաների և ճանապարհների պատկերների տվյալների բազայի ստեղծումն է: Վերահսկվող ուսուցումը ներառում է ցույց տալ, թե որ պատկերն է համապատասխանում մեքենային, և որ պատկերն է ներկայացնում ֆոնը: Սա կոչվում է պիտակավորում:
2. Տեսնելու համար, թե որ հատկանիշներն են պատկանում մեքենային, մենք փորձում ենք մեր պատկերը տարբեր գունային տարածություններով: Մենք ձևը ստանում ենք՝ օգտագործելով HOG-ի հնարավորությունները: Պատկերը փոխակերպվում է հատկանիշի վեկտորների:
3. Այս վեկտորները միացված են և օգտագործվում են որպես ուսումնական հիմք: Ստորև բերված գրաֆիկում ձևերն ու գույները նշված են ուղղահայաց և հորիզոնական առանցքների վրա:
Մեր դասերը մեր կապույտ կետերն են (մեքենան) և նարնջագույնները (ոչ ավտոմեքենա): Մենք պետք է ընտրենք նաև դասակարգիչ։
Մեքենայական ուսուցման ալգորիթմը նախատեսված է երկու դասեր բաժանող գիծ գծելու համար՝ ըստ առանձնահատկությունների: Նոր կետերը (սպիտակ խաչ) այնուհետև գուշակվում են գծի նկատմամբ իրենց դիրքերի համաձայն: Որքան շատ մարզումների տվյալներ ունենանք, այնքան ավելի ճշգրիտ կլինի կանխատեսումը:
4. Վերջին քայլը կանխատեսումն է: Այն իրականացնում է ալգորիթմ, որն անցնում է պատկերի միջով և վերածում այն վեկտորի՝ նույն հատկանիշներով, որոնք օգտագործվում են մարզման համար: Պատկերի յուրաքանչյուր հատված վերլուծվում և փոխանցվում է դասակարգիչին, ով գծում է մեքենաների շուրջը սահմանող տուփեր:
Մեքենայական ուսուցման ալգորիթմները թույլ են տալիս ընտրել, թե որ հատկանիշներն են օգտագործվում ուսուցման համար: Այս ալգորիթմներն այսօր ավելի շատ օգտագործվում են տվյալների մանիպուլյացիայի մեջ, քան պատկերների ճանաչման մեջ՝ Deep Learning-ի և նեյրոնային ցանցերի ժամանման պատճառով: Ավելին, հայտնաբերումը դանդաղ է և առաջացնում է բազմաթիվ կեղծ դրական արդյունքներ: Դրանք վերացնելու համար մեզ անհրաժեշտ են բազմաթիվ ֆոնային պատկերներ (ճանապարհներ, փողոցներ,…):
Խնդրում ենք ազատ զգալ կապվել օգտագործելով