Ինքնավար մեքենաները շուտով կդառնան առօրյա, և մենք դեռ սկզբում ենք: Եթե ​​մենք ուզում ենք հասկանալ, թե ինչպես ստեղծել այս ֆուտուրիստական ​​շարժիչները, մենք պետք է հասկանանք ամենահարմար տեխնիկան, որը հնարավոր դարձրեց ամեն ինչ. > Ինչպե՞ս ընկալել միջավայրը տեսախցիկով: Ի՞նչ է համակարգչային տեսլականը ինքնակառավարվող մեքենաներում:

Ստորև նկարը ցույց է տալիս չորս հիմնական քայլեր ինքնավար մեքենայի շահագործման մեջ:

  • Համակարգչային տեսողությունը և սենսորային միաձուլումը կոչվում են ընկալում:
    Խոսքը շրջակա միջավայրը հասկանալու մասին է: Computer Vision-ն օգտագործում է տեսախցիկ: Սա թույլ է տալիս նույնականացնել մեքենաները, հետիոտները, ճանապարհները, … Sensor Fusion-ն օգտագործում և միավորում է այլ սենսորների տվյալները, ինչպիսիք են Radar-ը և Lidar-ը, որպեսզի լրացնեն տեսախցիկի ստացած տվյալները:
    Սա հնարավորություն է տալիս գնահատել սենսորների դիրքերն ու արագությունները: տեսախցիկի կողմից հայտնաբերված առարկաները.
  • Տեղայնացումն այն քայլն է, որը կարող է մեքենան գտնել ավելի ճշգրիտ, քան GPS-ը:
  • Ճանապարհի պլանավորումն իրականացնում է ինքնավար մեքենայի ուղեղը:
    Ճանապարհի պլանավորողն օգտագործում է առաջին երկու քայլերի տվյալները՝ կանխատեսելու, թե ինչ կանեն տրանսպորտային միջոցները, հետիոտները և նրանց շրջապատող առարկաները՝ A կետից հետագիծ առաջացնելու համար: Բ կետին.
  • Control-ն օգտագործում է կարգավորիչներ՝ մեքենան գործարկելու համար:

Համակարգչային տեսլական

Computer Vision-ը կարգապահություն է, որը թույլ է տալիս տեսախցիկով հագեցած համակարգչին հասկանալ իր միջավայրը:

Համակարգչային տեսողության տեխնիկան օգտագործվում է ինքնավար մեքենաներում՝ հետիոտներին կամ այլ առարկաներ հայտնաբերելու համար, բայց կարող են օգտագործվել նաև քաղցկեղի ախտորոշման համար՝ պատկերներում աննորմալություններ փնտրելով:

Նրանք կարող են անցնել գծերի և գույների հայտնաբերումից շատ դասական եղանակով մինչև արհեստական ​​բանականություն:

Համակարգչային տեսլականը սկսվել է 50-ական թվականներին՝ որոշակի առարկաների ձևերի արտագրման ժամանակ։ Դարի վերջը մեզ հանգեցրեց այնպիսի տեխնիկայի մշակմանը, ինչպիսին է Canny-edge detection-ը, որը թույլ է տալիս տարբերակել պատկերի գույնի էվոլյուցիան:

2001 թվականին Վիոլա-Ջոնսի ալգորիթմը ցույց տվեց համակարգչի դեմքը ճանաչելու ունակությունը:

Հետագա տարիներին մեքենայական ուսուցումը հայտնի դարձավ օբյեկտների հայտնաբերման համար՝ կողմնորոշված ​​գրադիենտների հիստոգրամի (HOG) և դասակարգիչների լայն կիրառմամբ: Նպատակն է սովորեցնել մոդելին ճանաչել օբյեկտի ձևերը՝ ճանաչելով նրա տարբեր կողմնորոշումները (գրադիենտները): Կողմնորոշված ​​գրադիենտների հիստոգրամները պահպանում են յուրաքանչյուր պիքսելի ձևերն ու ուղղությունները. ապա միջինը ավելի լայն տարածքում:

Այնուհետև Deep Learning-ը շատ տարածված դարձավ իր կատարողականությամբ՝ շնորհիվ հզոր GPU-ների (Գրաֆիկական պրոցեսորային միավորներ, որոնք թույլ են տալիս զուգահեռ գործողություններ կատարել, ոչ մեկը մյուսի հետևից) և տվյալների կուտակման շնորհիվ: Մինչ GPU-ները, Deep Learning ալգորիթմները չէին աշխատում մեր մեքենաների վրա:

Համակարգչային տեսլականը կարող է իրականացվել երեք մոտեցումներով.

  • Առանց արհեստական ​​ինտելեկտի, ձևերի և գույների վերլուծության միջոցով
  • Մեքենայի ուսուցման մեջ՝ սովորելով առանձնահատկություններից
  • Deep Learning-ում` միայնակ սովորելով:

Մեքենայի ուսուցում

Մեքենայական ուսուցումը մի առարկա է, որն օգտագործվում է Computer Vision-ում՝ սովորելու, թե ինչպես ճանաչել ձևերը:

Ուսուցման երկու տեսակ կա.

  1. Վերահսկվող ուսուցումը մեզ թույլ է տալիս ավտոմատ կերպով ստեղծել կանոններ ուսումնական տվյալների բազայից:
    Մենք տարբերակում ենք.

ա. Դասակարգում. կանխատեսել՝ արդյոք տվյալը պատկանում է այս կամ այն ​​դասին: (օրինակ՝ շուն կամ կատու):

բ. Ռեգրեսիա. կանխատեսել մեկ տվյալ՝ հիմնվելով մյուսի վրա: (Օրինակ. Տան գինը իր չափսերով կամ փոստային ինդեքսով)

2. Չվերահսկվող ուսուցումը նշանակում է, որ նմանատիպ տվյալները ավտոմատ կերպով խմբավորվում են միասին:

Մեքենաների հայտնաբերման համար վերահսկվող ուսուցման գործընթացում կա չորս քայլ

  1. Առաջինը մեքենաների և ճանապարհների պատկերների տվյալների բազայի ստեղծումն է: Վերահսկվող ուսուցումը ներառում է ցույց տալ, թե որ պատկերն է համապատասխանում մեքենային, և որ պատկերն է ներկայացնում ֆոնը: Սա կոչվում է պիտակավորում:

2. Տեսնելու համար, թե որ հատկանիշներն են պատկանում մեքենային, մենք փորձում ենք մեր պատկերը տարբեր գունային տարածություններով: Մենք ձևը ստանում ենք՝ օգտագործելով HOG-ի հնարավորությունները: Պատկերը փոխակերպվում է հատկանիշի վեկտորների:

3. Այս վեկտորները միացված են և օգտագործվում են որպես ուսումնական հիմք: Ստորև բերված գրաֆիկում ձևերն ու գույները նշված են ուղղահայաց և հորիզոնական առանցքների վրա:
Մեր դասերը մեր կապույտ կետերն են (մեքենան) և նարնջագույնները (ոչ ավտոմեքենա): Մենք պետք է ընտրենք նաև դասակարգիչ։

Մեքենայական ուսուցման ալգորիթմը նախատեսված է երկու դասեր բաժանող գիծ գծելու համար՝ ըստ առանձնահատկությունների: Նոր կետերը (սպիտակ խաչ) այնուհետև գուշակվում են գծի նկատմամբ իրենց դիրքերի համաձայն: Որքան շատ մարզումների տվյալներ ունենանք, այնքան ավելի ճշգրիտ կլինի կանխատեսումը:

4. Վերջին քայլը կանխատեսումն է: Այն իրականացնում է ալգորիթմ, որն անցնում է պատկերի միջով և վերածում այն ​​վեկտորի՝ նույն հատկանիշներով, որոնք օգտագործվում են մարզման համար: Պատկերի յուրաքանչյուր հատված վերլուծվում և փոխանցվում է դասակարգիչին, ով գծում է մեքենաների շուրջը սահմանող տուփեր:

Մեքենայական ուսուցման ալգորիթմները թույլ են տալիս ընտրել, թե որ հատկանիշներն են օգտագործվում ուսուցման համար: Այս ալգորիթմներն այսօր ավելի շատ օգտագործվում են տվյալների մանիպուլյացիայի մեջ, քան պատկերների ճանաչման մեջ՝ Deep Learning-ի և նեյրոնային ցանցերի ժամանման պատճառով: Ավելին, հայտնաբերումը դանդաղ է և առաջացնում է բազմաթիվ կեղծ դրական արդյունքներ: Դրանք վերացնելու համար մեզ անհրաժեշտ են բազմաթիվ ֆոնային պատկերներ (ճանապարհներ, փողոցներ,…):

Խնդրում ենք ազատ զգալ կապվել օգտագործելով

Գիթհաբ