Մենք՝ մարդիկ, երբեք չենք կարող լինել 100% կատարյալ, որքան էլ որ փորձենք, կարող ենք առավելագույնը 99% լավ լինել, բայց ոչ երբեք 100%: Եթե ​​մենք՝ մարդիկ, 100% կատարյալ չենք, ինչպե՞ս կարող է լինել մեքենան: Բայց հետաքրքիրն այն է, որ նրանք կարող են ավելի լավը լինել, քան մարդը, եթե կատարյալ մարզված լինեն, քանի որ մարդիկ չեն կարող կրկնել նույն բանը, բայց մեքենան կարող է դա անել, երբեք չի ձանձրանում նույն բանը նորից ու նորից անելուց, որպեսզի մարզվի։ ամեն անգամ այն ​​սովորում է նոր տարր և պահում այն ​​իր հիշողության մեջ: Ընդհանուր առմամբ, հենց դա է նշանակում մեքենայական ուսուցում, որ մենք փորձում ենք վարժեցնել մեքենան ալգորիթմներով, որոնցից նա սովորում է և փորձում է հիշել թաքնված օրինաչափությունները: Բայց ինչպե՞ս կարող ենք ասել, որ մեքենան ճիշտ է կատարում իր աշխատանքը: Այստեղ սխալի չափիչները օգտագործվում են պարզելու, թե որքան լավ է սարքը աշխատում:

Սխալ. Ընդհանրապես, սխալը սխալ է, եթե մենք այն մշակում ենք ML տեսանկյունից, սխալը սխալ դասակարգումներն են կամ սխալ կանխատեսումները՝ կապված իրական դասակարգումների կամ կանխատեսումների հետ:

ML ալգորիթմները կարող են օգտագործվել կա՛մ կանխատեսման, կա՛մ դասակարգման համար, և քչերը կարող են օգտագործվել երկուսի համար, բոլոր դեպքերում, երբ մեքենան վերապատրաստվում է վերապատրաստման տվյալների վրա, սխալի չափանիշը պետք է օգտագործվի սխալը հաշվարկելու համար, որը մեզ տեղեկատվություն կտա, թե ինչպես լավ մեքենան կատարում է իր աշխատանքը: Ռեգրեսիայի առաջադրանքների համար մենք հաշվարկում ենք միջին քառակուսի սխալը (MSE), միջին բացարձակ սխալը (MAE) և արմատային միջին քառակուսի սխալը (RMSE) և կան ևս մի քանիսը, բայց կանոնավոր կերպով մենք օգտագործում ենք այս չափումները սխալները չափելու համար: Դասակարգման համար մենք օգտագործում ենք ճշտություններ, ճշգրտություն, հետ կանչում և f1 միավոր: Ի՞նչ են նշանակում այս ամենը, ինչպե՞ս ենք իրականացնելու և ի՞նչ կարող ենք ստանալ դրանցից։ մենք կքննարկենք.

Կանխատեսումներ

Դիտարկենք տների վաճառքի գների օրինակը, եթե մեզ խնդրեն կանխատեսել, թե որոնք կարող են լինել գալիք տարվա վաճառքի գները, մեզ նախ անհրաժեշտ են նախորդ տարվա տվյալները, այնուհետև մենք տվյալները կբաժանենք ուսուցման և փորձարկման, այնուհետև մենք կսովորեցնենք մոդելը վերապատրաստման տվյալների հետ: . Այժմ, շատ կարևոր է հասկանալ, թե որքան լավ է մեր մոդելը կատարել մեր մոդելը գնահատելու համար, մենք կօգտագործեինք սխալի որոշ չափումներ:

  1. Միջին քառակուսի սխալ (MSE)
  2. Արմատային միջին քառակուսի սխալ (RMSE)
  3. Միջին բացարձակ քառակուսի սխալ (MAE)

Այս սխալները մեզ կտրամադրեն տեղեկատվություն մեր մոդելի կատարողականի վերաբերյալ, եթե սխալն ավելի շատ է, ապա մոդելը վատ է և անհրաժեշտ է կարգավորել, իսկ եթե սխալը փոքր է, ապա մոդելը լավ է աշխատում: Եկեք հասկանանք, թե ինչպես են գործում այս սխալները:

Միջին քառակուսի սխալ (MSE).

Այն նաև հայտնի է որպես ծախսերի ֆունկցիա, հաճախ մենք հանդիպում ենք այս բառին, երբ կարգավորում ենք պարամետրերը: Միջին քառակուսի սխալը շատ հեշտ է հասկանալ և նույնիսկ իրականացնել, այն մեզ ասում է, թե որքան մոտ է ռեգրեսիոն գիծը տվյալների կետերի մի շարքին, այնուհետև այն հաշվարկում է յուրաքանչյուր տվյալների կետի և ռեգրեսիոն գծի միջև տարբերությունը և քառակուսի է տալիս տարբերությունը: Վիճակագրորեն այն ներկայացված է հետևյալ կերպ.

MSE բանաձեւ = (1/n) * Σ(փաստացի — կանխատեսված)**2

Փաստացի = Փորձարկվող կամ չտեսնված տվյալներ մոդելի կողմից:
Կանխատեսված = Միավորներ, որոնք կանխատեսվում են մոդելի կողմից՝ օգտագործելով վերապատրաստման տվյալները:
n = Տվյալների ընդհանուր թիվը

Տարբերության քառակուսիացումը կհեռացնի բացասական արժեքները, օրինակ՝ տարբերությունը կարող է լինել «-2», այնպես որ, եթե այն քառակուսի դարձնենք, ապա բացասական նշանը կհեռացվի: Բայց դա ունի ծախսեր, եթե դիտարկեք, երբ մենք քառակուսում ենք, -ve թիվը վերածվում է դրականի, բայց թիվը նույնպես կրկնապատկվում է, ինչը կարող է խնդիր լինել, այնպես որ դա հաղթահարելու համար կա ևս մեկ չափիչ, որը արմատային միջին քառակուսի սխալն է:

Արմատի միջին քառակուսի սխալ (RMSE).

Երբ մենք հաշվարկենք MSE-ն և վերցնենք այն արժեքի քառակուսի արմատը, որը մեզ տալիս է RMSE, MSE-ն կվերացնի բացասական արժեքները, իսկ RMSE-ն կպատժի կրկնապատկված արժեքները՝ վերցնելով քառակուսի արմատը:

RMSE = sqrt((1/n) * Σ(իրական — կանխատեսված)**2)

Փաստացի = Փորձարկում կամ չտեսնված տվյալներ մոդելի կողմից:

Կանխատեսված = Միավորներ, որոնք կանխատեսվում են մոդելի կողմից՝ օգտագործելով վերապատրաստման տվյալները:

n = Տվյալների միավորների ընդհանուր թիվը

Միջին բացարձակ սխալ (MAE).

Կփորձեմ հասկանալ, թե որն է բացարձակ սխալը, դա հաշվարկված արժեքի և իրական արժեքի տարբերությունն է: Օրինակ, եթե դուք ինչ-որ բան եք կշռում կշռող մեքենայի վրա, և այն կշռում էր 100 կգ, բայց դուք գիտեք, որ ապրանքի իրական քաշը 98 կգ է, նրանց միջև տարբերությունը մեզ տալիս է բացարձակ սխալ:

AE = |100–98|,

AE-ն այս դեպքում 2-ն է:

Ընդհանուր առմամբ AE = | x1 — X |, (Նշում. մոդուլը բացասական արժեքներից խուսափելն է):

Միջին բացարձակ սխալը(MAE) բոլոր բացարձակ սխալների միջինն է,

MAE = (1/n) * Σ(| x1 — X |)

X1 = չափված արժեքը,

X = Փաստացի արժեք, (որոշ տեղերում X-ը ներկայացված է նաև փոքրատառով)

n = Տվյալների միավորների ընդհանուր թիվը

MAE-ն չափում է շարունակական փոփոխականների ճշգրտությունը:

Մենք կարող ենք կասկածի տակ առնել, թե որ չափանիշն է լավագույնը: Դե, ընդհանուր առմամբ, MSE-ն ավելի լավն է և լայնորեն օգտագործվում, քանի որ այն պատժում է սխալը՝ վերցնելով տարբերության քառակուսին, մինչդեռ MAE-ն՝ ոչ:

Կարծում եմ, որ սա ինտուիցիա տվեց այն մասին, թե որոնք են լայնորեն կիրառվող կանխատեսման չափանիշները ռեգրեսիոն խնդիրների լուծման սխալը հաշվարկելու համար, MAE, MSE և RMSE: Այժմ տեսնենք, թե ինչպես կարելի է իմանալ՝ դասակարգման ալգորիթմը լավ է աշխատում, թե ոչ:

Դասակարգում

Կորոնավիրուսի բռնկման այս ժամանակաշրջանում շատ կարևոր է ստուգել՝ անձը ունի՞ վիրուս, թե՞ ոչ, դրա համար մենք օգտագործում ենք տարբեր գործիքներ (մեքենաներ), որոնք վերապատրաստվում են այս ախտանիշներն ունեցող մարդկանց ախտանիշների և տվյալների հավաքածուով՝ կախված նրանից. ուսուցման տվյալները մեքենան պատրաստվում է դասակարգել՝ արդյոք մարդը վիրուս ունի, թե ոչ: Պարզելու համար, թե արդյոք գործիքի կողմից օգտագործվող մոդելը ճիշտ է դասակարգել հիվանդներին, մենք օգտագործում ենք որոշ չափումներ, ինչպիսիք են Ճշգրտությունը, ճշգրտությունը, հիշելը և f1 միավորը:

Ճշգրտություն՝

Դա չափում է՝ տեսնելու, թե ինչպես է գործել մոդելը, որը սովորաբար չափվում է որպես «Ճշմարիտ դրականների» և «Ճշմարիտ բացասականների» գումարը, որը բաժանվում է «Ճշմարիտ դրական», «Երկ բացասական», «Կեղծ դրական» և «Կեղծ բացասականների» գումարով:

Ճշգրտություն = (TP + TN) / (TP + TN + FP + FN):

Սա մեզ ցույց կտա, թե որքան լավ է մոդելը դասակարգում տվյալները, կախված այս միջոցից՝ մենք կարող ենք բարելավել մեր կատարումը:

Իսկական բացասական կողմեր.

Երբ մեր մոդելը ճիշտ է կանխատեսել բացասական դասը, օրինակ, դիտարկենք Covid-ի դասակարգման օրինակը, եթե մոդելը եզրակացրել է, որ բացասական է փորձարկված անձին, որտեղ նա բացասական է, ապա այն կլինի իրական բացասական:

Իսկական դրական կողմեր.

Երբ մեր մոդելը ճիշտ է կանխատեսել դրական դասը, օրինակ, հաշվի առեք Covid-ի դասակարգման օրինակը, եթե մոդելը եզրակացրեց, որ անձի թեստը դրական է, որտեղ նա դրական է, ապա դա կլինի True Positive:

Ամեն անգամ, երբ մենք օգտագործում ենք դասակարգման խնդիր, մենք գծում ենք շփոթության մատրիցը, որը համեմատելու է իրական դասակարգումները NxN մատրիցում կանխատեսված դասակարգումների հետ:

Շփոթության մատրիցա.

Դա N x N մատրիցա է, այն մեզ կասի, թե մեր մոդելը որքանով է հաջողությամբ դասակարգում տվյալները տարբեր դասերի: Այն ունի ընդհանուր առմամբ չորս հատկանիշ՝ ճշմարիտ դրական, ճշմարիտ բացասական, կեղծ դրական և կեղծ բացասական: Մի առանցքը մեր կանխատեսված պիտակներն են, իսկ մյուսը` իրական պիտակները:

Ճշգրտություն՝

Այն պատմում է, թե որքանով է ճիշտ եղել մեր մոդելը դրական դասը կանխատեսելիս, դրական դասը կարելի է հասկանալ որպես True positives:

Ճշգրիտ = TruePositives / (TruePositives + FalsePositives)

Հիշել՝

Դա միջոց է՝ իմանալու, թե արդյոք մեր մոդելը ճիշտ է նույնացնում իրական դրական կողմերը: Ճշգրիտությունը ապահովում է միայն իրական դրական կանխատեսումները բոլոր դրական կանխատեսումներից, հիշելը ցույց է տալիս բաց թողնված դրական կանխատեսումները նույնպես:

Հետ կանչել = TruePositives / (TruePositives + FalseNegatives)

Վերոհիշյալ բոլոր ցուցանիշները տատանվում են 0-ից 1-ի կամ 0%-ից 100%-ի սահմաններում, երբ մենք օգտագործում ենք դասակարգման մոդել, մենք օգտագործում ենք այս բոլոր չափումները՝ պարզելու մեր մոդելի արդյունավետությունը:

f1 միավոր՝

Այն չափվում է որպես,

f1 միավոր = 2*((ճշգրտություն*կանչ)/(ճշգրտություն+կանչ))

Այն փոխանցում է ճշգրտության և հետկանչի հավասարակշռությունը:

Եզրակացություն.

Այս ճշտությունները կօգնեն մեզ իմանալով, թե քանի մարդ է իսկապես դրական կամ բացասական, օրինակ, եթե մարդն ունի վիրուսի հետ կապված որոշ ախտանիշներ, և նա որոշել է թեստ հանձնել, մոդելը կանխատեսել էր, որ մարդը բացասական է, բայց իրականում մարդը դրական է, պատկերացրեք, թե ինչ իրավիճակ կարող է լինել, քանի հոգու վրա կազդի միայն կեղծ հաղորդմանը հավատալը: Բոլոր նման տեսակի բռնկումներից խուսափելու համար սարքը, որն օգտագործվում է մարդկանց մոտ վիրուսները փորձարկելու համար, պետք է կատարյալ պատրաստված լինի: Նույն ձևով, ռեգրեսիայի խնդիրների համար սխալի չափիչները մեզ օգնում են հասկանալ, թե ինչ կարող է լինել վաղը վաճառքը: Բայց մենք պետք է նաև հաշվի առնենք մի քանի բան՝ շրջակա միջավայրը, համաճարակների համաճարակները և այլն, սրանք մի քանի բաներ են, որոնք մեքենան չի կարող հասկանալ, նրա աշխատանքն է կանխատեսել, թե ինչ կարող է տեղի ունենալ վաղը երեկվա տվյալների հիման վրա: Օրինակ՝ մոդելը վարժեցված է գովազդի տվյալների հետ՝ կանխատեսելու վաղվա վաճառքը, եթե վաղը բնական աղետ լինի, և ամբողջական վաճառքը խաթարվի, ապա դա մեքենայի մեղքը չէ, նա չի կարող կարգավորել նման իրավիճակը: Այսպիսով, մեքենաներից չափազանց շատ կախվածությունը և դրանց կուրորեն հավատալը նույնպես կարող է հանգեցնել խնդիրների: