Որոնման համակարգի որոշ չափումների արագ բացահայտում:
MRR = Միջին փոխադարձ վարկանիշ
Հիմնականում հաշվի առեք 1-ին համապատասխան կետի վարկանիշը, ապա միջին:
- Pro: հեշտ է մեկնաբանել
- Դեմ: Դիտարկվում է միայն 1-ին արդյունքը
Հիշել@k
- Դեմ. կարող են լինել շատ համապատասխան տարրեր ⇒ հայտարար = մեծ:
- Դեմ. չի դիտարկում արդյունքների դասակարգումը k-ի շրջանակներում:
Prec@k
- Դեմ. չի դիտարկում արդյունքների դասակարգումը k-ի շրջանակներում:
mAP
Միջին միջին ճշգրտություն: Նախ, ինչ է միջին ճշգրտությունը (AP):
AP = միջին ճշգրտություն @ k-ի տարբեր արժեքներ
Համապատասխանության վեկտորը սովորաբար 0-երի և 1-երի վեկտորն է, որտեղ 1-ը ցույց է տալիս համապատասխան տարրը:
Հայտարարը տվյալների հավաքածուի համապատասխան տարրերի ընդհանուր թիվն է. սա նույնն է, ինչ հիշողության մեջ:
Երկրորդ. ո՞րն է միջին միջին ճշգրտությունը (mAP): Դա շատ հարցումների ընթացքում ընդունված միջինն է:
- Pro. mAP-ը ներառում է արդյունքների դասակարգում + ճշգրտություն:
- Դեմ: Լավագույնս աշխատում է երկուական համապատասխանության համար, օրինակ. կետը տեղին է, թե ոչ:
DCG = զեղչված կուտակային շահույթ
Ըստ էության, մենք ամփոփում ենք միավորները վերևից ներքև, իսկ միավորները զեղչում ենք ավելի մոտ:
Նկատի ունեցեք, որ լոգարիթմի գործակիցը հիմնականում կազմված է: Վիքիպեդիայից.
Նախկինում չկար լոգարիթմական կրճատման գործակից[3] օգտագործելու տեսականորեն հիմնավոր հիմնավորում, բացի այն փաստից, որ այն առաջացնում է սահուն կրճատում: Սակայն Wang et al. (2013)[2] տեսական երաշխիք է տվել նորմալացված DCG-ում (NDCG) լոգարիթմական նվազեցման գործակից օգտագործելու համար: Հեղինակները ցույց են տալիս, որ էապես տարբեր վարկանիշային ֆունկցիաների յուրաքանչյուր զույգի համար NDCG-ն կարող է հետևողական կերպով որոշել, թե որն է ավելի լավը:
- Դեմ. նորմալացված չէ. սա դժվարացնում է տվյալների հավաքածուների համեմատությունը:
nDCG
Նորմալացված DCG:
որտեղ IDCG = իդեալական տիրույթ = առաջարկել ամենաիդեալական իրերը նախ: