Որոնման համակարգի որոշ չափումների արագ բացահայտում:

MRR = Միջին փոխադարձ վարկանիշ

Հիմնականում հաշվի առեք 1-ին համապատասխան կետի վարկանիշը, ապա միջին:

  • Pro: հեշտ է մեկնաբանել
  • Դեմ: Դիտարկվում է միայն 1-ին արդյունքը

Հիշել@k

  • Դեմ. կարող են լինել շատ համապատասխան տարրեր ⇒ հայտարար = մեծ:
  • Դեմ. չի դիտարկում արդյունքների դասակարգումը k-ի շրջանակներում:

Prec@k

  • Դեմ. չի դիտարկում արդյունքների դասակարգումը k-ի շրջանակներում:

mAP

Միջին միջին ճշգրտություն: Նախ, ինչ է միջին ճշգրտությունը (AP):

AP = միջին ճշգրտություն @ k-ի տարբեր արժեքներ

Համապատասխանության վեկտորը սովորաբար 0-երի և 1-երի վեկտորն է, որտեղ 1-ը ցույց է տալիս համապատասխան տարրը:

Հայտարարը տվյալների հավաքածուի համապատասխան տարրերի ընդհանուր թիվն է. սա նույնն է, ինչ հիշողության մեջ:

Երկրորդ. ո՞րն է միջին միջին ճշգրտությունը (mAP): Դա շատ հարցումների ընթացքում ընդունված միջինն է:

  • Pro. mAP-ը ներառում է արդյունքների դասակարգում + ճշգրտություն:
  • Դեմ: Լավագույնս աշխատում է երկուական համապատասխանության համար, օրինակ. կետը տեղին է, թե ոչ:

DCG = զեղչված կուտակային շահույթ

Ըստ էության, մենք ամփոփում ենք միավորները վերևից ներքև, իսկ միավորները զեղչում ենք ավելի մոտ:

Նկատի ունեցեք, որ լոգարիթմի գործակիցը հիմնականում կազմված է: Վիքիպեդիայից.

Նախկինում չկար լոգարիթմական կրճատման գործակից[3] օգտագործելու տեսականորեն հիմնավոր հիմնավորում, բացի այն փաստից, որ այն առաջացնում է սահուն կրճատում: Սակայն Wang et al. (2013)[2] տեսական երաշխիք է տվել նորմալացված DCG-ում (NDCG) լոգարիթմական նվազեցման գործակից օգտագործելու համար: Հեղինակները ցույց են տալիս, որ էապես տարբեր վարկանիշային ֆունկցիաների յուրաքանչյուր զույգի համար NDCG-ն կարող է հետևողական կերպով որոշել, թե որն է ավելի լավը:

  • Դեմ. նորմալացված չէ. սա դժվարացնում է տվյալների հավաքածուների համեմատությունը:

nDCG

Նորմալացված DCG:

որտեղ IDCG = իդեալական տիրույթ = առաջարկել ամենաիդեալական իրերը նախ: