Գրված է Նատալի Վոլկի կողմից: Քննարկում «Պատճառային եզրակացություն բժշկության մեջ և առողջապահական քաղաքականության մեջ» թղթի շուրջ:

Պատճառահետևանքային եզրակացությունը մեքենայական ուսուցման հետազոտության հիմնական ոլորտն է, որի նպատակն է ներառել պատճառահետևանքային հասկացությունը AI մոդելներում: Դրանով հետազոտողները կարծում են, որ մեքենայական ուսուցումը կարող է օգնել բարելավել մոդելի ընդհանրացումը և թափանցիկությունը, օգնել հաղթահարել կողմնակալությունը և նույնիսկ զարգացնել մարդու նման մտածողությունը արհեստական ​​ընդհանուր ինտելեկտով (AGI):

Ի՞նչ է պատճառահետևանքային եզրակացությունը:

Եկեք սկսենք հասկանալով, թե իրականում ինչ է պատճառահետևանքային եզրակացությունը: Պատճառահետևանքային եզրակացությունը պատճառահետևանքների որոշման գործընթացն է՝ ինչպես է որոշակի փոփոխականն ազդում արդյունքի վրա: Դուք, հավանաբար, շատ ծանոթ եք պատճառ և հետևանք հասկացությանը, բայց երբեմն դժվար է նույնականացնել: Երբ երկու փոփոխականների միջև կա որևէ տեսակի հարաբերություն, մարդիկ հակված են ենթադրելու պատճառահետևանքային կապ: Դա պայմանավորված է նրանով, որ պատճառահետևանքն ամենահեշտն ու ամենապարզն է հասկանալը:

Իրականում կան մի շարք հարաբերություններ, որոնք պարզապես փոխկապակցվածություն են: Սա կարող է պատահական լինել, կամ այն ​​պատճառով, որ կա հավելյալ փոփոխական, որը կապ է ստեղծում երկուսի միջև: Օրինակ, որոշ ուսումնասիրություններ եզրակացրել են, որ սուրճ խմելը մեծացնում է թոքերի քաղցկեղի ռիսկը: Այնուամենայնիվ, կար լրացուցիչ փոփոխական, որը փոխկապակցվածություն առաջացրեց այս երկուսի միջև՝ ծխելը: Պարզվում է, որ շատ սուրճ խմողների մեջ ծխողների թիվն ավելի մեծ է եղել, քան չխմածների մեջ։ Այս փոփոխականը՝ ծխելը, հայտնի է որպես շփոթեցնող փոփոխական, որն ազդում է այլ փոփոխականների վրա այնպես, որ ստեղծում է խեղաթյուրված կամ կեղծ հարաբերություններ նրանց միջև: Նրանք շփոթեցնում են փոփոխականների միջև ցանկացած իրական պատճառահետևանքային կապ:

Շփոթեցնող փոփոխականների հասցեագրում

Այս շփոթիչները իսկապես վերացնելու միակ միջոցը բոլոր արտաքին փոփոխականները մշտական ​​պահելն է և միայն հետաքրքրող փոփոխականը փոխելը: Այնուհետև այս փոփոխականի պատճառահետևանքային ազդեցությունը կարելի է իսկապես դիտարկել: Ցավոք, դա անհնար է. դուք պետք է փորձեք մեկ բուժում, հետևեք դրա հետևանքներին, այնուհետև վերադառնալ ժամանակի մեջ և կրկնել ամեն ինչ ճշգրիտ բացիայդ մեկ փոփոխականից: Սրա անհնարինության պատճառով այն հայտնի է որպես պատճառահետևանքային եզրակացության հիմնարար խնդիր:

Պայմանավորելը և միջամտելը երկուսն էլ շփոթեցնող փոփոխականները վերահսկելու եղանակներ են: Պայմանավորվելով փոփոխականով` դուք ապահովում եք, որ յուրաքանչյուր թեստային խմբում շփոթեցնող փոփոխականից տուժած մարդկանց մասնաբաժինը հավասար է: Մտածեք, որ դա նեղացնում է ուշադրության կենտրոնացումը դեպքերի ենթապոպուլյացիայի վրա: Օրինակ, եթե մենք փորձում ենք որոշել սոցիալական մեդիայի օգտագործման ազդեցությունը ակադեմիական արդյունքների վրա, ավագ դպրոցը հնարավոր շփոթեցնող փոփոխական է, քանի որ կրթության որակը կամ ակադեմիական չափանիշները կարող են տարբեր լինել: Պայմանավորելով՝ մենք կարող ենք դիտել միայն մեկ ավագ դպրոց. կամ, եթե մենք դիտարկում ենք մի քանի ավագ դպրոցներ, մենք կապահովենք, որ տարբեր ավագ դպրոցները հավասարապես ներկայացված լինեն ինչպես հսկիչ, այնպես էլ թեստային խմբերում: Քանի որ ձեզ հարկավոր չէ որևէ բան փոխել թեստային խմբի անհատների վերաբերյալ, պայմանավորումը դիտողական ուսումնասիրությունների գործնական տեխնիկա է:

Մինչդեռ փոփոխականի վրա միջամտելը նշանակում է փոփոխականի արժեքի ամրագրում այնպես, որ ամբողջ բնակչությունը կունենա այդ շփոթեցնող փոփոխականը: Ի տարբերություն պայմանավորվածության, սա նշանակում է հիմնովին փոխել բնակչության մեջ անհատների ասպեկտը: Օգտագործելով նախորդ օրինակը սոցիալական մեդիայի օգտագործման և ակադեմիական արդյունքների հետ, միջամտությունը կնշանակի ստիպել ուսումնասիրության բոլոր ուսանողներին փոխել ավագ դպրոցները, որպեսզի նրանք բոլորը լինեն նույն դպրոցում: Թեև միջամտությունները կարող են ավելի արդյունավետ լինել, քան պայմանավորումը պատճառահետևանքային կապերի բացահայտման համար, այն իրագործելի չէ դիտողական ուսումնասիրություններում և կարող է ունենալ որոշ էթիկական հետևանքներ կլինիկական միջավայրում:

Կլինիկական հսկողության փորձարկումների հնարավոր անբարոյականությունից և անիրագործելիությունից խուսափելու համար do-հաշվարկը կարող է օգտագործվել միջամտության համար: Հիմնական կանոնները ներկայացված են ստորև. Յուրաքանչյուր ոք, ով հետաքրքրված է do-հաշվի ավելի մանրակրկիտ ըմբռնմամբ, կարող է դիմել Judea Pearl-ի The Do-Calculus Revisited թերթին։

Խնդիրը մեքենայական ուսուցման հետ կապված

Իր ամենատարածված ձևով մեքենայական ուսուցումը գործում է տվյալների ուսումնասիրման և օրինաչափությունների նույնականացման միջոցով: Նկատի ունեցեք, որ ես ասում եմ նախշերի նույնականացում, դա պարզապես տվյալների մեջ հարաբերակցությունների նույնականացում է: Համեմատեք սպանությունների ավելի բարձր մակարդակի և պաղպաղակի վաճառքի աճի միջև կապը ավելի տաք ջերմաստիճանի և պաղպաղակի վաճառքի աճի միջև: Դուք կարող եք հասկանալ, որ առաջինը ասոցիատիվ հարաբերություն է, մինչդեռ երկրորդը, հավանաբար, պատճառահետևանքային է: Մեքենայի ուսուցման մոդելը տարբերություն չի տեսնում: Մեքենայի ուսուցման մոդելը փորձում է կանխատեսում անել, և կանխատեսումը հարցնում է. «Ի՞նչ է սովորաբար տեղի ունենում»: հաշվի առնելով որոշակի հանգամանքներ. Մինչդեռ պատճառահետևանքային եզրակացությունը հարցնում է. «Ի՞նչ կլիներ, եթե մենք միջամտեինք համակարգին»:

Պատահական եզրակացության կիրառությունները մեքենայական ուսուցման մեջ

Եթե ​​մեքենայական ուսուցումը կարողանար հասկանալ պատճառահետևանքային կապը, ապա այն կօգներ բազմաթիվ խնդիրների, որոնք ներկայումս պատուհասում են ոլորտը, ներառյալ կողմնակալությունը, տվյալների ծանր պահանջները, թափանցիկությունը և չափից ավելի հարմարեցումը: Մեքենայի ուսուցման մեջ պատճառահետևանքային եզրակացության հիմնական կիրառությունը փոխանցման ուսուցումն է, մասնավորապես՝ տիրույթի հարմարեցումը: Դոմենի հարմարեցումը փոխանցման ուսուցման տեսակ է, որտեղ առաջադրանքը մնում է նույնը, բայց ճշգրիտ կիրառումը (կամ տիրույթը) փոխվում է:

Ավանդաբար, մոդելին տրվում են վերապատրաստման տվյալներ, որպեսզի այն կարողանա սովորել կանխատեսել որոշակի ելքեր՝ հաշվի առնելով որոշակի մուտքային տվյալները: Օրինակ, մենք կարող ենք ստեղծել մեքենայական ուսուցման ալգորիթմ՝ կանխատեսելու համար, թե արդյոք հիվանդը ունի որոշակի հիվանդություն՝ ելնելով իր ախտանիշներից: Ենթադրենք, որ վերապատրաստման բոլոր տվյալները Mayo Clinic-ից են: Այնուամենայնիվ, հավանաբար Տորոնտոյի գլխավոր հիվանդանոցը ցանկանում է օգտագործել մոդելը: Այսպիսով, տիրույթը փոխվում է. Mayo Clinic-ի փոխարեն տիրույթն այժմ Տորոնտոյի գլխավոր հիվանդանոցն է: Պատճառահետևանքային եզրակացությունը կարող է օգտագործվել տիրույթի հարմարեցման համար:

Գոյություն ունեն տիրույթի հարմարեցման երեք հիմնական տեսակ, որոնք պետք է վերլուծվեն.

  1. Թիրախային տեղաշարժ. գնահատել հիվանդ մարդկանց մասնաբաժինը նոր տիրույթում և համապատասխանաբար ճշգրտել կանխատեսման մոդելը:
  2. Պայմանական տեղաշարժ. որոշել, թե ինչպես է տիրույթի փոփոխությունն ազդում հիվանդների ախտանիշների դրսևորման վրա: Սա ավելի դժվար է հաշվի առնել և, որպես կանոն, պահանջում է տիրույթի գիտելիքներ՝ պատճառահետևանքային կապի ուժեղ ըմբռնման համար:
  3. Ընդհանրացված թիրախային տեղաշարժ.վերլուծում է թե՛ թիրախային, թե՛ պայմանական տեղաշարժը տիրույթում: Սա շատ բարդ է և կարող է իրականացվել տարբեր մեթոդների համադրությամբ:

Դոմենի հարմարեցումը նաև օգտակար է «տվյալների հավաքածուի փոփոխություն» իրականացնելու համար, որն այն դեպքում, երբ անհամապատասխանություն կա վերապատրաստման և թեստային տվյալների բաշխման միջև: Օրինակ, կան բազմաթիվ ռազմական տվյալների բազաներ՝ առողջապահական տեղեկատվությամբ. սակայն, այս տվյալները անհամաչափորեն գերակշռում են արական սեռի ներկայացուցիչներին: Նմանապես, ավելի հարուստ անհատներն ավելի հավանական է, որ չափից ավելի ներկայացված լինեն առողջապահական հետազոտություններում: Դոմենի հարմարեցումը կարող է օգնել լուծել այս խնդիրը՝ առանց լրացուցիչ տվյալների զանգվածային քանակի հավաքման:

Ամրապնդող ուսուցում պատճառահետեւանքային կապով

Հզորացման ուսուցման հիմքում ընկած գաղափարն այն է, որ արհեստական ​​գործակալը ընտրում է առկա գործողությունները դիտարկված վիճակից այնպես, որ հավաքի օպտիմալ պարգևը: Նպատակն է առավելագույնի հասցնել ընդհանուր պարգևը՝ ընտրելով հնարավոր լավագույն գործողությունը յուրաքանչյուր բնապահպանական փոխազդեցության մեջ:

Բազմակողմանի ավազակային խնդիրը ամրապնդող ուսուցման գործակալի օրինակ է: Գործակալը, որը հայտնի է որպես խաղամոլ, նստում է մի շարք խաղային ավտոմատների առջև և փորձում է որոշել, թե որ մեքենան պետք է խաղա, որպեսզի առավելագույնի հասցնի դրանց ընդհանուր եկամուտը: Սկզբում, սակայն, խաղամոլը պատկերացում չունի յուրաքանչյուր խաղային ավտոմատի համար շահելու հավանականության մասին:

Յուրաքանչյուր խաղային ավտոմատ կամ դրական պարգև է տալիս P հավանականությամբ, կամ բացասական պարգև՝ 1-P հավանականությամբ: Ենթադրենք, որ դուք ունեք հինգ խաղային ավտոմատ [0.1, 0.2, 0.3, 0.4, 0.5] հավանականություններով: Եթե ​​խաղամոլը իմանար այս հավանականությունները, նրանք միշտ կընտրեին վերջինը. սակայն նրանք այս տեղեկությունը չունեն։

Այս խնդրի նկատմամբ ագահ մոտեցումը կլինի այն գործողությունը, որը մինչ այժմ ամենաարդյունավետն է եղել: Այնուամենայնիվ, սա օպտիմալ չէ, և կան ավելի լավ մոտեցումներ, հատկապես Թոմսոնի ընտրանքային մոտեցումը: Ի տարբերություն շատ այլ մոտեցումների, Թոմսոնի ընտրանքի մոտեցումը պարզապես չի ճշգրտում արդեն իսկ ստացված միջին պարգևի գնահատումը: Փոխարենը, այն ստեղծում է հավանականության բաշխում, օգտագործելով նախորդ պարգևների տեղեկատվությունը:

Եթե ​​հասանելի պարգևները երկուական են (հաղթել կամ պարտվել, քանի որ դրանք ամենահիմնական բազմակողմանի ավազակային սցենարի դեպքում են), հավանականության բաշխման համար կարող է օգտագործվել Բետա բաշխումը: Այս բաշխման մեջ α կարող է օգտագործվել հաջողությունների թիվը ներկայացնելու համար, մինչդեռ β-ը ձախողումների թիվն է: Բաշխումն ունի միջին արժեք՝

Բետա բաշխումը կարող է ստեղծվել խաղային ավտոմատներից յուրաքանչյուրի համար: Մինչ խաղամոլը կսկսի խաղալ մեքենայի վրա, α և β-ը կարող են երկուսն էլ սահմանվել մեկի վրա՝ առաջացնելով գծապատկերում կարմիրով երևացող հարթ գիծը: Քանի որ խաղամոլն ավելի շատ է խաղում մեքենայով, հավանականության բաշխման ստանդարտ շեղումը նվազում է, և խաղամոլը ավելի լավ է հասկանում մեքենայի հավանականությունը: Այնուամենայնիվ, կա մի կարևոր խնդիր. հավանականությունների բաշխումը կարող է կողմնակալ լինել՝ չնկատված շփոթեցնող գործոնների պատճառով: Սա կարող է լուծվել պատճառահետևանքային Thomson նմուշառմամբ:

Պատճառային Թոմսոնի նմուշառում

Թոմփսոնի նմուշառման հակաֆակտիվ պատճառաբանությունը կարող է օգնել կանխել չնկատված շփոթեցնող գործոնները, որոնք ստիպեն գործակալին ընտրել ոչ օպտիմալ մոտեցում:Օրինակ, խաղամոլը նստած է երկու խաղային ավտոմատների առջև և ունի բետա բաշխումներ խաղային ավտոմատներից յուրաքանչյուրի համար: . Դիտարկենք երկու լրացուցիչ շփոթեցնող փոփոխականներ. (1) խաղամոլը կարող է հարբած լինել կամ չխմած, և (2) խաղային ավտոմատները կարող են ավելի շատ կամ քիչ թարթող լույսեր ունենալ: Հավանաբար, եթե խաղամոլը հարբած է, նա ենթագիտակցական հակվածություն ունի թարթող խաղային ավտոմատի նկատմամբ:

Այս դեպքում խաղամոլը պետք է որոշի իր ինտուիցիան և հակաինտուիցիան: Ինտուիցիան կորոշվի՝ հարցնելով. Հաշվի առնելով, որ ես կարծում եմ, որ թարթող խաղային ավտոմատն ավելի լավն է, ինչպիսի՞ն կլիներ վճարումը, եթե ես խաղայի այդ մեկը:Նույնպես, հակաինտուիցիայի համար խաղամոլը կարող է հարցնել. Հաշվի առնելով, որ ես կարծում եմ, որ թարթող խաղային ավտոմատն ավելի լավն է, ինչպիսի՞ն կլիներ վճարումը, եթե ես այլ կերպ վարվեի:Գնահատելով ինտուիցիայի պարգևները ընդդեմ հակաինտուիցիայի, ինչը կարող է հասկանալ պատճառականությունը, խաղամոլը կարող է պոտենցիալ. շտկեք նրանց անհավատությունը:Այս տեսակի պատճառահետևանքային Thompson նմուշառումը գործում է խաղալիքների օրինակների հավաքածուում (տե՛ս այստեղ, եթե հետաքրքրված է), բայց դա դեռևս բաց հետազոտական ​​հարց է այն մասին, թե ինչպես կարելի է կարգավորել ամրապնդման մեջ չնկատված շփոթեցնողների խնդիրը: սովորել իրական կյանքի խնդիրների հետ առնչվելիս: