Ինչ, ինչպես և ինչու կառուցել մեքենայական ուսուցման բացատրելի ալգորիթմ՝ բաժնետոմսերի հավաքման արդյունքներով

Ինչու՞ անհանգստանալ:

Մի քանի տարի առաջ ես սկսեցի սովորել Python և R՝ նպատակ ունենալով սովորել, թե ինչպես կիրառել դրանց օպտիմալացումը, վիճակագրությունը, տվյալների գիտությունը, մեքենայական ուսուցումը և տվյալների վիզուալիզացիայի փաթեթներն ու գրադարանները:

Ես նաև գնեցի ֆոնդային շուկայի տվյալներ (ձիարշավի տվյալները հասանելի չէին) այն մտքով, որ ես կփորձարկեմ տարբեր մոդելներ՝ նկատի ունենալով մի քանի նպատակ.

  1. Իմացեք, թե ինչպես է աշխատում մոդելը
  2. Սովորեք Python և R
  3. Բացահայտեք այն բաժնետոմսերը, որոնք կարող են լինել լավ ներդրումային թեկնածուներ

Ես ունեմ Գործառնությունների հետազոտություն (նշանակային վերլուծություն ցանկացած տվյալների գիտնականների համար, ովքեր կարդում են սա) նախապատմություն և շատ մոդելավորում եմ կատարել PL1, Fortran և Fortran վիճակագրական և օպտիմալացման գրադարաններում, C և SAS-ում տարբեր ոլորտներում՝ բիզնեսի մի շարք խնդիրներ լուծելու համար: Այսպիսով, (1) և (2) նպատակներն այնքան էլ դժվար չէին հասնել:

Ներդրումներ կատարելու համար բաժնետոմսերի նույնականացումը շատ դժվար էր իմ փորձած բոլոր ալգորիթմների համար: Այսպիսով, դա պատճառ 1 է:

Մաքսային ML ալգորիթմի մշակման պատճառները ներառում են՝

Պատճառ 1.Հասանելի ծրագրաշարով մոդելավորելու բարդ խնդրի լուծում տալ:

Պատճառ 2.Եթե ես պատրաստվում եմ ներդնել իմ գումարը, խաղալ խաղի մեջ, ես ուզում եմ հասկանալ, թե ինչու է մոդելն ընտրում որոշակի բաժնետոմս որպես ներդրումային թեկնածու, և ոչ թե մեկ ուրիշը: Հատկանիշների ո՞ր համակցությունն է որոշում կայացնում:

Պատճառ 3.Եթե ալգորիթմն աշխատում է, և ես ուզում եմ այն ​​կիրառել մեկ այլ խնդրի վրա, երբ կարող եմ այն ​​բացատրել վերջնական օգտագործողին, կարող է արագացնել դրա ընդունումը և նվազեցնել ծախսերը: Մոդելի մշակման ծախսերը ներառում են ոչ միայն տվյալների մշակման և մոդելի կշիռների գնահատման, գործառույթի օպտիմալացման կամ ռազմավարությունների մոդելավորման ծախսած ժամանակը: Դրանք ներառում են նաև փորձարկում, մոնիտորինգ և վերջնական օգտագործողի փոփոխություն: Փոփոխությունները և ի՞նչ, եթե հարցերը կարող են ներառել տվյալներ ներկայումս օգտագործվող, նախընտրելի կամ ավելի ինտուիտիվ միջակայքերի մեջ, կամ նույնիսկ մոդելից որևէ հատկանիշ կամ որոշման փոփոխական ավելացնել կամ հեռացնել:

Պատճառ 4.Սեփական մեքենայական ուսուցման ալգորիթմի ստեղծման միջոցով հեշտ է փոփոխել բաղադրիչներն ու առանձնահատկությունները, քանի որ դուք ինքներդ եք գրել կոդը:

Պատճառ 5.Հերթական անգամ կարդալուց հետո, որ «Մեքենայական ուսուցման մոդելները օգտակար չեն X արդյունաբերության մեջ, քանի որ դրանք բացակայում են թափանցիկությունից», ես որոշեցի տեսնել, թե արդյոք կարող եմ ստեղծել «թափանցիկ մեքենայական ուսուցման մոդել»: Ինձ դուր է գալիս ամեն ինչ պարզելու փորձը:

Պատճառ 6.Ես սիրում եմ կոդավորել:

Ի՞նչ կառուցել:

Երբ ես մտածեցի այս մասին, ես որոշեցի թիրախավորել ամենադյուրին հասկանալի օգտակար մոդելը՝ հաշվարկային քարտը:

Հաշիվների քարտեր

Վարկանիշային քարտերը նրանց համար, ովքեր ծանոթ չեն դրանց, օգտագործվում են հայտատուին վարկ տրամադրելու կամ չտրամադրելու վերաբերյալ որոշումներ կայացնելիս: Նրանք դասակարգում են դեֆոլտի ռիսկը. ավելի բարձր միավորներն ավելի քիչ ռիսկային են, քան ցածրերը և կարող են չափորոշվել ըստ հավանականությունների կամ հավանականությունների:

Արդյունքների ստեղծման գործընթացը կարող է ներառել.

(1) Շարունակական փոփոխականների (հատկանիշների) միացում 0/1 մուտքերի մի շարքի մեջ:

(2) Գնահատելով կանխատեսող հզորությունը՝ օգտագործելով որոշ չափումներ՝ սովորաբար տեղեկատվական արժեքներ, երբեմն դրույքաչափեր:

(3) Ընտրելով այն հատկանիշները, որոնք կօգտագործվեն մոդելը գնահատելու համար: Սա կարող է ավտոմատացված լինել կամ կատարել մոդելավորողը:

(4) Մոդելի կշիռների գնահատում` օգտագործելով գծային ռեգրեսիա, լոգիստիկ ռեգրեսիա կամ մաթեմատիկական ծրագրավորում:

(5) Կշռադատեք կամ չափորոշեք միավորը լավ/վատ հավանականությունների կամ հավանականությունների՝ կշիռների չափով մինչև ամբողջ թվեր:

(6) Գնահատեք տվյալները՝ յուրաքանչյուր դիտարկման համար կշիռները (այժմ ամբողջ միավորները) գումարելով: Վարկերի գնահատման մեջ առանձնահատկությունները սովորաբար կոչվում են բնութագրեր, իսկ հատկանիշի աղբարկղը հատկանիշ է: Յուրաքանչյուր հատկանիշ ընկնում է միայն 1 հատկանիշի աղբարկղում, այնպես որ գնահատումը կամ աղյուսակի որոնում և գումար է կամ մատրիցային բազմապատկում:

Երբ մոդելը գնահատվում է, այն ներկայացվում է վերջնական օգտագործողներին, ովքեր սովորաբար ցանկանում են, որ այլ հնարավորություններ օգտագործվեն որպես կանխատեսողներ կամ մոդելի առանձնահատկություններ, որոնք ավելի ինտուիտիվ, հաճելի կամ բիզնես նպատակներին համահունչ են (օրինակ՝ թիրախավորելով որոշակի հատվածի բնակչությունը): Դա կրկնվող գործընթաց է, որը կարող է ավելի հեշտ լինել, քանի որ հեշտ է հասկանալ, թե ինչպես է աշխատում մոդելը:

Ինչո՞ւ անհանգստանալ

Մանրամասն պատասխան տալու համար մենք գնում ենք վազքուղի և հարցնում ենք, արդյոք որոշ ձիարշավի խաղադրույք կատարողներն ավելի խելացի են, քան բանկիրները:

Մարդիկ, ովքեր խաղադրույք են կատարում ձիարշավների վրա, կարող են հաշվի առնել հետևյալ գործոնները.

  • Ձիերի հաղթանակների քանակը
  • Ձիերի արագության վարկանիշ
  • Ջոկեյի պատմական ներկայացում
  • Մրցավազքի տեսակը
  • Մրցավազքի հեռավորությունը
  • Ձիերի թիվը մրցավազքում
  • Վճարման հավանականություն
  • և այլն:

Մոդելի հնարավոր առանձնահատկությունները, ինչպիսիք են նրանք, որոնք կարող են օգտագործվել բանկի վարկային ռիսկի մոդելում կամ բաժնետոմսերի ընտրության մոդելում:

Բանկերը սովորաբար ուղղակիորեն չեն օպտիմալացնում եկամուտները: Վճարման հավանականությունը չի մտնում գնահատման քարտի մեջ, այլ գնահատվում է երկրորդ քայլում, հաճախ գծային ռեգրեսիայով՝ տրված դեֆոլտի կորստի դեպքում: Սա, չնայած այն հանգամանքին, որ որոշ հաճախորդներ, որոնք դեֆոլտի մեջ են մտնում, շահութաբեր են. նրանք դեֆոլտի մեջ են մտնում իրենց վարկի մեծ մասը մարելուց հետո, իսկ որոշ հաշիվներ, որոնք դեֆոլտ չեն անում, շահութաբեր չեն. նրանք նախապես մարում են իրենց վարկը կամ վարկը: սկզբնականացման և մշակման ծախսերը ծածկված են:

Ձիարշավի բարդ խաղադրույք կատարողները օգտագործում են Քելլիի չափանիշը` որոշելու իրենց հասանելի միջոցների օպտիմալ մասը մրցավազքի վրա խաղադրույք կատարելու համար:

kelly մասնաբաժինը խաղադրույք = p մինուս (1-p) * կորուստ / շահույթ

որտեղ p-ը շահելու հավանականությունն է, իսկ կորստի/շահույթը` հատուցման հավանականության փոխադարձությունը:

Այսպիսով, ի տարբերություն բանկիրների, բարդ մրցարշավային խաղադրույք կատարողները ունեն վնաս և շահույթ, երբ նրանք խաղադրույք են կատարում, և այդ հարաբերակցությունը ներառված է յուրաքանչյուր խաղադրույքի համար իրենց որոշման մեջ:

Ինչո՞ւ անհանգստացնել հարցի պատասխանը

Եթե ​​մենք գնահատեինք գնահատականների կշիռները միայն հավանականության գնահատականներ ստանալու կամ դիտումները դասակարգելու համար, մենք հեշտությամբ կարող էինք դա անել՝ օգտագործելով բացատրելի մոդել (լոգիստիկ ռեգրեսիա կամ գծային ծրագրավորում և այլն), կամ ավելի դժվար բացատրելի մոդել (նյարդային ցանց, պատահական անտառ և այլն):

Այս բոլոր մոդելները կիսում են մեկ բան.

Նրանք կանխատեսումներ են անում ողջ բնակչության համար: Նրանց օբյեկտիվ գործառույթը նպատակաուղղված չէ վերջնական նպատակին

Թեկնածու բաժնետոմսերի ընտրության դեպքում ներդրումներ կատարելու համար այն, ինչ մենք հետևում ենք, N բաժնետոմսերի ցանկ է, որը պետք է դիտարկել ամեն շաբաթ ներդրումների համար և ուսումնասիրել՝ հիմնվելով նրանց ակնկալվող եկամտի վրա, որը կապված է Քելի չափանիշի հետ:

Գոյություն ունի ֆոնդային բնակչության մեծամասնությունը, որի մասին մեզ ընդհանրապես չի հետաքրքրում։ Ուրեմն ինչու՞ են նրանք ընդհանրապես դիտարկել մոդելի կորստի գործառույթում:

Մենք կարող ենք մոդելը կառուցել այնպես, որ այն հաշվարկի միավոր, որը առավելագույնի է հասցնում կամ նվազագույնի է հասցնում դիտարկվող դեպքերի քանակը՝ ելնելով դրանց շահույթից և վնասից և ոչ միայն հաջողության հավանականությունից:

Սա հատկապես կարևոր է բաժնետոմսերը դիտարկելիս, քանի որ ամենաբարձր եկամտաբերությամբ բաժնետոմսերը կարող են շատ նման լինել այն բաժնետոմսերին, որտեղ ներդրումները հանգեցրել են աղետի:

Մենք կցանկանայինք ունենալ մի ալգորիթմ, որը փոխանցում է բարձր եկամտաբեր բաժնետոմսերը, որոնց կանխատեսման առանձնահատկությունների պրոֆիլը ներառում է նաև ավելի բարձր ռիսկային բաժնետոմսեր, և մենք կցանկանայինք, որ դա արվի 1 միավորով՝ 2 մոդելի փոխարեն:

Ինչպե՞ս

Ես չկարողացա գտնել այս խնդիրը լուծող ալգորիթմի նկարչություն թվերով (հիանալի երաժշտական ​​միջանկյալ հղումով), որտեղ մենք ցանկանում ենք ստեղծել միավոր, որը նույնականացնում է դիտարկումների միայն ենթաբազմությունը և ցանկանում ենք օպտիմալացնել այդ ընտրությունը ավելի բարձր ցուցանիշներով: միավորներ.

ԿԱՐԳԱՎՈՐՄԱՆ ՔԱՅԼԵՐ.

Քայլ 1.Սահմանել նպատակային ֆունկցիան: Պաշարների հավաքման դեպքում դա արվել է վերևում: Մասնավորապես, մենք ցանկանում ենք ամեն շաբաթ առաջացնել 10 բաժնետոմս, որոնք ունեն ամենաբարձր ակնկալվող եկամտաբերությունը:

Քայլ 2.Հաշվարկեք յուրաքանչյուր բաժնետոմսի արդյունավետությունը մոդելի մշակման նմուշում:

Քայլ 3.Մոդելի մշակման նմուշից ընտրեք բոլոր հնարավոր կանխատեսող հատկանիշները:

Քայլ 4.Տվյալները բաժանեք մոդելի, վավերացման, փորձարկման և կանխատեսման (ժամկետանց) հատվածների: Ստեղծեք ինդեքսային զանգված կամ ցուցակ, որը յուրաքանչյուր դիտարկումը քարտեզագրում է իր հատվածին:

Քայլ 5.Օգտագործելով մոդելի տվյալները, զետեղեք յուրաքանչյուր հատկանիշ՝ տեղադրելով բաց թողնված արժեքները իրենց սեփական աղբարկղում: Հատկանիշի համար հաշվարկեք դրա փոխադարձ տեղեկատվական արժեքը՝ օգտագործելով 2-րդ քայլի կատարողականի սահմանումը: Ցանկության դեպքում կարող են օգտագործվել այլ չափումներ: Աղբամանները պետք է ունենան դիտումների որոշ նվազագույն քանակ կամ դիտումների նվազագույն տոկոս: Ամրագրման գործընթացը սովորաբար այնքան կարևոր չէ, որքան ենթադրվում է, քանի որ օպտիմալացումը դեռ լավ կաշխատի շատ կոպիտ / լայն ինտերվալներով:

Քայլ 6.Հիմք ընդունելով Քայլ 5-ի արդյունքները, ընտրեք մի շարք առանձնահատկություններ, որոնք կմտնեն մոդելի մեջ՝ թողնելով ցածր տեղեկատվական արժեքներ կամ կանխատեսող հզորության այլ չափումներ:

Քայլ 7.Կառուցեք X մատրիցը 1 սյունակով յուրաքանչյուր աղբարկղի համար Քայլ 5-ից հետո, երբ հատկանիշներն ընտրել են: Սյունակը պարունակում է 0, եթե դիտարկումը աղբարկղում չէ, և 1, եթե այն կա: Սա մեծապես կբարձրացնի X մատրիցայի չափը, ինչը ևս մեկ պատճառ է որևէ հատկանիշի համար շատ աղբարկղեր չստեղծելու համար: Բոլոր հատվածները պետք է լինեն X մատրիցայում, յուրաքանչյուր դիտարկման համար 1 տող:

ՍՈՎՈՐՈՒՄ

Վերջապես հասնում ենք ուսումնական մասին։ Սա այն վայրն է, որտեղ դուք իսկապես կարող եք ստեղծագործական ձեռք բերել և փորձարկել գաղափարները:

Իմ կիրառած մոտեցումը փոփոխված էվոլյուցիոն ալգորիթմի ներդրումն է: Կան մի քանիսը, որոնցից կարող եք ընտրել և հարմարեցնել ցանկացած հարմարվողականությամբ, որը ցանկանում եք փորձարկել:

Հիմնական գաղափարն այստեղ կրկնել հետևյալ քայլերը.

(1) ստեղծել հնարավոր լուծում (այս դեպքում գնահատականների կշիռների ամբողջություն):

(2) գնահատել տվյալները՝ օգտագործելով X մատրիցը և կշիռները

(3) գնահատել լուծումը (այս դեպքում հաշվարկել ակնկալվող եկամուտները բաժնետոմսերի քանակից, որոնք պետք է ընտրել ամեն շաբաթ ամենաբարձր միավորներով)

(4) որոշել, թե արդյոք և/կամ ինչպես հիշել լավ լուծումները և մոռանալ ավելի աղքատները

(5) ուսումնասիրել հիշողությունից լավ լուծումների հավաքածուների հիման վրա

(6) հաճախ շարժվել դեպի ավելի լավ լուծումներ: Սա բարդանում է նրանով, որ օպտիմալացման ֆունկցիայի մեջ կա if դրույթ, երբ ընտրվում են ամենաբարձր N գնահատման դիտարկումները: Այն իրականացվում է հիշողության մեջ լուծումները գնահատելու և որոնման տարածքը կարգավորելու միջոցով ուսումնասիրելու կամ մերձեցման ոլորտները որոշելով:

Հասանելի մոտեցումները, որոնք կարող են փորձարկվել, ներառում են՝

  • գենետիկական ալգորիթմներ
  • մասնիկների հոտի օպտիմիզացում
  • Բայեսյան օպտիմալացում
  • պատահական որոնում
  • տաբու որոնում
  • այլ հարմարեցված մոտեցում՝ հիմնված վերը նշվածի մասերի կամ այլ բանի վրա

Այլ մոդելների բաղադրիչներ, որոնք կարող են ներառվել ալգորիթմի մեջ.

  • կանոնավորացում
  • սահմանափակումներ
  • խմբաքանակի նորմալացում
  • հրաժարվել կամ վերջնական մոդելի այլ առանձնահատկությունների ընտրություն
  • ուսուցման տեմպերը և/կամ թափը

Հիպերպարամետրեր

Կան մի քանի հիպերպարամետրեր, որոնք պետք է սահմանվեն.

  • յուրաքանչյուր հատկանիշի համար աղբամանների քանակը կարող է լինել նույն թիվը բոլորի համար կամ տարբեր լինել յուրաքանչյուրի համար
  • աղբարկղում դիտումների նվազագույն քանակը
  • եթե և՛ L1, և՛ L2 կանոնավորացումն օգտագործվում է յուրաքանչյուրի քաշը
  • կատարվող կրկնությունների առավելագույն քանակը
  • կրկնությունների առավելագույն քանակը՝ առանց բարելավման
  • սովորողի հիշողության մեջ պահելու առավելագույն թվով դիտարկումներ
  • այլ պարամետրեր, որոնք պահանջվում են ցանկացած օպտիմալացումով

Անսամբլներ

Եթե ​​ցանկալի է մոդելների լուծումների համախումբ, այն հեշտությամբ կարող է ստեղծվել հիշողության մեջ առկա մոդելային լուծումներից, երբ ալգորիթմն ավարտվի:

Պաշարների ընտրության արդյունքները

Ոլորտ՝ Տեխնոլոգիա

Սեգմենտ. Բարձր անկայունություն

Կատարման հորիզոնը՝ 4 շաբաթ

Դիտարկման ժամկետը՝ 52 շաբաթ

Մոդելի առանձնահատկությունների քանակը՝ 30

X մատրիցում սյունակների քանակը՝ 134

Բաժնետոմսերի եզակի ցուցիչների քանակը՝ 535

Սահմանափակում:

  • տարվա ընթացքում ընտրված եզակի բաժնետոմսերի նվազագույն թիվը = 40
  • սա կիրառվում է, որպեսզի ալգորիթմը չսովորի որոշակի պաշար ընտրել

Ուսուցման մոդել. պարզ հավանականական որոնում ուսուցման թարմացումով յուրաքանչյուր 100 կրկնություն

Առավելագույն կրկնությունները՝ 400

Անսամբլ:

  • Ստեղծվել է 10000 տարբեր մոդել
  • յուրաքանչյուր մոդելի ընտրությունը որոշվում է բաժնետոմսերի բոլոր շաբաթների ընթացքում մոդելի գնահատականների 90%-ի սահմաններում՝ 0/1 միավոր բաժնետոմսերի շաբաթվա մակարդակում:
  • միավոր բաժնետոմսերի շաբաթվա մակարդակում = մոդելի միավորների գումարը / 10

Հաշվետու քարտի մասնակի նմուշ

Նմուշի առանձնահատկությունների միավորների և 2 հատկանիշների սկզբնական արժեքները ներկայացված են ստորև: Այստեղ կտրվածքը աղբամանի հատակն է, որտեղ առաջին աղբարկղը վերջին եռամսյակի ընթացքում բաժնետոմսի կատարողականի բոլոր արժեքներն է -31,54%-ից ցածր, վերջինը՝ 48,58%-ից բարձր, իսկ բացակայող արժեքները ստանում են 0 միավոր:

Մենք հեշտությամբ կարող ենք հասկանալ, որ մոդելին դուր են գալիս բաժնետոմսերը, որոնք վերջին եռամսյակում շատ էժանացել են (նրանք ստանում են 19 միավոր), և նրանք, որոնք վերջին շաբաթվա ընթացքում թանկացել են ավելի քան 1,66%-ով: Այն իսկապես պարգևատրում է այն հաշիվներին, որոնք վերջին շաբաթվա ընթացքում բարձրացել են ավելի քան 11,61%՝ տալով նրանց 47 միավոր, մինչդեռ այն լրջորեն պատժում է նրանց, ովքեր անկում են ապրում ավելի քան 5,93%:

Բոլոր 30 հատկանիշներն ունեն աղյուսակի 2-ի նման միավորներ, քանի որ ցուցադրված գնահատականը միավորների համույթի միջին միավորն է:

Performance (Quarter) 

        cut    points
     ------    ------
       -inf        19     0.38
     -31.54        -8    -0.13
     -12.02         0     0.01
      48.58         7     0.12
        nan         0     0.00

 Performance (Week) 

        cut    points
     ------    ------
       -inf       -56    -0.71
      -5.93        -6    -0.22
       1.66        27     0.43
      11.61        47     1.11

Հողամասեր

Այս սյուժեն ցույց է տալիս համակցված ակնկալվող եկամտաբերությունը և հավանականությունը, որ բաժնետոմսերի գինը բարձրանում է տարբեր հիմնականում 50 միավորով միավորված միավորների միջակայքերում: Անսամբլային մոտեցումը հանգեցրեց հետևյալ միավորների բաշխմանը.

Դիտարկումների 42%-ն ունեցել է 0 միավոր։

24%-ն ունեցել է 1-ից 25 միավոր:

Այնուհետև գնահատականներից յուրաքանչյուրում դիտումների քանակը նվազում է մինչև այն կետը, երբ 450–499 միջակայքը վերջին տիրույթն է՝ բաժնետոմսերի շաբաթվա դիտարկումների առնվազն 1%-ով:

Վերջապես 950–999 միավորների միջակայքն ունի այդքան բարձր գնահատական ​​ունեցող դիտարկումների միայն 0,45%-ը:

Հետաքրքիր է տեսնել, որ մոդելը, երբ աշխատում էր հավանականության արտադրյալի վրա, գինը բարձրանում է * տոկոս գինը բարձրանում է, հանած հավանականության գինը իջնում ​​է * տոկոս գինը իջնում ​​է, դեռևս ունի գրեթե միապաղաղ աճող հավանականություն (վերև) միավորների միջակայքում, մինչդեռ շահույթի և կորստի միջև բացը տարածելը.

Սպասվող կորստի և շահույթի ինդեքսավորումը հաշվարկվում է դույլի միջին կորուստը և շահույթը բաժանելով բոլոր դույլերի առավելագույն շահույթի վրա, որպեսզի հեշտ լինի գծագրել նույն գրաֆիկի վրա:

Եկամուտների սյուժեն ընդդեմ COUP-ի՝ ամենաբարձր վարկանիշ ունեցող բաժնետոմսի միավորների:

Միավորները տարբեր միավորների դիտարկումներն են 120-րդ շաբաթվա լավագույն 10 բաժնետոմսերի համար 52 շաբաթվա մոդելի մշակման նմուշի ընթացքում:

Կարելի է տեսնել, որ երբ միավորները բարձրանում են, տատանումները և ռիսկը վերադարձի բաշխման մեջ (y առանցք) նվազում է: Նկատի ունեցեք նաև, որ թոփ 10-ից ամենաբարձր եկամուտը եղել է 0 միավորի միջակայքում. անսամբլի մոդելներից և ոչ մեկն այն չի ընտրել, քանի որ այն շատ նման է ավելի ռիսկային ֆոնդային շաբաթվա պրոֆիլներին: Հիմնականում 0 միավորը կունենա ակնկալվող արժեք ‹ բնակչության ակնկալվող արժեքը, քանի որ և՛ հավանականությունը, և՛ շահույթը դեպի կորուստ հարաբերակցությունը բարձրանում են միավորների միջակայքում:

Ուղղահայաց սև գիծը ցույց է տալիս COUP-ի միավորը ընթացիկ շաբաթվա ընթացքում, երբ մոդելը գործարկվել է:

Մոդելի արդյունքները կարող են օգտագործվել առանձին դիտարկումների թիրախները գնահատելու համար՝ արդյունքները աղյուսակավորելով միջակայքում: Թիրախից հետո առաջին թիվն այն ակնկալիքն է, եթե 4 շաբաթվա վերջում ՀԵՂԱՓՈԽՈՒԹՅՈՒՆԸ իջնի գնի, երկրորդը, եթե այն բարձրանա և հավանականությունը, որ ՀԵՂԱՓՈԽՈՒԹՅՈՒՆԸ կբարձրանա:

Եզրակացություններ.

Մեքենայական ուսուցումը կարող է ներառվել ճկուն, պարզ հասկանալի մոդելի մեջ, այն է՝ ամբողջ թվով գնահատված գնահատականի քարտում:

Դա թույլ է տալիս մոդելավորողին տրամադրել ավելի կիրառելի լուծում՝ ուղղակիորեն հաշվարկելով արդյունքները: Անհրաժեշտ չէ գնահատել դասակարգման հավանականությունները, դասակարգել դրանք, ապա հաշվարկել երկրորդ մոդելը՝ որոշակի դիտարկման ազդեցության մեծությունը ստանալու համար:

Կան բազմաթիվ տարբերակներ, որոնք վերաբերում են այն բաղադրիչներին, լուծման ընթացակարգերին և կանոնակարգմանը:

Այդքան հակվածների համար ստեղծագործ լինելու հնարավորությունը բաց է։

Նման մոդելը կարող է օգտագործվել հետևյալի համար.

  • բացահայտել ներդրումների, ֆոնդային շուկայի և այլ հնարավորություններ:
  • բացահայտել գործարքների մի շարք, որոնք ունեն խարդախությունից ակնկալվող ամենաբարձր կորուստը՝ մեկ օրվա ընթացքում հետաքննվող գործարքների քանակի գործառնական սահմանափակումների շրջանակներում:
  • ստեղծեք հայտերի միավորներ, որոնք հաշվի են առնում ֆինանսական եկամուտները, սահմանափակումներ են դնում այն ​​հայտերի տոկոսի կամ քանակի վրա, որոնք նպատակաուղղված են ընդունելու:
  • բացահայտել N հաշիվների մի հատված, որոնք ավելի վատ են աշխատում, քան ակնկալվում էր գնահատականով՝ նվազագույնի հասցնելով ապագայում այս պրոֆիլով դիմումները մերժելու հետևանքով եկամտի կորուստը:

ՀԱՐՑԵՐ ԵՎ ԱՌԱՋԱՐԿՆԵՐ

Եթե ​​ունեք հարցեր, առաջարկություններ կամ խնդիրներ, որտեղ կցանկանայիք տեսնել նման ML մոդելի արդյունքները, խնդրում եմ ազատ զգալ ինձ էլ.

[email protected].

Ես նաև հուսով եմ, որ կթարմացնեմ մոդելների ընտրանքները և վերահսկելու արդյունքները minor3.com-ի էջում, եթե դուք հետաքրքրված եք: