Մեքենայի ուսուցումը փրկելու համար:

Փոքր և դանդաղ արտահոսքերը խորտակում են նավերը. համեմատաբար, դանդաղ և փոքր արտահոսքերը կարող են նաև զգալի կորուստներ առաջացնել ցանկացած բիզնեսի համար, եթե չհայտնաբերվեն և չշտկվեն վաղաժամ:

Հետաքրքիր են փոքր արտահոսքերը: Ենթադրենք, որ էլեկտրոնային առևտրի բիզնեսը վերջին օրվա ընթացքում տեսնում է գնումների 50%-ի անկում, որը կկանչվի ամբողջ ընկերությունը՝ գործադիր տնօրենից մինչև R&D, աջակցություն, որպեսզի հասկանանք, թե ինչու դա տեղի ունեցավ հնարավորինս արագ: Հիմա ենթադրենք, որ վերջին օրվա ընթացքում եկամուտների 1% անկում է նկատվել, ամենայն հավանականությամբ, ոչ ոք նույնիսկ չի նկատի: Բայց, եթե ամեն օր 1% անկում կա, ապա եկամուտը 50%-ով նվազելու համար կպահանջվի ընդամենը 2,5 ամիս։ Ո՞ր պահին այն կնկատվեր: Ընդամենը երկու շաբաթ անց եկամուտն արդեն կնվազի 13%-ով, իսկ մեկ ամիս հետո՝ 27%-ով: Եթե ​​բաց թողնվի կամ անտեսվի, ապա վնասը կարող է լինել նույնքան մեծ, որքան մեծ խափանումը:

Որո՞նք են բիզնեսի դանդաղ արտահոսքի որոշ օրինակներ:

  • Սխալ կարևոր բիզնես գործընթացում (օրինակ՝ վճարումներ կամ ցուցադրվող գովազդներ) որոշակի հարթակի և ՕՀ տարբերակի նոր թողարկումից հետո: Սկզբում քիչ օգտվողներ են տուժում, բայց քանի որ ավելի շատ օգտվողներ ներբեռնում են նոր տարբերակը, արտահոսքը դառնում է ջրհեղեղ:
  • Մարքեթինգային արշավի փոփոխությունը որոշակի հատվածի համար առաջացնում է փոխակերպման տոկոսադրույքի անկում՝ երկար ժամանակ աննկատ մնալով, ինչը հանգեցնում է առաջատարների/հաճախորդների կորստի:
  • Մրցակիցը բարելավեց իր գովազդի թիրախավորման ռազմավարությունը՝ շահելով ավելի շատ գովազդային հայտեր՝ առաջացնելով ձեր գովազդի դիտումների և փոխակերպումների աստիճանական անկում:
  • Կարևոր հատկանիշի UI/UX-ի շփոթեցնող փոփոխությունը հանգեցնում է գործառույթների օգտագործման դանդաղ և աստիճանական նվազեցման և դանդաղ աճի, քանի որ հիասթափված օգտվողները դադարում են օգտագործել արտադրանքը:
  • Ձեր բիզնեսի հաճախորդների աջակցության գրքույկի փոփոխությունը հանգեցնում է տոմսերի մշակման ժամանակի ավելացմանը՝ դանդաղորեն ավելացնելով աջակցության ծախսերը:
  • Եւ ավելին….

Ի՞նչ տեսք ունեն այս արտահոսքերը:

Վերը նշված յուրաքանչյուր օրինակի համար արտահոսքը պետք է տեսանելի լինի առնվազն մեկ KPI-ում (մետրիկ), որը չափվում է: Օրինակ, չափորոշիչները, որոնք չափում են գործառույթի օգտագործումը, վճարումների ավարտի թիվը կամ խափանումների տոկոսադրույքները, պետք է աստիճանական անկումներ կամ ավելացումներ ցույց տան: Այս արտահոսքերը սովորաբար դրսևորվում են որպես միտումների փոփոխություն չափումների մեջ՝ եկամուտներ, փոխարկման տոկոսադրույք և այլն:

Բայց երկու խնդիր կա այս դանդաղ արտահոսքերը հայտնաբերելու համար մինչև նավի խորտակվելը…

Նախ, բոլոր համապատասխան չափորոշիչների ձեռքով ստուգումը պարզապես իրագործելի չէ. կարող են լինել հազարավոր հետևելու համար, հատկապես, երբ յուրաքանչյուր KPI-ն չափվում է տարբեր հատվածներում. Սարքի տեսակները և այլն: Դանդաղ արտահոսքը կարող է առաջանալ դրանցից որևէ մեկում և կարող է ընդհանրապես չցուցաբերվել ընդհանուր մակարդակում:

Երկրորդ, դանդաղ արտահոսքերը կարող են դժվար լինել գծապատկերում նկատել, եթե չնայեք բավականաչափ մեծ ժամանակային պատուհանին և ժամանակային սանդղակին (համախմբման մակարդակը՝ ժամային, օրական և այլն): Բայց ինչն է բավականաչափ մեծ: Օր? Շաբաթ? Մեկ ամիս? Ո՞րն է ճիշտ ժամանակացույցը:

Եկեք քննենք երկուսը բջջային հավելվածի օրինակով: Ստորև բերված գրաֆիկը ներկայացնում է բջջային հավելվածի խափանումների ընդհանուր թիվը՝ չափված բոլոր օգտատերերի համար (բոլոր աշխարհագրությունները, հարթակները և հավելվածի տարբերակները).

Կա «վթարների» ամենօրյա հստակ օրինաչափություն, սակայն վթարների ընդհանուր թվի միտումի տեսանելի փոփոխություն չկա:

Այնուամենայնիվ, որոշակի տարբերակ օգտագործող iOS-ի վրա հիմնված սարքերում խափանումների քանակի աստիճանական աճ է գրանցվել: iOS-ի խափանումների չափման և խնդրահարույց տարբերակի ժամային սանդղակով դիտելիս, դժվար է նկատել փոփոխությունը առաջին օրը, երբ այն սկսեց աճել.

Թեև վթարների թիվն ավելացել է, եթե այս գրաֆիկի վրա նայենք ցուցատախտակին, ժամային ժամանակի սանդղակով, արտահոսքը կմնա աննկատ, մինչև այն շատ ավելի մեծանա:

Այսպիսով, ինչպե՞ս կարող ենք արագ հայտնաբերել դանդաղ արտահոսքը (վթարների աճը) այս դեպքում: Եկեք փոխենք ժամանակի սանդղակը. եկեք նայենք վթարների թվի օրական համախմբմանը.

Յուրաքանչյուր տվյալների կետով, որը ներկայացնում է օրական վթարների ընդհանուր թիվը, ավելի հեշտ է տեսնել, որ օգոստոսի 4-ն ավելի բարձր է թվում, քան նախկինում, և կա պոտենցիալ միտումի փոփոխություն:

Այս երկու մարտահրավերներն էլ ցույց են տալիս, որ արտահոսքի ձեռքով հայտնաբերումը զգալի ջանքեր կպահանջի վերլուծաբանների բանակի կողմից, որոնք պետք է անընդհատ շրջանառեն առնվազն հազարավոր գծապատկերներ, դիտեն դրանք մի քանի ժամանակային մասշտաբներով և հույս ունենան բացահայտելու նման դեպքերը: Եվ նույնիսկ այդ դեպքում. արդյոք այդքան ակնհայտ է, որ վթարների ավելի մեծ թվերը նշանակալի աճ են ներկայացնում:

Կա ավելի լավ լուծում՝ մեքենայական ուսուցման վրա հիմնված, բազմամասշտաբ անոմալիաների հայտնաբերում:

Բազմամասշտաբ անոմալիաների հայտնաբերում

Անոմալիաների հայտնաբերումը ժամանակային շարքերի համար ներառում է ժամանակային շարքի նորմալ վարքագծի ուսուցում և դրանցից զգալի շեղումների հայտնաբերում որպես անոմալիաներ:

Ստորև բերված նկարը ցույց է տալիս ժամանակային շարքը, որը չափում է նիստերի քանակը, և երկու անոմալիաներ, որոնք ցույց են տալիս անկում՝ համեմատած նորմալ օրինակի հետ.

Մեր Անոմալիաների հայտնաբերման համակարգի կառուցման վերջնական ուղեցույցում, մենք նկարագրել ենք անոմալիաների հայտնաբերման ամուր և լայնածավալ համակարգի ստեղծումը:

Ենթադրելով, որ ձեռքի տակ կա անոմալիաների հայտնաբերման ծրագրակազմ, մենք կարող ենք այն կիրառել յուրաքանչյուր չափման համար, որը մենք հավաքում ենք մի քանի ժամանակի սանդղակով, օրինակ՝ յուրաքանչյուր րոպեի, ժամի, օրվա և նույնիսկ շաբաթվա խափանումների քանակը:

Եկեք նայենք դրան վերը նշված հավելվածի խափանման օրինակի համար:

Ժամային հատիկավորության դեպքում վթարների աճը բավականաչափ չի ավելանում ժամային նորմալ միջակայքից (ստվերված տարածք).

Ամենօրյա մակարդակում պատկերը շատ տարբեր է։ Վթարների թիվը ակնհայտորեն գերազանցում է նորմալ միջակայքը՝ դա գրանցելով որպես անոմալիա.

Եվ եթե անտեսվի, այս միջադեպը մեծանում է, և արտահոսքը սկսում է ջրհեղեղ դառնալ.

Այս դեպքում խափանումների աճը հայտնաբերվել է միևնույն չափման (iOS սարքերի և հավելվածի մեկ տարբերակի խափանումների թիվը) ավտոմատ կերպով վերլուծելով մի քանի ժամանակային մասշտաբներով, թեև արտահոսքը դանդաղ էր ժամային ժամանակային մասշտաբով և չէր առաջացնում: Եթե ​​ցանկացած ժամ անոմալիա լինի, այն դրսևորվեց որպես զգալի անոմալիա ամենօրյա ժամանակային մասշտաբով, ինչը հնարավորություն է տալիս վաղ հայտնաբերել:

Արդյո՞ք անհրաժեշտ է բազմամասշտաբ վերլուծություն: Հարմարվողականության/հայտնաբերման փոխզիջում

Մենք կարող էինք վիճել, որ եթե մեկ օր սպասեինք, արտահոսքը կհայտնվեր ժամային ժամանակացույցով: Այնուամենայնիվ, այն երբեք չի հայտնաբերվի ժամային ժամանակացույցով: Անոմալիաների հայտնաբերման համար ժամանակային շարքերի մոդելավորման բոլոր հայտնի մեթոդները (ARIMA-ից, Holt-Winters-ից, LSTM-ներից և այլն), գնահատում են միտումները որպես նորմալ վարքագիծ սովորելու գործընթացի մաս և պետք է հարմարեցվեն ժամանակային շարքի վարքագծի փոքր փոփոխություններին: Հարմարվողականությունը չափազանց կարևոր է բիզնեսը չափելիս, քանի որ ոչինչ ստատիկ չէ: Սա նշանակում է, որ եթե արտահոսքն ավելի դանդաղ է՝ համեմատած ուսուցման ալգորիթմի հարմարվողականության արագության հետ, ապա ալգորիթմը մշտապես հետևելու է արտահոսքին՝ որպես վարքագծի նորմալ փոփոխություն:

Ստորև բերված նկարը ցույց է տալիս, թե ինչպես է նորմալ վարքագծի ալգորիթմը հարմարվում նստաշրջանների քանակի մետրային չափման դանդաղ նվազման միտումին.

Ամենօրյա մակարդակում նույն չափումը գրանցում է անոմալիա, երբ միտումը փոխվում է, ինչը հնարավորություն է տալիս հայտնաբերել միտումի փոփոխությունը:

Ամփոփելու համար, դանդաղ արտահոսքի հայտնաբերումը ձեռքով գրեթե անհնար է: Անոմալիաների հայտնաբերման ալգորիթմները լավ են համապատասխանում ժամանակային շարքի նորմալ վարքագծի հայտնաբերված փոփոխություններին, բայց քանի որ դանդաղ արտահոսքերը դեռ կարող են «թաքնվել» աղմուկի և այս ալգորիթմների կողմից հարմարվելու անհրաժեշտության տակ, բազմամասշտաբ մոտեցումն ապահովում է դանդաղ արտահոսքի հայտնաբերումը: