1. Մեծածավալ տվյալների վրա մոտավոր քանակական հաշվարկների հետազոտություն (Տեխնիկական հաշվետվություն) (arXiv)

Հեղինակ՝ Zhiwei Chen, Aoqian Zhang

Վերացական. Քանի որ տվյալների ծավալը մեծանում է, տվյալների պրոֆիլավորումն օգնում է հանել լայնածավալ տվյալների մետատվյալները: Այնուամենայնիվ, մետատվյալների մի տեսակ՝ պատվերի վիճակագրությունը, դժվար է հաշվարկել, քանի որ դրանք միաձուլվող կամ աճող չեն: Այսպիսով, ժամանակի և հիշողության տարածության սահմանափակումը չի ապահովում դրանց հաշվարկը լայնածավալ տվյալների վրա: Այս հոդվածում մենք կենտրոնանում ենք պատվերի վիճակագրության, քվանտիլների վրա և ներկայացնում ենք մոտավոր քանակական հաշվարկների վերաբերյալ ուսումնասիրությունների համապարփակ վերլուծություն: Ծածկված են ինչպես դետերմինիստական ​​ալգորիթմները, այնպես էլ պատահականացված ալգորիթմները, որոնք հաշվարկում են մոտավոր քվենտիլներ հոսքային մոդելների կամ բաշխված մոդելների վրա: Այնուհետև ներկայացված են տարբեր սցենարներում մոտավոր քվանտիլային ալգորիթմների արդյունավետությունն ու կատարումը բարելավելու բազմաթիվ մեթոդներ, ինչպիսիք են շեղված տվյալները և արագընթաց տվյալների հոսքերը: Ի վերջո, մենք ավարտում ենք տարբեր լեզուներով առկա փաթեթների լուսաբանումը և այս ոլորտում ապագա ուղղությունների համառոտ քննարկումը:

2. Տվյալների կենտրոնի հեռաչափության մոնիտորինգի մոտավոր քանակներ (arXiv)

Հեղինակ՝ Gangmuk Lim, Mohamed Hassan, Ze Jin, Stavros Volos, Myeongjae Jeon

Վերացական. Տվյալների կենտրոնների համակարգերը պահանջում են արդյունավետ խնդիրների վերացում և ռեսուրսների արդյունավետ պլանավորում, որպեսզի նվազագույնի հասցվեն խափանումները և արդյունավետ օգտագործվեն սահմանափակ ռեսուրսները: Դրանով տվյալների կենտրոնի օպերատորները օգտագործում են հոսքային վերլուծություն՝ տվյալների կենտրոնի հեռաչափությունը ժամանակավոր պատուհանի միջոցով հավաքելու և մշակելու համար: Քվանտիլային օպերատորը առանցքային է այս համակարգերի համար, քանի որ այն կարող է ամփոփել դիտարկվող համակարգի բնորոշ և աննորմալ վարքը: Իրական ժամանակում քվանտիլների հաշվարկումը ռեսուրսների ինտենսիվ է, քանի որ այն պահանջում է հարյուր միլիոնավոր իրադարձությունների մշակում վայրկյանների ընթացքում՝ միաժամանակ ապահովելով բարձր ճշգրտություն: Մենք հաղթահարում ենք այս մարտահրավերները իրական ժամանակի քվանտիլային հաշվարկում աշխատանքի ծանրաբեռնվածության վրա հիմնված մոտարկման միջոցով, որը դրդված է մեր ուսումնասիրության երեք պատկերացումներով. կշեռքները, և (iii) պոչի արժեքները գերակշռում են մեծ արժեքների փոքր հավաքածուով: Այսինքն՝ մենք առաջարկում ենք AOMG՝ արդյունավետ և ճշգրիտ քանակական մոտարկման ալգորիթմ, որը կապիտալիզացնում է այս պատկերացումները: AOMG-ը նվազագույնի է հասցնում քվանտիլ օպերատորի հիշողության հետքը՝ սեղմման և փոքր արժեքների հաճախականության վրա հիմնված ամփոփման միջոցով: Թեև այս ամփոփագրերը պահվում և մշակվում են ենթապատուհանների հատիկավորությամբ՝ հիշողության արդյունավետության համար, դրանք կարող են տարածվել մինչև օգտագործողի կողմից սահմանված ժամանակային պատուհանների քվանտիլների հաշվարկը: Ցածր արժեքի սխալը պոչի քվանտիլների համար ձեռք է բերվում՝ պահպանելով մի քանի պոչի արժեքներ մեկ ենթապատուհանում: AOMG-ը գնահատում է բարձր թողունակությամբ և 5%-ից պակաս հարաբերական արժեքի սխալով քվոտիլները օգտագործման լայն տիրույթում, մինչդեռ ժամանակակից ալգորիթմները կամ ունեն բարձր հարաբերական արժեքի սխալ (9.3–137.0%) կամ ավելի ցածր թողունակություն (15–։ 92%)