1. Ափսոսանքի վերլուծություն հիերարխիկ փորձագետների համար Ավազակային խնդիր (arXiv)

Հեղինակ՝ Qihan Guo, Siwei Wang, Jun Zhu

Վերացական. Մենք ուսումնասիրում ենք ստանդարտ ավազակային խնդրի ընդլայնումը, որտեղ կան փորձագետների R շերտեր: Բազմաշերտ փորձագետները շերտ առ շերտ ընտրություն են կատարում, և միայն վերջին շերտի փորձագետները կարող են զենք խաղալ: Ուսուցման քաղաքականության նպատակն է նվազագույնի հասցնել ընդհանուր ափսոսանքը այս հիերարխիկ փորձագետների միջավայրում: Մենք նախ վերլուծում ենք այն դեպքը, որ ընդհանուր ափսոսանքը գծային կերպով աճում է շերտերի քանակով: Այնուհետև մենք կենտրոնանում ենք այն դեպքի վրա, որ բոլոր փորձագետները խաղում են Վերին վստահության սահմանի (UCB) ռազմավարություն և տալիս են մի քանի ենթագծային վերին սահմաններ տարբեր հանգամանքների համար: Վերջապես, մենք նախագծում ենք մի քանի փորձեր՝ օգնելու ափսոսանքի վերլուծությանը հիերարխիկ UCB կառուցվածքի ընդհանուր դեպքի համար և ցույց տալու մեր տեսական արդյունքների գործնական նշանակությունը: Այս հոդվածը բազմաթիվ պատկերացումներ է տալիս ողջամիտ հիերարխիկ որոշումների կառուցվածքի մասին:

2. Առցանց երկաստիճան օպտիմիզացում. ափսոսանքի վերլուծություն առցանց այլընտրանքային գրադիենտ մեթոդների (arXiv)

Հեղինակ՝ Դավուդ Աթաի Տարզանաղ, Լաուրա Բալզանո

Համառոտ : Առցանց օպտիմիզացումը լավ հաստատված օպտիմալացման պարադիգմ է, որի նպատակն է կատարել ճիշտ որոշումների հաջորդականություն՝ հաշվի առնելով նախորդ որոշումների առաջադրանքների ճիշտ պատասխանի իմացությունը: Երկմակարդակ ծրագրավորումը ներառում է հիերարխիկ օպտիմալացման խնդիր, որտեղ այսպես կոչված արտաքին խնդրի իրագործելի շրջանը սահմանափակվում է ներքին խնդրի լուծումների հավաքածուի քարտեզագրման գրաֆիկով: Այս փաստաթուղթը միավորում է այս երկու գաղափարները և ուսումնասիրում առցանց երկմակարդակի օպտիմալացման պարամետրը, որում մեկը մյուսի հետևից բացահայտվում են ժամանակի փոփոխվող երկաստիճան խնդիրների հաջորդականությունը: Մենք տարածում ենք մեկ մակարդակի առցանց ալգորիթմների համար ափսոսանքի հայտնի սահմանները մինչև երկմակարդակ կարգավորում: Մասնավորապես, մենք ներմուծում ենք երկաստիճան ափսոսանքի նոր հասկացություններ, մշակում ենք առցանց փոփոխական ժամանակի միջինացված գրադիենտ մեթոդ, որն ի վիճակի է օգտագործել սահունությունը, և տրամադրում ենք ափսոսանքի սահմաններ ներքին և արտաքին մինիմալիզատորների հաջորդականությունների ուղու երկարության առումով: