Աշխատանք ափսոսանքի վերլուծության մաս 5 (մեքենայական ուսուցում)

Ափսոսանքի վերլուծություն հիերարխիկ փորձագետների համար Ավազակային խնդիր (arXiv)

Վերացական. Մենք ուսումնասիրում ենք ստանդարտ ավազակային խնդրի ընդլայնումը, որտեղ կան փորձագետների R շերտեր: Բազմաշերտ փորձագետները շերտ առ շերտ ընտրություն են կատարում, և միայն վերջին շերտի փորձագետները կարող են զենք խաղալ: Ուսուցման քաղաքականության նպատակն է նվազագույնի հասցնել ընդհանուր ափսոսանքը այս հիերարխիկ փորձագետների միջավայրում: Մենք նախ վերլուծում ենք այն դեպքը, որ ընդհանուր ափսոսանքը գծային կերպով աճում է շերտերի քանակով: Այնուհետև մենք կենտրոնանում ենք այն դեպքի վրա, որ բոլոր փորձագետները խաղում են Վերին վստահության սահմանի (UCB) ռազմավարություն և տալիս են մի քանի ենթագծային վերին սահմաններ տարբեր հանգամանքների համար: Վերջապես, մենք նախագծում ենք մի քանի փորձեր՝ օգնելու ափսոսանքի վերլուծությանը հիերարխիկ UCB կառուցվածքի ընդհանուր դեպքի համար և ցույց տալու մեր տեսական արդյունքների գործնական նշանակությունը: Այս հոդվածը բազմաթիվ պատկերացումներ է տալիս ողջամիտ հիերարխիկ որոշումների կառուցվածքի մասին:

2. Առցանց երկաստիճան օպտիմիզացում. ափսոսանքի վերլուծություն առցանց այլընտրանքային գրադիենտ մեթոդների (arXiv)

Հեղինակ՝ Դավուդ Աթաի Տարզանաղ, Լաուրա Բալզանո

Համառոտ : Առցանց օպտիմիզացումը լավ հաստատված օպտիմալացման պարադիգմ է, որի նպատակն է կատարել ճիշտ որոշումների հաջորդականություն՝ հաշվի առնելով նախորդ որոշումների առաջադրանքների ճիշտ պատասխանի իմացությունը: Երկմակարդակ ծրագրավորումը ներառում է հիերարխիկ օպտիմալացման խնդիր, որտեղ այսպես կոչված արտաքին խնդրի իրագործելի շրջանը սահմանափակվում է ներքին խնդրի լուծումների հավաքածուի քարտեզագրման գրաֆիկով: Այս փաստաթուղթը միավորում է այս երկու գաղափարները և ուսումնասիրում առցանց երկմակարդակի օպտիմալացման պարամետրը, որում մեկը մյուսի հետևից բացահայտվում են ժամանակի փոփոխվող երկաստիճան խնդիրների հաջորդականությունը: Մենք տարածում ենք մեկ մակարդակի առցանց ալգորիթմների համար ափսոսանքի հայտնի սահմանները մինչև երկմակարդակ կարգավորում: Մասնավորապես, մենք ներմուծում ենք երկաստիճան ափսոսանքի նոր հասկացություններ, մշակում ենք առցանց փոփոխական ժամանակի միջինացված գրադիենտ մեթոդ, որն ի վիճակի է օգտագործել սահունությունը, և տրամադրում ենք ափսոսանքի սահմաններ ներքին և արտաքին մինիմալիզատորների հաջորդականությունների ուղու երկարության առումով:

թեմայի վերաբերյալ նյութեր:

Նոր նյութեր

Օգտագործելով Fetch Vs Axios.Js-ը՝ HTTP հարցումներ կատարելու համար

JavaScript-ը կարող է ցանցային հարցումներ ուղարկել սերվեր և բեռնել նոր տեղեկատվություն, երբ դա անհրաժեշտ լինի: Օրինակ, մենք կարող ենք օգտագործել ցանցային հարցումը պատվեր ներկայացնելու,..

Տիրապետել հանգստության արվեստին. մշակողի ուղեցույց՝ ճնշման տակ ծաղկելու համար

Տիրապետել հանգստության արվեստին. մշակողի ուղեցույց՝ ճնշման տակ ծաղկելու համար Ինչպե՞ս հանգստացնել ձեր միտքը և աշխատեցնել ձեր պրոցեսորը: Ինչպես մնալ հանգիստ և զարգանալ ճնշման տակ...

Մեքենայի ուսուցում բանկային և ֆինանսների ոլորտում

Բարդ, խելացի անվտանգության համակարգերը և հաճախորդների սպասարկման պարզեցված ծառայությունները բիզնեսի հաջողության բանալին են: Ֆինանսական հաստատությունները, մասնավորապես, պետք է առաջ մնան կորի..

Ես AI-ին հարցրի կյանքի իմաստը, այն ինչ ասում էր, ցնցող էր:

Այն պահից ի վեր, երբ ես իմացա Արհեստական ինտելեկտի մասին, ես հիացած էի այն բանով, թե ինչպես է այն կարողանում հասկանալ մարդկային նորմալ տեքստը, և այն կարող է առաջացնել իր սեփական արձագանքը դրա..

Ինչպես սովորել կոդավորումը Python-ում վագրի պես:

Սովորելու համար ծրագրավորման նոր լեզու ընտրելը բարդ է: Անկախ նրանից, թե դուք սկսնակ եք, թե առաջադեմ, դա օգնում է իմանալ, թե ինչ թեմաներ պետք է սովորել: Ծրագրավորման լեզվի հիմունքները, դրա..

C++-ի օրական բիթ(ե) | Ամենաերկար պալինդրոմային ենթաշարը

C++ #198-ի ամենօրյա բիթ(ե), Ընդհանուր հարցազրույցի խնդիր. Ամենաերկար պալինդրոմային ենթատող: Այսօր մենք կանդրադառնանք հարցազրույցի ընդհանուր խնդրին. Ամենաերկար palindromic substring...

Kydavra ICAReducer՝ ձեր տվյալների ծավալայինությունը նվազեցնելու համար

Ի՞նչ է ICAReducer-ը: ICAReducer-ն աշխատում է հետևյալ կերպ. այն նվազեցնում է նրանց միջև բարձր փոխկապակցված հատկանիշները մինչև մեկ սյունակ: Բավականին նման է PCAreducer-ին, չնայած այն..

Պիտակներ

Machine Learning JavaScript Data Science Artificial Intelligence Python Software Development Web Development Coding Deep Learning React AI Software Engineering Nodejs Typescript Java Javascript Tips Tech Algorithms Front End Development Programming Languages iOS Data Business NLP Development Reactjs Tutorial CSS Learning Swift Angular API Javascript Development Startup Android Computer Science Learning To Code Reinforcement Learning