AMcoder - javascript, python, java, html, php, sql

Թեմայի վերաբերյալ հրապարակումներ 'reinforcement-learning'


Մեքենայական ուսուցման մեջ պատճառահետևանքային եզրակացության ներածություն
Գրված է Նատալի Վոլկի կողմից: Քննարկում «Պատճառային եզրակացություն բժշկության մեջ և առողջապահական քաղաքականության մեջ» թղթի շուրջ : Պատճառահետևանքային եզրակացությունը մեքենայական ուսուցման հետազոտության հիմնական ոլորտն է, որի նպատակն է ներառել պատճառահետևանքային հասկացությունը AI մոդելներում: Դրանով հետազոտողները կարծում են, որ մեքենայական ուսուցումը կարող է օգնել բարելավել մոդելի ընդհանրացումը և թափանցիկությունը, օգնել հաղթահարել կողմնակալությունը և նույնիսկ զարգացնել մարդու նման..

Ութ կարևոր դիտարկում ModelLLM-ում
Այս հոդվածը փորձում է ամփոփել Սամուել Ռ. ( https://arxiv.org/pdf/2304.00612.pdf ): Ձեռագիրը նկարագրում է ընթացիկ LLM պայթյունի ութ բնութագրերը: Կանխատեսելի է, որ LLM-ները ավելի ունակ են դառնում ներդրումների ավելացման դեպքում, նույնիսկ առանց նպատակային նորարարությունների: LLM-ը պահանջում է զգալի ենթակառուցվածքային ծախսեր: Ռեսուրսների գնման, բյուջեի պլանավորման և նախագծման որոշումներ կայացնելու համար երաշխավորված է մոդելի կատարողականը ճանաչել որպես մոդելի չափի (չափված պարամետրերի..

Եկեք հասկանանք մեքենայական ուսուցման և դրա կատեգորիաների մասին:
Եկեք հասկանանք մեքենայական ուսուցման և դրա կատեգորիաների մասին: Նախքան սկսելը, եկեք հասկանանք մեքենայական ուսուցման մասին: Ի՞նչ է մեքենայական ուսուցումը: Թոմ Միտչելը սահմանում է մեքենայական ուսուցումը որպես «Ծրագիրը սովորում է «E» փորձից՝ կապված «T» առաջադրանքների որոշ դասի և կատարողականի չափման «P» հետ, եթե «T» առաջադրանքների կատարողականը, որը չափվում է «P» -ով, բարելավվում է « Էլ Պարզ ասած՝ մեքենայական ուսուցումը նշանակում է միջոց կամ մեթոդ, որով մեքենան սովորում է՝ հիմնվելով տվյալ..

Atari AI.
Ես ուզում էի ստեղծել խելացի գործակալ, որը կարող է խաղալ տիկին Փաք-Մենի դասական խաղը: Ես որոշեցի օգտագործել Q-Learning ալգորիթմը գործակալին վերապատրաստելու համար, քանի որ այն հանրաճանաչ և հաստատված ամրապնդման ուսուցման տեխնիկա է: Ես սկսեցի ստեղծելով ALE ինտերֆեյսը, որը թույլ կտա ինձ շփվել խաղի հետ: Ես միացրեցի ցուցադրման էկրանը և ձայնը, որպեսզի կարողանայի տեսնել և լսել խաղը, երբ խաղում էր գործակալը: Այնուհետև ես բեռնեցի Ms. Pac-Man ROM-ը և ստացա գործողությունների տարածքի չափը, որը..

Տրանսֆերային ուսուցում ուժեղացման ուսուցման մեջ
Փոխանցման ուսուցումը բարելավում է RL-ի կատարումը նոր, չտեսնված առաջադրանքների վրա՝ օգտագործելով անցյալ առաջադրանքներից ստացված գիտելիքները: Ապացուցված է, որ ուժեղացման ուսուցումը (RL) գերազանց կատարում է մի շարք առաջադրանքներում, ինչպիսիք են (վիդեո) խաղեր խաղալը, ռոբոտաշինությունը և նույնիսկ ինքնավար վարելը: Այնուամենայնիվ, այս կատարումը կարող է լինել միայն…

Հիմնական նյութեր, որոնք վերաբերում են ուժեղացման ուսուցման գործակալի կառուցմանը
արագ ընթերցում, թե ինչպես ստեղծել ձեր սեփական ամրապնդման ուսուցման գործակալը Ահա մի ձեռնարկ, թե ինչպես կարելի է կառուցել ամրապնդող ուսուցման վրա հիմնված խաղեր Python-ի միջոցով. Տեղադրեք անհրաժեշտ գրադարանները: Ձեզ հարկավոր է տեղադրել հետևյալ գրադարանները. gym : Այս գրադարանը տրամադրում է…

AI յուրաքանչյուրը կարող է հասկանալ. Մաս 5 — Հետախուզում-շահագործում առևտուր
Համոզվեք, որ ստուգել եք AI, ով կարող է հասկանալ շարքի մնացած մասը Պարզ բացատրություն Հետախուզում-շահագործում փոխզիջումը՝ մտածելու այն ընտրության մասին, որը մենք անում ենք, երբ փորձում ենք նոր բան սովորել կամ որոշում կայացնել: Երբեմն մենք կարող ենք ցանկանալ փորձել մի բան, որը նախկինում երբեք չենք արել, քանի որ այն կարող է իսկապես զվարճալի կամ հետաքրքիր լինել, և մենք կարող ենք նոր բան սովորել, որը հայտնի է որպես հետազոտություն : Մյուս կողմից, մենք կարող ենք ցանկանալ կառչել մի բանից,..

Նոր նյութեր

Օգտագործելով Fetch Vs Axios.Js-ը՝ HTTP հարցումներ կատարելու համար
JavaScript-ը կարող է ցանցային հարցումներ ուղարկել սերվեր և բեռնել նոր տեղեկատվություն, երբ դա անհրաժեշտ լինի: Օրինակ, մենք կարող ենք օգտագործել ցանցային հարցումը պատվեր ներկայացնելու,..

Տիրապետել հանգստության արվեստին. մշակողի ուղեցույց՝ ճնշման տակ ծաղկելու համար
Տիրապետել հանգստության արվեստին. մշակողի ուղեցույց՝ ճնշման տակ ծաղկելու համար Ինչպե՞ս հանգստացնել ձեր միտքը և աշխատեցնել ձեր պրոցեսորը: Ինչպես մնալ հանգիստ և զարգանալ ճնշման տակ...

Մեքենայի ուսուցում բանկային և ֆինանսների ոլորտում
Բարդ, խելացի անվտանգության համակարգերը և հաճախորդների սպասարկման պարզեցված ծառայությունները բիզնեսի հաջողության բանալին են: Ֆինանսական հաստատությունները, մասնավորապես, պետք է առաջ մնան կորի..

Ես AI-ին հարցրի կյանքի իմաստը, այն ինչ ասում էր, ցնցող էր:
Այն պահից ի վեր, երբ ես իմացա Արհեստական ​​ինտելեկտի մասին, ես հիացած էի այն բանով, թե ինչպես է այն կարողանում հասկանալ մարդկային նորմալ տեքստը, և այն կարող է առաջացնել իր սեփական արձագանքը դրա..

Ինչպես սովորել կոդավորումը Python-ում վագրի պես:
Սովորելու համար ծրագրավորման նոր լեզու ընտրելը բարդ է: Անկախ նրանից, թե դուք սկսնակ եք, թե առաջադեմ, դա օգնում է իմանալ, թե ինչ թեմաներ պետք է սովորել: Ծրագրավորման լեզվի հիմունքները, դրա..

C++-ի օրական բիթ(ե) | Ամենաերկար պալինդրոմային ենթաշարը
C++ #198-ի ամենօրյա բիթ(ե), Ընդհանուր հարցազրույցի խնդիր. Ամենաերկար պալինդրոմային ենթատող: Այսօր մենք կանդրադառնանք հարցազրույցի ընդհանուր խնդրին. Ամենաերկար palindromic substring...

Kydavra ICAReducer՝ ձեր տվյալների ծավալայինությունը նվազեցնելու համար
Ի՞նչ է ICAReducer-ը: ICAReducer-ն աշխատում է հետևյալ կերպ. այն նվազեցնում է նրանց միջև բարձր փոխկապակցված հատկանիշները մինչև մեկ սյունակ: Բավականին նման է PCAreducer-ին, չնայած այն..