AMcoder - javascript, python, java, html, php, sql

Թեմայի վերաբերյալ հրապարակումներ 'nlp'


Snips NLU-ի ներածություն, բաց կոդով գրադարան, որը գտնվում է Snips ներկառուցված ձայնային հարթակի հետևում
Հեղինակ՝ Ադրիեն Բոլը , Կլեմեն Դումուրոն և Ժոզեֆ Դյուրոն Snips Embedded Voice Platform -ը թույլ է տալիս սարքի ցանկացած արտադրողի ստեղծել Private by Design ձայնային ինտերֆեյս իրենց արտադրանքի համար: Այն կարգավորում է Wakeword-ի հայտնաբերումը, խոսքի ճանաչումը և բնական լեզվի ըմբռնումը ամբողջությամբ սարքի վրա, այնպես որ ձեր անձնական ձայնային տվյալներից ոչ մեկը չի գնում ամպ: Snips հարթակը բաց է նաև ոչ առևտրային օգտագործման համար, բոլորի համար, ովքեր ցանկանում են կոտրել ձայնային..

Hash2Vec. մեկ տողային բառի վեկտորներ
Մի զվարճալի փորձ, որը ես վերջերս արեցի՝ փորձելով միավորել բառերի վեկտորները և LSH-ը Եկեք անմիջապես ցատկենք խորը վերջում: Այդպես զվարճալի կլինի: Ասեք, որ ունեք տեքստի կորպուս: [“dog barked at the tree”, “cat drank milk”] Այժմ յուրաքանչյուր բառ/նշան ներկայացրեք որպես պայուսակ-նգրամ վեկտոր: Դա անելու համար նախ մեզ անհրաժեշտ են բոլոր n-գրամները բոլոր նշաններում: Վերցնենք 1 և 2 գրամանոց վեկտորները: [d, o, g, b, a, r, k, e, d, …, m, i, l, k, do, og, ba, ar, …, mi, il, lk] Այժմ..

Տեքստի դասակարգում BERT-ով TensorFlow-ում և PyTorch-ում
BERT մոդելի հրապարակումը 2018 թվականին [1] հեղափոխություն էր NLP աշխարհում, քանի որ BERT-ի նման Լեզուների խոշոր մոդելները ձեռք են բերում գերժամանակակից արդյունքներ NLP-ի բազմաթիվ առաջադրանքներում: Ցույց տալու համար, թե ինչպես կարող է BERT-ն օգտագործվել գործնականում, մենք մշակում ենք տեքստի դասակարգման օրինակ: Այս դեպքերում մենք ասում ենք, որ BERT-ը, որը պարունակում է լեզվական կարողություններ և համաշխարհային գիտելիքներ իր բազմաթիվ աղբյուրներից, որոնցով նա վերապատրաստվել է (Վիքիպեդիա,..

Ներածություն բնական լեզվի մշակման մեջ
ML Concepts-ում մենք աշխատում ենք տվյալների գիտության ոլորտին համապատասխան դասընթացներով և նյութերով կայք կառուցելու ուղղությամբ: Մարդիկ միմյանց հետ շփվում են բառերի և տեքստի միջոցով: Այն ձևը, որով մարդիկ տեղեկատվություն են փոխանցում միմյանց, կոչվում է Բնական լեզու: Այնուամենայնիվ, համակարգիչները չեն կարող մեկնաբանել այս տվյալները , որոնք բնական լեզվով են, քանի որ նրանք հաղորդակցվում են 1-ով և 0-ով: Արտադրված տվյալները թանկարժեք են և կարող են արժեքավոր պատկերացումներ առաջարկել:..

Մարտահրավերներ և հնարավորություններ գեներատիվ ինտելեկտի համար մասնավոր շուկայի վերլուծաբանների համար
Արհեստական ​​ինտելեկտի նոր գեներատիվ լուծումների վերջին ալիքը, որոնք օգտագործում են տրանսֆորմատորների վրա հիմնված մեծ լեզուների մոդելները (LLM), նոր ուժ և հետաքրքրություն է ներշնչել արհեստական ​​ինտելեկտի և մեքենայական ուսուցման համակարգերի նկատմամբ և այն, ինչ նրանք կարող են անել բիզնեսի համար: Filament Syfter-ում մենք հետևում ենք բնական լեզվի մշակման նորագույն համակարգերին 2016 թվականից: Մենք տրանսֆորմատորների վրա հիմնված LLM-ների վաղ ընդունողներն էինք և փորձարկում էինք դրանց հետ և..

Բնական լեզվի մշակման համար հատկանիշի վեկտորի ձևավորում:
Մեքենայի ուսուցման ցանկացած նախագծի համար հիմնական խնդիրն է նախապես մշակել տվյալները՝ նախքան դրանք նեյրոնային ցանցին մատակարարելը: Եթե ​​վերցնենք Computer Vision-ի օրինակը, ապա գորշ գույնի պատկերը վերածվում է 2D զանգվածի: Համակարգիչները գործ ունեն թվերի հետ, և այդ պատճառով մենք պատկերը վերածում ենք 2D զանգվածի: Այսպիսով, անհրաժեշտ է, որ տվյալները, որոնք այս դեպքում նախադասություններ են, վերածենք թվերի, դա այն է, ինչ մենք կսովորենք այս հոդվածում: Հոդվածի հիմնական շարժառիթը Տեքստի..

Word2Vec (skip-gram մոդել). ՄԱՍ 1 - Ինտուիցիա:
Այստեղ բովանդակության մեծ մասը Քրիսի բլոգից է: Ես խտացրել եմ այն ​​և փոքր ադապտացիաներ եմ արել։ վարկեր՝ Քրիս ՄաքՔորմիկ http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/ http://mccormickml.com/2017/01/11/word2vec-tutorial-part-2-negative-sampling/ Ալգորիթմը գոյություն ունի երկու տարբերակով՝ CBOW և Skip-Gram : Հաշվի առնելով նախադասությունների մի շարք (որը նաև կոչվում է կորպուս ), մոդելը պտտվում է յուրաքանչյուր նախադասության բառերի վրա և կամ փորձում է..

Նոր նյութեր

Օգտագործելով Fetch Vs Axios.Js-ը՝ HTTP հարցումներ կատարելու համար
JavaScript-ը կարող է ցանցային հարցումներ ուղարկել սերվեր և բեռնել նոր տեղեկատվություն, երբ դա անհրաժեշտ լինի: Օրինակ, մենք կարող ենք օգտագործել ցանցային հարցումը պատվեր ներկայացնելու,..

Տիրապետել հանգստության արվեստին. մշակողի ուղեցույց՝ ճնշման տակ ծաղկելու համար
Տիրապետել հանգստության արվեստին. մշակողի ուղեցույց՝ ճնշման տակ ծաղկելու համար Ինչպե՞ս հանգստացնել ձեր միտքը և աշխատեցնել ձեր պրոցեսորը: Ինչպես մնալ հանգիստ և զարգանալ ճնշման տակ...

Մեքենայի ուսուցում բանկային և ֆինանսների ոլորտում
Բարդ, խելացի անվտանգության համակարգերը և հաճախորդների սպասարկման պարզեցված ծառայությունները բիզնեսի հաջողության բանալին են: Ֆինանսական հաստատությունները, մասնավորապես, պետք է առաջ մնան կորի..

Ես AI-ին հարցրի կյանքի իմաստը, այն ինչ ասում էր, ցնցող էր:
Այն պահից ի վեր, երբ ես իմացա Արհեստական ​​ինտելեկտի մասին, ես հիացած էի այն բանով, թե ինչպես է այն կարողանում հասկանալ մարդկային նորմալ տեքստը, և այն կարող է առաջացնել իր սեփական արձագանքը դրա..

Ինչպես սովորել կոդավորումը Python-ում վագրի պես:
Սովորելու համար ծրագրավորման նոր լեզու ընտրելը բարդ է: Անկախ նրանից, թե դուք սկսնակ եք, թե առաջադեմ, դա օգնում է իմանալ, թե ինչ թեմաներ պետք է սովորել: Ծրագրավորման լեզվի հիմունքները, դրա..

C++-ի օրական բիթ(ե) | Ամենաերկար պալինդրոմային ենթաշարը
C++ #198-ի ամենօրյա բիթ(ե), Ընդհանուր հարցազրույցի խնդիր. Ամենաերկար պալինդրոմային ենթատող: Այսօր մենք կանդրադառնանք հարցազրույցի ընդհանուր խնդրին. Ամենաերկար palindromic substring...

Kydavra ICAReducer՝ ձեր տվյալների ծավալայինությունը նվազեցնելու համար
Ի՞նչ է ICAReducer-ը: ICAReducer-ն աշխատում է հետևյալ կերպ. այն նվազեցնում է նրանց միջև բարձր փոխկապակցված հատկանիշները մինչև մեկ սյունակ: Բավականին նման է PCAreducer-ին, չնայած այն..