Թեմայի վերաբերյալ հրապարակումներ 'nlp'
Snips NLU-ի ներածություն, բաց կոդով գրադարան, որը գտնվում է Snips ներկառուցված ձայնային հարթակի հետևում
Հեղինակ՝ Ադրիեն Բոլը , Կլեմեն Դումուրոն և Ժոզեֆ Դյուրոն
Snips Embedded Voice Platform -ը թույլ է տալիս սարքի ցանկացած արտադրողի ստեղծել Private by Design ձայնային ինտերֆեյս իրենց արտադրանքի համար: Այն կարգավորում է Wakeword-ի հայտնաբերումը, խոսքի ճանաչումը և բնական լեզվի ըմբռնումը ամբողջությամբ սարքի վրա, այնպես որ ձեր անձնական ձայնային տվյալներից ոչ մեկը չի գնում ամպ: Snips հարթակը բաց է նաև ոչ առևտրային օգտագործման համար, բոլորի համար, ովքեր ցանկանում են կոտրել ձայնային..
Hash2Vec. մեկ տողային բառի վեկտորներ
Մի զվարճալի փորձ, որը ես վերջերս արեցի՝ փորձելով միավորել բառերի վեկտորները և LSH-ը
Եկեք անմիջապես ցատկենք խորը վերջում: Այդպես զվարճալի կլինի: Ասեք, որ ունեք տեքստի կորպուս:
[“dog barked at the tree”, “cat drank milk”]
Այժմ յուրաքանչյուր բառ/նշան ներկայացրեք որպես պայուսակ-նգրամ վեկտոր: Դա անելու համար նախ մեզ անհրաժեշտ են բոլոր n-գրամները բոլոր նշաններում: Վերցնենք 1 և 2 գրամանոց վեկտորները:
[d, o, g, b, a, r, k, e, d, …, m, i, l, k, do, og, ba, ar, …, mi, il, lk]
Այժմ..
Տեքստի դասակարգում BERT-ով TensorFlow-ում և PyTorch-ում
BERT մոդելի հրապարակումը 2018 թվականին [1] հեղափոխություն էր NLP աշխարհում, քանի որ BERT-ի նման Լեզուների խոշոր մոդելները ձեռք են բերում գերժամանակակից արդյունքներ NLP-ի բազմաթիվ առաջադրանքներում: Ցույց տալու համար, թե ինչպես կարող է BERT-ն օգտագործվել գործնականում, մենք մշակում ենք տեքստի դասակարգման օրինակ: Այս դեպքերում մենք ասում ենք, որ BERT-ը, որը պարունակում է լեզվական կարողություններ և համաշխարհային գիտելիքներ իր բազմաթիվ աղբյուրներից, որոնցով նա վերապատրաստվել է (Վիքիպեդիա,..
Ներածություն բնական լեզվի մշակման մեջ
ML Concepts-ում մենք աշխատում ենք տվյալների գիտության ոլորտին համապատասխան դասընթացներով և նյութերով կայք կառուցելու ուղղությամբ:
Մարդիկ միմյանց հետ շփվում են բառերի և տեքստի միջոցով: Այն ձևը, որով մարդիկ տեղեկատվություն են փոխանցում միմյանց, կոչվում է Բնական լեզու:
Այնուամենայնիվ, համակարգիչները չեն կարող մեկնաբանել այս տվյալները , որոնք բնական լեզվով են, քանի որ նրանք հաղորդակցվում են 1-ով և 0-ով: Արտադրված տվյալները թանկարժեք են և կարող են արժեքավոր պատկերացումներ առաջարկել:..
Մարտահրավերներ և հնարավորություններ գեներատիվ ինտելեկտի համար մասնավոր շուկայի վերլուծաբանների համար
Արհեստական ինտելեկտի նոր գեներատիվ լուծումների վերջին ալիքը, որոնք օգտագործում են տրանսֆորմատորների վրա հիմնված մեծ լեզուների մոդելները (LLM), նոր ուժ և հետաքրքրություն է ներշնչել արհեստական ինտելեկտի և մեքենայական ուսուցման համակարգերի նկատմամբ և այն, ինչ նրանք կարող են անել բիզնեսի համար:
Filament Syfter-ում մենք հետևում ենք բնական լեզվի մշակման նորագույն համակարգերին 2016 թվականից: Մենք տրանսֆորմատորների վրա հիմնված LLM-ների վաղ ընդունողներն էինք և փորձարկում էինք դրանց հետ և..
Բնական լեզվի մշակման համար հատկանիշի վեկտորի ձևավորում:
Մեքենայի ուսուցման ցանկացած նախագծի համար հիմնական խնդիրն է նախապես մշակել տվյալները՝ նախքան դրանք նեյրոնային ցանցին մատակարարելը: Եթե վերցնենք Computer Vision-ի օրինակը, ապա գորշ գույնի պատկերը վերածվում է 2D զանգվածի: Համակարգիչները գործ ունեն թվերի հետ, և այդ պատճառով մենք պատկերը վերածում ենք 2D զանգվածի: Այսպիսով, անհրաժեշտ է, որ տվյալները, որոնք այս դեպքում նախադասություններ են, վերածենք թվերի, դա այն է, ինչ մենք կսովորենք այս հոդվածում:
Հոդվածի հիմնական շարժառիթը Տեքստի..
Word2Vec (skip-gram մոդել). ՄԱՍ 1 - Ինտուիցիա:
Այստեղ բովանդակության մեծ մասը Քրիսի բլոգից է: Ես խտացրել եմ այն և փոքր ադապտացիաներ եմ արել։
վարկեր՝ Քրիս ՄաքՔորմիկ
http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/
http://mccormickml.com/2017/01/11/word2vec-tutorial-part-2-negative-sampling/
Ալգորիթմը գոյություն ունի երկու տարբերակով՝ CBOW և Skip-Gram : Հաշվի առնելով նախադասությունների մի շարք (որը նաև կոչվում է կորպուս ), մոդելը պտտվում է յուրաքանչյուր նախադասության բառերի վրա և կամ փորձում է..
Նոր նյութեր
Օգտագործելով Fetch Vs Axios.Js-ը՝ HTTP հարցումներ կատարելու համար
JavaScript-ը կարող է ցանցային հարցումներ ուղարկել սերվեր և բեռնել նոր տեղեկատվություն, երբ դա անհրաժեշտ լինի: Օրինակ, մենք կարող ենք օգտագործել ցանցային հարցումը պատվեր ներկայացնելու,..
Տիրապետել հանգստության արվեստին. մշակողի ուղեցույց՝ ճնշման տակ ծաղկելու համար
Տիրապետել հանգստության արվեստին. մշակողի ուղեցույց՝ ճնշման տակ ծաղկելու համար
Ինչպե՞ս հանգստացնել ձեր միտքը և աշխատեցնել ձեր պրոցեսորը:
Ինչպես մնալ հանգիստ և զարգանալ ճնշման տակ...
Մեքենայի ուսուցում բանկային և ֆինանսների ոլորտում
Բարդ, խելացի անվտանգության համակարգերը և հաճախորդների սպասարկման պարզեցված ծառայությունները բիզնեսի հաջողության բանալին են: Ֆինանսական հաստատությունները, մասնավորապես, պետք է առաջ մնան կորի..
Ես AI-ին հարցրի կյանքի իմաստը, այն ինչ ասում էր, ցնցող էր:
Այն պահից ի վեր, երբ ես իմացա Արհեստական ինտելեկտի մասին, ես հիացած էի այն բանով, թե ինչպես է այն կարողանում հասկանալ մարդկային նորմալ տեքստը, և այն կարող է առաջացնել իր սեփական արձագանքը դրա..
Ինչպես սովորել կոդավորումը Python-ում վագրի պես:
Սովորելու համար ծրագրավորման նոր լեզու ընտրելը բարդ է: Անկախ նրանից, թե դուք սկսնակ եք, թե առաջադեմ, դա օգնում է իմանալ, թե ինչ թեմաներ պետք է սովորել: Ծրագրավորման լեզվի հիմունքները, դրա..
C++-ի օրական բիթ(ե) | Ամենաերկար պալինդրոմային ենթաշարը
C++ #198-ի ամենօրյա բիթ(ե), Ընդհանուր հարցազրույցի խնդիր. Ամենաերկար պալինդրոմային ենթատող:
Այսօր մենք կանդրադառնանք հարցազրույցի ընդհանուր խնդրին. Ամենաերկար palindromic substring...
Kydavra ICAReducer՝ ձեր տվյալների ծավալայինությունը նվազեցնելու համար
Ի՞նչ է ICAReducer-ը:
ICAReducer-ն աշխատում է հետևյալ կերպ. այն նվազեցնում է նրանց միջև բարձր փոխկապակցված հատկանիշները մինչև մեկ սյունակ: Բավականին նման է PCAreducer-ին, չնայած այն..