ՍԵՆՏԻՄԵՆՏԻ ՎԵՐԼՈՒԾՈՒԹՅՈՒՆ

Ումայր Շաքելի կողմից

Ներածություն

Բիզնեսը հաջողությամբ վարելու համար ընկերությունը պետք է հասկանա, թե ինչ են ուզում իր հաճախորդները: Այս հաճախորդներն օգտագործում են ապրանքները և ցույց տալիս, թե ինչ են զգում: Այսպիսով, տրամադրությունների վերլուծությունը օգտագործվում է համակարգչին ակնարկները հասկանալու համար: Այն օգտագործում է բնական լեզվի մշակման (NLP) տեխնիկան և մեքենայական ուսուցումը և հայտնաբերում է՝ արդյոք տվյալների տրամադրությունը դրական է, բացասական, թե չեզոք: Այն փնտրում է զգացմունքներ, որոնք սովորաբար տեքստային են: Ամեն օր հազարավոր հաճախորդներ խոսում են ապրանքի գնի կամ որակի մասին: Նրանք արտահայտում են իրենց հույզերը վարկանիշներ թողնելիս, հարցումներ լրացնելիս կամ կարծիք հայտնելիս, որոնք կարող են շատ ժամանակ խլել մարդուց կարդալու և վերլուծելու համար: Այդ իսկ պատճառով այս ակնարկները պահվում են տվյալների բազայում, և այդ տվյալները անցնում են տրամադրությունների վերլուծության ծրագրի միջոցով, որը ցույց է տալիս արտադրանքի կամ ապրանքանիշի ընդհանուր տրամադրությունը: Զգացմունքների վերլուծությունը հայտնի է որպես «զգացմունքային արհեստական ինտելեկտ» կամ «կարծիքի մայնինգ»:

Տեսակներ

Զգացմունքների վերլուծությունը լինում է տարբեր ձևերով, քանի որ դա կախված է ակնարկների տվյալների տեսակից: Նրանք գնահատվում են բևեռականության, հույզերի, նախադասության մեջ կոնկրետ բառեր գտնելու կամ անգլերեն չգտնվող լեզուների առումով: Հետևյալը տրամադրությունների վերլուծության ամենատարածված կատեգորիաներն են.

Գնահատված տրամադրությունների վերլուծություն.Այն աշխատում է ճիշտ այնպես, ինչպես քննության արդյունքները: 100%-ը կլիներ «կատարյալ», 80%-ը՝ «լավ», 50%-ը՝ «միջին» և այլն։ Գնահատված տրամադրությունների վերլուծությունը լավագույնս աշխատում է այն տվյալների դեպքում, երբ հաճախորդը պետք է տա 1-5 աստղ գնահատական: Օրինակ, հաճախորդները տալիս են աստղեր, և ծրագիրը դասակարգում է տվյալները հինգ կատեգորիաների.
⭐⭐⭐⭐⭐: Շատ դրական
⭐⭐⭐⭐: Դրական
⭐⭐⭐: Չեզոք
⭐⭐: Բացասական
⭐: Շատ բացասական
Բոլոր վարկանիշները դասակարգելուց հետո պատրաստվում է գծապատկեր կամ գծապատկեր՝ արտադրանքի կառավարիչներին ցույց տալու ընդհանուր ակնարկները:
Զգացմունքների հայտնաբերում.Սա անցնում է տեքստի միջոցով՝ պարզելու, թե արդյոք տվյալ ակնարկն արտահայտում է երջանկություն, տխրություն կամ զայրույթ: Այս համակարգերից շատերն օգտագործում են մեքենայական ուսուցման բարդ ալգորիթմներ կամ լեքսիկոններ (բառերի ցուցակներ, որոնք արդեն դասակարգված են զգացմունքների տեսակների մեջ):
Օրինակ՝ «Սուրճը ֆանտաստիկ է» նախադասությունը: երջանկություն է արտահայտում «ֆանտաստիկ» բառի և նախադասության վերջում բացականչական նշանի պատճառով, մինչդեռ «Միսը սարսափելի է» նախադասությունը😡։ արտահայտում է զայրույթը «սարսափելի» և խռպոտ դեմքի էմոջիների պատճառով:
Թեև այս տեսակը շատ արդյունավետ է տեքստային տվյալների մեջ, սակայն բացասական բառերն օգտագործվում են դրական զգացմունքներ արտահայտելու համար բացասական կողմեր կան: Ինչպես «Այս տապակը գազան է»: անալիզատորը հայտնաբերում է այն որպես բացասական, թեև «գազանն» օգտագործվում է որպես հաճոյախոսություն:
Բազմալեզու տրամադրությունների վերլուծություն.Որոշ դեպքերում ակնարկները անգլերեն չեն: Այս տեսակը տվյալները թարգմանում է անգլերեն և վերլուծում դրանք: Այնուամենայնիվ, այս համակարգը ամենադժվարն է, քանի որ թարգմանությունը զգացմունք գտնելու միակ մեթոդը չէ, քանի որ յուրաքանչյուր մայրենի լեզու ունի իր մշակույթը, այդպիսով առաջացնելով զգացմունքներ արտահայտելու տարբեր ձևեր՝ օգտագործելով միայն մեկ տեսակի նախադասություն, ինչը հանգեցնում է հակասությունների:

Մեթոդներ և ծրագրավորման լեզուներ

Տվյալների մեջ զգացմունքները գտնելու և վերլուծելու երեք եղանակ կա.

Կանոնների վրա հիմնված մոտեցում.Այս մոտեցումը գործում է մի շարք կանոնների հիման վրա, որոնք մշակվում են ձեռքով: Սա ներառում է NLP տեխնիկան, ինչպիսիք են նշանավորումը, բխում, վերլուծություն և լեքսիկոններ: Այս մոտեցման գործընթացը հետևյալն է.

1: Նախ, այն դասակարգում է բառերի ցանկը երկու մասի, այսինքն՝ դրական և բացասական:

< ուժեղ>2. Երկրորդ, այն օգտագործում է ցուցակը և որոնում է այդ բառերը ակնարկներում: Յուրաքանչյուրը դրական կամ բացասական բառերի համար ավելանում է:

3: Վերջապես, այն համեմատում է դրական և բացասական բառերի քանակը.

— < ուժեղ>ա. Եթե դրական բառերն ավելի շատ են, ապա ընդհանուր ակնարկը դրական է, և հակառակը:
— բ: Եթե դրական և բացասական բառերը թվով հավասար են, ապա վերանայումը չեզոք է:
Ավտոմատ մոտեցում.Այս մոտեցումը հիմնված է մեքենայական ուսուցման տեխնիկայի վրա: Դրա համար կան բազմաթիվ եղանակներ, այնպես որ, ընդհանուր առմամբ, մոդելը կազմվում է ըստ իրավիճակի, որոշ տվյալներ են տրվում այն վերապատրաստելու համար, այնուհետև այն աշխատում է որպես դասակարգիչ։ Ահա թե ինչպես է այն աշխատում մանրամասն.

— a. Ուսուցման գործընթացում մոդելը նախ սովորում է կապել մուտքերը դրանց ճիշտ արդյունքների հետ: Դա անելու համար համակարգին տրվում է տվյալների 25%-ը՝ իրավիճակը հասկանալու համար:
— b. Երբ մոդելը հասկանում է իրավիճակը, այն տեղափոխվում է կանխատեսման գործընթաց: Այստեղ տվյալները սնվում են, և տվյալների ընդհանուր տրամադրությունը ստեղծվում է որպես արդյունք:
Հիբրիդային մոտեցում.Ինչպես անվանումն է ասում, այս մոտեցումն աշխատում է կանոնների վրա հիմնված և ավտոմատ մոտեցումների համադրմամբ: Այս մոտեցումն ամենաարդյունավետն է, քանի որ այն հավաքում է վերը նշված մոտեցումներից լավագույնը և գտնում է իրավիճակին դիմակայելու լավագույն տեխնիկան, ինչը հանգեցնում է արդյունքների, որոնք հաճախ ավելի ճշգրիտ են:

Այս մեթոդները սովորաբար իրականացվում են ծրագրավորման երկու լեզուներից որևէ մեկում՝ Python և JavaScript:

Զգացմունքների վերլուծության համար Python-ում օգտագործվող ընդհանուր գրադարաններն են.

scikit-learn.Այն անվճար մեքենայական ուսուցման գրադարան է և պարունակում է տեքստի վեկտորացման գործիքներ (տեքստը թվային ձևի վերածելու համար):
NLTK.Natural Language Toolkit-ը ավանդական NLP գրադարան է Python-ի համար, որն ունի համայնք, որն առաջացնում է նոր գաղափարներ՝ այն ավելի լավ աշխատելու համար:
spaCy.Այս գրադարանն օգտագործվում է տեքստի դասակարգիչների վերապատրաստման համար և նման է NLTK-ին:
TensorFlow.Այս գրադարանը մշակվել է Google-ի կողմից: Այն պարունակում է տեքստի վեկտորիզացիա և ապահովում է գործիքներ կառուցելու և ուսուցման համար:
PyTorch.Այն մշակվել է Facebook-ի AI Research Lab-ի կողմից և ունի աջակցության ուժեղ համայնք:

Ինչ վերաբերում է JavaScript-ին, ապա ընդհանուր գրադարաններն են.

OpenNLP.NLP, որը պարունակում է NLP-ի ամենատարածված հատկանիշները:
Stanford CoreNLP. Մեկ այլ NLP գրադարան, որը մշակվել է The Stanford NLP Group-ի կողմից:
LingPipe. Java-ի գործիքակազմ՝ հաշվողական լեզվաբանության միջոցով տեքստը մշակելու համար:
Weka.Բաց կոդով գրադարան՝ ստեղծված Վայկատոյի համալսարանի կողմից:

Կարևորություն

Մեր օրերում համակարգիչները հեշտացնում են խնդիրները, քանի որ դրանք ավելի արագ և արդյունավետ են: Բացի այդ, սոցիալական ցանցերի շնորհիվ մարդիկ ավելի հարմարավետ են զգում իրենց զգացմունքներն արտահայտելու համար: Այսպիսով, զգացմունքների վերլուծության ծրագրերն ավելի վստահելի են, քանի որ ի տարբերություն մեզ՝ մարդկանց, նրանք չունեն իրենց սեփական էմոցիաները վերանայումը սկանավորելիս՝ վերացնելով արդյունքների շեղումները: Այս ծրագրերը նաև տալիս են 100% արդյունավետությամբ արդյունքներ տվյալ ժամանակահատվածում:

Ավելին, տրամադրությունների վերլուծության հավելվածները իրական ժամանակում արդյունք են տալիս, որպեսզի նրանք հեշտությամբ կարողանան մշակել հաճախորդների կրկնվող ակնարկները: Սա խնայում է ժամանակն ու էներգիան, քանի որ մարդիկ չեն կարող անընդհատ աշխատել առանց ընդմիջման:

Բացի վերլուծությունից, այն տվյալների տեսակավորման հիանալի գործիք է, որը կարող է հսկայական ժամանակ խնայել այն մարդկանց համար, ովքեր պատասխանատու են ապրանքների փաստաթղթավորման համար, քանի որ նրանք կարող են պարզապես տեսնել ընդհանուր կարգավիճակը և զեկուցել դրա համաձայն:

Դիմումներ և օրինակներ

Զգացմունքների վերլուծության ընդհանուր հավելվածներն են.

Հաճախորդների ձայնը ծրագրեր.Հաճախորդները գնահատում են 1-ից 10 սանդղակով կամ տալիս են տեքստային կարծիք: Այս կերպ ընկերությունները գիտեն ընդհանուր կարգավիճակը և հայտնաբերում են խնդիրները, եթե այդպիսիք կան:
Ապրանքների և ապրանքանիշի փորձ.Հաճախորդները, ովքեր գնում են ապրանքներ, թողնում են ակնարկներ, որոնք այնուհետև օգտագործվում են ղեկավարների կողմից ցանկացած խնդիր լուծելու, առաջարկությունները լսելու կամ հաճախորդի ցանկությամբ թարմացնելու համար:
Սոցիալական լրատվամիջոցների տրամադրությունների վերլուծություն.Սա ակնարկներ հավաքելու ամենահզոր միջոցն է, քանի որ մենք ազատորեն հրապարակում ենք այն, ինչ զգում ենք որոշակի իրի վերաբերյալ: Այն առաջացնում է շատ տվյալներ, որոնք կարող են շատ արդյունավետ դարձնել մեքենայական ուսուցման մոդելները:

Ամենատարածված օրինակները սոցիալական մեդիա հարթակներն են, քանի որ դրանք ամենաշատը տվյալներ են ստանում օգտատերերից:

Facebook-ը և Twitter-ը վերլուծում են հավանումները և մեկնաբանությունները, ինչը կարող է օգնել պարզել՝ տվյալ հրապարակումը կրթական է, թե ատելության խոսք:
Uber-ը, Careem-ը, Daraz-ը և այլն վերլուծում են հաճախորդների ակնարկները, ինչը կարող է օգնել նրանց ճիշտ գինը սահմանել և ճանաչել վարորդին/խանութատիրոջը:

Եզրակացություն

Ամեն շաբաթ միլիոնավոր տվյալներ են ստեղծվում, որոնք պարունակում են զգացմունքներ և հույզեր, որոնք կարող են լինել աստղերի վարկանիշների կամ տեքստային արձագանքների տեսքով: Մարդկային ըմբռնման փոխարեն այս մարդկանց, զգացմունքների վերլուծիչը կարող է հեշտացնել իրավիճակը: Սրանք ծրագրեր են, որոնք պատրաստված են NLP-ի և մեքենայական ուսուցման տեխնիկայի միջոցով Python-ում և JavaScript-ում: Նրանք արագ և արդյունավետ են և խնայում են շատ ժամանակ և գումար:

թեմայի վերաբերյալ նյութեր:

Նոր նյութեր

Օգտագործելով Fetch Vs Axios.Js-ը՝ HTTP հարցումներ կատարելու համար

JavaScript-ը կարող է ցանցային հարցումներ ուղարկել սերվեր և բեռնել նոր տեղեկատվություն, երբ դա անհրաժեշտ լինի: Օրինակ, մենք կարող ենք օգտագործել ցանցային հարցումը պատվեր ներկայացնելու,..

Տիրապետել հանգստության արվեստին. մշակողի ուղեցույց՝ ճնշման տակ ծաղկելու համար

Տիրապետել հանգստության արվեստին. մշակողի ուղեցույց՝ ճնշման տակ ծաղկելու համար Ինչպե՞ս հանգստացնել ձեր միտքը և աշխատեցնել ձեր պրոցեսորը: Ինչպես մնալ հանգիստ և զարգանալ ճնշման տակ...

Մեքենայի ուսուցում բանկային և ֆինանսների ոլորտում

Բարդ, խելացի անվտանգության համակարգերը և հաճախորդների սպասարկման պարզեցված ծառայությունները բիզնեսի հաջողության բանալին են: Ֆինանսական հաստատությունները, մասնավորապես, պետք է առաջ մնան կորի..

Ես AI-ին հարցրի կյանքի իմաստը, այն ինչ ասում էր, ցնցող էր:

Այն պահից ի վեր, երբ ես իմացա Արհեստական ինտելեկտի մասին, ես հիացած էի այն բանով, թե ինչպես է այն կարողանում հասկանալ մարդկային նորմալ տեքստը, և այն կարող է առաջացնել իր սեփական արձագանքը դրա..

Ինչպես սովորել կոդավորումը Python-ում վագրի պես:

Սովորելու համար ծրագրավորման նոր լեզու ընտրելը բարդ է: Անկախ նրանից, թե դուք սկսնակ եք, թե առաջադեմ, դա օգնում է իմանալ, թե ինչ թեմաներ պետք է սովորել: Ծրագրավորման լեզվի հիմունքները, դրա..

C++-ի օրական բիթ(ե) | Ամենաերկար պալինդրոմային ենթաշարը

C++ #198-ի ամենօրյա բիթ(ե), Ընդհանուր հարցազրույցի խնդիր. Ամենաերկար պալինդրոմային ենթատող: Այսօր մենք կանդրադառնանք հարցազրույցի ընդհանուր խնդրին. Ամենաերկար palindromic substring...

Kydavra ICAReducer՝ ձեր տվյալների ծավալայինությունը նվազեցնելու համար

Ի՞նչ է ICAReducer-ը: ICAReducer-ն աշխատում է հետևյալ կերպ. այն նվազեցնում է նրանց միջև բարձր փոխկապակցված հատկանիշները մինչև մեկ սյունակ: Բավականին նման է PCAreducer-ին, չնայած այն..

Պիտակներ

Machine Learning JavaScript Data Science Artificial Intelligence Python Software Development Web Development Coding Deep Learning React AI Software Engineering Nodejs Typescript Java Javascript Tips Tech Algorithms Front End Development Programming Languages iOS Data Business NLP Development Reactjs Tutorial CSS Learning Swift Angular API Javascript Development Startup Android Computer Science Learning To Code Reinforcement Learning