Ումայր Շաքելի կողմից

Ներածություն

Բիզնեսը հաջողությամբ վարելու համար ընկերությունը պետք է հասկանա, թե ինչ են ուզում իր հաճախորդները: Այս հաճախորդներն օգտագործում են ապրանքները և ցույց տալիս, թե ինչ են զգում: Այսպիսով, տրամադրությունների վերլուծությունը օգտագործվում է համակարգչին ակնարկները հասկանալու համար: Այն օգտագործում է բնական լեզվի մշակման (NLP) տեխնիկան և մեքենայական ուսուցումը և հայտնաբերում է՝ արդյոք տվյալների տրամադրությունը դրական է, բացասական, թե չեզոք: Այն փնտրում է զգացմունքներ, որոնք սովորաբար տեքստային են: Ամեն օր հազարավոր հաճախորդներ խոսում են ապրանքի գնի կամ որակի մասին: Նրանք արտահայտում են իրենց հույզերը վարկանիշներ թողնելիս, հարցումներ լրացնելիս կամ կարծիք հայտնելիս, որոնք կարող են շատ ժամանակ խլել մարդուց կարդալու և վերլուծելու համար: Այդ իսկ պատճառով այս ակնարկները պահվում են տվյալների բազայում, և այդ տվյալները անցնում են տրամադրությունների վերլուծության ծրագրի միջոցով, որը ցույց է տալիս արտադրանքի կամ ապրանքանիշի ընդհանուր տրամադրությունը: Զգացմունքների վերլուծությունը հայտնի է որպես «զգացմունքային արհեստական ​​ինտելեկտ» կամ «կարծիքի մայնինգ»:

Տեսակներ

Զգացմունքների վերլուծությունը լինում է տարբեր ձևերով, քանի որ դա կախված է ակնարկների տվյալների տեսակից: Նրանք գնահատվում են բևեռականության, հույզերի, նախադասության մեջ կոնկրետ բառեր գտնելու կամ անգլերեն չգտնվող լեզուների առումով: Հետևյալը տրամադրությունների վերլուծության ամենատարածված կատեգորիաներն են.

  1. Գնահատված տրամադրությունների վերլուծություն.Այն աշխատում է ճիշտ այնպես, ինչպես քննության արդյունքները: 100%-ը կլիներ «կատարյալ», 80%-ը՝ «լավ», 50%-ը՝ «միջին» և այլն։ Գնահատված տրամադրությունների վերլուծությունը լավագույնս աշխատում է այն տվյալների դեպքում, երբ հաճախորդը պետք է տա ​​1-5 աստղ գնահատական: Օրինակ, հաճախորդները տալիս են աստղեր, և ծրագիրը դասակարգում է տվյալները հինգ կատեգորիաների.
    ⭐⭐⭐⭐⭐: Շատ դրական
    ⭐⭐⭐⭐: Դրական
    ⭐⭐⭐: Չեզոք
    ⭐⭐: Բացասական
    ⭐: Շատ բացասական
    Բոլոր վարկանիշները դասակարգելուց հետո պատրաստվում է գծապատկեր կամ գծապատկեր՝ արտադրանքի կառավարիչներին ցույց տալու ընդհանուր ակնարկները:
  2. Զգացմունքների հայտնաբերում.Սա անցնում է տեքստի միջոցով՝ պարզելու, թե արդյոք տվյալ ակնարկն արտահայտում է երջանկություն, տխրություն կամ զայրույթ: Այս համակարգերից շատերն օգտագործում են մեքենայական ուսուցման բարդ ալգորիթմներ կամ լեքսիկոններ (բառերի ցուցակներ, որոնք արդեն դասակարգված են զգացմունքների տեսակների մեջ):
    Օրինակ՝ «Սուրճը ֆանտաստիկ է» նախադասությունը: երջանկություն է արտահայտում «ֆանտաստիկ» բառի և նախադասության վերջում բացականչական նշանի պատճառով, մինչդեռ «Միսը սարսափելի է» նախադասությունը😡։ արտահայտում է զայրույթը «սարսափելի» և խռպոտ դեմքի էմոջիների պատճառով:
    Թեև այս տեսակը շատ արդյունավետ է տեքստային տվյալների մեջ, սակայն բացասական բառերն օգտագործվում են դրական զգացմունքներ արտահայտելու համար բացասական կողմեր ​​կան: Ինչպես «Այս տապակը գազան է»: անալիզատորը հայտնաբերում է այն որպես բացասական, թեև «գազանն» օգտագործվում է որպես հաճոյախոսություն:
  3. Բազմալեզու տրամադրությունների վերլուծություն.Որոշ դեպքերում ակնարկները անգլերեն չեն: Այս տեսակը տվյալները թարգմանում է անգլերեն և վերլուծում դրանք: Այնուամենայնիվ, այս համակարգը ամենադժվարն է, քանի որ թարգմանությունը զգացմունք գտնելու միակ մեթոդը չէ, քանի որ յուրաքանչյուր մայրենի լեզու ունի իր մշակույթը, այդպիսով առաջացնելով զգացմունքներ արտահայտելու տարբեր ձևեր՝ օգտագործելով միայն մեկ տեսակի նախադասություն, ինչը հանգեցնում է հակասությունների:

Մեթոդներ և ծրագրավորման լեզուներ

Տվյալների մեջ զգացմունքները գտնելու և վերլուծելու երեք եղանակ կա.

  • Կանոնների վրա հիմնված մոտեցում.Այս մոտեցումը գործում է մի շարք կանոնների հիման վրա, որոնք մշակվում են ձեռքով: Սա ներառում է NLP տեխնիկան, ինչպիսիք են նշանավորումը, բխում, վերլուծություն և լեքսիկոններ: Այս մոտեցման գործընթացը հետևյալն է.

    1: Նախ, այն դասակարգում է բառերի ցանկը երկու մասի, այսինքն՝ դրական և բացասական:

    < ուժեղ>2. Երկրորդ, այն օգտագործում է ցուցակը և որոնում է այդ բառերը ակնարկներում: Յուրաքանչյուրը դրական կամ բացասական բառերի համար ավելանում է:

    3: Վերջապես, այն համեմատում է դրական և բացասական բառերի քանակը.

    — < ուժեղ>ա. Եթե դրական բառերն ավելի շատ են, ապա ընդհանուր ակնարկը դրական է, և հակառակը:
    բ: Եթե դրական և բացասական բառերը թվով հավասար են, ապա վերանայումը չեզոք է:
  • Ավտոմատ մոտեցում.Այս մոտեցումը հիմնված է մեքենայական ուսուցման տեխնիկայի վրա: Դրա համար կան բազմաթիվ եղանակներ, այնպես որ, ընդհանուր առմամբ, մոդելը կազմվում է ըստ իրավիճակի, որոշ տվյալներ են տրվում այն ​​վերապատրաստելու համար, այնուհետև այն աշխատում է որպես դասակարգիչ։ Ահա թե ինչպես է այն աշխատում մանրամասն.

    a. Ուսուցման գործընթացում մոդելը նախ սովորում է կապել մուտքերը դրանց ճիշտ արդյունքների հետ: Դա անելու համար համակարգին տրվում է տվյալների 25%-ը՝ իրավիճակը հասկանալու համար:
    b. Երբ մոդելը հասկանում է իրավիճակը, այն տեղափոխվում է կանխատեսման գործընթաց: Այստեղ տվյալները սնվում են, և տվյալների ընդհանուր տրամադրությունը ստեղծվում է որպես արդյունք:
  • Հիբրիդային մոտեցում.Ինչպես անվանումն է ասում, այս մոտեցումն աշխատում է կանոնների վրա հիմնված և ավտոմատ մոտեցումների համադրմամբ: Այս մոտեցումն ամենաարդյունավետն է, քանի որ այն հավաքում է վերը նշված մոտեցումներից լավագույնը և գտնում է իրավիճակին դիմակայելու լավագույն տեխնիկան, ինչը հանգեցնում է արդյունքների, որոնք հաճախ ավելի ճշգրիտ են:

Այս մեթոդները սովորաբար իրականացվում են ծրագրավորման երկու լեզուներից որևէ մեկում՝ Python և JavaScript:

Զգացմունքների վերլուծության համար Python-ում օգտագործվող ընդհանուր գրադարաններն են.

  • scikit-learn.Այն անվճար մեքենայական ուսուցման գրադարան է և պարունակում է տեքստի վեկտորացման գործիքներ (տեքստը թվային ձևի վերածելու համար):
  • NLTK.Natural Language Toolkit-ը ավանդական NLP գրադարան է Python-ի համար, որն ունի համայնք, որն առաջացնում է նոր գաղափարներ՝ այն ավելի լավ աշխատելու համար:
  • spaCy.Այս գրադարանն օգտագործվում է տեքստի դասակարգիչների վերապատրաստման համար և նման է NLTK-ին:
  • TensorFlow.Այս գրադարանը մշակվել է Google-ի կողմից: Այն պարունակում է տեքստի վեկտորիզացիա և ապահովում է գործիքներ կառուցելու և ուսուցման համար:
  • PyTorch.Այն մշակվել է Facebook-ի AI Research Lab-ի կողմից և ունի աջակցության ուժեղ համայնք:

Ինչ վերաբերում է JavaScript-ին, ապա ընդհանուր գրադարաններն են.

  • OpenNLP.NLP, որը պարունակում է NLP-ի ամենատարածված հատկանիշները:
  • Stanford CoreNLP. Մեկ այլ NLP գրադարան, որը մշակվել է The Stanford NLP Group-ի կողմից:
  • LingPipe. Java-ի գործիքակազմ՝ հաշվողական լեզվաբանության միջոցով տեքստը մշակելու համար:
  • Weka.Բաց կոդով գրադարան՝ ստեղծված Վայկատոյի համալսարանի կողմից:

Կարևորություն

Մեր օրերում համակարգիչները հեշտացնում են խնդիրները, քանի որ դրանք ավելի արագ և արդյունավետ են: Բացի այդ, սոցիալական ցանցերի շնորհիվ մարդիկ ավելի հարմարավետ են զգում իրենց զգացմունքներն արտահայտելու համար: Այսպիսով, զգացմունքների վերլուծության ծրագրերն ավելի վստահելի են, քանի որ ի տարբերություն մեզ՝ մարդկանց, նրանք չունեն իրենց սեփական էմոցիաները վերանայումը սկանավորելիս՝ վերացնելով արդյունքների շեղումները: Այս ծրագրերը նաև տալիս են 100% արդյունավետությամբ արդյունքներ տվյալ ժամանակահատվածում:

Ավելին, տրամադրությունների վերլուծության հավելվածները իրական ժամանակում արդյունք են տալիս, որպեսզի նրանք հեշտությամբ կարողանան մշակել հաճախորդների կրկնվող ակնարկները: Սա խնայում է ժամանակն ու էներգիան, քանի որ մարդիկ չեն կարող անընդհատ աշխատել առանց ընդմիջման:

Բացի վերլուծությունից, այն տվյալների տեսակավորման հիանալի գործիք է, որը կարող է հսկայական ժամանակ խնայել այն մարդկանց համար, ովքեր պատասխանատու են ապրանքների փաստաթղթավորման համար, քանի որ նրանք կարող են պարզապես տեսնել ընդհանուր կարգավիճակը և զեկուցել դրա համաձայն:

Դիմումներ և օրինակներ

Զգացմունքների վերլուծության ընդհանուր հավելվածներն են.

  1. Հաճախորդների ձայնը ծրագրեր.Հաճախորդները գնահատում են 1-ից 10 սանդղակով կամ տալիս են տեքստային կարծիք: Այս կերպ ընկերությունները գիտեն ընդհանուր կարգավիճակը և հայտնաբերում են խնդիրները, եթե այդպիսիք կան:
  2. Ապրանքների և ապրանքանիշի փորձ.Հաճախորդները, ովքեր գնում են ապրանքներ, թողնում են ակնարկներ, որոնք այնուհետև օգտագործվում են ղեկավարների կողմից ցանկացած խնդիր լուծելու, առաջարկությունները լսելու կամ հաճախորդի ցանկությամբ թարմացնելու համար:
  3. Սոցիալական լրատվամիջոցների տրամադրությունների վերլուծություն.Սա ակնարկներ հավաքելու ամենահզոր միջոցն է, քանի որ մենք ազատորեն հրապարակում ենք այն, ինչ զգում ենք որոշակի իրի վերաբերյալ: Այն առաջացնում է շատ տվյալներ, որոնք կարող են շատ արդյունավետ դարձնել մեքենայական ուսուցման մոդելները:

Ամենատարածված օրինակները սոցիալական մեդիա հարթակներն են, քանի որ դրանք ամենաշատը տվյալներ են ստանում օգտատերերից:

  • Facebook-ը և Twitter-ը վերլուծում են հավանումները և մեկնաբանությունները, ինչը կարող է օգնել պարզել՝ տվյալ հրապարակումը կրթական է, թե ատելության խոսք:
  • Uber-ը, Careem-ը, Daraz-ը և այլն վերլուծում են հաճախորդների ակնարկները, ինչը կարող է օգնել նրանց ճիշտ գինը սահմանել և ճանաչել վարորդին/խանութատիրոջը:

Եզրակացություն

Ամեն շաբաթ միլիոնավոր տվյալներ են ստեղծվում, որոնք պարունակում են զգացմունքներ և հույզեր, որոնք կարող են լինել աստղերի վարկանիշների կամ տեքստային արձագանքների տեսքով: Մարդկային ըմբռնման փոխարեն այս մարդկանց, զգացմունքների վերլուծիչը կարող է հեշտացնել իրավիճակը: Սրանք ծրագրեր են, որոնք պատրաստված են NLP-ի և մեքենայական ուսուցման տեխնիկայի միջոցով Python-ում և JavaScript-ում: Նրանք արագ և արդյունավետ են և խնայում են շատ ժամանակ և գումար: