Բարև ձեզ, ես ձեզ կպատմեմ այն ​​աշխատանքի մասին, որը ես ստեղծել եմ և ինքս եմ վերլուծել տվյալների հավաքածուն:

Նշում

Այս տվյալները վերցված են https://www.numbeo.com/cost-of-living/-ից: Շնորհակալություն numbeo.com-ին ամեն ինչի համար:
Այս տվյալները ներառում են երկրների կենսական արժեքները:

Ինչ կարող եք ակնկալել:

  • Տվյալների մաքրում և խմբագրում
  • Արտաքին կետերի հայտնաբերում և հեռացում
  • Տվյալների պատկերացում և վերլուծություն
  • Մեքենայի ուսուցում

Մենք ներմուծում ենք այն գրադարանները, որոնք կօգտագործենք։

Սեղմեք տվյալների հավաքածու մուտք գործելու համար:

Տվյալների շտեմարանում «?» մենք հանում ենք արժեքներ ունեցող արժեքները։ Այնուհետև մենք վերականգնում ենք ինդեքսի արժեքները:

Այժմ մենք տվյալներից ջնջում ենք «$» և «,» նիշերը:

Տեսնենք տվյալների հավաքածուի սյունակների տեսակները:

Այստեղ մենք տեսնում ենք, որ տվյալները բոլոր սյունակները դասակարգված են, և մենք բոլոր սյունակները վերածում ենք թվային տիպի, բացառությամբ «CountryName» անունով սյունակի:

Մենք կավելացնենք նոր սյունակ մեր տվյալների բազայում, այս սյունակը ցույց կտա երկրների զարգացման կարգավիճակը:

Հիմա եկեք մաքրենք բաց թողնված տվյալները և վերականգնենք ինդեքսները:

Արտաքին կետերի հայտնաբերում և հեռացում

Այստեղ մենք կստուգենք, թե արդյոք տվյալների հավաքածուի յուրաքանչյուր սյունակում կան արտանետումներ:
Եթե կան արտաքին տվյալներ, մենք կհանենք այս արժեքները մեր տվյալների հավաքածուից:
Այս գործընթացն անելու պատճառն այն է, որ մենք կարող ենք ստանալ ավելի ճշգրիտ արդյունքներ վերլուծության և մեքենայական ուսուցման մասերում:

Այստեղ մենք ընտրում ենք միայն թվային արժեքների սյունակները մեր տվյալների բազայից:

Այնուհետև մենք յուրաքանչյուր սյունակի համար հայտնաբերում ենք ուրվագիծ, և եթե կա արտանետում, մենք հեռացնում ենք այդ արժեքները մեր տվյալների հավաքածուից:
Այս գործողությունները կատարելու համար մենք կօգտագործենք for հանգույց:

Այստեղ մենք տեսնում ենք տվյալների միջինը և մեդիանը՝ ըստ երկրների զարգացման կարգավիճակի։

Մենք պատրաստեցինք մեր տվյալների հավաքածուն վերլուծության մասի համար: Դրանից հետո մենք կանցնենք տվյալների վիզուալիզացմանը: Տեսնենք, ի՞նչ հետևություններ կարող ենք անել։

Եկեք պատկերացնենք այս արժեքները ըստ կատեգորիաների:

Մենք ստեղծել ենք մեր պատկերները։ Մենք կարող ենք տեսնել բաշխումները բոլոր պատկերներում: Այստեղ եկեք գնահատենք մեքենայական ուսուցում օգտագործող երկրների զարգացման մակարդակը։

Նախ, եկեք ստեղծենք կախված և անկախ փոփոխականները:

Այժմ եկեք բաժանենք մեր տվյալները վերապատրաստման և փորձարկման մասերի:

Դրանից հետո կլինեն մեքենայական ուսուցման գործընթացներ։

Ալգորիթմներ

  • Պատահական անտառ
  • Որոշման ծառերի դասակարգիչ
  • Աջակցող վեկտորային մեքենաներ (SVM)
  • GaussianNB
  • K-Neighbors դասակարգիչ (KNN)

Kaggle. https://www.kaggle.com/code/muhammetmirayzakl/effect-of-cost-of-living-on-level-of-development

Linkedln. https://www.linkedin.com/in/muhammet-mira%C3%A7-0564631a0/

UpWork՝ https://www.upwork.com/freelancers/~0178f4cf3eb93b5f83

Github: https://github.com/miracyuzakli