Բարև ձեզ, ես ձեզ կպատմեմ այն աշխատանքի մասին, որը ես ստեղծել եմ և ինքս եմ վերլուծել տվյալների հավաքածուն:
Նշում
Այս տվյալները վերցված են https://www.numbeo.com/cost-of-living/-ից: Շնորհակալություն numbeo.com-ին ամեն ինչի համար:
Այս տվյալները ներառում են երկրների կենսական արժեքները:
Ինչ կարող եք ակնկալել:
- Տվյալների մաքրում և խմբագրում
- Արտաքին կետերի հայտնաբերում և հեռացում
- Տվյալների պատկերացում և վերլուծություն
- Մեքենայի ուսուցում
Մենք ներմուծում ենք այն գրադարանները, որոնք կօգտագործենք։
Սեղմեք տվյալների հավաքածու մուտք գործելու համար:
Տվյալների շտեմարանում «?» մենք հանում ենք արժեքներ ունեցող արժեքները։ Այնուհետև մենք վերականգնում ենք ինդեքսի արժեքները:
Այժմ մենք տվյալներից ջնջում ենք «$» և «,» նիշերը:
Տեսնենք տվյալների հավաքածուի սյունակների տեսակները:
Այստեղ մենք տեսնում ենք, որ տվյալները բոլոր սյունակները դասակարգված են, և մենք բոլոր սյունակները վերածում ենք թվային տիպի, բացառությամբ «CountryName» անունով սյունակի:
Մենք կավելացնենք նոր սյունակ մեր տվյալների բազայում, այս սյունակը ցույց կտա երկրների զարգացման կարգավիճակը:
Հիմա եկեք մաքրենք բաց թողնված տվյալները և վերականգնենք ինդեքսները:
Արտաքին կետերի հայտնաբերում և հեռացում
Այստեղ մենք կստուգենք, թե արդյոք տվյալների հավաքածուի յուրաքանչյուր սյունակում կան արտանետումներ:
Եթե կան արտաքին տվյալներ, մենք կհանենք այս արժեքները մեր տվյալների հավաքածուից:
Այս գործընթացն անելու պատճառն այն է, որ մենք կարող ենք ստանալ ավելի ճշգրիտ արդյունքներ վերլուծության և մեքենայական ուսուցման մասերում:
Այստեղ մենք ընտրում ենք միայն թվային արժեքների սյունակները մեր տվյալների բազայից:
Այնուհետև մենք յուրաքանչյուր սյունակի համար հայտնաբերում ենք ուրվագիծ, և եթե կա արտանետում, մենք հեռացնում ենք այդ արժեքները մեր տվյալների հավաքածուից:
Այս գործողությունները կատարելու համար մենք կօգտագործենք for հանգույց:
Այստեղ մենք տեսնում ենք տվյալների միջինը և մեդիանը՝ ըստ երկրների զարգացման կարգավիճակի։
Մենք պատրաստեցինք մեր տվյալների հավաքածուն վերլուծության մասի համար: Դրանից հետո մենք կանցնենք տվյալների վիզուալիզացմանը: Տեսնենք, ի՞նչ հետևություններ կարող ենք անել։
Եկեք պատկերացնենք այս արժեքները ըստ կատեգորիաների:
Մենք ստեղծել ենք մեր պատկերները։ Մենք կարող ենք տեսնել բաշխումները բոլոր պատկերներում: Այստեղ եկեք գնահատենք մեքենայական ուսուցում օգտագործող երկրների զարգացման մակարդակը։
Նախ, եկեք ստեղծենք կախված և անկախ փոփոխականները:
Այժմ եկեք բաժանենք մեր տվյալները վերապատրաստման և փորձարկման մասերի:
Դրանից հետո կլինեն մեքենայական ուսուցման գործընթացներ։
Ալգորիթմներ
- Պատահական անտառ
- Որոշման ծառերի դասակարգիչ
- Աջակցող վեկտորային մեքենաներ (SVM)
- GaussianNB
- K-Neighbors դասակարգիչ (KNN)
Kaggle. https://www.kaggle.com/code/muhammetmirayzakl/effect-of-cost-of-living-on-level-of-development
Linkedln. https://www.linkedin.com/in/muhammet-mira%C3%A7-0564631a0/
UpWork՝ https://www.upwork.com/freelancers/~0178f4cf3eb93b5f83
Github: https://github.com/miracyuzakli