Բարև բոլորին, Դուք իմացե՞լ եք Python-ում պանդաների մասին:
Եկեք նայենք դրան…
Ի՞նչ են պանդաները Python-ում:
Pandas-ը բաց կոդով գրադարան է, որը ստեղծվել է հիմնականում հարաբերական կամ պիտակավորված տվյալների հետ հեշտ և ինտուիտիվ աշխատելու համար: Այն տրամադրում է տվյալների տարբեր կառուցվածքներ և գործողություններ՝ թվային տվյալների և ժամանակային շարքերի մանիպուլյացիայի համար: Այս գրադարանը կառուցված է NumPy գրադարանի վերևում:
Սկսել
Ինչպե՞ս տեղադրել պանդաները:
Պանդաների տեղադրումը շատ հեշտ է: Պարզապես փորձեք ստորև նշված հրամանը
C:\Users\Your Name›pip install pandas
Պանդաների ներմուծում.
Այստեղ «pd»-ը նշվում է որպես պանդաների կեղծանուն:
Պանդաները սովորաբար տրամադրում են տվյալների մանիպուլյացիայի երկու կառուցվածք, Դրանք են.
- Սերիա
- Տվյալների շրջանակ
Սերիա:
Սերիան միաչափ պիտակավորված զանգված է, որն ունակ է պահել ցանկացած տեսակի տվյալներ (ամբողջ թիվ, տող, float, python առարկաներ և այլն): Առանցքների պիտակները միասին կոչվում են ինդեքս:
պանդաներ.Սերիա
Պանդաների շարքը կարող է ստեղծվել հետևյալ կոնստրուկտորի միջոցով.
pandas.Series( data, index, dtype, copy)
տվյալներ-տվյալներն ունեն տարբեր ձևեր, ինչպիսիք են ndarray, ցուցակ, հաստատուններ
index-Ինդեքսի արժեքները պետք է լինեն եզակի և hashable, նույն երկարությունը, ինչ տվյալները: Կանխադրված np.arrange(n) եթե ինդեքս չի փոխանցվում:
dtype-dtype-ը տվյալների տեսակի համար է: Եթե Ոչ մեկը, ապա կստացվի տվյալների տեսակը
պատճենել-Պատճենել տվյալները: Կանխադրված սխալ
Ստեղծեք դատարկ շարք
Հիմնական շարքը, որը կարելի է ստեղծել, դատարկ շարք է:
ԱՐԴՅՈՒՆՔ:
Զանգվածից շարքի ստեղծում՝
Զանգվածից շարք ստեղծելու համար մենք պետք է ներմուծենք numpy մոդուլ և օգտագործենք array() ֆունկցիան։
Ելք՝
Զանգվածից շարքի ստեղծում ինդեքսով.
Որպեսզի ինդեքսով զանգվածից շարք ստեղծենք, մենք պետք է ինդեքս տրամադրենք նույն թվով տարրով, որքան այն զանգվածում է:
Ելք՝
Ցուցակների շարքի ստեղծում.
Ցուցակից շարք ստեղծելու համար նախ պետք է ցուցակ ստեղծենք, որից հետո կարող ենք շարք ստեղծել ցուցակից:
Օրինակ:
Ելք՝
Սկալարի արժեքից շարքի ստեղծում՝
Սկալյար արժեքից շարք ստեղծելու համար պետք է տրամադրվի ինդեքս։ Սկալյար արժեքը կկրկնվի ինդեքսի երկարությանը համապատասխանելու համար
ԱՐԴՅՈՒՆՔ:
Բառարանից շարքի ստեղծում.
Բառարանից շարք ստեղծելու համար նախ պետք է բառարան ստեղծենք, որից հետո կարող ենք շարք պատրաստել բառարանից։ Բառարանի բանալին օգտագործվում է ինդեքս կառուցելու համար:
ԱՐԴՅՈՒՆՔ:
Բառարանում մենք կարող ենք տեղադրել նոր արժեքներ Տեսնենք օրինակ.
Համեմատության օպերատորներ.
Այս Համեմատության օպերատորները, եթե պայմանը բավարարում է այն, վերադառնում են որպես True այլապես False:
Այստեղ ստորև բերված օրինակը վերադարձնում է միայն իրական արժեքները,
Տվյալների շրջանակ.
Տվյալների շրջանակը տվյալների երկչափ կառուցվածք է, այսինքն՝ տվյալները դասավորված են աղյուսակային ձևով՝ տողերում և սյունակներում: Pandas DataFrame-ը բաղկացած է երեք հիմնական բաղադրիչներից՝ տվյալներ, տողեր և սյունակներ:
Dataframe-ի ստեղծում ndarray/lists-ից.
Narray/list-ի dict-ից DataFrame ստեղծելու համար ամբողջ շարվածքը պետք է լինի նույն երկարության: Եթե ինդեքսը փոխանցվում է, ապա երկարության ինդեքսը պետք է հավասար լինի զանգվածների երկարությանը: Եթե ոչ մի ինդեքս չի փոխանցվում, ապա լռելյայն ինդեքսը կլինի միջակայք(n), որտեղ n-ը զանգվածի երկարությունն է:
Օրինակ:
Ելք՝
Այստեղ ինդեքսների արժեքները կարող են փոփոխվել: Օրինակ ես փոխել եմ ինդեքսի արժեքը որպես stud1, stud2, stud3
— -›Dataframe-ի յուրաքանչյուր սյունակի տվյալների տեսակը ներկայացված է ստորև.
Վերադարձված Series օբյեկտի ինդեքսը սյունակի անունն է, իսկ Series արժեքի սյունակը պարունակում է համապատասխան սյունակի տվյալների տեսակը:
Ավելացնելով նոր սյունակ.
Այստեղ ես որպես գնահատական ավելացրել եմ նոր սյունակ,
— -›Այստեղ տողերի ընդհանուր քանակը չորսն է, եթե ցանկանում եք, որ առաջին երկու տողերը մուտքագրեք ստորև նշված կոդը,
Ելք՝
— -›Եթե ցանկանում եք, որ վերջին երկու տողերը տպվեն
Ելք՝
նկարագրել():
describe()մեթոդը վերադարձնում է տվյալների նկարագրությունը DataFrame-ում: Եթե DataFrame-ը պարունակում է թվային տվյալներ, նկարագրությունը պարունակում է այս տեղեկատվությունը յուրաքանչյուր սյունակի համար.
— -›Այս ստորև բերված օրինակում տվյալների շրջանակը նկարագրված է որպես ['օբյեկտ']
Ինչպես ցույց է տրված ելքային պատկերում, describe()-ի վարքագիծը տարբեր է տողերի շարքի հետ:
Տարբեր վիճակագրություններ են վերադարձվել, ինչպիսիք են արժեքների քանակը, եզակի արժեքները, վերին և հաճախականությունը այս դեպքում:
Պանդաների ինդեքսավորում.
Պանդաներում կան ինդեքսավորման որոշ մեթոդներ, որոնք օգնում են տարր ստանալ DataFrame-ից: Այս ինդեքսավորման մեթոդները շատ նման են թվում, բայց վարվում են շատ տարբեր:
- Dataframe.loc[].Այս ֆունկցիան օգտագործվում է պիտակների համար:
- Dataframe.iloc[]. Այս ֆունկցիան օգտագործվում է դիրքերի կամ ամբողջ թվերի վրա հիմնված:
Տվյալների շրջանակի ինդեքսավորում՝ օգտագործելով .loc[]՝
Այս ֆունկցիան ընտրում է տվյալներ ըստ տողերի և սյունակների պիտակի: df.loc
ինդեքսատորն ընտրում է տվյալները այլ կերպ, քան պարզապես ինդեքսավորման օպերատորը: Այն կարող է ընտրել տողերի կամ սյունակների ենթաբազմություններ: Այն կարող է նաև միաժամանակ ընտրել տողերի և սյունակների ենթաբազմություններ:
Օրինակ 1:
Օրինակ 2:
Տվյալների շրջանակի ինդեքսավորում՝ օգտագործելով .iloc[]՝
Այս ֆունկցիան թույլ է տալիս առբերել տողերն ու սյունակները ըստ դիրքի: Դա անելու համար մենք պետք է նշենք մեր ուզած տողերի դիրքերը, ինչպես նաև մեր ուզած սյունակների դիրքերը: df.iloc
indexer-ը շատ նման է df.loc
-ին, բայց օգտագործում է միայն ամբողջ թվեր՝ իր ընտրությունը կատարելու համար:
Օրինակ 1:
Օրինակ 2:
Եկեք բռնենք բոլորիդ հաջորդ բլոգում…
Հարցեր կան: Խնդրում եմ կապել ինձ մեկնաբանությունների բաժնում, կպատասխանեմ ձեզ :)
Պատկերի աղբյուր՝ https://www.shutterstock.com/