Բարև բոլորին, Դուք իմացե՞լ եք Python-ում պանդաների մասին:

Եկեք նայենք դրան…

Ի՞նչ են պանդաները Python-ում:

Pandas-ը բաց կոդով գրադարան է, որը ստեղծվել է հիմնականում հարաբերական կամ պիտակավորված տվյալների հետ հեշտ և ինտուիտիվ աշխատելու համար: Այն տրամադրում է տվյալների տարբեր կառուցվածքներ և գործողություններ՝ թվային տվյալների և ժամանակային շարքերի մանիպուլյացիայի համար: Այս գրադարանը կառուցված է NumPy գրադարանի վերևում:

Սկսել

Ինչպե՞ս տեղադրել պանդաները:

Պանդաների տեղադրումը շատ հեշտ է: Պարզապես փորձեք ստորև նշված հրամանը

C:\Users\Your Name›pip install pandas

Պանդաների ներմուծում.

Այստեղ «pd»-ը նշվում է որպես պանդաների կեղծանուն:

Պանդաները սովորաբար տրամադրում են տվյալների մանիպուլյացիայի երկու կառուցվածք, Դրանք են.

  • Սերիա
  • Տվյալների շրջանակ

Սերիա:

Սերիան միաչափ պիտակավորված զանգված է, որն ունակ է պահել ցանկացած տեսակի տվյալներ (ամբողջ թիվ, տող, float, python առարկաներ և այլն): Առանցքների պիտակները միասին կոչվում են ինդեքս:

պանդաներ.Սերիա

Պանդաների շարքը կարող է ստեղծվել հետևյալ կոնստրուկտորի միջոցով.

pandas.Series( data, index, dtype, copy)

տվյալներ-տվյալներն ունեն տարբեր ձևեր, ինչպիսիք են ndarray, ցուցակ, հաստատուններ

index-Ինդեքսի արժեքները պետք է լինեն եզակի և hashable, նույն երկարությունը, ինչ տվյալները: Կանխադրված np.arrange(n) եթե ինդեքս չի փոխանցվում:

dtype-dtype-ը տվյալների տեսակի համար է: Եթե ​​Ոչ մեկը, ապա կստացվի տվյալների տեսակը

պատճենել-Պատճենել տվյալները: Կանխադրված սխալ

Ստեղծեք դատարկ շարք

Հիմնական շարքը, որը կարելի է ստեղծել, դատարկ շարք է:

ԱՐԴՅՈՒՆՔ:

Զանգվածից շարքի ստեղծում՝

Զանգվածից շարք ստեղծելու համար մենք պետք է ներմուծենք numpy մոդուլ և օգտագործենք array() ֆունկցիան։

Ելք՝

Զանգվածից շարքի ստեղծում ինդեքսով.
Որպեսզի ինդեքսով զանգվածից շարք ստեղծենք, մենք պետք է ինդեքս տրամադրենք նույն թվով տարրով, որքան այն զանգվածում է:

Ելք՝

Ցուցակների շարքի ստեղծում.

Ցուցակից շարք ստեղծելու համար նախ պետք է ցուցակ ստեղծենք, որից հետո կարող ենք շարք ստեղծել ցուցակից:

Օրինակ:

Ելք՝

Սկալարի արժեքից շարքի ստեղծում՝

Սկալյար արժեքից շարք ստեղծելու համար պետք է տրամադրվի ինդեքս։ Սկալյար արժեքը կկրկնվի ինդեքսի երկարությանը համապատասխանելու համար

ԱՐԴՅՈՒՆՔ:

Բառարանից շարքի ստեղծում.

Բառարանից շարք ստեղծելու համար նախ պետք է բառարան ստեղծենք, որից հետո կարող ենք շարք պատրաստել բառարանից։ Բառարանի բանալին օգտագործվում է ինդեքս կառուցելու համար:

ԱՐԴՅՈՒՆՔ:

Բառարանում մենք կարող ենք տեղադրել նոր արժեքներ Տեսնենք օրինակ.

Համեմատության օպերատորներ.

Այս Համեմատության օպերատորները, եթե պայմանը բավարարում է այն, վերադառնում են որպես True այլապես False:

Այստեղ ստորև բերված օրինակը վերադարձնում է միայն իրական արժեքները,

Տվյալների շրջանակ.

Տվյալների շրջանակը տվյալների երկչափ կառուցվածք է, այսինքն՝ տվյալները դասավորված են աղյուսակային ձևով՝ տողերում և սյունակներում: Pandas DataFrame-ը բաղկացած է երեք հիմնական բաղադրիչներից՝ տվյալներ, տողեր և սյունակներ:

Dataframe-ի ստեղծում ndarray/lists-ից.

Narray/list-ի dict-ից DataFrame ստեղծելու համար ամբողջ շարվածքը պետք է լինի նույն երկարության: Եթե ​​ինդեքսը փոխանցվում է, ապա երկարության ինդեքսը պետք է հավասար լինի զանգվածների երկարությանը: Եթե ​​ոչ մի ինդեքս չի փոխանցվում, ապա լռելյայն ինդեքսը կլինի միջակայք(n), որտեղ n-ը զանգվածի երկարությունն է:

Օրինակ:

Ելք՝

Այստեղ ինդեքսների արժեքները կարող են փոփոխվել: Օրինակ ես փոխել եմ ինդեքսի արժեքը որպես stud1, stud2, stud3

— -›Dataframe-ի յուրաքանչյուր սյունակի տվյալների տեսակը ներկայացված է ստորև.

Վերադարձված Series օբյեկտի ինդեքսը սյունակի անունն է, իսկ Series արժեքի սյունակը պարունակում է համապատասխան սյունակի տվյալների տեսակը:

Ավելացնելով նոր սյունակ.

Այստեղ ես որպես գնահատական ​​ավելացրել եմ նոր սյունակ,

— -›Այստեղ տողերի ընդհանուր քանակը չորսն է, եթե ցանկանում եք, որ առաջին երկու տողերը մուտքագրեք ստորև նշված կոդը,

Ելք՝

— -›Եթե ցանկանում եք, որ վերջին երկու տողերը տպվեն

Ելք՝

նկարագրել():

describe()մեթոդը վերադարձնում է տվյալների նկարագրությունը DataFrame-ում: Եթե ​​DataFrame-ը պարունակում է թվային տվյալներ, նկարագրությունը պարունակում է այս տեղեկատվությունը յուրաքանչյուր սյունակի համար.

— -›Այս ստորև բերված օրինակում տվյալների շրջանակը նկարագրված է որպես ['օբյեկտ']

Ինչպես ցույց է տրված ելքային պատկերում, describe()-ի վարքագիծը տարբեր է տողերի շարքի հետ:
Տարբեր վիճակագրություններ են վերադարձվել, ինչպիսիք են արժեքների քանակը, եզակի արժեքները, վերին և հաճախականությունը այս դեպքում:

Պանդաների ինդեքսավորում.

Պանդաներում կան ինդեքսավորման որոշ մեթոդներ, որոնք օգնում են տարր ստանալ DataFrame-ից: Այս ինդեքսավորման մեթոդները շատ նման են թվում, բայց վարվում են շատ տարբեր:

  • Dataframe.loc[].Այս ֆունկցիան օգտագործվում է պիտակների համար:
  • Dataframe.iloc[]. Այս ֆունկցիան օգտագործվում է դիրքերի կամ ամբողջ թվերի վրա հիմնված:

Տվյալների շրջանակի ինդեքսավորում՝ օգտագործելով .loc[]՝

Այս ֆունկցիան ընտրում է տվյալներ ըստ տողերի և սյունակների պիտակի: df.loc ինդեքսատորն ընտրում է տվյալները այլ կերպ, քան պարզապես ինդեքսավորման օպերատորը: Այն կարող է ընտրել տողերի կամ սյունակների ենթաբազմություններ: Այն կարող է նաև միաժամանակ ընտրել տողերի և սյունակների ենթաբազմություններ:

Օրինակ 1:

Օրինակ 2:

Տվյալների շրջանակի ինդեքսավորում՝ օգտագործելով .iloc[]՝

Այս ֆունկցիան թույլ է տալիս առբերել տողերն ու սյունակները ըստ դիրքի: Դա անելու համար մենք պետք է նշենք մեր ուզած տողերի դիրքերը, ինչպես նաև մեր ուզած սյունակների դիրքերը: df.iloc indexer-ը շատ նման է df.loc -ին, բայց օգտագործում է միայն ամբողջ թվեր՝ իր ընտրությունը կատարելու համար:

Օրինակ 1:

Օրինակ 2:

Եկեք բռնենք բոլորիդ հաջորդ բլոգում…

Հարցեր կան: Խնդրում եմ կապել ինձ մեկնաբանությունների բաժնում, կպատասխանեմ ձեզ :)

Պատկերի աղբյուր՝ https://www.shutterstock.com/