Պիթոն պանդաներում ես կարողացա պարզապես df.groupby(x,y).value_counts(normalize=True)
անել՝ խմբի յուրաքանչյուր արժեքի համամասնությունը ստանալու համար: Այնուամենայնիվ, ես չկարողացա դա անելու միջոց գտնել Ռ.
Ես խմբավորել եմ իմ df-ն ըստ x-ի և y-ի և ամփոփել եմ հաճախականությունը հաշվարկելու համար, որպես այդպիսին df %>% group_by(x,y) %>% summarize(count=n())
, բայց փոխարենը կցանկանայի տեսնել յուրաքանչյուր y-ի համամասնությունը յուրաքանչյուր x-ի համար:
x y count
1 A 22
1 B 65
1 C 94
1 D 40
2 D 34
2 E 1
2 F 6
3 E 4
3 F 13
օրինակ, համամասնությունների նոր սյունակը պետք է ունենա
x y proportion
1 A 0.0995475
1 B 0.2941176
1 C 0.4253393
1 D 0.1809955
2 D 0.8292683
2 E 0.024390
2 F 0.1463415
3 E 0.2352941
3 F 0.7647059
df %>% group_by(x) %>% mutate(proportion = prop.table(count))
30.03.2017