A/B թեստավորումը, որը նաև հայտնի է որպես պառակտման թեստավորում, համեմատում է ինչ-որ բանի երկու տարբեր տարբերակներ (բջջային հավելված, վեբ էջ, գովազդ և այլն)՝ որոշելու, թե որն է ավելի լավ կատարում: A/B թեստավորումը սովորական վիճակագրական թեստ է, հատկապես մարքեթինգային ռազմավարության մեջ: Մենք կարող ենք տեսնել, թե որ տարբերակն է ավելի շատ գնումներ կամ ավելի շատ կտտացնում պառակտման փորձարկումից հետո, այնուհետև կարող ենք ռազմավարական որոշումներ կայացնել: Շատ ընկերություններ օգտագործում են A/B թեստավորում նոր տեխնոլոգիաների աշխարհում, ինչպիսիք են Instagram-ը, Facebook-ը, Google-ը, LinkedIn-ը և այլն:
Ինչպե՞ս է աշխատում A/B թեստավորումը:
Եկեք պատկերացնենք, որ մենք ունենք առցանց գնումների կայք և ցանկանում ենք փոխել հիմնական էջը, բայց մենք վստահ չենք, թե ինչպես այն կգործի: Այս պահին մենք կարող ենք օգտագործել A/B թեստավորում: Մենք հրապարակում ենք յուրաքանչյուր էջ նույն URL-ով և առաջին էջը ցույց ենք տալիս մեր այցելուների կեսին: Մեր մնացած այցելուները տեսնում են մեր նոր էջը։ Այցելուներից որոշ պատասխաններ ստանալուց հետո մենք կարող ենք ստուգել, թե որ էջն է ավելի լավ աշխատել: Բայց ինչպե՞ս ենք մենք փորձարկում: Եկեք բացահայտենք իրական աշխարհի նախագիծը:
Օրինակ՝ Համեմատեք հայտի մեթոդները Python-ի միջոցով
AB թեստավորման քայլեր.
1- Ստեղծեք վարկած
2- Ենթադրությունների ստուգում
- Ենթադրություն 1. բաշխումները նորմալ են յուրաքանչյուր փոփոխականի համար
- Ենթադրություն 2. Տարբերակները միատարր են
3- Կիրառել վարկածը և վերահսկել p-արժեքը: Եթե p-արժեքը փոքր է 0,05-ից, մենք կարող ենք մերժել H0-ը: Եթե ոչ, մենք չենք կարող մերժել H0-ն:
- Եթե ենթադրությունները ճիշտ են, օգտագործեք անկախ նմուշների t-թեստը (պարամետրական թեստ, t-թեստ)
- Եթե ենթադրությունները ճիշտ չեն, օգտագործեք Mann-Whitney U թեստը (ոչ պարամետրական թեստ, Mann-Whitney U)
Բիզնեսի խնդիր. մարքեթինգային ստրատեգները վերջերս ներկայացրեցին հայտի նոր տեսակ՝ «միջին սակարկություններ», որպես այլընտրանք գոյություն ունեցող «առավելագույն հայտի» հայտի տեսակին: Մեր հաճախորդներից մեկը՝ bombabomba.com-ը, որոշեց փորձարկել այս նոր հնարավորությունը և կցանկանար A/B թեստ անել՝ տեսնելու, թե արդյոք միջին սակագինը փոխակերպում է առավելագույն գնից ավելին: A/B թեստավորումը շարունակվում է արդեն 1 ամիս, և այժմ bombabomba.com-ը սպասում է ձեզ՝ վերլուծելու այս A/B թեստի արդյունքները մեզանից։ Bombabomba.com-ի համար գնումը հաջողության վերջնական չափանիշն է: Հետևաբար, Գնման չափանիշը պետք է կենտրոնանա վիճակագրական թեստերի վրա:
Փոփոխականներ:
impression_cont. Գովազդի վերահսկիչ խմբի թիվը
impression_test. Գովազդի թեստային խմբի թիվը
click_cont. վերահսկիչ խմբի ցուցադրվող գովազդի վրա սեղմումների քանակը
click_test. ցուցադրվող գովազդի վրա սեղմումների քանակը թեստային խմբի համար
buy_cont. Գովազդի համար վերահսկվող խմբի համար սեղմելուց հետո գնված ապրանքների քանակը
buy_test. գնված ապրանքների քանակը թեստային խմբի համար գովազդի սեղմումից հետո
վաստակի_cont. Շահույթ գնումներից հետո վերահսկիչ խումբ
gaining_test. եկամուտներ թեստային խմբի գնումներից հետո
Քայլ 1. Ներմուծեք գրադարաններ
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from scipy.stats import ttest_1samp, shapiro, levene, ttest_ind, mannwhitneyu
Քայլ 2. Կարդացեք «ab_testing.xlsx» ֆայլը և ստացեք առաջին 5 տողը
df_control = առավելագույն սակարկություն
df_test = միջին գնային առաջարկ
df_control = pd.read_excel('ab_testing.xlsx') df.head()
Արդյունք:
Քայլ 3. Ստեղծեք H0 վարկածը և ստուգեք յուրաքանչյուր խմբի միջին գնումը
H0. Միջին գնումները հավասար են վերահսկիչ և թեստային խմբերի համար:
M1=Վերահսկիչ խմբի գնման միջինը
M2=Թեստային խմբի գնման միջինը
H0 : M1 = M2
H1 : M1!= M2
df[['purchase_cont', 'purchase_test']].agg(['mean'])
Արդյունք:
Ինչպես տեսնում եք վերևում, միջին գնումների միջև տարբերություն կա: Այնուամենայնիվ, առանցքային հարցն այն է, թե արդյոք դա նշանակալի է վիճակագրորեն:
Քայլ 4. Ենթադրությունների ստուգում
Ենթադրություն 1:
H0: Բաշխումը նորմալ է: ‹br›
H1. Բաշխումը բարոյական չէ:
Բաշխումները ստուգելու համար մենք կօգտագործենք Shapiro մեթոդը:
test_stat, p_value = shapiro(df[‘purchase_cont’]) print(‘Test statistic: %.5f\np value: %.5f’ % (test_stat, p_value))
Արդյունք:
test_stat, p_value = shapiro(df[‘purchase_test’]) print(‘Test statistic: %.5f\np value: %.5f’ % (test_stat, p_value))
Արդյունք:
Յուրաքանչյուր խմբի համար p արժեքները 0,05-ից մեծ են, ուստի մենք ընդունում ենք H0 վարկածը, որը բաշխումը նորմալ է:
Ենթադրություն 2:
H0: Տարբերակները միատարր են:
H1: Տարբերությունները միատարր չեն:
Մենք կօգտագործենք Levene մեթոդը՝ ստուգելու, որ շեղումները միատարր են:
test_stat, p_value = levene(df[‘purchase_cont’], df[‘purchase_test’]) print(‘Test statistic: %.5f\np value: %.5f’ % (test_stat, p_value))
Արդյունք:
P արժեքը 0,05-ից մեծ է, ուստի մենք կընդունենք H0-ը, որ շեղումները միատարր են: Երկու ենթադրությունները ճիշտ են, ուստի այս դեպքի համար մենք կօգտագործենք պարամետրային թեստ:
Քայլ 5. Պարամետրային փորձարկում
test_stat, p_value = ttest_ind(df['purchase_cont'], df['purchase_test'], equal_var=True) print('Test statistic: %.5f\np value: %.5f' % (test_stat, p_value))
Արդյունք:
P արժեքը 0,05-ից մեծ է, ուստի մենք կընդունենք H0 վարկածը, որ միջին գնումները հավասար են յուրաքանչյուր խմբի համար: Եզրափակելով՝ 95% վստահության միջակայքով առավելագույն և միջին սակարկությունների մեթոդների միջև վիճակագրական տարբերություն չկա:
Linkedln՝ https://www.linkedin.com/in/sedat-parlak-0b7013131/
GitHub՝ https://github.com/SedatParlak