Jak wybrać 45 najlepszych prezentacji na FORUM?

Podobne dokumenty
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.

Badania eksperymentalne

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

Testy nieparametryczne

Przykład 1. (A. Łomnicki)

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

Statystyka w przykładach

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

STATYSTYKA MATEMATYCZNA

Badania eksperymentalne

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Testowanie hipotez statystycznych

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Zadania ze statystyki cz.8. Zadanie 1.

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

Uwaga. Decyzje brzmią różnie! Testy parametryczne dotyczące nieznanej wartości

Wykład 1 Zmienne losowe, statystyki próbkowe - powtórzenie materiału

Wykład 10 Testy jednorodności rozkładów

Weryfikacja hipotez statystycznych testy t Studenta

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Analiza niepewności pomiarów

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Doświadczalnictwo leśne. Wydział Leśny SGGW Studia II stopnia

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

Wykład 11 Testowanie jednorodności

WERYFIKACJA HIPOTEZ STATYSTYCZNYCH

Porównanie wyników grupy w odniesieniu do norm Test t dla jednej próby

Zmienne losowe, statystyki próbkowe. Wrocław, 2 marca 2015

METODOLOGIA BADAŃ PSYCHOLOGICZNYCH I STATYSTYKA. opracowała dr Anna Szałańska

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA

Analiza wariancji i kowariancji


STATYSTYKA MATEMATYCZNA

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Statystyka matematyczna i ekonometria

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną. laboratoria 30 zaliczenie z oceną

Statystyka i Analiza Danych

Badanie zgodności dwóch rozkładów - test serii, test mediany, test Wilcoxona, test Kruskala-Wallisa

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 4

Testowanie hipotez statystycznych

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

Założenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW

Weryfikacja hipotez statystycznych testy dla dwóch zbiorowości

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

laboratoria 24 zaliczenie z oceną

Eksploracja Danych. Testowanie Hipotez. (c) Marcin Sydow

LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej

Metody statystyczne w socjologii SYLABUS A. Informacje ogólne Opis

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Hipotezą statystyczną nazywamy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

KARTA KURSU. Kod Punktacja ECTS* 1

Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka

Statystyka i eksploracja danych

Metody Statystyczne. Metody Statystyczne

SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY

Statystyka w zarządzaniu : pełny wykład / Amir D. Aczel. wyd. 1, dodr. 5. Warszawa; Spis treści

Pomiar wpływu I: Jak mierzyć wpływ? Wstęp do projektowania ewaluacji

Metody Statystyczne. Metody Statystyczne.

STATYSTYKA MATEMATYCZNA WYKŁAD 3. Populacje i próby danych

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA MATEMATYCZNA

Elementy statystyki wielowymiarowej

STATYSTYKA MATEMATYCZNA

Opracowywanie wyników doświadczeń

TESTOWANIE HIPOTEZ Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas cechy.

Testowanie hipotez statystycznych

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Własności statystyczne regresji liniowej. Wykład 4

Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)

ZMIENNE LOSOWE. Zmienna losowa (ZL) X( ) jest funkcją przekształcającą przestrzeń zdarzeń elementarnych w zbiór liczb rzeczywistych R 1 tzn. X: R 1.

Podstawy statystyki matematycznej w programie R

Wykład 10 Zrandomizowany plan blokowy

Statystyka w analizie i planowaniu eksperymentu

TESTOWANIE HIPOTEZ STATYSTYCZNYCH Przez hipotezę statystyczną rozumiemy, najogólniej mówiąc, pewną wypowiedź na temat rozkładu interesującej nas

STATYSTYKA MATEMATYCZNA

Rozkłady statystyk z próby

Księgarnia PWN: George A. Ferguson, Yoshio Takane - Analiza statystyczna w psychologii i pedagogice

Wykład 9 Testy rangowe w problemie dwóch prób

Przykład 2. Na podstawie książki J. Kowal: Metody statystyczne w badaniach sondażowych rynku

METODY STATYSTYCZNE W BIOLOGII

Pobieranie prób i rozkład z próby

Badania marketingowe. - Konspekt wykładowy

STATYSTYKA I DOŚWIADCZALNICTWO. Wykład 2

Rozkłady statystyk z próby. Statystyka

W analizowanym zbiorze danych występowały sporadyczne (nie przekraczające pięciu brakujących wyników na zmienną), losowe braki danych, które

mtim Dedykowane aplikacje mobilne dla TIM S.A.

Wprowadzenie do analizy korelacji i regresji

Uwaga! Test studenta dla pojedynczej próby, niekierunkowy. Wykład 9: Testy Studenta. Test Studenta dla jednej próby, kierunkowy

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Transkrypt:

Być data driven company w erze Big Data. Jak wybrać 45 najlepszych prezentacji na FORUM? Doświadczenia z budowy platformy do prowadzenia na dużą skalę eksperymentów A/B Joanna Radosław Komuda, Kita, IAB Allegro Polska

Właściwie po co te testy? Przecież wszyscy. Ludzie zazwyczaj Nikt rozsądny Moje dziecko to zawsze Popatrz jakie to słodkie. Jak mam coś znaleźć, to robię to tak Nie, nie, nie. To się nie sprawdzi. Stary, 8 lat w branży.

Właściwie po co te testy? Zróbmy ankietę Pokażmy ekspertom makietę Zróbmy badanie fokusowe Pozwólmy naszym ideom umierać za nas Karl Popper Data driven company

Co powinniśmy testować? Wszystko Nie no serio, prawie wszystko Efektywność systemów rekomendacji Efektywność algorytmów wyszukiwania Zmiany w budowie stron Zmiany w aplikacjach Każdą nową funkcjonalność

1. Definicja testu 2. Plan eksperymentalny 3. Podział na grupy Jak to działa? 4. Zebranie danych 5. Dobór statystyki 6. Od testu do wdrożenia na całym serwisie 7. Dużo jednoczesnych testów -> kiedy uruchomić kolejny Czyli trochę wyzwań: od technologicznych poprzez programistyczne aż po statystyczne.

Definicja testu Osoba definiująca test musi mieć dostęp do graficznego interface. Musimy przekazać dalej definicję której funkcjonalności dotyczy eksperyment identyfikowanie użytkowników, którzy rzeczywiście mieli kontakt z naszą funkcjonalnością. Co jeśli trzeba przewinąć ekran albo rozklikać jakieś menu?

Definicja testu Miara sukcesu: Przychodowość wiadomo Ilość kliknięć? Jednorodność koszyka zakupowego? Długość ścieżki zakupowej? Aktywizacja nowych użytkowników?

Co porównujemy: Średnia? Mediana? 75 centyl/percentyl? Definicja testu

Plan eksperymentalny Jak Jak wybrać Grupa testowa 45 45 najlepszych Użytkownicy Grupa kontrolna Początek pomiaru Koniec pomiaru

Plan eksperymentalny Tak to działa przy jednym pomiarze. Co jeśli dwa lub więcej? Szczególnie jeśli pomiar odbywa się w jawny dla użytkownika sposób. Np. zmiana świadomości marki wskutek kontaktu z reklamą.

Grupa kontrolna 1 Plan eksperymentalny Pierwszy pomiar Drugi pomiar Grupa kontrolna 2 Jak Jak wybrać 45 45 Drugi najlepszych pomiar Grupa testowa 1 Pierwszy pomiar Drugi pomiar Grupa testowa 2 Drugi pomiar

Podział na grupy 1. Losowy 2. Rozłączność grup w obrębie eksperymentu 3. Rozłączność grup między eksperymentami o ile to konieczne prezentacji (eksperymenty na na dotyczą FORUM? tego samego elementu lub mogą na siebie wpływać)

Podział na grupy - wyzwania Losowość: każdy z użytkowników powinien mieć jednakowe prawdopodobieństwo znalezienia się w grupie. Dwa możliwe podejścia: prezentacji na na 1.1 nadreprezentacja bardziej aktywnych FORUM? 1. Dzielimy on-line w miarę jak się pojawiają 2. Dzielimy off-line przed eksperymentem na podstawie bazy danych 2.1 nie wiemy kiedy kolejny raz się pojawią i czy w ogóle się pojawią (eksperyment nie może trwać dowolnie długo) 2.2 problem z nowymi użytkownikami

Podział na grupy - wyzwania Kilka sposobów identyfikacji użytkownika: 1. cookie 2. zarejestrowani użytkownicy 3. identyfikatory w aplikacjach mobilnych Rozłączność!! Tak, tak. Nie zważając na to, że jeden użytkownik może się ukrywać pod kilkoma identyfikatorami.

Podział na grupy - wyzwania Czasem trzeba sprawdzić dodatkowe warunki: położenie geograficzne profil demograficzny dotychczasową historię zakupów Szybkość!!

Podział na grupy - wyzwania Utrzymanie równoliczności grup przydzielonych do wariantów!

Czy eksperyment powinien odbywać się na wszystkich użytkownikach? Tak, ale 4 testowanych algorytmów + grupa kontrolna (5x20%) oznacza: 80% użytkowników ma do czynienia z mało optymalnymi strategiami czyli: mniejszy przychód

Czy eksperyment powinien odbywać się na wszystkich użytkownikach? Multi Armed Bandits

Zebranie danych

Dobór statystyki W statystyce musimy sobie odpowiedzieć na jedno zasadnicze pytanie

Dobór statystyki No może nieco więcej niż jedno 1. Czy próby są od siebie zależne czy niezależne? 2. Ile mam grup? 3. Na jakiej skali pomiarowej jest zmienna zależna?

Dobór statystyki I jeszcze 4. Czy rozkład zmiennej zależnej jest normalny? Witamy w świecie rozkładów prawostronnie skośnych

Dobór statystyki I tak znaleźliśmy się w świecie statystyk nieparametrycznych. Tak, macie rację. Nie uczyli o tym zbyt wiele na studiach. Test Manna-Whitneya Test Kołmogorowa-Smirnowa Test Kruskala-Wallisa Nie tylko stwierdzenie czy jest różnica, ale która grupa wygrywa.

Od testu do wdrożenia na całym serwisie Dobra praktyka przełączamy małymi grupkami (np.: po 5% dziennie) i obserwujemy.

Id testu Początek testu 1 2016-01-01 00:00:00 2 2016-07-01 00:00:00 3 2016-06-20 14:21:00 4 2016-10-03 Dużo jednoczesnych testów -> kiedy uruchomić kolejny Koniec testu Jak 2016-11-30 23:59:59 Jak wybrać 45 45 najlepszych 2016-12-31 23:59:59 2016-10-20 15:29:59 2016-10-31 11:59:59 Wskaż optymalny moment do przeprowadzenia testu, który ma trwać dwa 12:00:00 tygodnie. Ma się pokrywać z jak najmniejszą ilością zaplanowanych testów. Złożoność wielomianowa lub liniowa mile widziana.

Dziękuję za uwagę radoslaw.kita@allegrogroup.com rkita@sgh.waw.pl