Šukasz Zaniewicz. Support Vector Machines for Uplift Modeling. PhD dissertation. Supervisor: dr hab. in». Szymon Jaroszewicz

Podobne dokumenty
Hard-Margin Support Vector Machines

Machine Learning for Data Science (CS4786) Lecture11. Random Projections & Canonical Correlation Analysis

Proposal of thesis topic for mgr in. (MSE) programme in Telecommunications and Computer Science

Epigenome - 'above the genome'

Rozpoznawanie twarzy metodą PCA Michał Bereta 1. Testowanie statystycznej istotności różnic między jakością klasyfikatorów

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 8: Structured PredicCon 2

Warsztaty Ocena wiarygodności badania z randomizacją

Towards Stability Analysis of Data Transport Mechanisms: a Fluid Model and an Application


Fig 5 Spectrograms of the original signal (top) extracted shaft-related GAD components (middle) and

Akademia Morska w Szczecinie. Wydział Mechaniczny

Linear Classification and Logistic Regression. Pascal Fua IC-CVLab

Sargent Opens Sonairte Farmers' Market

Zarządzanie sieciami telekomunikacyjnymi


Domy inaczej pomyślane A different type of housing CEZARY SANKOWSKI

Łukasz Reszka Wiceprezes Zarządu

European Crime Prevention Award (ECPA) Annex I - new version 2014

EXAMPLES OF CABRI GEOMETRE II APPLICATION IN GEOMETRIC SCIENTIFIC RESEARCH

SYNTEZA SCENARIUSZY EKSPLOATACJI I STEROWANIA

Helena Boguta, klasa 8W, rok szkolny 2018/2019

Raport bieżący: 44/2018 Data: g. 21:03 Skrócona nazwa emitenta: SERINUS ENERGY plc

ZAANGA OWANIE PRACOWNIKÓW W PROJEKTY INFORMATYCZNE

archivist: Managing Data Analysis Results

ZGŁOSZENIE WSPÓLNEGO POLSKO -. PROJEKTU NA LATA: APPLICATION FOR A JOINT POLISH -... PROJECT FOR THE YEARS:.

Wykaz linii kolejowych, które są wyposażone w urządzenia systemu ETCS

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Wykaz linii kolejowych, które są wyposażone w urzadzenia systemu ETCS

Previously on CSCI 4622

Machine Learning for Data Science (CS4786) Lecture 24. Differential Privacy and Re-useable Holdout

Wprowadzenie do programu RapidMiner, część 2 Michał Bereta 1. Wykorzystanie wykresu ROC do porównania modeli klasyfikatorów

Revenue Maximization. Sept. 25, 2018

XXIII Konferencja Naukowa POJAZDY SZYNOWE 2018

Stargard Szczecinski i okolice (Polish Edition)

Cracow University of Economics Poland

Few-fermion thermometry

PROGRAM STAŻU. Nazwa podmiotu oferującego staż / Company name IBM Global Services Delivery Centre Sp z o.o.

Updated Action Plan received from the competent authority on 4 May 2017

UMOWY WYPOŻYCZENIA KOMENTARZ

Instrukcja obsługi User s manual

PRZEWODNIK PO PRZEDMIOCIE. Negotiation techniques. Management. Stationary. II degree

tum.de/fall2018/ in2357

ARNOLD. EDUKACJA KULTURYSTY (POLSKA WERSJA JEZYKOWA) BY DOUGLAS KENT HALL

Anonymous Authentication Using Electronic Identity Documents

Opis Przedmiotu Zamówienia oraz kryteria oceny ofert. Części nr 10

Streszczenie rozprawy doktorskiej

OpenPoland.net API Documentation

Filozofia z elementami logiki Klasyfikacja wnioskowań I część 2

Twoje osobiste Obliczenie dla systemu ogrzewania i przygotowania c.w.u.

Baptist Church Records


OBWIESZCZENIE MINISTRA INFRASTRUKTURY. z dnia 18 kwietnia 2005 r.

Jak działa grawitacja?

Machine Learning for Data Science (CS4786) Lecture 11. Spectral Embedding + Clustering

WYKŁAD 2: PSYCHOLOGIA POZNAWCZA JAKO NAUKA EKSPERYMENTALNA

Zakopane, plan miasta: Skala ok. 1: = City map (Polish Edition)

ERASMUS + : Trail of extinct and active volcanoes, earthquakes through Europe. SURVEY TO STUDENTS.

Podstawa prawna: Art. 70 pkt 1 Ustawy o ofercie - nabycie lub zbycie znacznego pakietu akcji

Weronika Mysliwiec, klasa 8W, rok szkolny 2018/2019

Formularz recenzji magazynu. Journal of Corporate Responsibility and Leadership Review Form

Council of the European Union Brussels, 7 April 2016 (OR. en, pl)

Struktury proponowane dla unikalnych rozwiązań architektonicznych.

SubVersion. Piotr Mikulski. SubVersion. P. Mikulski. Co to jest subversion? Zalety SubVersion. Wady SubVersion. Inne różnice SubVersion i CVS

Extraclass. Football Men. Season 2009/10 - Autumn round

MaPlan Sp. z O.O. Click here if your download doesn"t start automatically

Numeryczna symulacja rozpływu płynu w węźle

PLAN STUDIÓW DOKTORANCKICH Z FIZYKI I ASTRONOMII DZIEDZINA / NAUKI FIZYCZNE DYSCYPLINA / FIZYKA lub ASTRONOMIA

BAZIE KWALIFIKACJI ZAGRANICZNYCH

The Lorenz System and Chaos in Nonlinear DEs

Cel szkolenia. Konspekt

General Certificate of Education Ordinary Level ADDITIONAL MATHEMATICS 4037/12



Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Wyk lad 8: Leniwe metody klasyfikacji

DOI: / /32/37

STEROWANIA RUCHEM KOLEJOWYM Z WYKORZYSTANIEM METOD SYMULACYJNYCH

No matter how much you have, it matters how much you need

Wpływ dyrektywy PSD II na korzystanie z instrumentów płatniczych. Warszawa, 15 stycznia 2015 r. Zbigniew Długosz

EPS. Erasmus Policy Statement

Rev Źródło:

Cracow University of Economics Poland. Overview. Sources of Real GDP per Capita Growth: Polish Regional-Macroeconomic Dimensions

Zmiany techniczne wprowadzone w wersji Comarch ERP Altum

Krytyczne czynniki sukcesu w zarządzaniu projektami

ZGŁOSZENIE WSPÓLNEGO POLSKO -. PROJEKTU NA LATA: APPLICATION FOR A JOINT POLISH -... PROJECT FOR THE YEARS:.

Kielce University of Technology.

Gradient Coding using the Stochastic Block Model


ABOUT NEW EASTERN EUROPE BESTmQUARTERLYmJOURNAL

POLITECHNIKA ŚLĄSKA INSTYTUT AUTOMATYKI ZAKŁAD SYSTEMÓW POMIAROWYCH

PL Zjednoczona w różnorodności PL A8-0206/136. Poprawka 136 Marita Ulvskog w imieniu Komisji Zatrudnienia i Spraw Socjalnych

Klasyfikacja Support Vector Machines

MATLAB Neural Network Toolbox przegląd

MoA-Net: Self-supervised Motion Segmentation. Pia Bideau, Rakesh R Menon, Erik Learned-Miller

A Zadanie

Kwartalnik Prawo- o-ekonomia 3/2015. Podatk. Andrzej Springer. dnia 15 maja 2015 r co do zasady - podatkowych.

Transkrypt:

Šukasz Zaniewicz Support Vector Machines for Uplift Modeling PhD dissertation Supervisor: dr hab. in». Szymon Jaroszewicz Institute of Computer Science Polish Academy of Sciences Warsaw, January 2018

Research of the author was supported by Project 'Information technologies: research and their interdisciplinary applications' POKL.04.01.01-00-051/10-00.

Abstract Šukasz Zaniewicz, Support Vector Machines for Uplift Modeling Doctoral dissertation supervised by dr hab. in». Szymon Jaroszewicz, Institute of Computer Science, Polish Academy of Sciences, Warsaw 2018. Uplift modeling is a branch of Machine Learning which aims to predict not the class itself, but the dierence between the class variable behavior in two groups: treatment and control. Objects in the treatment group have been subjected to some action, while objects in the control group have not. By including the control group it is possible to build a model which predicts the causal eect of the action for a given individual. As a consequence, uplift modeling is directly applicable in elds where presence of the control group is common in market practice. This is always the case for randomized controlled clinical trials and is becoming a standard in marketing campaigns where it has been realized that, at least in some situations, the true eect of an examined action can only be measured against a background of a control group. This dissertation presents application of the Support Vector Machines designed specically for uplift modeling. The SVM optimization task has been reformulated to explicitly model the dierence in class behavior between two datasets. The model predicts whether a given object will have a positive, neutral or negative response to a given action, and by tuning a parameter of the model the analyst is able to inuence the relative proportion of neutral predictions and thus the conservativeness of the model. Moreover, this work extends also the L p -SVMs to the case of uplift modeling and demonstrates that this allows for a more stable selection of the size of negative, neutral and positive groups. Furthermore, ecient quadratic and convex optimization methods are presented for eciently solving the two related optimization tasks. Experiments demonstrate that the proposed methods compare favorably with other uplift modeling approaches. This dissertation discusses also the issue of nonrandom assignment to treatment and control groups. In general, uplift modeling is best applied to training sets obtained from randomized controlled experiments, but such experiments are not always possible, in which case treatment 3

assignment is biased. To handle such situations we proposed a modication of the Uplift Support Vector Machines which are less sensitive to such a bias. This is achieved by including in the model formulation an additional term which penalizes models which score treatment and control groups dierently. We call the technique Székely regularization since it is based on the energy distance proposed by Székely and Rizzo. Optimization algorithm based on stochastic gradient descent techniques has been developed for this problem. Further, this work demonstrates experimentally that the proposed regularization term does indeed produce uplift models which are less sensitive to biased treatment assignment. 4

Streszczenie Šukasz Zaniewicz, Maszyny wektorów wspieraj cych w modelowaniu ró»nicowym. Rozprawa doktorska przygotowana pod kierunkiem dr. hab. in». Szymona Jaroszewicza, Instytut Podstaw Informatyki Polskiej Akademii Nauk, Warszawa 2018. Modelowanie ró»nicowe jest dziedzin uczenia maszynowego, której celem nie jest przewidywanie zmiennej celu, lecz ró»nic w zachowaniu zmiennej celu mi dzy dwoma grupami: eksperymentaln i kontroln. Obiekty w grupie eksperymentalnej zostaªy poddane pewnemu dziaªaniu, podczas gdy obiekty w grupie kontrolnej nie. Wª czaj c grup kontroln, mo»liwe staje si zbudowanie modelu przewiduj cego przyczynowy efekt danego dziaªania na poziomie konkretnego obiektu. W konsekwencji modelowanie ró»nicowe znajduje bezpo±rednie zastosowanie w dziedzinach, w których stosowanie grup kontrolnych jest powszechne. Jest tak w przypadku randomizowanych prób klinicznych, staje si te» standardem w marketingu bezpo±rednim, gdzie zauwa»ono,»e, przynajmniej w niektórych sytuacjach, prawdziw korzy± z badanego dziaªania mo»na zmierzy tylko bior c pod uwag grup kontroln. Niniejsza praca przedstawia maszyny wektorów wspieraj cych zaadaptowane do problemu modelowania ró»nicowego. Zadanie optymalizacyjne maszyn klasykacyjnych zostaªo przeformuªowane, tak aby mo»liwe byªo modelowanie ró»nic w zachowaniu zmiennej celu mi dzy dwoma zbiorami danych. Model przewiduje, czy wpªyw badanego dziaªania na dany obiekt b dzie pozytywny, neutralny czy negatywny. Poprzez odpowiedni dobór parametrów modelu, analityk ma bezpo±redni wpªyw na wzgl dny udziaª prognoz neutralnych. Dalej, w pracy dostosowano do problemu modelowania ró»nicowego tak»e model L p -SVMs, wykorzystuj cy zmodykowan funkcj straty. Pokazano,»e to pozwala na bardziej stabilny wybór proporcji przewidywa«negatywnego, neutralnego i pozytywnego wpªywu dziaªania. Przedstawiono równie» wydajne metody optymalizacji kwadratowej i wypukªej sªu» ce do rozwi zania problemów optymalizacyjnych zwi zanych z proponowanymi modelami. Eksperymentalnie wykazano,»e proponowane algorytmy s konkurencyjne wobec innych metod modelowania ró»nicowego. 5

W rozprawie omówiony zostaª równie» problem nielosowego przypisania obiektów do grupy eksperymentalnej i kontrolnej. Zasadniczo, modelowanie ró»nicowe najlepiej jest stosowa w przypadku przypisania caªkowicie losowego, ale takie eksperymenty nie zawsze s mo»liwe. W praktyce, przydziaª do grupy kontrolnej cz sto nast puje na podstawie decyzji dokonywanych przez czªowieka, jest zatem obci»ony. Aby mo»liwe byªo zastosowanie modelowania ró»nicowego w takim scenariuszu, w pracy przedstawiono modykacj proponowanego modelu, która jest mniej wra»liwa na obci»ony podziaª na grupy. Modykacja polega na dodaniu do sformuªowaniu modelu dodatkowego wyrazu, który karze modele, których predykcje w grupie kontrolnej i eksperymentalnej ró»ni si. Technik t nazywano regularyzacj Székely'ego, poniewa» opiera si ona na odlegªo±ci energetycznej zaproponowanej przez Székely'ego i Rizzo. Przestawiono równie» algorytm optymalizacji dla tego typu modeli oparty o techniki stochastycznego spadku gradientu. Ponadto, w pracy wykazano eksperymentalnie,»e proponowany dodatkowy wyraz regularyzacyjny istotnie tworzy modele ró»nicowe, które s mniej wra»liwe na nielosowe przypisanie obiektów do grup eksperymentalnej i kontrolnej. 6