Optymalizacja kryteriów selekcji dla rozpadu Λ+c pμ+μza pomocą wielowymiarowej analizy danych Maciej Kościelski Jakub Malczewski opiekunowie prof. dr hab. Mariusz Witek mgr inż. Małgorzata Pikies
LHCb kalorymetr hadronowy kalorymetr elektromagnetyczny detektor wierzchołka detektor mionowy
przykładowa detekcja mionów p Λ +c μ μ
Λ +c Rozpad Λ+c pμ+μ- jest silnie wzbroniony w ramach Modelu Standardowego. Badanie rzadkich rozpadów tego typu posiada potencjał odkrycia Nowej Fizyki, czyli niezgodności z przewidywaniami Modelu Standardowego. Przy jego poszukiwaniu używa się rozpadu rezonansowego Λ+c pφ(μ+μ-) jako kanału normalizacyjnego, którego współczynnik rozgałęzienia wynosi BF(Λ+c pφ(μ+μ- ) ) = 3.1*10-7. Celem naszej pracy była optymalizacja kryteriów selekcji dla rozpadu Λ+c pφ i ewentualna obserwacja rozpadu Λ+c pω, którego jeszcze nigdy nie obserwowano.
p Dane wejściowe Λ + c μ μ Po wstępnej selekcji (tzw. Stripping). - Dane z eksperymentu LHCb z lat 2011-2012 - Próbka Monte Carlo dla rozpadu Λ+c pφ(μ+μ- ) Dane w formie tzw. standardowych ntupli (ROOT) zawierają informacje o rozpadzie (kinematyka, parametry wierzchołka wtórnego, identyfikacja produktów rozpadu, zmienne izolacyjne).
Masa C - wycinek danych pomiarowych spodziewany sygnał w okolicach masy C
Do analizy danych użyliśmy narzędzia TMVA będącego częścią pakietu Root. Toolkit for Multi Variate Analysis
Szkolenie Do szkolenia algorytmów użyliśmy jako sygnał próbkę Monte Carlo rozpadu Λ+c pφ(μ+μ- ). Jako tło posłużyły dane z obszaru poza masą niezmienniczą Λ+c, w której spodziewaliśmy się znaleźć rzeczywisty sygnał. Strategia szkolenia: Stworzyliśmy szeroką listę zmienny dających dobrą separację sygnału i tła Wybraliśmy najefektywniejszą metodę MVA Przeprowadziliśmy szkolenie, odrzucając mało znaczące zmienne. Redukowaliśmy je, dopóki nie zaobserwowaliśmy znaczącego spadku wydajności (całka krzywej ROC)
Krzywa ROC dla różnych metod MVA - porównanie
Zmienne użyte podczas analizy za pomocą BDT Nazwa robocza Istotność zmiennej 1 : Lambda_cplus_IPCHI2_OWNPV : 1.191e-01 2 : Exp_1000_Lambda_cplus_TAU : 1.114e-01 3 : Lambda_cplus_ENDVERTEX_CHI2 : 9.357e-02 4 : Lambda_cplus_CDFiso : 8.643e-02 5 : pplus_pt : 7.873e-02 6 : min(pplus_track_chi2ndof,min(muplus_track_chi2ndof, )) : 7.817e-02 7 : Lambda_cplus_PT : 7.092e-02 8 : muplus_pt : 6.817e-02 9 : muminus_pt : 6.788e-02 10 : Lambda_cplus_FD_OWNPV_/_sqrt_Lambda_cplus_FDCHI2_OWNPV : 6.348e-02 11 : min(pplus_pt,min(muplus_pt,muminus_pt)) : 6.265e-02 12 : mu_2_isolation : 5.263e-02 13 : mu_1_isolation : 4.695e-02 Są to głównie zmienne topologiczne, dobrze symulowane przy generacji MC.
Przykładowe zmienne użyte podczas analizy. Histogramy unormowano.
Przykładowe zmienne użyte podczas analizy. Warto zauważyć różnice między rozkładami dla tła i sygnału, które pomogły lepiej odseparować badane przypadki.
Histogramy zmiennej dyskryminującej dla tła i sygnału wygenerowane dla próbki treningowej i testowej.
Po uzyskaniu dla każdego zdarzenia zmiennej dyskryminującej BDT określiliśmy dokładne wartości w których dokonaliśmy cięć. Wybraliśmy trzy zmienne: zmienna dyskryminująca BDT ProbNNmu prawdopodobieństwo identyfikacji mionów ProbNNp prawdopodobieństwo identyfikacji protonu Za kryterium optymalizacji (FoM) uznaliśmy S/ (S+B), gdzie S - ilość sygnału MC jaki pozostał po cięciu B - ilość tła jakie pozostało po cięciu Dla każdego punktu (ProbNNmu, ProbNNp) wyznaczyliśmy największe FoM oraz odpowiadające mu cięcie na zmiennej BDT. Następnie wybraliśmy punkt o najwyższym FoM na całej siatce.
Tło Sygnał Histogramy prawdopodobieństwa, że cząstka zaklasyfikowana jako mion w rzeczywistości jest mionem dla sygnału i tła. Widać istotne różnice w rozkładzie.
max( S/ S+B(bdt) )(ProbNNp, ProbNNmu) Pr ob NN p u ProbNNm Wykres największego FoM dla cięć na prawdopodobieństwach określonych na siatce.
Events Wartości zmiennej masa + C po selekcji
Po selekcji sygnału dopasowaliśmy krzywą wykładniczą do tła i krzywą Gaussa do sygnału w celu oszacowania jego ilości i błędu wyznaczonej masy. Kanał φ
Określenie ilości sygnału w kanale ω i w kanale φ pozwoliło nam oszacować stosunek tych rozpadów. Dało to możliwość wyznaczenie współczynnika rozgałęzienia nieobserwowanego dotąd rozpadu przez kanał ω. Kanał ω
Events Masa C po selekcji, w rozbiciu na kanał φ i ω kanał φ kanał ω BR Nω / NΦ = BFω / BFΦ BFΦ = (3,21 ± 0,69) 10-7 BFω = (6,8 ± 1,5) 10-8 MeV/c2
KONIEC Maciej Kościelski maciej.j.koscielski(małpa)student.put.poznan.pl Jakub Malczewski jakubmalczewski(małpa)opmbx.org opiekunowie prof. dr hab. Mariusz Witek mgr inż. Małgorzata Pikies
Źródła: Dane z eksperymentu LHCb z lat 2011-2012 Search for Λ+c pμ+μ- decay, Marcin Chrząszcz, Tadeusz Lesiak, Borys Nowak, Mariusz Witek, nz11-agh1.ifj.edu.pl/.../lc2pmumu_2016-08-03.pdf Badanie rozpadów w eksperymencie LHCb, Paweł Nowak, nz11-agh1.ifj.edu.pl/.../mgr5.pdf Particle Data Group, pdg.lbl.gov ROOT a Data Analysis Framework, root.cern.ch TMVA Users Guide, tmva.sourceforge.net/docu/tmvausersguide.pdf Praktyki ATLAS - atlas.ifj.edu.pl/praktyki/materialy.html Searches for Rare or Forbidden Semileptonic Charm Decays (eksperyment BaBar), www-spires.slac.stanford.edu/.../slac-pub-14482.pdf