Optymalizacja kryteriów selekcji dla rozpadu Λ+c pμ+μza pomocą wielowymiarowej analizy danych

Podobne dokumenty
1. Wcześniejsze eksperymenty 2. Podstawowe pojęcia 3. Przypomnienie budowy detektora ATLAS 4. Rozpady bozonów W i Z 5. Tło 6. Detekcja sygnału 7.

Prof. Jacek Ciborowski Warszawa, 12 stycznia 2015 Instytut Fizyki Doświadczalnej Uniwersytetu Warszawskiego Pasteura Warszawa.

Uczenie maszynowe w zastosowaniu do fizyki cząstek

Wyznaczanie efektywności mionowego układu wyzwalania w CMS metodą Tag & Probe

Obserwacja Nowej Cząstki o Masie 125 GeV

Jak to działa: poszukiwanie bozonu Higgsa w eksperymencie CMS. Tomasz Früboes

LEPTON TAU : jako taki, oraz zastosowania. w niskich i wysokich energiach. Zbigniew Wąs

Cząstki elementarne i ich oddziaływania PROJEKT 2016 Obserwacja mezonów powabnych i dziwnych analiza danych zebranych w eksperymencie LHCb

Pakiet ROOT. prosty generator Monte Carlo. Maciej Trzebiński. Instytut Fizyki Jądrowej Polskiej Akademii Nauki

Artur Kalinowski WYBRANE ASPEKTY POSZUKIWA BOZONU HIGGSA Z MODELU STANDARDOWEGO W ZDERZENIACH PROTON PROTON W EKSPERYMENCIE CMS PRZY LHC

Bardzo rzadki rozpad został zaobserwowany przez CMS

Poszukiwania bozonu Higgsa w rozpadzie na dwa leptony τ w eksperymencie CMS

Bardzo rzadki rozpad został zaobserwowany przez CMS

Poszukiwanie gwiazd zmiennych w eksperymencie Pi of the Sky

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Badanie wysokoenergetycznych mionów kosmicznych w detektorze ICARUS.

Machine learning Lecture 6

Obserwacja kandydata na bozon Higgsa przez eksperymenty ATLAS i CMS

Analiza niepewności pomiarów

Metamorfozy neutrin. Katarzyna Grzelak. Sympozjum IFD Zakład Czastek i Oddziaływań Fundamentalnych IFD UW. K.Grzelak (UW ZCiOF) 1 / 23

g) wartość oczekiwaną (przeciętną) i wariancję zmiennej losowej K.

Tomasz Szumlak WFiIS AGH 03/03/2017, Kraków

Compact Muon Solenoid

Wyznaczanie bezwzględnej aktywności źródła 60 Co. Tomasz Winiarski

r. akad. 2008/2009 V. Precyzyjne testy Modelu Standardowego w LEP, TeVatronie i LHC

Fizyka cząstek elementarnych warsztaty popularnonaukowe

Poszukiwania mezonu B s w eksperymencie CMS

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Janusz Adamowski METODY OBLICZENIOWE FIZYKI Kwantowa wariacyjna metoda Monte Carlo. Problem własny dla stanu podstawowego układu N cząstek

Bozon Higgsa prawda czy kolejny fakt prasowy?

Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów

Promieniowanie kosmiczne składa się głównie z protonów, z niewielką. domieszką cięższych jąder. Przechodząc przez atmosferę cząstki

Prawdopodobieństwo i statystyka

ALGORYTM RANDOM FOREST

Ćwiczenie LP1. Jacek Grela, Łukasz Marciniak 22 listopada 2009

Niech X i Y będą niezależnymi zmiennymi losowymi o rozkładach wykładniczych, przy czym Y EX = 4 i EY = 6. Rozważamy zmienną losową Z =.

Wprowadzenie do statystyki oraz analizy danych

Algorytmy metaheurystyczne Wykład 11. Piotr Syga

Jak działają detektory. Julia Hoffman

Pomiar rozpadów Dalitz Hiperonów za pomocą spektrometrów HADES oraz PANDA. Jacek Biernat

Poszukiwany: bozon Higgsa

2008/2009. Seweryn Kowalski IVp IF pok.424

Prawdopodobieństwo i statystyka

Rozkład Gaussa i test χ2

Komputerowa Analiza Danych Doświadczalnych

Sterowanie wielkością zamówienia w Excelu - cz. 3

Instytut Fizyki Politechniki Łódzkiej Laboratorium Metod Analizy Danych Doświadczalnych Ćwiczenie 3 Generator liczb losowych o rozkładzie Rayleigha.

Statystyka i eksploracja danych

Elementy modelowania matematycznego

Wnioskowanie statystyczne i weryfikacja hipotez statystycznych

Machine learning Lecture 2

KLASYFIKACJA. Słownik języka polskiego

Wykład 9 Wnioskowanie o średnich

Psychofizyka. Pomiary detekcji sygnałów Porównanie modeli

Boska cząstka odkryta?

Prawdopodobieństwo i statystyka

Ćwiczenie 3++ Spektrometria promieniowania gamma z licznikiem półprzewodnikowym Ge(Li) kalibracja energetyczna i wydajnościowa

Modele i wnioskowanie statystyczne (MWS), sprawozdanie z laboratorium 1

Prawdopodobieństwo i statystyka r.

Klasyfikacja przypadków w ND280

Metody probabilistyczne

I. Przedmiot i metodologia fizyki

Statystyka w przykładach

Budowanie macierzy danych geograficznych Procedura normalizacji Budowanie wskaźnika syntetycznego

Rachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne.

Praktyki studenckie na LHC IFJ PAN, 5 lipca 2017

LHC i po co nam On. Piotr Traczyk CERN

WYKŁAD 8. Wszechświat cząstek elementarnych dla przyrodników

Prawdopodobieństwo i rozkład normalny cd.

Sposoby opisu i modelowania zakłóceń kanałowych

Jeśli czas działania algorytmu zależy nie tylko od rozmiaru danych wejściowych i przyjmuje różne wartości dla różnych danych o tym samym rozmiarze,

Wszechświata. Piotr Traczyk. IPJ Warszawa

Wyznaczanie profilu wiązki promieniowania używanego do cechowania tomografu PET

Statystyka matematyczna. Wykład VI. Zesty zgodności

Ćwiczenie LP2. Jacek Grela, Łukasz Marciniak 25 października 2009

Rozkład normalny. Marcin Zajenkowski. Marcin Zajenkowski () Rozkład normalny 1 / 26

Na tropach czastki Higgsa

Czym materia różni się od antymaterii - najnowsze wyniki z eksperymentu LHCb

RACHUNEK PRAWDOPODOBIEŃSTWA I STATYSTYKA MATEMATYCZNA

Rafał Staszewski. Praktyki studenckie Laboratorium Fizyki Cząstek Elementarnych 7 lipca 2017, IFJ PAN

Regresja logistyczna (LOGISTIC)

Analiza Statystyczna

1 Wykład 3 Generatory liczb losowych o dowolnych rozkładach.

Badania operacyjne egzamin

Sztuczna Inteligencja Tematy projektów Sieci Neuronowe

WYKŁAD 3. Witold Bednorz, Paweł Wolff. Rachunek Prawdopodobieństwa, WNE, Uniwersytet Warszawski. 1 Instytut Matematyki

Analiza danych LHC w poszukiwaniu rezonansów w rozkładzie masy niezmienniczej dwóch mionów.

Zmienność wiatru w okresie wieloletnim

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Podstawy Sztucznej Inteligencji (PSZT)

LABORATORIUM PODSTAW TELEKOMUNIKACJI

Maciej Piotr Jankowski

LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU

Projekt Sieci neuronowe

Ćwiczenie nr 1 : Statystyczny charakter rozpadów promieniotwórczych

Wstęp do metod numerycznych Uwarunkowanie Eliminacja Gaussa. P. F. Góra

Rachunek prawdopodobieństwa Rozdział 6: Twierdzenia graniczne.

Algorytm selekcji Hoare a. Łukasz Miemus

Zawartość. Zawartość

Metody systemowe i decyzyjne w informatyce

Transkrypt:

Optymalizacja kryteriów selekcji dla rozpadu Λ+c pμ+μza pomocą wielowymiarowej analizy danych Maciej Kościelski Jakub Malczewski opiekunowie prof. dr hab. Mariusz Witek mgr inż. Małgorzata Pikies

LHCb kalorymetr hadronowy kalorymetr elektromagnetyczny detektor wierzchołka detektor mionowy

przykładowa detekcja mionów p Λ +c μ μ

Λ +c Rozpad Λ+c pμ+μ- jest silnie wzbroniony w ramach Modelu Standardowego. Badanie rzadkich rozpadów tego typu posiada potencjał odkrycia Nowej Fizyki, czyli niezgodności z przewidywaniami Modelu Standardowego. Przy jego poszukiwaniu używa się rozpadu rezonansowego Λ+c pφ(μ+μ-) jako kanału normalizacyjnego, którego współczynnik rozgałęzienia wynosi BF(Λ+c pφ(μ+μ- ) ) = 3.1*10-7. Celem naszej pracy była optymalizacja kryteriów selekcji dla rozpadu Λ+c pφ i ewentualna obserwacja rozpadu Λ+c pω, którego jeszcze nigdy nie obserwowano.

p Dane wejściowe Λ + c μ μ Po wstępnej selekcji (tzw. Stripping). - Dane z eksperymentu LHCb z lat 2011-2012 - Próbka Monte Carlo dla rozpadu Λ+c pφ(μ+μ- ) Dane w formie tzw. standardowych ntupli (ROOT) zawierają informacje o rozpadzie (kinematyka, parametry wierzchołka wtórnego, identyfikacja produktów rozpadu, zmienne izolacyjne).

Masa C - wycinek danych pomiarowych spodziewany sygnał w okolicach masy C

Do analizy danych użyliśmy narzędzia TMVA będącego częścią pakietu Root. Toolkit for Multi Variate Analysis

Szkolenie Do szkolenia algorytmów użyliśmy jako sygnał próbkę Monte Carlo rozpadu Λ+c pφ(μ+μ- ). Jako tło posłużyły dane z obszaru poza masą niezmienniczą Λ+c, w której spodziewaliśmy się znaleźć rzeczywisty sygnał. Strategia szkolenia: Stworzyliśmy szeroką listę zmienny dających dobrą separację sygnału i tła Wybraliśmy najefektywniejszą metodę MVA Przeprowadziliśmy szkolenie, odrzucając mało znaczące zmienne. Redukowaliśmy je, dopóki nie zaobserwowaliśmy znaczącego spadku wydajności (całka krzywej ROC)

Krzywa ROC dla różnych metod MVA - porównanie

Zmienne użyte podczas analizy za pomocą BDT Nazwa robocza Istotność zmiennej 1 : Lambda_cplus_IPCHI2_OWNPV : 1.191e-01 2 : Exp_1000_Lambda_cplus_TAU : 1.114e-01 3 : Lambda_cplus_ENDVERTEX_CHI2 : 9.357e-02 4 : Lambda_cplus_CDFiso : 8.643e-02 5 : pplus_pt : 7.873e-02 6 : min(pplus_track_chi2ndof,min(muplus_track_chi2ndof, )) : 7.817e-02 7 : Lambda_cplus_PT : 7.092e-02 8 : muplus_pt : 6.817e-02 9 : muminus_pt : 6.788e-02 10 : Lambda_cplus_FD_OWNPV_/_sqrt_Lambda_cplus_FDCHI2_OWNPV : 6.348e-02 11 : min(pplus_pt,min(muplus_pt,muminus_pt)) : 6.265e-02 12 : mu_2_isolation : 5.263e-02 13 : mu_1_isolation : 4.695e-02 Są to głównie zmienne topologiczne, dobrze symulowane przy generacji MC.

Przykładowe zmienne użyte podczas analizy. Histogramy unormowano.

Przykładowe zmienne użyte podczas analizy. Warto zauważyć różnice między rozkładami dla tła i sygnału, które pomogły lepiej odseparować badane przypadki.

Histogramy zmiennej dyskryminującej dla tła i sygnału wygenerowane dla próbki treningowej i testowej.

Po uzyskaniu dla każdego zdarzenia zmiennej dyskryminującej BDT określiliśmy dokładne wartości w których dokonaliśmy cięć. Wybraliśmy trzy zmienne: zmienna dyskryminująca BDT ProbNNmu prawdopodobieństwo identyfikacji mionów ProbNNp prawdopodobieństwo identyfikacji protonu Za kryterium optymalizacji (FoM) uznaliśmy S/ (S+B), gdzie S - ilość sygnału MC jaki pozostał po cięciu B - ilość tła jakie pozostało po cięciu Dla każdego punktu (ProbNNmu, ProbNNp) wyznaczyliśmy największe FoM oraz odpowiadające mu cięcie na zmiennej BDT. Następnie wybraliśmy punkt o najwyższym FoM na całej siatce.

Tło Sygnał Histogramy prawdopodobieństwa, że cząstka zaklasyfikowana jako mion w rzeczywistości jest mionem dla sygnału i tła. Widać istotne różnice w rozkładzie.

max( S/ S+B(bdt) )(ProbNNp, ProbNNmu) Pr ob NN p u ProbNNm Wykres największego FoM dla cięć na prawdopodobieństwach określonych na siatce.

Events Wartości zmiennej masa + C po selekcji

Po selekcji sygnału dopasowaliśmy krzywą wykładniczą do tła i krzywą Gaussa do sygnału w celu oszacowania jego ilości i błędu wyznaczonej masy. Kanał φ

Określenie ilości sygnału w kanale ω i w kanale φ pozwoliło nam oszacować stosunek tych rozpadów. Dało to możliwość wyznaczenie współczynnika rozgałęzienia nieobserwowanego dotąd rozpadu przez kanał ω. Kanał ω

Events Masa C po selekcji, w rozbiciu na kanał φ i ω kanał φ kanał ω BR Nω / NΦ = BFω / BFΦ BFΦ = (3,21 ± 0,69) 10-7 BFω = (6,8 ± 1,5) 10-8 MeV/c2

KONIEC Maciej Kościelski maciej.j.koscielski(małpa)student.put.poznan.pl Jakub Malczewski jakubmalczewski(małpa)opmbx.org opiekunowie prof. dr hab. Mariusz Witek mgr inż. Małgorzata Pikies

Źródła: Dane z eksperymentu LHCb z lat 2011-2012 Search for Λ+c pμ+μ- decay, Marcin Chrząszcz, Tadeusz Lesiak, Borys Nowak, Mariusz Witek, nz11-agh1.ifj.edu.pl/.../lc2pmumu_2016-08-03.pdf Badanie rozpadów w eksperymencie LHCb, Paweł Nowak, nz11-agh1.ifj.edu.pl/.../mgr5.pdf Particle Data Group, pdg.lbl.gov ROOT a Data Analysis Framework, root.cern.ch TMVA Users Guide, tmva.sourceforge.net/docu/tmvausersguide.pdf Praktyki ATLAS - atlas.ifj.edu.pl/praktyki/materialy.html Searches for Rare or Forbidden Semileptonic Charm Decays (eksperyment BaBar), www-spires.slac.stanford.edu/.../slac-pub-14482.pdf