Michał Kusy, StatSoft Polska Sp. z o.o.
|
|
- Wacława Wójcik
- 10 lat temu
- Przeglądów:
Transkrypt
1 PUBLICATION BIAS JAKI JEST EFEKT CHOWANIA WYNIKÓW BADAŃ W SZUFLADZIE? Michał Kusy, StatSoft Polska Sp. z o.o. Na podstawie efektu wyznaczonego w badaniu staram się oszacować i ocenić nieznany rzeczywisty efekt. Jak bardzo ufam wynikom tego badania? Mogę je porównać z innymi podobnymi badaniami. Nie jestem jednak w stanie dotrzeć do wszystkich. Czy zidentyfikowane badania, a w szczególności wyniki opublikowane nie będą w związku z tym obciążone? Zacznijmy od dwóch krótkich historii. Dwóch badaczy Publicysta Rozważmy następującą sytuację. Badacz analizuje pewne schorzenie, które nie jest na tyle znane, żeby był w stanie wskazać jego potencjalne przyczyny. W związku z tym przeprowadza wiele porównań, spośród których jedno wskazuje na istotne powiązanie pewnej cechy pacjenta ze schorzeniem. Ciężko jednak znaleźć uzasadnienie dla takiej zależności. Ponieważ wynik jest istotny statystycznie, badacz mimo wszystko decyduje się go opublikować. Dlatego nazwiemy go dalej Publicystą. Archiwista Dla odmiany wyobraźmy sobie innego badacza. Chce wykazać skuteczność terapii pewnego schorzenia określoną substancją. Badaniu poddaje 200 pacjentów losowo przypisanych do dwóch równolicznych grup: leczonej, której podaje analizowaną substancję, oraz kontrolnej, której podaje placebo. Mimo że spodziewa się uzyskać silny efekt, wynik okazuje się jednak nieistotny statystycznie. Ponieważ raport z badania nie zostaje przyjęty do publikacji, badacz z bólem serca chowa go do szuflady biurka. W ten sposób zapracował sobie na tytuł Archiwisty. Obaj badacze nie znają stanu faktycznego. Gdyby Archiwista znał rzeczywisty efekt leczenia i wiedział, że terapia jest skuteczna, nie musiałby przeprowadzać badania. Niestety może się okazać, że wyniki nie są zgodne z rzeczywistością. Wtedy oba przypadki łączy wspólny problem zniekształcają ocenę badanego zjawiska. Zwykle skupiamy się na tym, żeby błędu nie popełnił Publicysta. Inaczej mówiąc staramy się kontrolować tzw. błąd Copyright StatSoft Polska
2 I rodzaju, czyli wyniki fałszywie pozytywne. Okazuje się jednak, że brak informacji o nieistotnych wynikach może być równie szkodliwy jak wyniki niezgodne z rzeczywistością, ale istotne statystycznie. Wynik pojedynczego badania może być obarczony dużym błędem, wynikającym choćby z małej liczby badanych. W związku z tym badacz dokonuje przeglądu dostępnych badań i porównuje uzyskane w nich wyniki. Otrzymuje wykres leśny (forest plot), widoczny poniżej. Każde z badań przedstawia wynik istotny. Wyznaczony na ich podstawie efekt łączny jest obarczony mniejszym błędem niż pojedyncze badania i wskazuje na istotną skuteczność terapii. Czy badacz przekonał się, że substancja faktycznie działa? Rys. 1. Wykres leśny. Jakość wyników metaanalizy zależy od jakości danych, na których jest przeprowadzona. Przed jej wykonaniem definiuje się kryteria włączenia badań do analizy. Najczęściej analizuje się jednak badania, które zostały opublikowane, lub do których był stosunkowo łatwy dostęp. Nie ma jednak informacji, ile faktycznie przeprowadzono podobnych badań i jakie uzyskano w nich wyniki. Aby zilustrować możliwe konsekwencje analizy na obciążonych wynikach, przeprowadzimy symulację badań opisujących skuteczność terapii. Symulacja stawia nas w luksusowej sytuacji, na którą zwykle nie możemy sobie pozwolić. Ponieważ znamy całą populację, znamy prawdę. Wiemy, czy w rzeczywistości lek jest skuteczny czy nie Copyright StatSoft Polska 2014
3 Nieskuteczny lek Na początku stworzymy lek nieskuteczny. Dla każdego z pacjentów losujemy wartość, która charakteryzuje stan jego zdrowia. Załóżmy, że niskie wartości odpowiadają pacjentom bardziej schorowanym. Ponieważ chcemy symulować lek zupełnie nieskuteczny, w dwóch porównywanych grupach leczonej i kontrolnej losujemy wartości z tego samego rozkładu. W związku z tym przeciętny poziom analizowanej zmiennej będzie w obu grupach jednakowy. Kolejny krok to przeprowadzenie badania, a w zasadzie wielu badań skuteczności naszego leku. Zakładamy, że lek został oceniony w 400 badaniach na próbach o różnej liczności (od 4 do pacjentów w każdej z grup). Efekty i błędy standardowe wyznaczone w poszczególnych badaniach przedstawiono poniżej. Po prawej stronie widzimy wyniki pacjentów dla wybranego badania STUDY 252 i zbliżony średni poziom w porównywanych grupach. STUDY 252: 0,8 1,0 8,0 9,0 1 11,0 12,0 13,0-1,0-0,5 0,5 1,0 Rys. 2. Lek nieskuteczny przykładowe badanie. Nad każdym z 400 badaczy mamy niesamowitą przewagę znamy prawdę. Wiemy, że lek jest nieskuteczny. Większość z nich dochodzi do podobnego wniosku, jednak w 22 badaniach wynik okazuje się istotny statystycznie. 13 badaczy stwierdza, że leczenie jest szkodliwe, a 9, że skuteczne. Zatrzymamy się na chwilę przy tym problemie. Dlaczego zdarzają się badania, które stwierdzają skuteczność terapii? W rzeczywistych badaniach moglibyśmy tłumaczyć to np. nie do końca losowym przypisaniem pacjentów do grup lub brakiem zaślepienia próby. Tutaj nie ma jednak mowy o źle przygotowanym badaniu. Nasi pacjenci nie mają żadnej charakterystyki tu nie ma kobiet ani mężczyzn, młodych lub starych. Symulacja nie faworyzuje również żadnej z grup. Takie niezgodne z prawdą wyniki (w tym przypadku informacje o szkodliwości lub skuteczności leku) pojawiają się losowo ze względu na procedurę stosowaną we wnioskowaniu statystycznym. Mimo że nie zawsze zdajemy sobie z tego sprawę, stosując test statystyczny, określamy procent badań, w których taki błąd jesteśmy skłonni zaakceptować. Copyright StatSoft Polska
4 Poziom istotności α, który w tym przykładzie przyjęliśmy jako 5, mówi, że w około 5% badań opisujących nasz nieskuteczny lek otrzymamy wynik istotny, ale niezgodny z rzeczywistością. Faktycznie 22 spośród 400 badaczy otrzyma istotne statystycznie wyniki i będą to niestety potencjalni Publicyści. Na poniższym wykresie oznaczyliśmy ich gwiazdkami. Rys. 3. Lek nieskuteczny wyniki istotne statystycznie. Autor pojedynczego badania z istotnym wynikiem może być przekonany o skuteczności leczenia. Jeśli porówna swój wynik z innymi badaniami, w których brak istotności, może zweryfikować ocenę leczenia. Co się jednak stanie, jeśli autorzy badań z nieistotnymi wynikami schowają je w szufladzie, podobnie jak Archiwista? Załóżmy, że opublikowano jedynie wyniki istotne statystycznie. Są to badania zarówno korzystne, jak i niekorzystne dla leku. Efekt łączny wyznaczony w metaanalizie wynosi wtedy -3 i jest nieistotny (p=0,305). Będąc lekarzem, takiego leku nie podalibyśmy swoim pacjentom. Gdyby jednak do szuflady trafiła również część badań niekorzystnych dla leku? Badania są często prowadzone na zlecenie producenta leku i w związku z tym nastawione na wykazanie jego skuteczności. Załóżmy więc zupełnie skrajną sytuację żadne z 400 badań nie jest rejestrowane i autorzy nie czują się zobligowani do opublikowania wyników niekorzystnych dla leku. Pozostaje więc 9 Publicystów, którzy sugerują istotną skuteczność terapii. Zostali przedstawieni poniżej. Badania mają różną wielkość najmniejsze uwzględnia 10 pacjentów, największe Efekt łączny wyznaczony na ich podstawie wynosi 2 i jest istotny statystycznie (p=00). Poniższe wyniki widzieliśmy już wcześniej w innej formie na wykresie leśnym (rys. 1.). Przypomnijmy, że w przeciwieństwie do autorów znamy rzeczywisty efekt leczenia - wynosi Copyright StatSoft Polska 2014
5 Rys. 4. Lek nieskuteczny badania z istotną skutecznością. Skuteczny lek Dla odmiany opracujemy teraz lek skuteczny. Tym razem przeciętny poziom analizowanej zmiennej wśród wszystkich leczonych jest większy o od przeciętnego poziomu w grupie kontrolnej. Poniżej widzimy wyniki uzyskane w poszczególnych badaniach oraz wyniki pacjentów dla wybranego badania STUDY 252. STUDY 252: 0,8 1,0 8,0 9,0 1 11,0 12,0 13,0-1,0-0,5 0,5 1,0 1,5 Rys. 5. Lek skuteczny przykładowe badanie. Widząc wszystkie badania, stwierdzamy, że średni efekt jest rzeczywiście większy od zera. Również w tym przypadku żaden z 400 badaczy nie zna prawdy. Większość (242) z nich Copyright StatSoft Polska
6 otrzyma wynik istotny statystycznie wskazujący na skuteczność leczenia. Jeden badacz uzna lek za istotnie szkodliwy. Rys. 6. Lek skuteczny wyniki istotne statystycznie. Ponieważ wiemy, że lek jest skuteczny, możemy powiedzieć, że w pozostałych 158 badaniach popełniono błąd. Nazywa się go błędem II rodzaju. Powyżej gwiazdkami zostały zaznaczone badania z wynikami istotnymi statystycznie. Jak widać błąd II rodzaju popełniano głównie w lewej, dolnej części wykresu. Na brak istotności mogła mieć wpływ stosunkowo mała różnica wartości między grupami, duża zmienność wyników w grupach lub zbyt mała liczba pacjentów. Jeśli zestawimy wyniki wszystkich badań, otrzymamy istotny statystycznie wynik równy 0. Pamiętamy jednak, że wiele nieistotnych wyników pada ofiarą Archiwistów. Sprawdzimy zatem, jaki będzie efekt analizy opartej jedynie na wynikach istotnych statystycznie i dodatkowo korzystnych dla leku. Istotność statystyczna wiąże się silnie z wielkością próby. Wśród wyników istotnych statystycznie znajduje się większość dużych badań, m.in. badanie z udziałem pacjentów. Wielkość próby w poszczególnych badaniach możemy porównać poniżej. Metaanaliza przeprowadzona na tak wybranych 241 badaniach wskazuje na efekt równy 2, istotny statystycznie (p=00). Wiemy jednak, że jest on zawyżony w stosunku do rzeczywistego efektu leku na poziomie Copyright StatSoft Polska 2014
7 Rys. 7. Lek skuteczny badania z istotną skutecznością. Błąd publikacji (publication bias) Przegląd systematyczny wymaga określenia kryteriów doboru badań do analizy. W rzeczywistości najczęściej nie ma jednak możliwości wskazania wszystkich badań, które spełniają zdefiniowane kryteria. Jeśli metaanalizę wykonamy na obciążonej próbie badań, jej wynik będzie również obarczony błędem. Problem ten nie dotyczy wyłącznie metaanalizy, lecz każdego przeglądu literatury. Spośród możliwych źródeł błędu można wskazać m.in.: Błąd publikacji stosunkowo silne efekty mają większą szansę na publikację od efektów słabych lub nieistotnych. Dodatkowo wyniki publikacji naukowych częściej pojawiają się w przeglądach systematycznych od innych, niepublikowanych wyników. Język najczęściej przeszukiwane są bazy danych i czasopisma anglojęzyczne. Dostępność badania trudnodostępne mają mniejszą szansę znaleźć się w przeglądzie. Koszty tylko część badań jest dostępna bezpłatnie lub za niską opłatą. Powtórzenia wyniki istotne statystycznie mają większą szansę być publikowane więcej niż raz. Cytowanie wyniki istotne statystycznie łatwiej jest znaleźć ze względu na częste cytowanie. Nasze rozważania skupiają się na pierwszym z wymienionych źródeł błędu. Błąd publikacji wiąże się zarówno z siłą i istotnością statystyczną efektu w opublikowanych badaniach, jak i stosunkowo małą liczbą odwołań do tzw. szarej literatury (grey literature), Copyright StatSoft Polska
8 czyli wyników niepublikowanych. Jest to m.in. efekt często nieuzasadnionego przekonania o niskiej jakości takich badań. Aby dokładnie wyznaczyć błąd publikacji, musielibyśmy zestawić wyniki wszystkich Publicystów i Archiwistów. W rzeczywistości do wielu badań nie mamy jednak dostępu, a nawet nie zdajemy sobie z nich sprawy. Możemy natomiast skorzystać z pewnych narzędzi, które oceniają występowanie błędu oraz jego wpływ na wyniki analizy. Opierają się one na następujących założeniach: Ryzyko pominięcia badania maleje wraz ze wzrostem wielkości próby (precyzji wyników). Ryzyko pominięcia badania maleje wraz ze wzrostem obserwowanego w nim efektu. Inaczej mówiąc, zakładamy, że duże badania są częściej publikowane, bez względu na istotność statystyczną wyników, w związku z ich rejestracją oraz zaangażowaniem czasu i środków. Największym ryzykiem pominięcia obarczone są z kolei badania na małych próbach, w których obserwowano efekt umiarkowany lub słaby. Grzebanie w szufladach Pora na przegląd szuflad. Co może zrobić badacz, który nie wie, ile łącznie przeprowadzono badań i do jakich wyników nie dotarł? Dysponuje jedynie wynikami dostępnych badań. Na ich podstawie ma wyobrazić sobie szuflady i sprawdzić ich zawartość. Zadanie jest niestandardowe i wymaga niestandardowych narzędzi. 0,1 0,1 0,3 0,3 0,5 0,5 2 (0,15;0,30) p = 00 2 (1;3) p = 00-1,0-0,5 0,5 1,0 1,5-0,5 0,5 1,0 1,5 Rys. 8. Wykres lejkowy - lek nieskuteczny (L) i skuteczny (P). Jedną z najpopularniejszych metod wykorzystywanych do oceny błędu publikacji jest wykres lejkowy (funnel plot). To wykres rozrzutu, na którym oś pozioma przedstawia mierzony efekt, a pionowa miarę precyzji badań (np. błąd standardowy). Gdy nie ma obciążenia publikacji, spodziewamy się równomiernego rozrzutu badań wokół efektu łącznego. Jeżeli błąd publikacji występuje, to w miarę przesuwania się w dół wykresu symetria powinna być coraz bardziej zaburzona. Powyżej widzimy wykresy lejkowe odpowiednio dla Copyright StatSoft Polska 2014
9 nieskutecznego i skutecznego leku. W obu przypadkach obserwujemy asymetrię wykresu. Brakuje badań o stosunkowo słabym efekcie i dużym błędzie. Ocena wykresów jest jednak subiektywna. Możemy więc skorzystać ze specjalnych testów asymetrii. Do najpopularniejszych należą test Begga i Mazumdar [1] i test Eggera [4]. Testy w obu przypadkach wskazują na istotną zależność między błędem standardowym efektu a jego wartością. Sugerują zatem, że efekt łączny jest obarczony błędem systematycznym. W obu wariantach leku badacz zorientuje się zatem, że ma do czynienia z błędem publikacji. Czy dowie się jednak, w jakim stopniu wpłynął on na uzyskany wynik? Do odtworzenia brakujących badań może wykorzystać procedurę trim & fill (Duval i Tweedie [3]). Dwa etapy procedury odcinanie i wypełnianie pozwalają skorygować efekt łączny i jego błąd. Odcinanie badań trwa, dopóki wykres nie stanie się symetryczny względem przeliczonej miary efektu. W kolejnym etapie wykres jest ponownie wypełniany usuniętymi badaniami i ich lustrzanymi odbiciami. Teoretycznie procedura powinna doprowadzić do nieobciążonego oszacowania miary efektu i jej zmienności. Analiza wyników leku nieskutecznego prowadzi do usunięcia 8 badań, czyli wszystkich, oprócz badania o najsłabszym efekcie (STUDY 23). W związku z tym metoda skoryguje efekt na tyle, na ile pozwoli jej ten najsłabszy wynik. Efekt skorygowany wynosi 0,12. Jest równy efektowi z badania STUDY 23, ma jednak mniejszy błąd standardowy. Wynik jest nadal istotny statystycznie. Badacz niestety nie zna faktycznej liczby badań i rzeczywistego efektu. Może się posiłkować jedynie wynikami widocznymi na wykresie lejkowym. W tym przypadku, mimo że wynik jest nadal istotny, powinien jednak zwrócić uwagę na liczbę usuniętych badań. 0,1 0,1 0,3 0,3 0,5 0,5 2 (0,15;0,30) p = 00 2 (1;3) p = 00 0,12 (6;0,18) p = 00 0 (0,39;1) p = 00-1,0-0,5 0,5 1,0 1,5-0,5 0,5 1,0 1,5 Rys. 9. Metoda trim & fill - lek nieskuteczny (L) i skuteczny (P). Jeśli badacz skoryguje wyniki dla leku skutecznego, okaże się, że otrzyma efekt zgodny z rzeczywistym (). Zanim osiągnięta zostanie symetria wykresu, procedura usuwa znaczną część badań. W szacowaniu korekty biorą udział głównie badania z najmniejszym błędem standardowym, czyli mające najsilniejszy wpływ na wyniki analizy. Mimo, że Copyright StatSoft Polska
10 badacz nie dysponuje badaniami schowanym w szufladzie, na podstawie reszty wyników udało mu się odtworzyć rzeczywisty efekt leczenia. Jak z tym żyć Sprawdziliśmy, jak może zachować się efekt wyznaczony na obciążonej próbie badań. Oba przykłady zostały jednak celowo przerysowane. W rzeczywistości prowadzone są rejestry badań, których wyniki są publikowane, nawet mimo braku istotności statystycznej. W przeglądach systematycznych pojawiają się nieistotne efekty, a autorzy coraz częściej docierają do wyników niepublikowanych. Można znaleźć prace, w których podjęto próbę oceny skali zjawiska. Sutton [5] pokazał, że błąd publikacji występuje w większości uwzględnionych przez niego metaanaliz. W 50% metaanaliz nie powoduje znacznych rozbieżności w wynikach. W 45% zmienia wielkość efektu, ale nie ma wpływu na ostateczne ustalenia (np. odnośnie skuteczności leczenia). Natomiast istnienie błędu publikacji w pozostałych 5% metaanaliz podważa ich kluczowe ustalenia. Wyniki analizy oparto głównie na pracach z bazy Cochrane. Ponieważ Cochrane Collaboration przywiązuje dużą wagę do szerokiego przeglądu literatury, w ich pracach pojawia się zazwyczaj więcej badań niż w innych publikowanych metaanalizach. W związku z tym paradoksalnie błąd publikacji mógł się wkraść do analizy, która próbowała go ocenić i niewykluczone, że skala zjawiska jest w rzeczywistości większa. Na koniec przydałaby się jakaś pozytywna konkluzja. Wskazaliśmy dolegliwość, ale pacjent czeka na lekarstwo. Przedstawiliśmy kilka metod, które wyglądają obiecująco. Warto wspomnieć, że są dostępne w kolejnej odsłonie (3.0) programu STATISTICA Zestaw Medyczny. Narzędzia te pomagają diagnozować problem i walczą z jego skutkami. Trzeba jednak sięgnąć głębiej, do samego źródła. Najlepszą profilaktyką wydaje się w tym przypadku uświadamianie problemu. Być może dzięki temu w niedalekiej przyszłości wyniki prowadzonych badań staną się powszechnie dostępne, niezależnie od głębokości szuflady badacza. Literatura 1. Begg C.B., Mazumdar M., Operating characteristics of a rank correlation test for publication bias. Biometrics. 1994; 50, Borenstein M., Hedges L.V., Higgins J.P.T., Rothstein H.R., Introduction to Meta- Analysis. John Wiley and Sons Ltd Duval S.J., Tweedie R.L., A non-parametric trim and fill method of accounting for publication bias in meta-analysis. Journal of the American Statistical Association. 2000; 95, Egger M., Davey Smith G., Schneider M., Minder C., Bias in meta-analysis detected by a simple, graphical test. BMJ. 1997; 315, Copyright StatSoft Polska 2014
11 5. Rothstein H.R., Sutton A.J., Borenstein M., Publication Bias in Meta-Analysis: Prevention, Assessment and Adjustments. John Wiley and Sons Ltd StatSoft, Inc. (2013). STATISTICA (data analysis software system), version StatSoft Polska Sp. z o.o STATISTICA Zestaw Medyczny wersja Copyright StatSoft Polska
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Michał Kusy, StatSoft Polska Sp. z o.o.
ILOŚCIOWA SYNTEZA WYNIKÓW BADAŃ PIERWOTNYCH - METAANALIZA W STATISTICA ZESTAWIE MEDYCZNYM Michał Kusy, StatSoft Polska Sp. z o.o. Wprowadzenie Metaanaliza, czyli ilościowa synteza wyników pochodzących
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
Wykład 2: Tworzenie danych
Wykład 2: Tworzenie danych Plan: Statystyka opisowa a wnioskowanie statystyczne Badania obserwacyjne a eksperyment Planowanie eksperymentu, randomizacja Próbkowanie z populacji Rozkłady próbkowe Wstępna/opisowa
Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (punktowa, przedziałowa) Weryfikacja
Pobieranie prób i rozkład z próby
Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.
Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu
Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)
Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA
Wykład 4: Wnioskowanie statystyczne Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Idea wnioskowania statystycznego Celem analizy statystycznej nie jest zwykle tylko
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
Testowanie hipotez statystycznych
Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Wykład 9 Wnioskowanie o średnich
Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 dr inż. Anna Skowrońska-Szmer zima 2017/2018 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją
Jeśli powyższy opis nie jest zrozumiały należy powtórzyć zagadnienie standaryzacji zanim przejdzie się dalej!
CO POWINNIŚMY WIEDZIEĆ (I ROZUMIEĆ) ZABIERAJĄC SIĘ DO CZYTANIA 1. Jeśli mamy wynik (np. z kolokwium) podany w wartościach standaryzowanych (np.: z=0,8) to wiemy, że aby ustalić jaki był wynik przed standaryzacją
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego
Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Zadania ze statystyki cz.8. Zadanie 1.
Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,
Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi
Odchudzamy serię danych, czyli jak wykryć i usunąć wyniki obarczone błędami grubymi Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska D syst D śr m 1 3 5 2 4 6 śr j D 1
Szkice rozwiązań z R:
Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 6 Mikołaj Czajkowski Wiktor Budziński Metody symulacyjne Monte Carlo Metoda Monte-Carlo Wykorzystanie mocy obliczeniowej komputerów, aby poznać charakterystyki zmiennych losowych poprzez
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Regresja linearyzowalna
1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
LABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (estymacja punktowa, przedziałowa)
Kontekstowe wskaźniki efektywności nauczania - warsztaty
Kontekstowe wskaźniki efektywności nauczania - warsztaty Przygotowała: Aleksandra Jasińska (a.jasinska@ibe.edu.pl) wykorzystując materiały Zespołu EWD Czy dobrze uczymy? Metody oceny efektywności nauczania
LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU
LINIOWOŚĆ METODY OZNACZANIA ZAWARTOŚCI SUBSTANCJI NA PRZYKŁADZIE CHROMATOGRAFU Tomasz Demski, StatSoft Polska Sp. z o.o. Wprowadzenie Jednym z elementów walidacji metod pomiarowych jest sprawdzenie liniowości
ANALIZA SYSTEMU POMIAROWEGO (MSA)
StatSoft Polska, tel. 1 484300, 601 414151, info@statsoft.pl, www.statsoft.pl ANALIZA SYSTEMU POMIAROWEGO (MSA) dr inż. Tomasz Greber, Politechnika Wrocławska, Instytut Organizacji i Zarządzania Wprowadzenie
Statystyka matematyczna i ekonometria
Statystyka matematyczna i ekonometria Wykład 5 Anna Skowrońska-Szmer lato 2016/2017 Hipotezy 2 Hipoteza zerowa (H 0 )- hipoteza o wartości jednego (lub wielu) parametru populacji. Traktujemy ją jako prawdziwą
P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?
2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
JAK PORADZIĆ SOBIE Z NIEPOŻĄDANĄ ZMIENNOŚCIĄ TYPU SYSTEMATYCZNEGO W BADANIACH MEDYCZNYCH?
JAK PORADZIĆ SOBIE Z NIEPOŻĄDANĄ ZMIENNOŚCIĄ TYPU SYSTEMATYCZNEGO W BADANIACH MEDYCZNYCH? Janusz Wątroba, StatSoft Polska Sp. z o.o. Charakterystyczną cechą badań empirycznych jest zmienność, którą badacz
STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych;
STATYSTYKA OPISOWA Przykłady problemów statystycznych: - badanie opinii publicznej na temat preferencji wyborczych; - badanie skuteczności nowego leku; - badanie stopnia zanieczyszczenia gleb metalami
Estymacja punktowa i przedziałowa
Temat: Estymacja punktowa i przedziałowa Kody znaków: żółte wyróżnienie nowe pojęcie czerwony uwaga kursywa komentarz 1 Zagadnienia 1. Statystyczny opis próby. Idea estymacji punktowej pojęcie estymatora
Badanie zależności skala nominalna
Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność
Prawdopodobieństwo i rozkład normalny cd.
# # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl
R-PEARSONA Zależność liniowa
R-PEARSONA Zależność liniowa Interpretacja wyników: wraz ze wzrostem wartości jednej zmiennej (np. zarobków) liniowo rosną wartości drugiej zmiennej (np. kwoty przeznaczanej na wakacje) czyli np. im wyższe
12/30/2018. Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie. Estymacja Testowanie hipotez
Biostatystyka, 2018/2019 dla Fizyki Medycznej, studia magisterskie Wyznaczanie przedziału 95%CI oznaczającego, że dla 95% prób losowych następujące nierówności są prawdziwe: X t s 0.025 n < μ < X + t s
Testowanie hipotez statystycznych. Wprowadzenie
Wrocław University of Technology Testowanie hipotez statystycznych. Wprowadzenie Jakub Tomczak Politechnika Wrocławska jakub.tomczak@pwr.edu.pl 10.04.2014 Pojęcia wstępne Populacja (statystyczna) zbiór,
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013
ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.
Oszacowanie i rozkład t
Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie
Ewaluacja w polityce społecznej
Ewaluacja w polityce społecznej Dane i badania w kontekście ewaluacji metody ilościowe Dr hab. Ryszard Szarfenberg Instytut Polityki Społecznej UW rszarf.ips.uw.edu.pl/ewalps/dzienne/ Rok akademicki 2017/2018
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Statystyka w przykładach
w przykładach Tomasz Mostowski Zajęcia 10.04.2008 Plan Estymatory 1 Estymatory 2 Plan Estymatory 1 Estymatory 2 Własności estymatorów Zazwyczaj w badaniach potrzebujemy oszacować pewne parametry na podstawie
RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013
RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013 ZESPÓŁ SZKÓŁ NR 14 W BYDGOSZCZY GIMNAZJUM NR 37 INTEGRACYJNE Opracowanie A. Tarczyńska- Pajor na podstawie
WNIOSKOWANIE STATYSTYCZNE
STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących
Badania obserwacyjne w ocenie bezpieczeństwa leków This gentle murmur it could be stings of remorse
Badania obserwacyjne w ocenie bezpieczeństwa leków This gentle murmur it could be stings of remorse Magdalena Władysiuk 1. Pharmacovigilance: Co to jest pharmacovigilance? Podstawowe założenia systemu
Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński
Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków
Wyniki badania profilaktyki lekarskiej w zakresie porad żywieniowych dla dzieci do lat 3
Warszawa, 29 maja 2013 roku Wyniki badania profilaktyki lekarskiej w zakresie porad żywieniowych dla dzieci do lat 3 Cele badania Badanie przeprowadzono w celu poznania dodatkowych przyczyn złej sytuacji
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
JAK EFEKTYWNIE I POPRAWNIE WYKONAĆ ANALIZĘ I RAPORT Z BADAŃ BIEGŁOŚCI I WALIDACJI PRAKTYCZNE WSKAZÓWKI
JAK EFEKTYWNIE I POPRAWNIE WYKONAĆ ANALIZĘ I RAPORT Z BADAŃ BIEGŁOŚCI I WALIDACJI PRAKTYCZNE WSKAZÓWKI Michał Iwaniec, StatSoft Polska Sp. z o.o. Wprowadzenie W wielu zagadnieniach laboratoryjnych statystyczna
Testowanie hipotez statystycznych
Testowanie hipotez statystycznych Hipotezą statystyczną jest dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia
ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza
Porównywanie populacji
3 Porównywanie populacji 2 Porównywanie populacji Tendencja centralna Jednostki (w grupie) według pewnej zmiennej porównuje się w ten sposób, że dokonuje się komparacji ich wartości, osiągniętych w tej
STATYSTYKA MATEMATYCZNA WYKŁAD 4. Testowanie hipotez Estymacja parametrów
STATYSTYKA MATEMATYCZNA WYKŁAD 4 Testowanie hipotez Estymacja parametrów WSTĘP 1. Testowanie hipotez Błędy związane z testowaniem hipotez Etapy testowana hipotez Testowanie wielokrotne 2. Estymacja parametrów
WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA
WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA Janusz Wątroba i Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Zakres zastosowań analizy danych w różnych dziedzinach działalności biznesowej i
Publiczna Szkoła Podstawowa nr 14 w Opolu. Edukacyjna Wartość Dodana
Publiczna Szkoła Podstawowa nr 14 w Opolu Edukacyjna Wartość Dodana rok szkolny 2014/2015 Edukacyjna Wartość Dodana (EWD) jest miarą efektywności nauczania dla szkoły i uczniów, którzy do danej placówki
Testowanie hipotez statystycznych.
Statystyka Wykład 10 Wrocław, 22 grudnia 2011 Testowanie hipotez statystycznych Definicja. Hipotezą statystyczną nazywamy stwierdzenie dotyczące parametrów populacji. Definicja. Dwie komplementarne w problemie
-> Średnia arytmetyczna (5) (4) ->Kwartyl dolny, mediana, kwartyl górny, moda - analogicznie jak
Wzory dla szeregu szczegółowego: Wzory dla szeregu rozdzielczego punktowego: ->Średnia arytmetyczna ważona -> Średnia arytmetyczna (5) ->Średnia harmoniczna (1) ->Średnia harmoniczna (6) (2) ->Średnia
Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)
Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Przygotował: Dr inż. Wojciech Artichowicz Katedra Hydrotechniki PG Zima 2014/15 1 TABLICE ROZKŁADÓW... 3 ROZKŁAD
Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna
PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH. Wprowadzenie do problematyki modelowania statystycznego
PRZYKŁADY BUDOWY MODELI REGRESYJNYCH I KLASYFIKACYJNYCH Janusz Wątroba, StatSoft Polska Sp. z o.o. Tematyka artykułu obejmuje wprowadzenie do problematyki modelowania statystycznego i jego roli w badaniu
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/
Matematyka z el. statystyki, # 6 /Geodezja i kartografia II/ Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, bud. CIW, p. 221 e-mail: zdzislaw.otachel@up.lublin.pl
SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY
SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
6.4 Podstawowe metody statystyczne
156 Wstęp do statystyki matematycznej 6.4 Podstawowe metody statystyczne Spóbujemy teraz w dopuszczalnym uproszczeniu przedstawić istotę analizy statystycznej. W szczególności udzielimy odpowiedzi na postawione
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Analiza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Wielkość dziennego obrotu w tys. zł. (y) Liczba ekspedientek (x) 6 2 4 5,5 6,6
Zad. 1. Zbadano wydajność odmiany pomidorów na 100 poletkach doświadczalnych. W wyniku przeliczeń otrzymano przeciętną wydajność na w tonach na hektar x=30 i s 2 x =7. Przyjmując, że rozkład plonów pomidora
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.
W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,
istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy
MODEL REGRESJI LINIOWEJ. METODA NAJMNIEJSZYCH KWADRATÓW Analiza regresji zajmuje się badaniem zależności pomiędzy interesującymi nas wielkościami (zmiennymi), mające na celu konstrukcję modelu, który dobrze
Wykład 5: Statystyki opisowe (część 2)
Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz
METAANALIZA I METAREGRESJA W PROGRAMIE STATISTICA ZESTAW MEDYCZNY
METAANALIZA I METAREGRESJA W PROGRAMIE STATISTICA ZESTAW MEDYCZNY Michał Kusy, StatSoft Polska Sp. z o.o. Statystyczne metody łączenia wyników pochodzących z niezależnych badań muszą często radzić sobie
Analiza wyników egzaminacyjnych 2013
Analiza wyników egzaminacyjnych 2013 z wykorzystaniem wskaźników edukacyjnej wartości dodanej (EWD) 1. Zestawienie ogólne wskaźników EWD dla egzaminu 2013 Wskaźniki EWD dla tegorocznego egzaminu gimnazjalnego
Przekształcanie wykresów.
Sławomir Jemielity Przekształcanie wykresów. Pokażemy tu, jak zmiana we wzorze funkcji wpływa na wygląd jej wykresu. A. Mamy wykres funkcji f(). Jak będzie wyglądał wykres f ( ) + a, a stała? ( ) f ( )
Warszawa, dnia 11 kwietnia 2012 r. Poz. 388 ROZPORZĄDZENIE MINISTRA ZDROWIA 1) z dnia 2 kwietnia 2012 r.
DZIENNIK USTAW RZECZYPOSPOLITEJ POLSKIEJ Warszawa, dnia 11 kwietnia 2012 r. Poz. 388 ROZPORZĄDZENIE MINISTRA ZDROWIA 1) z dnia 2 kwietnia 2012 r. w sprawie minimalnych wymagań, jakie muszą spełniać analizy
Zawartość. Zawartość
Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami
Kształtowanie kompetencji personalnych i społecznych w szkole zawodowej drogą do sukcesu na rynku pracy
Wyniki cząstkowe testów ex ante z uczniami. We wszystkich pięciu uczestniczących w tym etapie projektu szkołach ponadgimnazjalnych rozpoczęły się zajęcia Innowacyjnego Programu Szkolnego Doradztwa Zawodowego.
Raport dla szkoły Z BADANIA PODŁUŻNEGO W SZKOŁACH PODSTAWOWYCH. Efektywność nauczania na I etapie edukacyjnym
ͳ Raport dla szkoły Z BADANIA PODŁUŻNEGO W SZKOŁACH PODSTAWOWYCH Efektywność nauczania na I etapie edukacyjnym Dane szkoły Nr identyfikacyjny: Nazwa szkoły: Miejscowość: Adres: Instytut Badań Edukacyjnych
MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY
MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY WYKORZYSTANIU METOD STATYSTYCZNYCH mgr Małgorzata Pelczar 6 Wprowadzenie Reforma służby zdrowia uwypukliła problem optymalnego ustalania kosztów usług zdrowotnych.
1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:
Wariancja z populacji: Podstawowe miary rozproszenia: 1 1 s x x x x k 2 2 k 2 2 i i n i1 n i1 Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: 1 k 2 s xi x n 1 i1 2 Przykład 38,
Sposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
Projektowanie systemu krok po kroku
Rozdział jedenast y Projektowanie systemu krok po kroku Projektowanie systemu transakcyjnego jest ciągłym szeregiem wzajemnie powiązanych decyzji, z których każda oferuje pewien zysk i pewien koszt. Twórca
Estymacja parametrów w modelu normalnym
Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia
Testy nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach
Na A (n) rozważamy rozkład P (n) , który na zbiorach postaci A 1... A n określa się jako P (n) (X n, A (n), P (n)
MODELE STATYSTYCZNE Punktem wyjścia w rozumowaniu statystycznym jest zmienna losowa (cecha) X i jej obserwacje opisujące wyniki doświadczeń bądź pomiarów. Zbiór wartości zmiennej losowej X (zbiór wartości