METAANALIZA I METAREGRESJA W PROGRAMIE STATISTICA ZESTAW MEDYCZNY

Wielkość: px
Rozpocząć pokaz od strony:

Download "METAANALIZA I METAREGRESJA W PROGRAMIE STATISTICA ZESTAW MEDYCZNY"

Transkrypt

1 METAANALIZA I METAREGRESJA W PROGRAMIE STATISTICA ZESTAW MEDYCZNY Michał Kusy, StatSoft Polska Sp. z o.o. Statystyczne metody łączenia wyników pochodzących z niezależnych badań muszą często radzić sobie z problemami wynikającymi ze zmienności między badaniami. Mimo że metaanaliza pozwala połączyć wyniki z badań pierwotnych w postaci efektu łącznego, jej celem nie jest sprowadzenie wszystkich wartości do jednej miary efektu. Dobrze oddaje to wykres leśny, przedstawiający uzyskany efekt łączny w kontekście poszczególnych badań i ich zmienności. W kolejnych rozdziałach przedstawimy przykład wykonania metaanalizy w programie STATISTICA Zestaw Medyczny. Do oceny zmienności wyników wykorzystamy analizę niejednorodności. Szukając przyczyn tej zmienności, sięgniemy do analizy w grupach i metaregresji, aby sprawdzić powiązania między efektem i wybranymi charakterystykami badania. Badania Przedstawiane analizy opierają się na danych pochodzących z analizy skuteczności szczepienia BCG w profilaktyce gruźlicy. Szczepionka BCG (Bacillus Calmette-Guérin) zapobiegająca rozwojowi gruźlicy została opracowana we Francji przez Alberta Calmette i Camille'a Guérin. Obecnie Światowa Organizacja Zdrowia (WHO) zaleca jej stosowanie w ramach programu szczepień ochronnych w krajach o podwyższonym ryzyku zachorowania na gruźlicę. Mimo że szczepionkę wprowadzono do użycia w 1921 roku, jej skuteczność często poddawano w wątpliwość. Dostępne wyniki badań wahają się od wartości wskazujących na przypuszczalną szkodliwość szczepienia do prawie 80% skuteczności. W latach 90., wraz z niepokojącym rozpowszechnianiem się gruźlicy w Stanach Zjednoczonych, pojawiła się potrzeba zestawienia i podsumowania dotychczasowych badań opisujących skuteczność BCG. W 1994 roku Colditz i wsp. [4] przeprowadzili metaanalizę dostępnych badań, a rok później Berkey i wsp. [2] podjęli się próby wyjaśnienia części zmienności efektów za pomocą metaregresji. Dokonano przeglądu 1264 artykułów i abstraktów dotyczących występowania samej choroby oraz szczepień BCG i innych szczepień przeciw gruźlicy. Do identyfikacji badań klinicznych oceniających skuteczność szczepionki BCG wykorzystano elektroniczne bazy publikacji medycznych, analizując odwołania do wyszukanych artykułów, przeglądając 50

2 ` wcześniej przygotowane listy badań BCG oraz kontaktując się z ekspertami w tej dziedzinie. Przeglądane publikacje obcojęzyczne były tłumaczone na język angielski. Wyszukiwanie przeprowadzały niezależnie przynajmniej dwie osoby, a wszystkie przeglądane artykuły rejestrowano wraz z ewentualnymi przyczynami wyłączenia ich z badania. Do metaanalizy włączono jedynie badania oceniające skuteczność szczepienia BCG w zapobieganiu przypadkom gruźlicy lub śmierci. Autorzy starali się zgromadzić następujące informacje o każdym z badań: rok publikacji, rok szczepienia, sposób zaplanowania badania, przedział wiekowy badanej populacji, liczba włączonych pacjentów, położenie (szerokość geograficzna), typ i dawka użytej szczepionki, droga podania, czas badania lub czas do uodpornienia, rodzaj miary efektu oraz wynik opisujący skuteczność szczepionki. Ostatecznie kryteria włączenia do metaanalizy skuteczności szczepienia BCG w profilaktyce gruźlicy spełniło 13 badań, na których będą bazować kolejne analizy. Metaanaliza Analizę w module Metaanaliza programu STATISTICA Zestaw Medyczny rozpoczynamy od wprowadzenia wyników poszczególnych badań. Zbiór danych zawiera informacje o liczbach pacjentów z gruźlicą i pacjentów zdrowych, w grupach szczepionych BCG i nieszczepionych. Na podstawie tych wartości dla każdego badania program oblicza interesującą nas miarę efektu, którą w tym przypadku jest współczynnik ryzyka RR. W pierwszym badaniu (Aronson 1948) gruźlica wystąpiła u 4 spośród 123 osób szczepionych i 11 spośród 139 nieszczepionych. Współczynnik ryzyka i 95% przedział ufności wyniosły w tym badaniu odpowiednio: 0,411 i (0,134; 1,257). Ponieważ dane z badań pierwotnych zostały wcześniej zapisane w arkuszu STASTISTICA, można je wprowadzić do analizy jednocześnie. Moduł Metaanaliza umożliwia również wprowadzenie badań z już 51

3 wyliczonymi efektami, co jest szczególnie istotne w sytuacjach, gdy nie ma dostępu do szczegółowych danych dla badania, dysponujemy jednak wyliczoną na ich podstawie miarą efektu. Po wprowadzeniu poszczególnych badań program wylicza automatycznie wszystkie miary efektu dostępne dla takich danych. Istnieje również możliwość przeliczania części współczynników między sobą, dzięki czemu w analizie można jednocześnie uwzględnić badania prezentujące różne miary efektu. W przypadku miar efektu wyrażonych na skali ilorazowej (takich jak np. współczynnik ryzyka RR czy iloraz szans OR) przed przeprowadzeniem metaanalizy program zastosuje przekształcenie logarytmiczne. Pozwala ono sprowadzić wyniki do skali addytywnej, a następnie wyznaczyć średnią ważoną będącą oszacowaniem efektu łącznego w metaanalizie. Dopiero po wyliczeniu łącznego efektu przedstawiamy wynik na wyjściowej skali. Metaanaliza - model z efektem stałym i zmiennym Metaanaliza, czyli ilościowa synteza wyników pochodzących z niezależnych badań, to narzędzie badawcze, które pozwala precyzyjnie ocenić wpływ działania analizowanego czynnika oraz rozszerzyć wnioski z pojedynczych badań na szerszą populację w sytuacji, gdy nie mamy dostępu do danych surowych, a dysponujemy jedynie zbiorczymi wynikami tych badań. Jako jedną z pierwszych metaanaliz traktuje się analizę wykonaną przez Karla Pearsona w 1904 roku. Aby ocenić skuteczność szczepienia na tyfus brzuszny Pearson wykorzystał wyniki z pięciu prób o małej liczności i obliczył uśrednioną miarę korelacji między umieralnością a stosowaniem szczepionki. Mimo że metaanaliza znajduje obecnie szerokie zastosowanie w medycynie, farmakologii i epidemiologii, pierwsze publikacje oceniające skuteczność terapii za pomocą tej techniki 52

4 ` badawczej pojawiły się stosunkowo późno. Sam termin metaanaliza (meta-analysis) sformułował po raz pierwszy Gene Glass w 1976 roku. W połowie lat 80. upowszechniły się tzw. przeglądy systematyczne (systematic reviews), w których metaanaliza odgrywa dużą rolę. O jej znaczeniu we współczesnych naukach medycznych może świadczyć chociażby fakt, że najwyżej w hierarchii wiarygodności danych z badań klinicznych stawia się właśnie metaanalizę badań z grupą kontrolną. W większości przypadków metaanaliza jest oparta na jednym z dwóch modeli statystycznych: modelu z efektem stałym (fixed-effect model) lub modelu z efektem zmiennym (random-effects model). W modelu z efektem stałym zakłada się, że wyniki wszystkich badań opisują tę samą, rzeczywistą wartość efektu, a różnice w obserwowanych efektach wynikają z błędu próby. W tym przypadku efekt łączny jest wyznaczany na podstawie średniej ważonej efektów, przy czym wagi są wyznaczane jako odwrotności wariancji odpowiednich badań. Podejmując decyzję o włączeniu do metaanalizy grupy badań, zakładamy, że mają one na tyle zgodny charakter, że synteza ich wyników ma sens. Najczęściej jednak rzeczywisty efekt nie jest w każdym z nich jednakowy, co jest spowodowane np. specyficznymi, nieopisanymi w publikacjach cechami pacjentów lub różnicami w sposobie zaplanowania badania, z których nie zdajemy sobie sprawy. W modelu z efektem zmiennym (nazywanym również modelem efektów losowych) uwzględniamy sytuację, w której nieznane, rzeczywiste efekty różnią się między badaniami. Zwykle zakłada się, że mają one rozkład normalny. Również w tym modelu efekt łączny jest wyznaczany na podstawie średniej ważonej efektów poszczególnych badań, z tym że wagi są wyznaczane jako odwrotności wariancji wewnątrz badań, powiększonej o wariancję pomiędzy badaniami. Wróćmy do naszego przykładu. Biorąc pod uwagę zróżnicowanie zgromadzonych badań wybieramy model z efektem zmiennym. Miarą efektu, którą będziemy rozpatrywać jest współczynnik ryzyka RR. Przed wykonaniem analizy program automatycznie sprowadzi wartości do skali logarytmicznej, a na koniec przeskaluje wynik do wyjściowej miary. Na karcie Badania wyświetlone zostają wyniki dla poszczególnych badań pierwotnych i wyniki metaanalizy, umieszczone w ostatnim wierszu. Uzyskany w modelu efekt łączny wynosi RR = 0,490, a odpowiedni 95% przedział ufności (0,345; 0,695). Wynik jest istotny statystycznie przy poziomie istotności α = 0,05 (p = 0,0001). Oznacza to zatem średnio o 50% niższe ryzyko zachorowania na gruźlicę wśród osób szczepionych BCG w porównaniu do grupy kontrolnej. Gdybyśmy dla porównania przeprowadzili metaanalizę, zakładając, że zbiór badań jest jednorodny, a zmienność wynika jedynie z błędu próby (model z efektem stałym), uzyskalibyśmy współczynnik ryzyka RR = 0,650 (0,601; 0,704), również istotny statystycznie. Widzimy, że w modelu z efektem stałym wyznaczony przedział ufności dla współczynnika ryzyka jest wyraźnie węższy niż w przypadku modelu z efektem zmiennym. 53

5 Mimo że metaanaliza pozwala połączyć wyniki wielu badań w postaci efektu łącznego, jej celem nie jest sprowadzenie tych wszystkich wartości do jednej miary efektu. W zależności od zmienności wyników badań, badacz może koncentrować uwagę na oszacowaniu efektu (w przypadku bardzo jednorodnych badań), wartości efektu i jego zmienności lub też głównie na zmienności. Dobrze oddaje to wykres leśny (forest plot), przedstawiający zarówno efekt łączny, jak i cały kontekst (poszczególne badania i ich zmienność), w którym został on wyznaczony. Najczęściej przedstawia się na nim wyniki poszczególnych badań i obliczone przedziały ufności oraz wynik łączny, umieszczany poniżej badań. Dodatkowo punkty oznaczające wartości efektu zaznaczane są najczęściej jako kwadraty o różnych polach, które odpowiadają wadze danego badania w metaanalizie. Moduł Metaanaliza pozwala również dołączyć do wykresu tabelę z wybranymi wynikami badań. Udziały poszczególnych badań w metaanalizie są dość zbliżone i mieszczą się w zakresie ok. 4-10%. Wynika to z faktu, że model z efektem zmiennym uwzględnia w obliczeniach zmienność zaobserwowaną między badaniami i nawet mało liczne badania wnoszą pewną informację o zmienności efektu. W modelu z efektem stałym wagi badań wahałyby się w tym przykładzie od niecałego 1% do 42% i byłyby w większym stopniu zależne od liczności badania. Od razu rzuca się w oczy duża zmienność wyników, od 80% zmniejszenia ryzyka w grupie szczepionych BCG (Ferguson & Simes 1949, Vandiviere 1973) do wyników świadczących na niekorzyść szczepionki, jak np. RR = 1,562 w badaniu Comstock & Webster Widzimy również, że w 5 spośród 13 rozpatrywanych badań wyniki okazały się nieistotne statystycznie. 54

6 ` Analiza skumulowana Innym sposobem spojrzenia na wpływ poszczególnych badań na obliczany efekt łączny jest tzw. skumulowana metaanaliza (cumulative meta-analysis). Badania są w niej zwykle sortowane chronologicznie, dzięki czemu można śledzić, jak łączny efekt i błąd jego oszacowania zmieniały się w czasie, po uwzględnieniu kolejnych publikacji. 55

7 Powyżej przedstawiono wykres z wynikami analizy skumulowanej. Analizowane badania pochodzą z ponad 30-letniego okresu, w związku z czym ich wyniki będą oddawać zmiany, które zachodziły zarówno w praktyce medycznej, jak i sposobie planowania badań oraz raportowania ich wyników. Precyzja oszacowania efektu łącznego poprawia się naturalnie po dołączeniu do pojedynczego badania Aronson 1948 dwóch kolejnych badań. Widzimy jednak, że zmienność wyników jest na tyle duża, że dodanie kolejnych 10 badań nie powoduje znacznego zwężenia 95% przedziału ufności dla efektu łącznego. Analiza wrażliwości W trakcie przeprowadzania metaanalizy spotykamy ograniczenia związane nie tylko z zastosowanymi technikami analitycznymi, ale przede wszystkim z dostępnością danych. Przykładowo dane uzyskane z badań kohortowych nie pozwoliły na analizę czasu trwania odporności po szczepieniu, a uwzględnienie różnego wieku pacjentów było ograniczone określonym doborem pacjentów do badań oraz brakiem odpowiednich informacji w publikacjach. Potencjalnym źródłem obciążenia wyników metaanalizy są również badania niepublikowane, których wyniki są często nieistotne statystycznie lub nawet sprzeczne z publikowanymi danymi. Colditz i wsp. [4] kontaktowali się z ekspertami z WHO, CDC (Centers for Disease Control and Prevention) i innych organizacji, prosząc o pomoc w wyszukaniu jakichkolwiek niepublikowanych badań skuteczności BCG. Nie udało się jednak dotrzeć do takich badań. Przeprowadzono zatem analizę wrażliwości, w której oceniano m.in., jak wyniki metaanalizy przedstawiałyby się dla różnych zestawów uwzględnionych badań. Wykonano również metaanalizy po włączeniu dodatkowych 20 hipotetycznych badań, z których każde miało liczność porównywalną z największym badaniem rozpatrywanym w bazowej metaanalizie i wskazywało na brak skuteczności BCG. Według autorów główne konkluzje zostały zachowane, a efekt łączny pozostał istotny statystycznie. Aby ocenić, na ile założenia metaanalizy i uwzględnione w niej badania wpłynęły na uzyskane łączne wyniki, możemy wykonać szereg eksperymentów kryjących się pod ogólnym terminem analizy wrażliwości (sensitivity analysis). Gdy część wyników znacznie odbiega od pozostałych, można zbadać wpływ poszczególnych badań na efekt łączny, powtarzając wielokrotnie metaanalizę po wyłączeniu każdego z nich z osobna lub wyłączeniu grupy badań. Podobnie jeśli badanie nie zostało uwzględnione w metaanalizie, np. ze względu na jakość danych, możemy sprawdzić, jak zmieniłaby się łączna wartość efektu, gdyby włączyć je do analizy. Poniżej przedstawiono wykres wrażliwości, pokazujący zmiany w efekcie łącznym spowodowane wyłączeniem z metaanalizy poszczególnych badań. Pionowymi liniami zaznaczony został efekt łączny i granice przedziału ufności dla całościowej metaanalizy. Do tych poziomów możemy odnieść wartość efektu łącznego i zakres przedziału ufności dla metaanalizy przeprowadzonej bez danego badania. 56

8 ` Na podstawie wykresu możemy stwierdzić, że nieuwzględnienie w analizie badania Aronson 1948 nie wpłynęłoby znacznie na efekt łączny, natomiast w metaanalizie przeprowadzonej bez badania TB Prevention Trial 1980 otrzymalibyśmy nieco mniejszy współczynnik ryzyka (RR = 0,454). Dodatkowy wykres przedstawiający procentową zmianę błędu standardowego po wyłączeniu badania z metaanalizy pokazuje, że w tym przypadku błąd standardowy zmniejszyłby się o około 15%. Badanie TB Prevention Trial 1980 miało silny wpływ na wyniki metaanalizy. Było to najliczniejsze spośród analizowanych badań, a wyznaczony w nim współczynnik ryzyka sugerował brak efektu (RR = 1,012, p = 0,8494). Niejednorodność wyników Rozważając niejednorodność wyników analizowanych badań, mamy na uwadze zmienność rzeczywistej wartości efektu. Obserwowana zmienność może wynikać z różnic na poziomie klinicznym (np. zróżnicowania populacji pacjentów, interwencji, czasu obserwacji) lub metodycznym (np. różnic w zaplanowaniu badań, jakości badań), jak również z błędów losowych. Aby wyodrębnić z obserwowanego rozrzutu wyników rzeczywistą wariancję, porównujemy zaobserwowaną zmienność między badaniami ze zmiennością, której oczekiwalibyśmy, gdyby badania wskazywały efekt wspólny. Różnica między nimi powinna odzwierciedlać rzeczywiste różnice między badaniami i na jej bazie konstruuje się podstawowe miary wykorzystywane w analizie niejednorodności (heterogeneity analysis). Przykładową miarą oceniającą niejednorodność wyników jest ważona suma kwadratów Q Cochrana. Przy założeniu, że każde z k badań wskazuje na ten sam stały efekt, współczynnik Q będzie pochodził z rozkładu chi-kwadrat o k-1 stopniach swobody. W ten sposób otrzymujemy test sprawdzający niejednorodność efektów. Na podstawie wartości 57

9 Q wyznacza się również T 2 estymator wariancji rzeczywistych efektów, oraz I 2 statystykę, która przedstawia udział procentowy zmienności rzeczywistej do łącznej. W rozważanym przykładzie interesujący jest nie tylko efekt łączny, ale również, jeśli nie przede wszystkim, znaczna wariancja efektów leczenia, które zmieniają się od RR równego 0,198 (80% zmniejszenie ryzyka) do 1,562 (56% zwiększenie ryzyka). Statystyka Q wynosi 152,233 (df = 12), a p jest mniejsze od 0,0001, w związku z czym możemy stwierdzić, że wyniki badań istotnie się od siebie różnią. Wariancja rzeczywistych efektów T 2 jest równa 0,309 i stanowi 92% obserwowanej zmienności (I 2 = 92,12). Duża zmienność powoduje, że 95% przedział predykcji dla efektu jest szeroki. W zakresie (0,135; 1,769), oznaczonym na wykresie leśnym przerywaną linią spodziewalibyśmy się z dużym prawdopodobieństwem uzyskać wartość RR w kolejnym badaniu. Do graficznej oceny niejednorodności badań, oprócz wykresu leśnego, można wykorzystać szereg wykresów przedstawiających różne aspekty zmienności. Przykładem może być wykres L Abbego, przedstawiający w tym przypadku zależność między ryzykiem wystąpienia gruźlicy w grupie pacjentów szczepionych BCG a ryzykiem gruźlicy w grupie kontrolnej. Linia ciągła odpowiada poziomowi równowagi (RR = 1,00), a linia przerywana wyznaczonemu w metaanalizie efektowi łącznemu (RR = 0,49). Wielkość znaczników jest proporcjonalna do udziału danego badania w metaanalizie. Znaczny rozrzut punktów wokół przerywanej prostej sugeruje zwykle dużą zmienność wyników badań. Naszą uwagę zwraca jednak badanie Stein & Aronson Co prawda jego wynik nie odbiega znacznie od obliczonego efektu łącznego, ale charakteryzuje się ono największym odsetkiem zachorowań na gruźlicę, zarówno wśród osób zaszczepionych, jak i grupie kontrolnej. Dodatkowo możemy zaobserwować, że wartości RR większe od obliczonego efektu łącznego występują w badaniach oznaczonych ciemniejszym kolorem, w których ryzyko wystąpienia gruźlicy w grupie kontrolnej jest stosunkowo wysokie. 58

10 ` Analiza niejednorodności badań nie kończy się zwykle na samym stwierdzeniu istnienia zmienności. Z praktycznego punktu widzenia bardziej przydatne jest wskazanie jej potencjalnych źródeł. Wykorzystujemy w tym celu między innymi analizę w grupach i metaregresję, szukając powiązań między charakterystykami badania i wartością efektu. Analiza w grupach Analizę w grupach (subgroup analyses) wykonujemy w sytuacji, gdy chcemy porównać wyniki metaanalizy przeprowadzanej na różnych grupach badań. W analizie w grupach na obserwowaną zmienność efektu wpływają: zmienność międzygrupowa, rzeczywista zmienność efektu w grupach i błąd próby. W przypadku modelu z efektem zmiennym wariancję rzeczywistych efektów T 2 możemy szacować dla każdej z grup oddzielnie lub wspólnie. Dodatkowo przeprowadza się testy porównujące efekty łączne między grupami. Szukając przyczyn zmienności wyników poszczególnych badań, Colditz i wsp. [4] rozważali m.in. użycie różnych szczepów BCG, występowanie innych zakażeń prątkowych w badanej populacji, genetyczne lub związane z wiekiem różnice w badanych populacjach, zmniejszoną złośliwość niektórych szczepów gruźlicy itp. Rozpatrywano również błędy merytoryczne oraz różnice metodyczne powodujące obciążenie wyników poszczególnych badań. Uwzględnili przykładowo zmienną określającą sposób przypisania pacjentów do porównywanych grup. W 7 badaniach pacjentów przypisano w sposób losowy (random allocation), w 4 zastosowano losowanie systematyczne (systematic allocation), a w 2 59

11 pseudorandomizację (alternate allocation). Poniżej przedstawiono wyniki analizy w tak zdefiniowanych grupach. Istotny statystycznie okazał się jedynie współczynnik ryzyka w grupie z przydziałem losowym, RR = 0,366 (0,180; 0,745). Analizując wykres leśny dla analizy w grupach, nie możemy powiedzieć, że metoda przypisania pacjentów do grup wyjaśnia zróżnicowanie wyników badań. Również test oparty na statystyce Q nie wykazał istotnych różnic między trzema grupami badań (p = 0,4638). Metaregresja Metaregresja (meta-regression) to kolejne podejście powszechnie stosowane w analizie niejednorodności badań. Stanowi ona połączenie technik metaanalizy i regresji liniowej. Krótko mówiąc, metaregresja ocenia czy istnieje liniowa zależność między zmiennymi na poziomie badania a odpowiednimi efektami leczenia i określa kierunek tej zależności. W porównaniu do analizy w grupach jest to metoda bardziej zaawansowana, pozwalająca włączyć do analizy jednocześnie większą liczbę zmiennych, zarówno ilościowych, jak i jakościowych. Warto zaznaczyć, że metaregresja nie powinna być wykonywana jedynie ze względu na wyniki metaanalizy sugerujące, że powiązanie może istnieć, lub ze względu na dostępność danych w uwzględnionych badaniach. Idealnie byłoby, gdyby możliwe źródła zmienności zostały zidentyfikowane przed połączeniem wyników w metaanalizie, co jest niewątpliwie utrudnione ze względu na obserwacyjny charakter metaanalizy. Co więcej, powinien istnieć przekonujący mechanizm biologiczny lub farmakologiczny, pozwalający uzasadnić 60

12 ` wyniki metaregresji. Powiązań odkrytych w metaregresji nie uważa się za dowód istnienia związku przyczynowo-skutkowego. Nawet dla zmiennych definiowanych a priori uzyskiwane w metaregresji wyniki traktuje się bardziej jako hipotezy czy sugestie co do możliwych rzeczywistych zależności. Berkey i wsp. [2] przypuszczali, że szczepionka może mieć inną skuteczność w różnych strefach klimatycznych. Swoją hipotezę opierali na założeniach, że w chłodniejszym klimacie skłonność do wytwarzania naturalnej odporności na gruźlicę jest słabsza, wyższe temperatury mogą osłabiać działanie BCG, a bezpośrednie działanie promieni słonecznych zabija część bakterii niezbędnych do prawidłowego działania szczepionki. Z braku lepszych predyktorów (np. danych o warunkach przechowywania szczepionki w każdym z badań), autorzy oparli się na odległości od równika, która miała być surogatem warunków klimatycznych. Odkryto, że spośród siedmiu uwzględnionych w analizie zmiennych, odległość miejsca badania od równika i ocena jakości badania charakteryzują się najsilniejszym związkiem ze skutecznością BCG. Ze względu na charakter post hoc tej analizy uzyskane wyniki nie są definitywne, mogą natomiast sugerować kierunek dodatkowych badań. W metaregresji, podobnie jak w metaanalizie, istnieją dwa powszechnie stosowane modele statystyczne. Model z efektem stałym zakłada jeden wspólny efekt dla każdego zestawu wartości predyktorów, a różnice między obserwowanymi wynikami tłumaczy błędem losowym. Alternatywnie: model z efektem zmiennym zakłada, że efekt leczenia nie jest stały w badaniach o jednakowych wartościach zmiennych objaśniających. Prognoza metaregresji wskazuje wtedy położenie wartości oczekiwanej rozkładu mierzonego efektu przy określonym zestawie wartości predyktorów. 61

13 Ponieważ mierzony efekt wyrażono w postaci współczynnika ryzyka RR, przed utworzeniem modelu program logarytmuje wartości RR, podobnie jak w przypadku metaanalizy. Uzyskana w ten sposób zmienna log RR, gdzie log oznacza logarytm naturalny, będzie zmienną zależną w metaregresji. Wyniki metaregresji dla modelu z efektem zmiennym przedstawiono poniżej. Dla każdego uwzględnionego predyktora testowana jest istotność współczynnika regresji. Współczynnik regresji dla zmiennej Szerokość wynosi -0,0292 i jest istotnie różny od zera, o czym mówi wartość prawdopodobieństwa testowego p = 0,00001 dla testu Z opartego na rozkładzie normalnym. Do oceny jednoczesnego wpływu wielu zmiennych objaśniających wykorzystuje się test oparty na statystyce Q. W naszym przykładzie uwzględniliśmy tylko jedną zmienną, dlatego zarówno test Q, jak i test Z prowadzą do tych samych wyników. Wyniki sugerują powiązanie szerokości geograficznej ze skutecznością szczepionki BCG. Większa skuteczność szczepionki występowała w badaniach prowadzonych dalej od równika. Zależność między log RR a zmienną Szerokość możemy zapisać w postaci: logrr = 0,2595 0,0292 Szerokość. Prezentując wyniki metaregresji staramy się pokazać zależność między rozważaną zmienną a wyznaczonym efektem. W przeciwieństwie do wykresów leśnych, wykresy tworzone w metaregresji nie przedstawiają przedziałów ufności dla poszczególnych badań, ponieważ kierują one uwagę na badania o mniejszej precyzji. Na wykresie każdy punkt wskazuje parę (Szerokość, log RR) dla danego badania. Pole znacznika jest proporcjonalne do wagi badania w metaregresji. Ponieważ analiza oparta jest na modelu z efektem zmiennym, wagi uwzględniają zmienność wewnątrz badań powiększoną o wariancję pomiędzy badaniami T 2. Pozioma linia oznacza poziom odniesienia równy 0. Na wykresie zaznaczono również przebieg dopasowania liniowego. W przypadku badań przeprowadzanych bliżej równika oczekiwana wartość efektu jest bliższa zeru, co odpowiada współczynnikowi ryzyka RR = 1,00, oznaczającemu brak skuteczności szczepienia. Z kolei dla największych rozpatrywanych tu szerokości oczekiwana wartość log RR wynosi około -1,50, co daje RR około 0,20 i 80% zmniejszenie ryzyka gruźlicy. Badając część zmienności niewyjaśnionej przez model opieramy się na odpowiedniku współczynnika determinacji R 2 dla zwykłej regresji. W modelu z efektem zmiennym zakładamy, że łączna wariancja pochodzi ze zmienności wewnątrz badań i zmienności pomiędzy badaniami. Predyktory określane na poziomie badania wyjaśniają jedynie część zmienności między badaniami. Z tego względu odpowiednik współczynnika determinacji 62

14 ` w metaregresji bazuje jedynie na wartościach T 2. Wariancja wartości niewyjaśniona w modelu wynosi 0,063. Badając niejednorodność badań, oszacowaliśmy wariancję rzeczywistych efektów T 2 = 0,309. Stanowi ona 92% obserwowanej zmienności (I 2 = 92,12). Obliczony w metaregresji współczynnik determinacji R 2 wynosi 0,7950, co oznacza, że spośród 92% obserwowanej zmienności model wyjaśnił około 80%. Wśród pozostałych czynników rozważanych jako zmienne objaśniające uwzględniono m.in. sposób przydzielenia pacjentów do grup oraz średni wiek szczepionych. Żadna z nich nie poprawiła jakości modelu. Metaregresja jest często używana do badania relacji między efektami leczenia a zmiennymi zawierającymi dane zagregowane, jak np. średni wiek w badaniu. Dane zagregowane mogą być użyteczne do oceny zmienności w ramach czynników na poziomie badania. Do interpretacji takich analiz należy jednak podchodzić z dużą ostrożnością, ponieważ średni wiek wewnątrz badania nie oddaje prawdziwego wieku poszczególnych pacjentów. Uzyskany w ten sposób wynik może być obarczony tzw. błędem agregacji (błędem ekologicznym). Podsumowanie Wyniki metaanalizy wykonanej przez Colditza i wsp. [4] i metaregresji przeprowadzonej przez Berkeya i wsp. [2] rzuciły nowe światło na ocenę skuteczności szczepienia BCG w profilaktyce gruźlicy. Analiza nie skupiła się wyłącznie na uzyskanym efekcie łącznym. Obserwując stosunkowo dużą wariancję wyników badań, wykorzystano narzędzia pozwalające ocenić tę zmienność i podjąć próbę jej wyjaśnienia. W przedstawionych powyżej rozdziałach zobaczyliśmy m.in. przykłady wykonania metaanalizy, analizy w grupach i metaregresji w module Metaanaliza programu STATISTICA Zestaw Medyczny. 63

15 Literatura 1. Baker W.L., White C.M., Cappelleri J.C. i wsp. (2009), Understanding heterogeneity in meta-analysis: the role of meta-regression, The International Journal of Clinical Practice, 63, 10, Berkey C.S., Hoaglin D.C., Mosteller F., Colditz G.A. (1995), A random-effects regression model for meta-analysis. Statistics in Medicine, 14, Borenstein M., Hedges L.V., Higgins J.P.T., Rothstein H.R. (2009), Introduction to Meta-Analysis, John Wiley and Sons Ltd. 4. Colditz G.A., Brewer T.F., Berkey C.S. i wsp. (1994), Efficacy of BCG vaccine in the prevention of tuberculosis. Meta-analysis of the published literature. Journal of the American Medical Association, 271, Gajewski P., Jaeshke R., Brożek J. (2008), Podstawy EBM czyli medycyny opartej na danych naukowych dla lekarzy i studentów, Medycyna Praktyczna, Kraków. 6. Hartung J., Knapp G., Sinha B.K. (2008), Statistical Meta-Analysis with Applications, John Wiley and Sons Inc. 64

Michał Kusy, StatSoft Polska Sp. z o.o.

Michał Kusy, StatSoft Polska Sp. z o.o. ILOŚCIOWA SYNTEZA WYNIKÓW BADAŃ PIERWOTNYCH - METAANALIZA W STATISTICA ZESTAWIE MEDYCZNYM Michał Kusy, StatSoft Polska Sp. z o.o. Wprowadzenie Metaanaliza, czyli ilościowa synteza wyników pochodzących

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

Zadania ze statystyki cz.8. Zadanie 1.

Zadania ze statystyki cz.8. Zadanie 1. Zadania ze statystyki cz.8. Zadanie 1. Wykonano pewien eksperyment skuteczności działania pewnej reklamy na zmianę postawy. Wylosowano 10 osobową próbę studentów, których poproszono o ocenę pewnego produktu,

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Testowanie hipotez statystycznych

Testowanie hipotez statystycznych Agenda Instytut Matematyki Politechniki Łódzkiej 2 stycznia 2012 Agenda Agenda 1 Wprowadzenie Agenda 2 Hipoteza oraz błędy I i II rodzaju Hipoteza alternatywna Statystyka testowa Zbiór krytyczny Poziom

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:

( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie: ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość

Bardziej szczegółowo

STATYSTYKA MATEMATYCZNA

STATYSTYKA MATEMATYCZNA STATYSTYKA MATEMATYCZNA 1. Wykład wstępny. Teoria prawdopodobieństwa i elementy kombinatoryki 2. Zmienne losowe i ich rozkłady 3. Populacje i próby danych, estymacja parametrów 4. Testowanie hipotez 5.

Bardziej szczegółowo

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych

Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012

Bardziej szczegółowo

KORELACJE I REGRESJA LINIOWA

KORELACJE I REGRESJA LINIOWA KORELACJE I REGRESJA LINIOWA Korelacje i regresja liniowa Analiza korelacji: Badanie, czy pomiędzy dwoma zmiennymi istnieje zależność Obie analizy się wzajemnie przeplatają Analiza regresji: Opisanie modelem

Bardziej szczegółowo

Rozdział 8. Regresja. Definiowanie modelu

Rozdział 8. Regresja. Definiowanie modelu Rozdział 8 Regresja Definiowanie modelu Analizę korelacji można traktować jako wstęp do analizy regresji. Jeżeli wykresy rozrzutu oraz wartości współczynników korelacji wskazują na istniejąca współzmienność

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012 ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.

Bardziej szczegółowo

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego

Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy

Bardziej szczegółowo

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9

X Y 4,0 3,3 8,0 6,8 12,0 11,0 16,0 15,2 20,0 18,9 Zadanie W celu sprawdzenia, czy pipeta jest obarczona błędem systematycznym stałym lub zmiennym wykonano szereg pomiarów przy różnych ustawieniach pipety. Wyznacz równanie regresji liniowej, które pozwoli

Bardziej szczegółowo

Regresja logistyczna (LOGISTIC)

Regresja logistyczna (LOGISTIC) Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim

Bardziej szczegółowo

Testowanie hipotez statystycznych. Wnioskowanie statystyczne

Testowanie hipotez statystycznych. Wnioskowanie statystyczne Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy

Bardziej szczegółowo

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji

REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji

Bardziej szczegółowo

Statystyka i Analiza Danych

Statystyka i Analiza Danych Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania analizy wariancji w opracowywaniu wyników badań empirycznych Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki -

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji.

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. Ćwiczenie: Wybrane zagadnienia z korelacji i regresji. W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00±0,20)

Bardziej szczegółowo

Analizy wariancji ANOVA (analysis of variance)

Analizy wariancji ANOVA (analysis of variance) ANOVA Analizy wariancji ANOVA (analysis of variance) jest to metoda równoczesnego badania istotności różnic między wieloma średnimi z prób pochodzących z wielu populacji (grup). Model jednoczynnikowy analiza

Bardziej szczegółowo

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9

Stanisław Cichocki. Natalia Nehrebecka. Wykład 9 Stanisław Cichocki Natalia Nehrebecka Wykład 9 1 1. Dodatkowe założenie KMRL 2. Testowanie hipotez prostych Rozkład estymatora b Testowanie hipotez prostych przy użyciu statystyki t 3. Przedziały ufności

Bardziej szczegółowo

MODELE LINIOWE. Dr Wioleta Drobik

MODELE LINIOWE. Dr Wioleta Drobik MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą

Bardziej szczegółowo

Statystyka matematyczna dla leśników

Statystyka matematyczna dla leśników Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje

Bardziej szczegółowo

Wykład 9 Wnioskowanie o średnich

Wykład 9 Wnioskowanie o średnich Wykład 9 Wnioskowanie o średnich Rozkład t (Studenta) Wnioskowanie dla jednej populacji: Test i przedziały ufności dla jednej próby Test i przedziały ufności dla par Porównanie dwóch populacji: Test i

Bardziej szczegółowo

Pobieranie prób i rozkład z próby

Pobieranie prób i rozkład z próby Pobieranie prób i rozkład z próby Marcin Zajenkowski Marcin Zajenkowski () Pobieranie prób i rozkład z próby 1 / 15 Populacja i próba Populacja dowolnie określony zespół przedmiotów, obserwacji, osób itp.

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres

Bardziej szczegółowo

Weryfikacja hipotez statystycznych

Weryfikacja hipotez statystycznych Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Wnioskowanie statystyczne dla zmiennych numerycznych Porównywanie dwóch średnich Boot-strapping Analiza

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x

ZJAZD 4. gdzie E(x) jest wartością oczekiwaną x ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych

Bardziej szczegółowo

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15

VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15 VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Regresja linearyzowalna

Regresja linearyzowalna 1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:

Bardziej szczegółowo

Analiza wariancji - ANOVA

Analiza wariancji - ANOVA Analiza wariancji - ANOVA Analiza wariancji jest metodą pozwalającą na podział zmienności zaobserwowanej wśród wyników eksperymentalnych na oddzielne części. Każdą z tych części możemy przypisać oddzielnemu

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

Metodologia badań psychologicznych. Wykład 12. Korelacje

Metodologia badań psychologicznych. Wykład 12. Korelacje Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 12. Korelacje Korelacja Korelacja występuje wtedy gdy dwie różne miary dotyczące tych samych osób, zdarzeń lub obiektów

Bardziej szczegółowo

Przykład 1. (A. Łomnicki)

Przykład 1. (A. Łomnicki) Plan wykładu: 1. Wariancje wewnątrz grup i między grupami do czego prowadzi ich ocena 2. Rozkład F 3. Analiza wariancji jako metoda badań założenia, etapy postępowania 4. Dwie klasyfikacje a dwa modele

Bardziej szczegółowo

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1

W statystyce stopień zależności między cechami można wyrazić wg następującej skali: n 1 Temat: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Guillforda Przedział Zależność Współczynnik [0,00 0,20) Słaba

Bardziej szczegółowo

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).

Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y). Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH

RÓWNOWAŻNOŚĆ METOD BADAWCZYCH RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych

Bardziej szczegółowo

3. Modele tendencji czasowej w prognozowaniu

3. Modele tendencji czasowej w prognozowaniu II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y

Bardziej szczegółowo

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013 ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.

Bardziej szczegółowo

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ

Współczynnik korelacji. Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Współczynnik korelacji Współczynnik korelacji jest miernikiem zależności między dwiema cechami Oznaczenie: ϱ Własności współczynnika korelacji 1. Współczynnik korelacji jest liczbą niemianowaną 2. ϱ 1,

Bardziej szczegółowo

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne.

W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. W2. Zmienne losowe i ich rozkłady. Wnioskowanie statystyczne. dr hab. Jerzy Nakielski Katedra Biofizyki i Morfogenezy Roślin Plan wykładu: 1. Etapy wnioskowania statystycznego 2. Hipotezy statystyczne,

Bardziej szczegółowo

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE

STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

Regresja i Korelacja

Regresja i Korelacja Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane

Bardziej szczegółowo

Własności statystyczne regresji liniowej. Wykład 4

Własności statystyczne regresji liniowej. Wykład 4 Własności statystyczne regresji liniowej Wykład 4 Plan Własności zmiennych losowych Normalna regresja liniowa Własności regresji liniowej Literatura B. Hansen (2017+) Econometrics, Rozdział 5 Własności

Bardziej szczegółowo

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25

Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane

Bardziej szczegółowo

Stosowana Analiza Regresji

Stosowana Analiza Regresji prostej Stosowana Wykład I 5 Października 2011 1 / 29 prostej Przykład Dane trees - wyniki pomiarów objętości (Volume), średnicy (Girth) i wysokości (Height) pni drzew. Interesuje nas zależność (o ile

Bardziej szczegółowo

Jak sprawdzić normalność rozkładu w teście dla prób zależnych?

Jak sprawdzić normalność rozkładu w teście dla prób zależnych? Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu

Bardziej szczegółowo

Grupowanie materiału statystycznego

Grupowanie materiału statystycznego Grupowanie materiału statystycznego Materiał liczbowy, otrzymany w wyniku przeprowadzonej obserwacji statystycznej lub pomiaru, należy odpowiednio usystematyzować i pogrupować. Doskonale nadają się do

Bardziej szczegółowo

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji

Ćwiczenie: Wybrane zagadnienia z korelacji i regresji Ćwiczenie: Wybrane zagadnienia z korelacji i regresji W statystyce stopień zależności między cechami można wyrazić wg następującej skali: Skala Stanisza r xy = 0 zmienne nie są skorelowane 0 < r xy 0,1

Bardziej szczegółowo

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:

Bardziej szczegółowo

7.4 Automatyczne stawianie prognoz

7.4 Automatyczne stawianie prognoz szeregów czasowych za pomocą pakietu SPSS Następnie korzystamy z menu DANE WYBIERZ OBSERWACJE i wybieramy opcję WSZYSTKIE OBSERWACJE (wówczas wszystkie obserwacje są aktywne). Wreszcie wybieramy z menu

Bardziej szczegółowo

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu

Bardziej szczegółowo

Oszacowanie i rozkład t

Oszacowanie i rozkład t Oszacowanie i rozkład t Marcin Zajenkowski Marcin Zajenkowski () Oszacowanie i rozkład t 1 / 31 Oszacowanie 1 Na podstawie danych z próby szacuje się wiele wartości w populacji, np.: jakie jest poparcie

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY

MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY WYKORZYSTANIU METOD STATYSTYCZNYCH mgr Małgorzata Pelczar 6 Wprowadzenie Reforma służby zdrowia uwypukliła problem optymalnego ustalania kosztów usług zdrowotnych.

Bardziej szczegółowo

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r

Statystyka matematyczna Testowanie hipotez i estymacja parametrów. Wrocław, r Statystyka matematyczna Testowanie hipotez i estymacja parametrów Wrocław, 18.03.2016r Plan wykładu: 1. Testowanie hipotez 2. Etapy testowania hipotez 3. Błędy 4. Testowanie wielokrotne 5. Estymacja parametrów

Bardziej szczegółowo

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński

Wstęp do teorii niepewności pomiaru. Danuta J. Michczyńska Adam Michczyński Wstęp do teorii niepewności pomiaru Danuta J. Michczyńska Adam Michczyński Podstawowe informacje: Strona Politechniki Śląskiej: www.polsl.pl Instytut Fizyki / strona własna Instytutu / Dydaktyka / I Pracownia

Bardziej szczegółowo

statystyka badania epidemiologiczne

statystyka badania epidemiologiczne statystyka badania epidemiologiczne Epidemiologia Epi = wśród Demos = lud Logos = nauka Epidemiologia to nauka zajmująca się badaniem rozprzestrzenienia i uwarunkowań chorób u ludzi, wykorzystująca tą

Bardziej szczegółowo

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

Szkice rozwiązań z R:

Szkice rozwiązań z R: Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami

Bardziej szczegółowo

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki

Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Tablica Wzorów Rachunek Prawdopodobieństwa i Statystyki Spis treści I. Wzory ogólne... 2 1. Średnia arytmetyczna:... 2 2. Rozstęp:... 2 3. Kwantyle:... 2 4. Wariancja:... 2 5. Odchylenie standardowe:...

Bardziej szczegółowo

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31

Statystyka. Wykład 8. Magdalena Alama-Bućko. 10 kwietnia Magdalena Alama-Bućko Statystyka 10 kwietnia / 31 Statystyka Wykład 8 Magdalena Alama-Bućko 10 kwietnia 2017 Magdalena Alama-Bućko Statystyka 10 kwietnia 2017 1 / 31 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia

Bardziej szczegółowo

ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH

ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH - Adrian Gorgosz - Paulina Tupalska ANALIZA WIELOPOZIOMOWA (AW) Multilevel Analysis Obecna od lat 80. Popularna i coraz częściej stosowana

Bardziej szczegółowo

RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013

RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013 RAPORT WSKAŹNIK EDUKACYJNEJ WARTOŚCI DODANEJ PO EGZAMINIE GIMNAZJALNYM W ROKU SZKOLNYM 2012/2013 ZESPÓŁ SZKÓŁ NR 14 W BYDGOSZCZY GIMNAZJUM NR 37 INTEGRACYJNE Opracowanie A. Tarczyńska- Pajor na podstawie

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

METODY STATYSTYCZNE W BIOLOGII

METODY STATYSTYCZNE W BIOLOGII METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne

Bardziej szczegółowo

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?

P: Czy studiujący i niestudiujący preferują inne sklepy internetowe? 2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali

Bardziej szczegółowo

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających,

parametrów strukturalnych modelu = Y zmienna objaśniana, X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, 诲 瞴瞶 瞶 ƭ0 ƭ 瞰 parametrów strukturalnych modelu Y zmienna objaśniana, = + + + + + X 1,X 2,,X k zmienne objaśniające, k zmiennych objaśniających, α 0, α 1, α 2,,α k parametry strukturalne modelu, k+1 parametrów

Bardziej szczegółowo

Wykład 2: Tworzenie danych

Wykład 2: Tworzenie danych Wykład 2: Tworzenie danych Plan: Statystyka opisowa a wnioskowanie statystyczne Badania obserwacyjne a eksperyment Planowanie eksperymentu, randomizacja Próbkowanie z populacji Rozkłady próbkowe Wstępna/opisowa

Bardziej szczegółowo

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp

OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA. z wykorzystaniem programu obliczeniowego Q maxp tel.: +48 662 635 712 Liczba stron: 15 Data: 20.07.2010r OBLICZENIE PRZEPŁYWÓW MAKSYMALNYCH ROCZNYCH O OKREŚLONYM PRAWDOPODOBIEŃSTWIE PRZEWYŻSZENIA z wykorzystaniem programu obliczeniowego Q maxp DŁUGIE

Bardziej szczegółowo

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość

Idea. θ = θ 0, Hipoteza statystyczna Obszary krytyczne Błąd pierwszego i drugiego rodzaju p-wartość Idea Niech θ oznacza parametr modelu statystycznego. Dotychczasowe rozważania dotyczyły metod estymacji tego parametru. Teraz zamiast szacować nieznaną wartość parametru będziemy weryfikowali hipotezę

Bardziej szczegółowo

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1. tel. 44 683 1 55 tel. kom. 64 566 811 e-mail: biuro@wszechwiedza.pl Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: gdzie: y t X t y t = 1 X 1

Bardziej szczegółowo

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie...

Spis treści. Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów. Wstęp Wprowadzenie... Księgarnia PWN: Bruce M. King, Edward W. Minium - Statystyka dla psychologów i pedagogów Wstęp... 13 1. Wprowadzenie... 19 1.1. Statystyka opisowa.................................. 21 1.2. Wnioskowanie

Bardziej szczegółowo

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych.

Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Statystyka i opracowanie danych- W 8 Wnioskowanie statystyczne. Testy statystyczne. Weryfikacja hipotez statystycznych. Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Hipotezy i Testy statystyczne Każde

Bardziej szczegółowo

5. WNIOSKOWANIE PSYCHOMETRYCZNE

5. WNIOSKOWANIE PSYCHOMETRYCZNE 5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania

Bardziej szczegółowo

Badania obserwacyjne 1

Badania obserwacyjne 1 Badania obserwacyjne 1 Chorobowość Chorobowość (ang. prevalence rate) liczba chorych w danej chwili na konkretną chorobę w określonej grupie mieszkańców (np. na 100 tys. mieszkańców). Współczynnik ten

Bardziej szczegółowo

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności.

TEST STATYSTYCZNY. Jeżeli hipotezę zerową odrzucimy na danym poziomie istotności, to odrzucimy ją na każdym większym poziomie istotności. TEST STATYSTYCZNY Testem statystycznym nazywamy regułę postępowania rozstrzygająca, przy jakich wynikach z próby hipotezę sprawdzaną H 0 należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

Bardziej szczegółowo

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

Regresja wielokrotna. PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Regresja wielokrotna Model dla zależności liniowej: Y=a+b 1 X 1 +b 2 X 2 +...+b n X n Cząstkowe współczynniki regresji wielokrotnej: b 1,..., b n Zmienne niezależne (przyczynowe): X 1,..., X n Zmienna

Bardziej szczegółowo

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.

Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie. STATISTICA INSTRUKCJA - 1 I. Wprowadzanie danych Podstawowe / Nowy / Arkusz Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą

Bardziej szczegółowo

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI

LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych

Bardziej szczegółowo

Analiza regresji - weryfikacja założeń

Analiza regresji - weryfikacja założeń Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.

Bardziej szczegółowo

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )

Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( ) Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 STATYSTYKA I DOŚWIADCZALNICTWO Wykład 6 Metody sprawdzania założeń w analizie wariancji: -Sprawdzanie równości (jednorodności) wariancji testy: - Cochrana - Hartleya - Bartletta -Sprawdzanie zgodności

Bardziej szczegółowo

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA

WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA Powtórka Powtórki Kowiariancja cov xy lub c xy - kierunek zależności Współczynnik korelacji liniowej Pearsona r siła liniowej zależności Istotność

Bardziej szczegółowo

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu

Wykład Centralne twierdzenie graniczne. Statystyka matematyczna: Estymacja parametrów rozkładu Wykład 11-12 Centralne twierdzenie graniczne Statystyka matematyczna: Estymacja parametrów rozkładu Centralne twierdzenie graniczne (CTG) (Central Limit Theorem - CLT) Centralne twierdzenie graniczne (Lindenberga-Levy'ego)

Bardziej szczegółowo