Ocena zapisów testów porównań strefowych UTAH przy użyciu Empirycznego Systemu Oceny (ESS)
|
|
- Alicja Czajkowska
- 7 lat temu
- Przeglądów:
Transkrypt
1 kom. Dominika Słapczyńska ekspert w Zakładzie Badań Dokumentów i Technik Audiowizualnych CLKP Ocena zapisów testów porównań strefowych UTAH przy użyciu Empirycznego Systemu Oceny (ESS) Wstęp Badania poligraficzne nie należą do nowych metod wykorzystywanych w kryminalistyce, choć problematyka ich wiarygodności nadal stanowi pole do dyskusji. W ostatnim czasie w literaturze fachowej niejednokrotnie poruszano problem ich trafności 1. Kwestia ta jest niezwykłe istotna w praktyce sądowej, gdy opinia z badania poligraficznego wliczana jest w poczet dowodów obciążających. W tej sytuacji rodzi się pytanie o poziom dokładności uzyskanych wyników ekspertyzy. Ostatnie pięciolecie przyniosło dynamiczny rozwój badań poligraficznych, zapewniając jej specjalistom narzędzia w postaci wykazu zwalidowanych technik badawczych, sprawdzonych metod analizy danych psychofizjologicznych oraz wspomagających ten proces algorytmów komputerowych. Wyniki badań naukowych przeprowadzonych nad analizą i interpretacją danych psychofizjologicznych zarejestrowanych w trakcie badań poligraficznych pozwalają obecnie oszacować poziom prawdopodobieństwa błędu konkretnego rozstrzygnięcia. Biegły nie musi już unikać na rozprawie sądowej odpowiedzi o procentowe określenie dokładności badań poligraficznych, gdyż prowadzenie czynności badawczych zgodnie z wytycznymi wybranej techniki pozwala na podstawie danych normatywnych podać w przybliżeniu poziom błędu, którym obarczony jest wynik ekspertyzy. Dobór właściwej techniki lub technik badawczych to jeden z podstawowych czynników decydujących o metodologicznej poprawności badania i późniejszych analiz. Z poszczególnymi technikami uzyskiwania danych psychofizjologicznych wiążą się określone procedury ich analizy i interpretacji. Niniejszy artykuł stanowi propozycję sposobu analizy i oceny danych psychofizjologicznych uzyskanych w kryminalistycznych badaniach poligraficznych opartych na teście porównań strefowych Utah, którego wartość diagnostyczna sięga powyżej 90% bez wyników rozstrzygniętych, co stanowi wymóg dla metod dowodowych w procedurze amerykańskiej (ASTM 2 ). Zapisy reakcji, zgodnie z metodologią techniki CQT, pierwotnie oceniane są jakościowo, a następnie przy użyciu zaawansowanych metod numerycznych. Wśród tych ostatnich znajduje się Empiryczny System Oceny (Empirical Scoring System ESS), którego zastosowanie pozwala wyznaczyć poziom wiarygodności konkretnego badania. Technika pytań porównawczych Badania poligraficzne opierają się na dwóch grupach testów. Pierwsza z nich obejmuje testy weryfikacyjne, a wśród nich testy pytań porównawczych (Comparison Question Test CQT). Druga grupa to grupa testów rozpoznawczych, do której należy test informacji ukrytej (Concealed Information Test CIT). Testy pytań porównawczych są powszechnie stosowane zarówno w badaniach diagnostycznych, jak i w procedurze skriningowej 3. Koncepcja testów CQT zakłada, iż badany niemający związku z danym przestępstwem zareaguje większym pobudzeniem psychofizjologicznym na pytania kontrolne, które dotyczą czynów o charakterze przestępczym lub nagannym moralnie, innych niż ten będący przedmiotem postępowania. Pytania krytyczne natomiast spowodują pobudzenie emocjonalne i fizjologiczne osoby, która swój związek z daną sprawą będzie próbowała zataić, czy to z obawy o przykre dla niej konsekwencje, czy to z innych znanych jej powodów, np. z chęci pomocy bliskiej osobie. Test Utah Wśród testów CQT tylko nieliczne spełniają kryterium dopuszczalności dowodowej, jakim jest wartość diagnostyczna powyżej 90%. Wyniki metaanalizy 4 przeprowadzonej przez R. Nelsona i współpracowników wskazują, iż trafność testu UTAH plasuje się na poziomie 93% (Utah PLT) oraz 91% (Utah DLT) z wyłączeniem wyników nierozstrzygniętych. 22 PROBLEMY KRYMINALISTYKI 282(4) 2013
2 Test Utah można przeprowadzać w dwóch podstawo wych wersjach: z trzema lub czterema pytaniami krytycznymi. W pierwszym przypadku sekwencja pytań testowych będzie przedstawiała się w następujący sposób: Przykład 1. Sekwencja pytań w teście Utah PLT w wersji multi-facet. 1. SY Czy jest Pan przekonany, że zadam tylko te pytania, które dzisiaj omówiliśmy? 2. SR Czy zamierza Pan odpowiadać zgodnie z prawdą na pytania o śmierć J. Kowalskiego? 3. N1 Czy obecnie jest maj? 4. C1 Czy przed 2012 rokiem użył Pan siły fizycznej wobec kogoś? 5. R1 Czy zadał Pan rany J. Kowalskiemu w dniu r.? 6. N2 Czy dzisiaj jest poniedziałek? 7. C2 Czy przed 2012 r. był Pan agresywny wobec bliskiej osoby? 8. R2 Czy był Pan w domu J. Kowalskiego w dniu r.? 9. N3 Czy jest obecnie 2013 r.? 10. C3 Czy przed 2012 r. użył Pan przemocy wobec kogoś? 11. R3 Czy Pan wie kto pozbawił życia J. Kowalskiego w dniu r? Pytania krytyczne testu Utah mogą dotyczyć jednej kwestii związanej z zachowaniem sprawcy zdarzenia, a same testy określa się wtedy jako jednokwestyjne (single-issue test). Pytania krytyczne w teście jednokwestyjnym w sprawie napadu na sklep mogą mieć następującą postać: R5 Czy dokonał Pan napadu na sklep przy ul. Szanajcy w Warszawie w dniu 4 maja br.? R8 Czy dokonał Pan napadu na sklep monopolowy na ul. Szanajcy w zeszłym miesiącu? R11 Czy brał Pan udział w napadzie na sklep monopolowy na Pradze w maju br.? Pytania krytyczne testu wielokwestyjnego (multi-facet test) odnoszą się natomiast do różnych istotnych okoliczności (aspektów) zachowania sprawcy danego zdarzenia. W badaniu mogą one mieć postać pytań krytycznych przytoczonych w powyższym przykładzie (nr 1). Z praktyki wynika, że rozpoczęcie czynności badawczych od przeprowadzenia testu próbnego i wytłumaczenie na jego podstawie osobie badanej istoty badania podnosi skuteczność ekspertyzy 5. Zgodnie z wytycznymi techniki Utah 6 w trakcie badań test prezentuje się co najmniej trzykrotnie, przy czym pytania krytyczne rotują względem pytań kontrolnych, zmieniając miejsce w prezentowanej sekwencji. Ponadto zaleca się prowadzenie stymulacji międzytestowej (np. ponowne omówienie z badanym pytań krytycznych i porównawczych) w celu przeciwdziałania procesowi habituacji badanego 7. Analiza uzyskanych poligramów odbywa się dwuetapowo. Po ocenie jakościowej, która pozwala zweryfikować jakość uzyskanych zapisów, poszczególne zmiany na krzywych analizowane są zgodnie z regułami wybranej metody numerycznej. W przypadku testu Utah można wykorzystać system siedmiostopniowej oceny o tej samej nazwie co format testu (system numerycznej oceny Utah) lub wybrać prostszy, ale równie skuteczny, Empiryczny System Oceny. Analiza numeryczna zapisów uzyskanych przy użyciu techniki Utah zakłada porównanie natężenia zmian zarejestrowanych na pytania krytyczne względem poprzedzających je reakcji na pytania kontrolne. Analiza danych z wykorzystaniem Empirycznego Systemu Oceny (Empirical Scoring System ESS) Skuteczność ESS została potwierdzona przez jej autorów w drodze kilku niezależnych badań eksperymentalnych 8. Zgodnie z danymi jej średnia trafność wynosi ok. 90%, a średni poziom testów nierozstrzygniętych plasuje się na poziomie 10%. Analizy mające na celu zestawienie skuteczności prezentowanej metody oceny numerycznej z innymi systemami pokazują, iż trafność ESS oraz metody siedmiostopniowej jest porównywalna 9. Podkreślić należy, że ESS nie zalicza się do metod opartych na nowych ustaleniach w obszarze badań psychofizjologicznych 10. Jego twórcy korzystali z rozwiązań i ustaleń naukowych poczynionych już przez C. Backstera (1963) w zakresie przekształcania danych liczbowych czy Kirchera i Raskina (1988) odnośnie do cech diagnostycznych, które stanowią tu podstawowe kryteria analizy zapisów 11. ESS, jako metoda analizy i oceny reakcji fizjologicznych w testach pytań porównawczych, oparta jest na trzech głównych wytycznych. 1. Analizy poligramów należy dokonać na podstawie 3 cech Kirchera 12, które obejmują długość linii oddechu (stłumienie oddechu, wzrost częstotliwości oddechu, tymczasowe podniesienie linii podstawowej krzywej oddechu), wielkość amplitudy krzywej elektrodermalnej, wielkość amplitudy linii podstawowej krzywej naczyniowo-sercowej. Blok oddechowy uznawany jest za diagnostyczny tylko wówczas, gdy został zarejestrowany po prezentacji pytania krytycznego. Reakcja w tym kanale musi obejmować co najmniej trzy pełne cykle oddechowe. 2. Identyfikacja wyżej wymienionych cech diagnostycznych na poszczególnych krzywych oraz porównanie ich wielkości na pytania krytyczne i kontrolne pozwala przypisać im wartości numeryczne w skali trzystopniowej. W kanale oddechowym oraz naczyniowo-sercowym natężenie zmian oceniane jest poprzez przyznanie im wartości -1, 0, +1, natomiast reakcjom elektrodermalnym -2, 0, ESS wykorzystuje trzy zasady analizy danych fizjologicznych: PROBLEMY KRYMINALISTYKI 282(4)
3 zasada 1: porównując reakcje na pytania porównawcze i krytyczne, wartość punktową należy przypisać zmianie o większym natężeniu, którą można zaobserwować wzrokowo. Nie ma natomiast znaczenia, jak duża jest różnica w natężeniu porównywanych reakcji im reakcja większa, tym lepiej. zasada 2: identyfikując poszczególne cechy, należy zwrócić uwagę na moment ich pojawienia się na krzywych; ocenie należy poddać tylko te reakcje, które występują w tzw. oknie oceny reakcji 13 ; analizie i ocenie nie podlegają te reakcje, które pojawiły się na krzywych przed prezentacją pytania lub kilka sekund po udzieleniu odpowiedzi przez badanego zasada 3: nie należy oceniać metodą numeryczną niestabilnych, nieregularnych zapisów zawierających artefakty. Przy definiowaniu reakcji diagnostycznych czynnikiem kluczowym jest wspomniany już moment, w którym pojawiają się one na poszczególnych krzywych. I tak: okno oceny reakcji w kanale oddechowym (P) rozpoczyna się w chwili prezentowania pytania. W kanale naczyniowo-sercowym (CA) analizowane są zmiany, które pojawiają się od momentu prezentowania bodźca do chwili zakończenia reakcji. Reakcja elektrodermalna (EDA) powinna pojawić się pomiędzy 0,5 sekundy od chwili prezentacji pytania do 5 sekund po odpowiedzi badanego na pytanie. Porównywanie wielkości reakcji na pytania krytyczne i kontrolne w każdym z kanałów prowadzi się wizualnie bez konieczności precyzyjnego określenia tej różnicy. Autorzy ESS przyjęli założenie, iż większa zmiana w przebiegu rejestrowanych parametrów jest powodowana przez bodziec, który dla badanego jest bardziej znaczący pod względem czynników emocjonalnych, poznawczych oraz behawioralnych, które przyczyniły się do jego powstania. Jeśli ekspert stwierdzi większe natężenie reakcji na konkretne pytanie niż ta w porównywanym pytaniu, przyznaje jej punkt. Natomiast brak wizualnej różnicy pomiędzy porównywanymi reakcjami uprawnia do przyznania wartości 0. Wartość dodatnia (+1 dla kanału CA i P lub +2 dla EDA) jest przyznawana, jeśli reakcja na pytanie kontrolne jest większa od tej zarejestrowanej na pytanie krytyczne. Wartość ujemną (-1 dla CA i P oraz -2 dla EDA) przypisuje się reakcji, która pojawiła się po prezentacji bodźca krytycznego i jest większa w stosunku do zmiany zarejestrowanej na pytanie kontrolne. Zmianom występującym na obu krzywych oddechowych nadaje się jedną wspólną wartość liczbową. Zasady interpretacji wartości punktowych na podstawie danych normatywnych Na kolejnym etapie analizy punkty nadane poszczególnym zmianom na krzywych P, CA oraz EDA na pytania krytyczne w trzech powtórzeniach testu Utah ulegają zsumowaniu, dając w ten sposób trzy oceny cząstkowe dla każdego pytania R5, R8, R11. W przypadku testów diagnostycznych (single-issue Utah, multi-facet Utah), oceny cząstkowe sumowane są w wynik całkowity (grand total). Wynik końcowy daje podstawę do interpretacji badania i ustalenia poziomu istotności rezultatu. Metodologia CQT na podstawie uzyskanych wyników punktowych dopuszcza 3 typy wnioskowania: Deception Indicated DI (wprowadzenie w błąd), No Deception Indicated NDI (brak wprowadzenia w błąd) oraz Inconclusive INC 14 (wynik nierozstrzygnięty). Przyporządkowanie wyniku testu do jednej z powyższych kategorii odbywa się na podstawie dwóch progów punktowych, tj.: dla DI i NDI, które należy wyznaczyć w zależności od zakładanej przez eksperta czułości pomiaru. Oznacza to, że progi punktowe skorelowane są z przyjętym przez badacza poziomem tolerancji błędu (α) dla danego pomiaru. W kryminalnych testach diagnostycznych twórcy ESS rekomendują przyjęcie tolerancji błędu na poziomie α = 10% (,01) dla rozstrzygnięcia negatywnego 15 NDI oraz α = 5% (0,05) dla rozstrzygnięcia pozytywnego 16 DI. Wraz z obniżeniem poziomu tolerancji błędu (poniżej 10%) dla NDI wzrasta poziom czułości pomiaru, ale koreluje on dodatnio z podwyższeniem poziomu wyników nierozstrzygniętych. Progi punktowe w zależności od przyjętej dokładności badania w ESS wyznacza się na podstawie danych normatywnych 17. R. Nelson i współpracownicy, bazując na jednolitym, prostym systemie analizy i oceny danych oraz posługując się zaawansowanymi narzędziami statystycznymi (metoda Monte Carlo) 18, ustalili poziom prawdopodobieństwa błędu dla każdego wyniku punktowego uzyskanego zarówno w testach diagnostycznych, jak i przesiewowych. W tab. 1 zgromadzono informacje o charakterze empirycznym, które pozwalają określić optymalne progi punktowe w zależności od zakładanego przez eksperta poziomu dokładności badania. Przyjmując proponowany poziom tolerancji błędu i posługując się tab. 1, ekspert może ustalić dwa progi punktowe dla trzech rodzajów rozstrzygnięć, które wynoszą +2 dla NDI oraz -4 dla DI. Jeśli całkowita suma punktów przyznanych na podstawie reakcji na wszystkie pytania krytyczne testu jest równa lub większa od +2, wynik testu jest klasyfikowany jako brak wprowadzenia w błąd (NDI). Suma punktów równa lub mniejsza od -4 uprawnia do postawienia diagnozy wprowadzenie w błąd (DI). Wynik w przedziale od -4 do +2 uznawany jest za nierozstrzygnięty (INC). Wyznaczanie poziomu istotności p-value Na podstawie wyniku końcowego testu (grand total) ekspert może ocenić prawdopodobieństwo wystąpienia błędu (p-value) w analizowanym przez niego przypadku. 24 PROBLEMY KRYMINALISTYKI 282(4) 2013
4 Tabela 1 Tabela przedstawia rozkład prawdopodobieństwa błędu dla różnych wyników numerycznej analizy danych testowych uzyskanych przy użyciu ESS w badaniach wszystkimi formatami CQT z 3 pytaniami relewantnymi Table showing the probability of error for various results of test data analysis according to the ESS system in examinations including all CQT tests with three relevant questions Progi punktowe wynik NDI Na podstawie dystrybucji końcowych wyników dla osób klasyfikowanych jako NDI Progi punktowe wynik DI Na podstawie dystrybucji końcowych wyników dla osób klasyfikowanych jako DI Próg punktowy Wartość p Próg punktowy Wartość p -1 0, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , <0, , <0,001 Źródło: R. Nelson, M. Handler, Empirical Scoring System: NPC Quick Reference, Lafayette Instrument. Za zgodą. W naukach przyrodniczych błąd nie jest synonimem pomyłki. Poziom istotności oznacza niemożliwą do uniknięcia niepewność nierozerwalnie związaną ze specyfiką przedmiotu badania tu z reakcjami psychofizjologicznymi. W tym sensie niepewność nie oznacza pomyłek i nie sposób jej uniknąć, zachowując większą staranność. P-value jest zatem statystyczną miarą pozwalającą na zorientowanie się, na ile wiarygodne są osiągnięte wyniki. Badania naukowe w obszarze badań poligraficznych przeprowadzane są na ograniczonej liczbie osób tzw. próbie, a uogólnianie obserwowanych reakcji na całą populację jest obarczone błędem (być może dana osoba na skutek zbiegu różnych okoliczności reaguje w specyficzny sposób). P-value to właśnie statystyczna miara pozwalająca określić, na ile prawdopodobne jest, że obserwowane zjawisko jest takim właśnie artefaktem, tj. jego powodem jest zbieg okoliczności, a nie rzeczywiście istniejące zjawisko. W celu ustalenia p-value dla konkretnego wyniku badania poligraficznego uzyskany całkowity wynik punktowy badacz musi odszukać w tab. 1 i wyznaczyć odpowiadający mu poziom prawdopodobieństwa błędu. Przykład nr 2: rozstrzygnięcie NDI Pytanie krytyczne: R5 R8 R11 oceny cząstkowe: Suma (grand total): +3 (p =,067) Dla obliczonego wyniku, posługując się tab. 1, można teraz ustalić wartość p-value, a następnie dokonać jej interpretacji: Całkowity wynik testu (+3) pozwala na zakwalifikowanie badanego jako osoby niemającej związku ze zdarzeniem będącym przedmiotem postępowania, a prawdopodobieństwo popełnienia błędu w analizowanym przypadku wynosi 6,7%. Innymi słowy prawdopodobieństwo, iż osoba badana nie ma związku z danym zdarzeniem w zakresie stawianych pytań krytycznych wynosi 93,3% 19. PROBLEMY KRYMINALISTYKI 282(4)
5 Przykład nr 3: rozstrzygnięcie DI Pytanie krytyczne: R5 R8 R11 oceny cząstkowe: suma -5 (p =,032) Przyjmując analogiczną formułę z przykładu 2, można wnioskować, iż: Całkowity wynik testu (-5) pozwala na zakwalifikowanie badanego jako osoby mającej związek ze zdarzeniem będącym przedmiotem postępowania, a prawdopodobieństwo popełnienia błędu dla analizowanego przypadku wynosi 3,2%. Innymi słowy prawdopodobieństwo, iż osoba badana ma związek z danym zdarzeniem w zakresie stawianych pytań krytycznych wynosi 96,8%. Jeśli natomiast całkowita liczba punktów testu mieści się w przedziale pomiędzy -4 a +2, wynik testu klasyfikowany jest jako nierozstrzygnięty (inconclusive INC). W takiej sytuacji zastosowanie znajduje analiza dwustopniowa na podstawie tzw. reguły Sentera 20. Jeśli wynik całkowity testu nie daje podstaw do jego rozstrzygnięcia, należy zastosować analizę opartą wyłącznie na ocenach cząstkowych ustalonych dla poszczególnych pytań krytycznych. Dla testów nierozstrzygniętych autorzy ESS na drugim etapie oceny zastosowali również tzw. poprawkę Bonferroniego 21, która wprowadziła nowy poziom tolerancji błędu α = 1,7% (,017) dla DI (zamiast α = 0,5), któremu zgodnie z danymi normatywnymi można przypisać wartość -7. Opierając analizę jedynie na ocenach cząstkowych, ekspert ustala, które pytanie krytyczne uzyskało najmniejszą wartość liczbową. Jeśli p < α (,017), to wynik testu klasyfikowany jest jako DI; taka sytuacja ma miejsce, gdy którakolwiek z ocen cząstkowych jest równa lub mniejsza -7. Przykład nr 4: rozstrzygnięcie DI z zastosowaniem reguły Sentera Pytanie krytyczne: R5 R8 R11 Oceny cząstkowe (p =,008) suma -3 (p =,058) Interpretacja na podstawie danych liczbowych i normatywnych brzmi: Wynik testu oparty na ocenie cząstkowej o najniższej wartości (-9) pozwala na zakwalifikowanie badanego jako osoby mającej związek ze zdarzeniem będącym przedmiotem postępowania, a prawdopodobieństwo popełnienia błędu w analizowanym przypadku wynosi p = 2,4% 22. Innymi słowy prawdopodobieństwo, iż osoba badana ma związek z danym zdarzeniem w zakresie stawianych pytań krytycznych wynosi 97,6%. Jeśli natomiast wynik cząstkowy o najniższej wartości jest większy od -7, test pozostaje nierozstrzygnięty. Przykład nr 5: rozstrzygnięcie INC Pytanie krytyczne: R5 R8 R11 ocena cząstkowa (p =,043) suma -1 (p =,159) W tym przypadku: Test pozostaje nierozstrzygnięty. Poziom prawdopodobieństwa błędu dla tego rozstrzygnięcia wynosi p = 15,9%, co przewyższa przyjętą dla danego pomiaru tolerancję błędu α = 5%, a poziom prawdopodobieństwa błędu dla oceny cząstkowej o najniższej wartości wynosi p = 4,3%, co przewyższa poziom tolerancji błędu α = 1,7% z poprawką Bonferroniego. Pamiętać należy, iż zastosowanie reguły Sentera nigdy nie daje końcowego wyniku testu w postaci NDI. Podsumowując, jeśli wynik całkowity testu jest równy lub mniejszy niż -4 lub ocena cząstkowa jednego z pytań krytycznych w teście nierozstrzygniętym jest równa lub mniejsza niż -7, wynik końcowy badania klasyfikowany jest jako wprowadzanie w błąd (DI). Analiza testów UTAH z zastosowaniem ESS i danych normatywnych przykłady Poniżej przytoczono zapisy z dwóch spraw, w których prowadzono badania z zastosowaniem testów Utah PLT, a ich wyniki zostały potwierdzone kolejnymi ustaleniami poczynionymi przez prowadzących postępowania. Poligramy oceniono metodą ilościową ESS (w tabelach przedstawiono wartości liczbowe) na podstawie reakcji diagnostycznych wyznaczonych na poszczególnych krzywych. Uzyskane rezultaty zinterpretowano z zastosowaniem danych normatywnych, co pozwoliło na określenie prawdopodobieństwa błędu w obu przypadkach. Przypadek 1. Wynik testu NDI Numeryczna ocena ESS: Pytania krytyczne R5 R8 R11 Test1 P EDA CA Test 2 P EDA CA Test 3 P EDA CA Oceny cząstkowe Całkowity wynik testu to PROBLEMY KRYMINALISTYKI 282(4) 2013
6 W tym przypadku statystyczna interpretacja danych na podstawie zasad ESS oraz danych normatywnych może przedstawiać się w następujący sposób: Na podstawie naukowo udowodnionego modelu numerycznej analizy danych o nazwie Empiryczny System Oceny (Empirical Scoring System ESS) obliczono całkowity wynik testu, który wynosi +21, co oznacza brak związku osoby ze zdarzeniem. Przyjmując tolerancję błędu na poziomie α = 10% (0,1) dla negatywnego rozstrzygnięcia oraz związany z nim próg punktowy na poziomie +2, prawdopodobieństwo popełnienia błędu w tym przypadku wynosi poniżej p = 0,1%. Innymi słowy, prawdopodobieństwo, że osoba badana nie jest związana ze zdarzeniem w zakresie pytań krytycznych wynosi więcej niż 99,9%. PROBLEMY KRYMINALISTYKI 282(4)
7 Ryc. 1. Trzy poligramy osoby niewinnej. Reakcje o większym natężeniu na pytania kontrolne oznaczono strzałkami w kolorze czerwonym Fig. 1. Three polygrams of innocent person. High intensity reactions are marked with red arrows Przypadek 2. Wynik testu DI Numeryczna ocena ESS: Pytania krytyczne R5 R8 R11 Test 1 P EDA CA Test 2 P EDA CA Test 3 P EDA CA Oceny cząstkowe Całkowita suma -21 W powyższym przypadku statystyczna interpretacja danych na podstawie zasad ESS oraz danych normatywnych może przedstawiać się następująco: Na podstawie naukowo udowodnionego modelu numerycznej analizy danych o nazwie Empiryczny System Oceny (Empirical Scoring System ESS) obliczono całkowity wynik testu, który wynosi -21, co oznacza związek osoby ze zdarzeniem. Przyjmując tolerancję błędu na poziomie α = 5% (0,05) dla pozytywnego rozstrzygnięcia oraz związany z nim próg punktowy na poziomie -4, prawdopodobieństwo popełnienia błędu w tym przypadku wynosi mniej niż p = 0,1%. Innymi słowy, prawdopodobieństwo, że osoba badana jest związana ze zdarzeniem w zakresie pytań krytycznych wynosi więcej niż 99,9%. W ocenie zapisów biegli mogą komplementarnie stosować algorytmy komputerowe, które w dużej mierze oparte są na tych samych rozwiązaniach, co systemy ręcznego zliczania reakcji. Z piśmiennictwa wynika, że narzędzia komputerowe do analizy danych psychofizjologicznych cechuje większa dokładność niż tzw. ślepą analizę zapisów dokonywaną przez specjalistów 23. Poniżej zaprezentowano raporty wygenerowane przy użyciu komputerowego systemu analizy danych o nazwie OSS-3 24, który wykorzystano jako narzędzie służące potwierdzeniu i obiektywizacji uzyskanych rezultatów. Ostatni etap procesu badawczego wiąże się ze sformułowaniem wniosków końcowych opinii, które oparte zostaną na uzyskanych danych liczbowych oraz przyjętych progach punktowych dla decyzji DI oraz NDI. Ustaleniom ekspertyzy biegły musi teraz nadać kryminalistyczne znaczenie, które będzie akceptowalne dla zleceniodawcy w kontekście procesowym. Pomimo wypracowanych zasad analizy reakcji diagnostycznych i ich statystycznej interpretacji przekształcenie danych psychofizjologicznych na procesowo przydatne wnioski na gruncie polskiego prawa wydaje się niełatwe. 28 PROBLEMY KRYMINALISTYKI 282(4) 2013
8 PROBLEMY KRYMINALISTYKI 282(4)
9 Ryc. 2. Trzy poligramy osoby winnej Fig. 2. Three polygrams of guilty person A B Ryc. 3. Raporty z komputerowej analizy danych fizjologicznych osób badanych; A osoba niewinna, B osoba winna Fig. 3. Computerised evaluation reports of physiological data 30 PROBLEMY KRYMINALISTYKI 282(4) 2013
10 Podsumowanie Istotnym atutem Empirycznego Systemu Oceny jest prosty w zastosowaniu zbiór reguł oceny zapisów reakcji psychofizjologicznych. Pozwala on na sprawną ocenę poligramów i stwarza możliwość szybkiej konfrontacji wniosków końcowych sformułowanych niezależnie przez różnych ekspertów oceniających te same zapisy. Dbałość o przestrzeganie wymogów systemu zarządzania jakością, na którym opierają się policyjne laboratoria kryminalistyczne, nakazuje przeprowadzenie weryfikacji rzetelności każdej nowej metody badawczej, w tym Empirycznego Systemu Oceny, przed jej wdrożeniem do powszechnej praktyki. Dlatego prezentowany system oceny powinien stać się przedmiotem kompleksowych badań, które pozwolą ustalić jego wartość diagnostyczną na osobach z polskiego kręgu kulturowego. Znaczny postęp w analizie zapisów testu CQT, szacowanie wiarygodności wyniku badania na podstawie danych normatywnych, a także rezultaty polskich badań walidacyjnych nad ESS, mogą w przyszłości pozwolić na zmianę istniejącej sytuacji, w której ekspert, aby uwiarygodnić zastosowaną metodę badawczą, może użyć jedynie danych odnośnie do jej wartości diagnostycznej. Trafnie sformułowane wnioski opinii, wsparte statystyczną analizą, mogą zdecydować o wykorzystaniu opinii z badań poligraficznych w postępowaniu karnym. Określenie stopnia wiarygodności wyniku badania przyczyni się do pozytywnej oceny tego rodzaju dowodu. Dlatego prezentacja rezultatów ekspertyzy na tle współczesnych osiągnięć naukowych zwiększa szansę na jej uznanie w polskim środowisku prawniczym i zmniejsza ryzyko jej odrzucenia przez organy procesowe w toku oceny zgromadzonego w sprawie materiału. PRZYPISY 1 Wójcikiewicz J.: CIT czy CQT, Problemy Kryminalistyki 2012, 275(1); Widacki J.: W sprawie wyboru techniki badania poligraficznego. Czy technika oparta na testach GKT (CIT) jest lepsza od techniki opartej na testach CQ?, Problemy Kryminalistyki 2011, 273(3). 2 ASTM E Standard Terminology Relating to Forensic Psychophysiology. 3 Ze względu na cel badania poligraficznego testy dzielimy na diagnostyczne i skriningowe. Te pierwsze wykorzystywane są w sprawach kryminalnych i dotyczą zdarzenia będącego przedmiotem prowadzonego postępowania. Testy przesiewowe zaś stosowane są m.in. dla celów kadrowych, dotyczą wielu różnych kwestii istotnych z punktu widzenia interesów danej służby i służą ujawnieniu zagadnień problematycznych, w które może być zaangażowana osoba badana. 4 Nelson R., Show P., Handker M., Krapohl D.: Meta- Analytic Survey of Criterion Accuracy of Validated Polygraph Techniques, The Ad-Hoc Committee on Validated Techniques, Kircher J.C., Packard T., Bell B.G., Bernhardt P.C.: Effects of Prior Demonstrations of Polygraph Accuracy on Outcomes of Propable-Lie and Directed-Lie Polygraph Test, Polygraph 2011, 39(1). 6 Handler M., Nelson R.: Test Structure and Administration, European Polygraph 2008, 2(4). 7 Honts C.R., Raskin D.C., Kircher, J.C.: Mental and physical countermeasures reduce the accuracy of polygraph tests. Journal of Applied Psychology, 1994, 79, Nelson R., Handler M., Shaw P., Gougler M., Blalock B., Russell C., Cushman B., Oelrich M.: Using the Empirical Scoring System, Polygraph 2011,40(2). 9 Krapohl D.J.: Polygraph Principles: A Literature Review, Polygraph 2013, 42(1). 10 Nelson R., Blalock B., Oelrich M., Cushman B.: Realiability of the Empirical Scoring System with Expert Examiners, Polygraph 2011, 40(3). 11 Ibidem. 12 Cechy Kirchera to opracowany przez naukowców z Uniwersytetu Utah zestaw cech diagnostycznych o potwierdzonej empirycznie korelacji z pobudzeniem psychofizjologicznym rejestrowanym w trakcie badania poligraficznego. Wyznaczenie owych cech umożliwiło standaryzację procesu analizy zmian fizjologicznych oraz pozwoliło na ustalenie prawdopodobieństwa błędu dla testów CQT dla poszczególnych wyników punktowych. Cechy Kirchera posłużyły do opracowania komputerowych algorytmów zliczających wspomagających proces analizy danych OSS 3 oraz CPS. 13 Okno oceny reakcji przedział czasowy, w którym musi pojawić się reakcja, aby mogła zostać uznana za diagnostyczną i podlegać ocenie numerycznej. 14 Na potrzeby tego opracowania autorka będzie posługiwać się zwrotami DI, NDI i INC wyłącznie w rozumieniu technicznym dla uproszczenia sposobu prezentowania zagadnienia. 15 Negatywne rozstrzygnięcie NDI, stwierdzenie braku związku badanego ze sprawą. 16 Pozytywne rozstrzygnięcie DI, stwierdzenie związku badanego ze sprawą. 17 Dane normatywne przedstawiają rozkład prawdopodobieństwa błędu ustalony osobno w grupie NDI oraz DI, w zależności od wyniku punktowego testu. Według autorów ESS dane normatywne podane w tabeli 1 reprezentatywne są dla każdej populacji i przy uwzględnieniu takiego założenia mogą być wykorzystywane do statystycznej oceny zapisów z badań poligraficznych także w Polsce. Niemniej teza ta wymaga weryfikacji w badaniach prowadzonych na populacji polskiej. 18 Nelson R., Handler M.: Monte Carlo study of criterion validity of the Directed Lie Screening Test using Emipirical Scoring System and the Objective Scoring System Version 3, Polygraph 2012, 41(3); Using Normative PROBLEMY KRYMINALISTYKI 282(4)
11 Reference Data with Diagnostic Exams and the Empirical Scoring System, Polygraph 2012, 41(3). 19 Interpretacja statystyczna uzyskanego rozstrzygnięcia. 20 Reguła Sentera zakłada, że gdy wynik testu jest nierozstrzygnięty, interpretacji dokonuje się na podstawie ocen cząstkowych. Gdy któraś z nich jest mniejsza niż próg punktowy dla DI, całe badanie klasyfikuje się jako DI. Reguła Sentera redukuje poziom rozstrzygnięć INC o 60%. Kraphol D., Strum S.: Terminology Reference for the Science of Psychophysiological Detection of Deception, Polygraph 2002, 31(3). 21 Nelson R., Handler M., op.cit. 22 Przy podawaniu poziomu prawdopodobieństwa błędu dla wyniku testu opartego na najniższej ocenie cząstkowej jednego z pytań relewantnych należy odpowiadającą jej wartość p pomnożyć trzykrotnie, tu 0,8% x 3 = 2,4%. Nelson R., Handler M., op. cit. 23 Kircher J.C., Kristjansson S.D., Gardner M.K., Webb A.: Human and computer decision-making in the psychophysiological detection of deception, Final report to the Departament of Defense Polygraph Institute (2005), University of Utah: Salt Lake City. 24 Objective Scoring System version 3 Obiektywny System Oceny wersja 3, jego skuteczność wynosi 90,2%. Nelson R.: Criterion Validity of the Empirical Scoring System and the Objective Scoring System, version 3 with the USAF Modified General Question Technique, Polygraph 2011, 40(3). BIBLIOGRAFIA 1. ASTM E Standard Terminology Relating to Forensic Psychophysiology. 2. Cuchman B., Krapohl D.J.: Evidence for technical questions in polygraph techniques. Presentation at the APA annual Seminar, Myrle Beach. Sc (2010). 3. Honts C.R., Raskin D.C., Kircher J.C.: Mental and physical countermeasures reduce the accuracy of polygraph tests. Journal of Applied Psychology 1994, 79, Kircher J.C., Raskin D.C.: Human versus computerized evaluations of polygraph data in a laboratory setting. Journal of Applied Psychology 1988, 73(2). 5. Kircher J.C., Packard T., Bell B.G., Bernhardt P.C.: Effects of Prior Demonstrations of Polygraph Accuracy on Outcomes of Propable-Lie and Directed-Lie Polygraph Test, Polygraph 2001, 39(1). 6. Kircher J.C., Kristjansson S.D., Gardner M.K., Webb A.: Human and computer decision-making in the psychophysiological detection of deception, Final report to the Departament of Defense Polygraph Institute. (2005), University of Utah: Salt Lake City. 7. Widacki J.: W sprawie wyboru techniki badania poligraficznego. Czy technika oparta na testach GKT (CIT) jest lepsza od techniki opartej na testach CQ?, Problemy Kryminalistyki 2011, 273(3). 8. Wójcikiewicz J.: CIT czy CQT?, Problemy Kryminalistyki 2012, 275(1). 9. Nelson R., Blalock B., Oelrich M., Cushman B.: Realiability of the Empirical Scoring System with Expert Examiners, Polygraph 2011, 40(3). 10 Nelson R., Handler M.: Using Normative Reference Data with Diagnostic Exams and the Empirical scoring System, Polygraph 41(3) Nelson R., Handler M.: Empirical Scoring System: NPC Quick Reference, Lafayette Instrument. 12. Nelson R.: Criterion Validity of the Empirical Scoring System and the Objective Scoring System, version 3 with the USAF Modified General Question Technique, Polygraph 2011, 40(3). 14. Konieczny J.: Badania poligraficzne. Podręcznik dla zawodowców. Wydawnictwa Akademickie i Profesjonalne, Warszawa Streszczenie Artykuł stanowi propozycję prezentowania wyników testów pytań porównawczych na podstawie Empirycznego Systemu Oceny oraz danych normatywnych, które pozwalają ustalić poziom wiarygodności danego rozstrzygnięcia. Tę prostą w zastosowaniu metodę oceny reakcji psychofizjologicznych zaprezentowano na zapisach z kryminalistycznych badań poligraficznych. Słowa kluczowe: poligraf, ESS, ocena numeryczna Summary The paper presents the way of presentation of Comparison Questions Test results using Empirical Scoring System and normative data that allow to determine the degree of reliability of the decision. This easy-to- -use method for assessing psychophysiological reactions is presented on the basis of polygrams from forensic examinations. Keywords: polygraph, ESS, numerical scoring 32 PROBLEMY KRYMINALISTYKI 282(4) 2013
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA
Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów
METODY STATYSTYCZNE W BIOLOGII
METODY STATYSTYCZNE W BIOLOGII 1. Wykład wstępny 2. Populacje i próby danych 3. Testowanie hipotez i estymacja parametrów 4. Planowanie eksperymentów biologicznych 5. Najczęściej wykorzystywane testy statystyczne
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
(narzędzie do pomiaru cech zachowania oprac. dr hab. Zbigniew Spendel)
TEST PSYCHOLOGICZNY/ PEDAGOGICZNY (narzędzie do pomiaru cech zachowania oprac. dr hab. Zbigniew Spendel) 1. Jest narzędziem diagnostycznym posługiwanie się nim musi być uzasadnione celem postępowania diagnostycznego
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Definicja testu psychologicznego
Definicja testu psychologicznego Badanie testowe to taka sytuacja, w której osoba badana uczestniczy dobrowolnie, świadoma celu jakim jest jej ocena. Jest to sytuacja tworzona specjalnie dla celów diagnostycznych,
Kontekstowe wskaźniki efektywności nauczania - warsztaty
Kontekstowe wskaźniki efektywności nauczania - warsztaty Przygotowała: Aleksandra Jasińska (a.jasinska@ibe.edu.pl) wykorzystując materiały Zespołu EWD Czy dobrze uczymy? Metody oceny efektywności nauczania
SIGMA KWADRAT. Weryfikacja hipotez statystycznych. Statystyka i demografia CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY
SIGMA KWADRAT CZWARTY LUBELSKI KONKURS STATYSTYCZNO-DEMOGRAFICZNY Weryfikacja hipotez statystycznych Statystyka i demografia PROJEKT DOFINANSOWANY ZE ŚRODKÓW NARODOWEGO BANKU POLSKIEGO URZĄD STATYSTYCZNY
Badania biegłości laboratorium poprzez porównania międzylaboratoryjne
Badania biegłości laboratorium poprzez porównania międzylaboratoryjne Dr inż. Maciej Wojtczak, Politechnika Łódzka Badanie biegłości (ang. Proficienty testing) laboratorium jest to określenie, za pomocą
Statystyka matematyczna dla leśników
Statystyka matematyczna dla leśników Wydział Leśny Kierunek leśnictwo Studia Stacjonarne I Stopnia Rok akademicki 03/04 Wykład 5 Testy statystyczne Ogólne zasady testowania hipotez statystycznych, rodzaje
Warszawa, 20 marca 2015r. Zarząd. Polskiego Towarzystwa Badań Poligraficznych
Warszawa, 20 marca 2015r. Zarząd Polskiego Towarzystwa Badań Poligraficznych ul. Barska 1/5 30-307 Kraków www.ptbp.pl e-mail: biuro@ptbp.pl tel. +48 535 735 007 Polska Agencja Prasowa S.A. newsroom@pap.pl
166 Wstęp do statystyki matematycznej
166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej
1. TESTY PSYCHOLOGICZNE
1. TESTY PSYCHOLOGICZNE 1. pojęcie testu psychologicznego 2. zastosowanie 3. podstawowe wymogi (standaryzacja, obiektywność, rzetelność, trafność, normalizacja) 4. cecha psychologiczna w ujęciu psychologicznym
Statystyka w pracy badawczej nauczyciela
Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem
Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym
Wiesława MALSKA Politechnika Rzeszowska, Polska Anna KOZIOROWSKA Uniwersytet Rzeszowski, Polska Wykorzystanie testu t dla pojedynczej próby we wnioskowaniu statystycznym Wstęp Wnioskowanie statystyczne
Metody badawcze. Metodologia Podstawowe rodzaje metod badawczych
Metody badawcze Metodologia Podstawowe rodzaje metod badawczych Metoda badawcza Metoda badawcza to sposób postępowania (poznania naukowego). planowych i celowych sposobach postępowania badawczego. Muszą
5. WNIOSKOWANIE PSYCHOMETRYCZNE
5. WNIOSKOWANIE PSYCHOMETRYCZNE Model klasyczny Gulliksena Wynik otrzymany i prawdziwy Błąd pomiaru Rzetelność pomiaru testem Standardowy błąd pomiaru Błąd estymacji wyniku prawdziwego Teoria Odpowiadania
STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.
STRESZCZENIE rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne. Zasadniczym czynnikiem stanowiącym motywację dla podjętych w pracy rozważań
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
Statystyka. Rozkład prawdopodobieństwa Testowanie hipotez. Wykład III ( )
Statystyka Rozkład prawdopodobieństwa Testowanie hipotez Wykład III (04.01.2016) Rozkład t-studenta Rozkład T jest rozkładem pomocniczym we wnioskowaniu statystycznym; stosuje się go wyznaczenia przedziału
Weryfikacja hipotez statystycznych. KG (CC) Statystyka 26 V / 1
Weryfikacja hipotez statystycznych KG (CC) Statystyka 26 V 2009 1 / 1 Sformułowanie problemu Weryfikacja hipotez statystycznych jest drugą (po estymacji) metodą uogólniania wyników uzyskanych w próbie
mgr Marcin Gołaszewski Prezes Polskiego Towarzystwa Badań Poligraficznych (www.ptbp.pl)
mgr Marcin Gołaszewski Prezes Polskiego Towarzystwa Badań Poligraficznych (www.ptbp.pl) Przesłuchanie biegłego z zakresu badań poligraficznych (wariograficznych) w postępowaniu jurysdykcyjnym tryb, najczęściej
KOMPUTEROWE MEDIA DYDAKTYCZNE JAKO NARZĘDZIE PRACY NAUCZYCIELA FIZYKI SPRAWOZDANIE Z BADAŃ WŁASNYCH
Artur Bartoszewski Katedra Informatyki Politechnika Radomska Magdalena Gawor IX Liceum Ogólnokształcące przy Zespole Szkół Zawodowych im. Stanisława Staszica w Radomiu KOMPUTEROWE MEDIA DYDAKTYCZNE JAKO
VI WYKŁAD STATYSTYKA. 9/04/2014 B8 sala 0.10B Godz. 15:15
VI WYKŁAD STATYSTYKA 9/04/2014 B8 sala 0.10B Godz. 15:15 WYKŁAD 6 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI Weryfikacja hipotez ( błędy I i II rodzaju, poziom istotności, zasady
Testowanie hipotez statystycznych. Wnioskowanie statystyczne
Testowanie hipotez statystycznych Wnioskowanie statystyczne Hipoteza statystyczna to dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Hipotezy
Rodzaje testów. Testy. istnieje odpowiedź prawidłowa. autoekspresja brak odpowiedzi prawidłowej ZGADYWANIE TRAFNOŚĆ SAMOOPISU
Rodzaje testów Testy wiedza umiejętności zdolności właściwości poznawcze właściwości afektywne uczucia postawy osobowość emocje wierzenia istnieje odpowiedź prawidłowa autoekspresja brak odpowiedzi prawidłowej
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności
Wyniki badań reprezentatywnych są zawsze stwierdzeniami hipotetycznymi, o określonych granicach niepewności Statystyka indukcyjna pozwala kontrolować i oszacować ryzyko popełnienia błędu statystycznego
Wykład 3 Hipotezy statystyczne
Wykład 3 Hipotezy statystyczne Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu obserwowanej zmiennej losowej (cechy populacji generalnej) Hipoteza zerowa (H 0 ) jest hipoteza
Systemowe zarządzanie jakością. Koncepcja systemu, ocena systemu, wspomaganie decyzji. Piotr Miller
Systemowe zarządzanie jakością. Koncepcja systemu, ocena systemu, wspomaganie decyzji. Piotr Miller Podejmowanie decyzji na podstawie faktów to jedna z ośmiu zasad zarządzania jakością wymienionych w normie
TESTY NIEPARAMETRYCZNE. 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa.
TESTY NIEPARAMETRYCZNE 1. Testy równości średnich bez założenia normalności rozkładu zmiennych: Manna-Whitney a i Kruskala-Wallisa. Standardowe testy równości średnich wymagają aby badane zmienne losowe
Testowanie hipotez statystycznych
9 października 2008 ...czyli definicje na rozgrzewkę n-elementowa próba losowa - wektor n zmiennych losowych (X 1,..., X n ); intuicyjnie: wynik n eksperymentów realizacja próby (X 1,..., X n ) w ω Ω :
Sterowanie jakością badań i analiza statystyczna w laboratorium
Sterowanie jakością badań i analiza statystyczna w laboratorium CS-17 SJ CS-17 SJ to program wspomagający sterowanie jakością badań i walidację metod badawczych. Może działać niezależnie od innych składników
Uchwała Zarządu Polskiego Towarzystwa Badań Poligraficznych nr 7/2016 z dnia r. STANDARD KURSÓW I SZKOLEŃ Z ZAKRESU BADAŃ POLIGRAFICZNYCH
Uchwała Zarządu Polskiego Towarzystwa Badań Poligraficznych nr 7/2016 z dnia 20.07.2016r. STANDARD KURSÓW I SZKOLEŃ Z ZAKRESU BADAŃ POLIGRAFICZNYCH Rozdział I Rodzaje kursów i szkoleń 1 Polskie Towarzystwo
WNIOSKOWANIE STATYSTYCZNE
STATYSTYKA WNIOSKOWANIE STATYSTYCZNE ESTYMACJA oszacowanie z pewną dokładnością wartości opisującej rozkład badanej cechy statystycznej. WERYFIKACJA HIPOTEZ sprawdzanie słuszności przypuszczeń dotyczących
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory
Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl
Porównanie dwóch rozkładów normalnych
Porównanie dwóch rozkładów normalnych Założenia: 1. X 1 N(µ 1, σ 2 1), X 2 N(µ 2, σ 2 2) 2. X 1, X 2 są niezależne Ocena µ 1 µ 2 oraz σ 2 1/σ 2 2. Próby: X 11,..., X 1n1 ; X 21,..., X 2n2 X 1, varx 1,
15. PODSUMOWANIE ZAJĘĆ
15. PODSUMOWANIE ZAJĘĆ Efekty kształcenia: wiedza, umiejętności, kompetencje społeczne Przedmiotowe efekty kształcenia Pytania i zagadnienia egzaminacyjne EFEKTY KSZTAŁCENIA WIEDZA Wykazuje się gruntowną
Przełom w procesie walidacji i wyrażaniu wartości diagnostycznej testów wykorzystywanych w badaniach poligraficznych
I. ARTYKUŁY I ROZPRAWY 15 Marcin Gołaszewski Przełom w procesie walidacji i wyrażaniu wartości diagnostycznej testów wykorzystywanych w badaniach poligraficznych Proces normalizacji badań poligraficznych
P: Czy studiujący i niestudiujący preferują inne sklepy internetowe?
2 Test niezależności chi-kwadrat stosuje się (między innymi) w celu sprawdzenia czy pomiędzy zmiennymi istnieje związek/zależność. Stosujemy go w sytuacji, kiedy zmienna zależna mierzona jest na skali
Uchwała nr 7/2016 Zarządu Polskiego Towarzystwa Badań Poligraficznych z dnia r. STANDARD KURSÓW I SZKOLEŃ Z ZAKRESU BADAŃ POLIGRAFICZNYCH
Uchwała nr 7/2016 Zarządu Polskiego Towarzystwa Badań Poligraficznych z dnia 20.07.2016r. STANDARD KURSÓW I SZKOLEŃ Z ZAKRESU BADAŃ POLIGRAFICZNYCH - tekst jednolity 1 ogłoszony dnia 12.11.2017 Rozdział
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: PROGNOZOWANIE Z WYKORZYSTANIEM SYSTEMÓW INFORMATYCZNYCH Kierunek: Informatyka Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych Rodzaj zajęć: wykład, laboratorium I KARTA PRZEDMIOTU
Zadania ze statystyki, cz.6
Zadania ze statystyki, cz.6 Zad.1 Proszę wskazać, jaką część pola pod krzywą normalną wyznaczają wartości Z rozkładu dystrybuanty rozkładu normalnego: - Z > 1,25 - Z > 2,23 - Z < -1,23 - Z > -1,16 - Z
Szkice rozwiązań z R:
Szkice rozwiązań z R: Zadanie 1. Założono doświadczenie farmakologiczne. Obserwowano przyrost wagi ciała (przyrost [gram]) przy zadanych dawkach trzech preparatów (dawka.a, dawka.b, dawka.c). Obiektami
Metodologia badań psychologicznych. Wykład 4 Testy
Metodologia badań psychologicznych Lucyna Golińska SPOŁECZNA AKADEMIA NAUK Wykład 4 Testy Definicja testu Pierwszy test- James McKeen Cattell w 1890r. (mental test and measurements) test do badania zdolności
Testowanie hipotez. Marcin Zajenkowski. Marcin Zajenkowski () Testowanie hipotez 1 / 25
Testowanie hipotez Marcin Zajenkowski Marcin Zajenkowski () Testowanie hipotez 1 / 25 Testowanie hipotez Aby porównać ze sobą dwie statystyki z próby stosuje się testy istotności. Mówią one o tym czy uzyskane
Zarządzenie Nr 90/2008 Burmistrza Miasta Czeladź. z dnia 09.05. 2008
Zarządzenie Nr 90/2008 Burmistrza Miasta Czeladź z dnia 09.05. 2008 w sprawie : wprowadzenia procedury Identyfikacji zagrożeń oraz oceny ryzyka zawodowego na stanowiskach pracy w Urzędzie Miasta Czeladź
Zawartość. Zawartość
Opr. dr inż. Grzegorz Biesok. Wer. 2.05 2011 Zawartość Zawartość 1. Rozkład normalny... 3 2. Rozkład normalny standardowy... 5 3. Obliczanie prawdopodobieństw dla zmiennych o rozkładzie norm. z parametrami
Wnioskowanie statystyczne Weryfikacja hipotez. Statystyka
Wnioskowanie statystyczne Weryfikacja hipotez Statystyka Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.
Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w
Proces badawczy schemat i zasady realizacji
Proces badawczy schemat i zasady realizacji Agata Górny Zaoczne Studia Doktoranckie z Ekonomii Warszawa, 23 października 2016 Metodologia i metoda naukowa 1 Metodologia Metodologia nauka o metodach nauki
Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
Krakowska Akademia im. Andrzeja Frycza Modrzewskiego. Karta przedmiotu. obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 2014/2015
Krakowska Akademia im. Andrzeja Frycza Modrzewskiego Karta przedmiotu obowiązuje studentów, którzy rozpoczęli studia w roku akademickim 014/015 WydziałPsychologii i Nauk Humanistycznych Kierunek studiów:
Walidacja metod analitycznych Raport z walidacji
Walidacja metod analitycznych Raport z walidacji Małgorzata Jakubowska Katedra Chemii Analitycznej WIMiC AGH Walidacja metod analitycznych (według ISO) to proces ustalania parametrów charakteryzujących
Porównywanie populacji
3 Porównywanie populacji 2 Porównywanie populacji Tendencja centralna Jednostki (w grupie) według pewnej zmiennej porównuje się w ten sposób, że dokonuje się komparacji ich wartości, osiągniętych w tej
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI
LABORATORIUM 8 WERYFIKACJA HIPOTEZ STATYSTYCZNYCH PARAMETRYCZNE TESTY ISTOTNOŚCI WERYFIKACJA HIPOTEZ Hipoteza statystyczna jakiekolwiek przypuszczenie dotyczące populacji generalnej- jej poszczególnych
STRESZCZENIE ROZPRAWY DOKTORSKIEJ. mgr Marcin Druszcz ZABEZPIECZENIE MEDYCZNE DZIAŁAŃ PODODDZIAŁÓW POLICJI NA TERYTORIUM KRAJU W LATACH
STRESZCZENIE ROZPRAWY DOKTORSKIEJ mgr Marcin Druszcz /Autor rozprawy/ ZABEZPIECZENIE MEDYCZNE DZIAŁAŃ PODODDZIAŁÓW POLICJI NA TERYTORIUM KRAJU W LATACH 2010-2015.... /Temat rozprawy/ dr hab. Andrzej Czupryński..
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji
Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki
Opracowała dr Ryta Suska-Wróbel. Gdańsk, 25 luty 2016 r.
Opracowała dr Ryta Suska-Wróbel Gdańsk, 25 luty 2016 r. EFEKTY KSZTAŁCENIA - zasób wiedzy, umiejętności i kompetencji społecznych uzyskanych w procesie kształcenia przez osobę uczącą się. W szkolnictwie
KARTA PRZEDMIOTU/SYLABUS
KARTA PRZEDMIOTU/SYLABUS Wydział Kierunek studiów Jednostka organizacyjna prowadząca kierunek Poziom kształcenia Forma studiów Profil kształcenia Jednostka organizacyjna prowadząca przedmiot Moduł / Przedmiot
Wydział Matematyki. Testy zgodności. Wykład 03
Wydział Matematyki Testy zgodności Wykład 03 Testy zgodności W testach zgodności badamy postać rozkładu teoretycznego zmiennej losowej skokowej lub ciągłej. Weryfikują one stawiane przez badaczy hipotezy
WYTYCZNE W SPRAWIE TESTÓW, OCEN LUB DZIAŁAŃ MOGĄCYCH DOPROWADZIĆ DO ZASTOSOWANIA ŚRODKÓW WSPARCIA EBA/GL/2014/ września 2014 r.
EBA/GL/2014/09 22 września 2014 r. Wytyczne w sprawie rodzajów testów, ocen lub działań mogących doprowadzić do zastosowania środków wsparcia zgodnie z art. 32 ust. 4 lit. d) ppkt (iii) dyrektywy w sprawie
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych
Zadania ze statystyki, cz.7 - hipotezy statystyczne, błąd standardowy, testowanie hipotez statystycznych Zad. 1 Średnia ocen z semestru letniego w populacji studentów socjologii w roku akademickim 2011/2012
Wykorzystanie testu Levene a i testu Browna-Forsythe a w badaniach jednorodności wariancji
Wydawnictwo UR 2016 ISSN 2080-9069 ISSN 2450-9221 online Edukacja Technika Informatyka nr 4/18/2016 www.eti.rzeszow.pl DOI: 10.15584/eti.2016.4.48 WIESŁAWA MALSKA Wykorzystanie testu Levene a i testu Browna-Forsythe
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA
WIELKA SGH-OWA POWTÓRKA ZE STATYSTYKI REGRESJA LINIOWA Powtórka Powtórki Kowiariancja cov xy lub c xy - kierunek zależności Współczynnik korelacji liniowej Pearsona r siła liniowej zależności Istotność
Psychologia WF-PS. Studia drugiego stopnia Profil ogólnoakademicki Studia stacjonarne, niestacjonarne Magister
Załącznik nr 4 do Uchwały nr 34/2012 Senatu UKSW z dnia 26 kwietnia 2012 r. 1. Dokumentacja dotycząca opisu efektów kształcenia dla programu kształcenia dla kierunku psychologia dla jednolitych studiów
Zad. 4 Należy określić rodzaj testu (jedno czy dwustronny) oraz wartości krytyczne z lub t dla określonych hipotez i ich poziomów istotności:
Zadania ze statystyki cz. 7. Zad.1 Z populacji wyłoniono próbę wielkości 64 jednostek. Średnia arytmetyczna wartość cechy wyniosła 110, zaś odchylenie standardowe 16. Należy wyznaczyć przedział ufności
Ewaluacja w polityce społecznej
Ewaluacja w polityce społecznej Standardy ewaluacji i metaewaluacja Dr hab. Ryszard Szarfenberg rszarf.ips.uw.edu.pl/ewalps/ Dwa pojęcia standardu Standard jako pojęcie statystyczne X jest standardem =
System monitorowania realizacji strategii rozwoju. Andrzej Sobczyk
System monitorowania realizacji strategii rozwoju Andrzej Sobczyk System monitorowania realizacji strategii rozwoju Proces systematycznego zbierania, analizowania publikowania wiarygodnych informacji,
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
METODA PERT. Maciej Patan. Instytut Sterowania i Systemów Informatycznych Uniwersytet Zielonogórski
METODA PERT Maciej Patan Programowanie sieciowe. Metoda PERT 1 WPROWADZENIE PERT (ang. Program Evaluation and Review Technique) Metoda należy do sieci o strukturze logicznej zdeterminowanej Parametry opisujace
Priorytetyzacja przypadków testowych za pomocą macierzy
Priorytetyzacja przypadków testowych za pomocą macierzy W niniejszym artykule przedstawiony został problem przyporządkowania priorytetów do przypadków testowych przed rozpoczęciem testów oprogramowania.
Źródła danych i informacji
Źródła danych i informacji Metodyka pracy naukowej Tomasz Poskrobko Źródło pochodzenia danych Dane Pierwotne Wtórne Rodzaje publikacji recenzowane Monografie naukowe Artykuły naukowe Podręczniki, skrypty
ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY
ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY Instrukcja przeprowadzania analiz badań edukacyjnych i sporządzania raportów po badaniach. Cele prowadzenia analiz jakościowych i ilościowych
Weryfikacja przypuszczeń odnoszących się do określonego poziomu cechy w zbiorowości (grupach) lub jej rozkładu w populacji generalnej,
Szacownie nieznanych wartości parametrów (średniej arytmetycznej, odchylenia standardowego, itd.) w populacji generalnej na postawie wartości tych miar otrzymanych w próbie (estymacja punktowa, przedziałowa)
Analiza współzależności dwóch cech I
Analiza współzależności dwóch cech I Współzależność dwóch cech W tym rozdziale pokażemy metody stosowane dla potrzeb wykrywania zależności lub współzależności między dwiema cechami. W celu wykrycia tych
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera
Formularz recenzji magazynu. Journal of Corporate Responsibility and Leadership Review Form
Formularz recenzji magazynu Review Form Identyfikator magazynu/ Journal identification number: Tytuł artykułu/ Paper title: Recenzent/ Reviewer: (imię i nazwisko, stopień naukowy/name and surname, academic
STATYSTYKA wykład 8. Wnioskowanie. Weryfikacja hipotez. Wanda Olech
TATYTYKA wykład 8 Wnioskowanie Weryfikacja hipotez Wanda Olech Co nazywamy hipotezą Każde stwierdzenie o parametrach rozkładu lub rozkładzie zmiennej losowej w populacji nazywać będziemy hipotezą statystyczną
LABORATORIUM Z FIZYKI
LABORATORIUM Z FIZYKI LABORATORIUM Z FIZYKI I PRACOWNIA FIZYCZNA C w Gliwicach Gliwice, ul. Konarskiego 22, pokoje 52-54 Regulamin pracowni i organizacja zajęć Sprawozdanie (strona tytułowa, karta pomiarowa)
Kognitywistyka II r. Terminy wykładów. Literatura - psychometria. Teorie inteligencji i sposoby jej pomiaru (1)
Kognitywistyka II r Teorie inteligencji i sposoby jej pomiaru (1) Terminy wykładów 13. 03. 2008 27. 03. 2008 03. 04. 2008 17. 04. 2008 24. 04. 2008 08. 05. 2008 15. 05. 2008 29. 05. 2008 05. 06. 2008 12.
Matematyka - Statystyka matematyczna Mathematical statistics 2, 2, 0, 0, 0
Nazwa przedmiotu: Kierunek: Matematyka - Statystyka matematyczna Mathematical statistics Inżynieria materiałowa Materials Engineering Rodzaj przedmiotu: Poziom studiów: forma studiów: obowiązkowy studia
Biostatystyka, # 3 /Weterynaria I/
Biostatystyka, # 3 /Weterynaria I/ dr n. mat. Zdzisław Otachel Uniwersytet Przyrodniczy w Lublinie Katedra Zastosowań Matematyki i Informatyki ul. Głęboka 28, p. 221 bud. CIW, e-mail: zdzislaw.otachel@up.lublin.pl
Prawdopodobieństwo i rozkład normalny cd.
# # Prawdopodobieństwo i rozkład normalny cd. Michał Daszykowski, Ivana Stanimirova Instytut Chemii Uniwersytet Śląski w Katowicach Ul. Szkolna 9 40-006 Katowice E-mail: www: mdaszyk@us.edu.pl istanimi@us.edu.pl
Wykład 4: Wnioskowanie statystyczne. Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA
Wykład 4: Wnioskowanie statystyczne Podstawowe informacje oraz implementacja przykładowego testu w programie STATISTICA Idea wnioskowania statystycznego Celem analizy statystycznej nie jest zwykle tylko
PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com
Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych
Regresja logistyczna (LOGISTIC)
Zmienna zależna: Wybór opcji zachodniej w polityce zagranicznej (kodowana jako tak, 0 nie) Zmienne niezależne: wiedza o Unii Europejskiej (WIEDZA), zamieszkiwanie w regionie zachodnim (ZACH) lub wschodnim
Państwowa Wyższa Szkoła Zawodowa im. prof. Edwarda F. Szczepanika w Suwałkach Instytut Ochrony Zdrowia Nazwa programu kształcenia (kierunku)
Państwowa Wyższa Szkoła Zawodowa im. prof. Edwarda F. Szczepanika w Suwałkach Instytut Ochrony Zdrowia Nazwa programu kształcenia (kierunku) Pielęgniarstwo Poziom i forma studiów studia I stopnia stacjonarne
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
STATYSTYKA EKONOMICZNA
STATYSTYKA EKONOMICZNA Analiza statystyczna w ocenie działalności przedsiębiorstwa Opracowano na podstawie : E. Nowak, Metody statystyczne w analizie działalności przedsiębiorstwa, PWN, Warszawa 2001 Dr
13. Interpretacja wyników testowych
13. Interpretacja wyników testowych q testowanie a diagnozowanie psychologiczne q interpretacja wyników testu q interpretacja kliniczna a statystyczna q interpretacja ukierunkowana na kryteria lub normy
ROZPORZĄDZENIE MINISTRA ZDROWIA 1) z dnia 15 listopada 2010 r.
Dziennik Ustaw Nr 222 15439 Poz. 1453 1453 ROZPORZĄDZENIE MINISTRA ZDROWIA 1) z dnia 15 listopada 2010 r. w sprawie wzorów wniosków przedkładanych w związku z badaniem klinicznym, wysokości opłat za złożenie
Przeprowadzono dla Międzynarodowej Rady Egzaminatorów Konsultantów Laktacyjnych (IBLCE ) Czerwiec Sporządzili:
Analiza punktów koniecznych do zaliczenia egzaminu dla Dyplomowanych Konsultantów Laktacyjnych certyfikowanych przez Międzynarodową Radę Egzaminatorów (IBCLC ) Egzamin certyfikacyjny Przeprowadzono dla
System ustalania wartości punktów ECTS dla przedmiotów na Wydziale Ekonomiczno-Socjologicznym UŁ
System ustalania wartości punktów ECTS dla przedmiotów na Wydziale Ekonomiczno-Socjologicznym UŁ Opis systemu. System akumulacji i transferu punktów ECTS przyjęty na Wydziale Ekonomiczno- Socjologicznym
ANALIZA WRAŻLIWOŚCI CENY OPCJI O UWARUNKOWANEJ PREMII
STUDIA I PRACE WYDZIAŁU NAUK EKONOMICZNYCH I ZARZĄDZANIA NR 31 Ewa Dziawgo Uniwersytet Mikołaja Kopernika w Toruniu ANALIZA WRAŻLIWOŚCI CENY OPCJI O UWARUNKOWANEJ PREMII Streszczenie W artykule przedstawiono
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Podstawowe pojęcia statystyczne
Podstawowe pojęcia statystyczne Istnieją trzy rodzaje kłamstwa: przepowiadanie pogody, statystyka i komunikat dyplomatyczny Jean Rigaux Co to jest statystyka? Nauka o metodach ilościowych badania zjawisk
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności. Dr Anna ADRIAN Paw B5, pok407
Rachunek prawdopodobieństwa i statystyka - W 9 Testy statystyczne testy zgodności Dr Anna ADRIAN Paw B5, pok407 adan@agh.edu.pl Weryfikacja hipotez dotyczących postaci nieznanego rozkładu -Testy zgodności.