WYKORZYSTANIE MODELU SKORINGOWEGO DO AUTOMATYCZNEJ DIAGNOSTYKI NA PODSTAWIE ZAPISU WIDEO BRONCHOSKOPII
|
|
- Lidia Popławska
- 6 lat temu
- Przeglądów:
Transkrypt
1 WYKORZYSTANIE MODELU SKORINGOWEGO DO AUTOMATYCZNEJ DIAGNOSTYKI NA PODSTAWIE ZAPISU WIDEO BRONCHOSKOPII Lucjan Janowski, Akademia Górniczo-Hutnicza Mariusz Duplaga, Uniwersytet Jagielloński Collegium Medicum Krzysztof Suwada, StatSoft Polska Medyczne zbiory zapisów wideo mogą zawierać bardzo wiele sekwencji wideo z bronchoskopii zarchiwizowanych na przestrzeni lat. Odnajdywanie szukanej informacji w takiej bazie danych może zająć dużo czasu i wymaga specjalistycznej wiedzy medycznej. Dedykowany algorytm automatyzacji wyszukiwania mógłby znacząco skrócić czas poświęcony na odnalezienie poszukiwanego zapisu wideo. Do zagadnienia tego można podejść na wiele sposobów, w tym artykule zaprezentowane zostaną modele skoringowe dedykowane odnajdywaniu krwawień oraz bladości śluzówki. Wstęp Zapis wideo bronchoskopii przechowywany w formie cyfrowej jest kodowany w standardzie MPEG-7 i składa się z sekwencji tzw. ramek (ang. frames) podobnie jak zwykły film rejestrowany na taśmie analogowej. Jedynie niewielka ilość ramek z całego zapisu zawiera użyteczne informacje z punktu widzenia wykrywania konkretnej zmiany. Z drugiej strony liczba zapisów rośnie dosyć szybko i odpowiednio wydajny algorytm pozyskiwania ramek jest elementem kluczowym dla działania całego systemu. Do zadania można podejść na dwa sposoby: pierwszy skupia się na redukcji wielkości zapisu wideo poprzez usuwanie ramek niezawierających istotnych informacji, drugi bazuje na rozpoznawaniu elementów obrazu i odpowiedniej klasyfikacji zapisów wideo i prezentowania tylko tych ich fragmentów, które spełniają zadane wcześniej kryteria. Wykrywanie i klasyfikacja obiektów występujących w plikach graficznych i obrazach wideo w dalszym ciągu jest sporym wyzwaniem. Podejście prezentowane w tym artykule wykorzystuje sposób opisu obrazu dostępny w standardzie MPEG-7, tzw. deskryptory MPEG-7. Jest to pewien zestaw liczb opisujących zawartość pliku wideo: dźwięk oraz obraz. Wykorzystanie tych zmiennych w połączeniu z odpowiednimi algorytmami statystycznymi pozwoli zbudować model wykrywający poszukiwane zmiany. 94
2 Jedną z głównych przeszkód w budowie automatycznego systemu przetwarzania obrazów medycznych są trudności z dostępem do odpowiednio opisanych (przez wykwalifikowany personel medyczny) zbiorów danych. Podczas realizacji projektu BRONCHOVID trudność ta została pokonana dzięki szerokiej współpracy ze specjalistami z dziedziny bronchoskopii, którzy odpowiednio oznaczyli kluczowe ramki z zapisu wideo. Projekt sponsorowany przez Ministerstwo Nauki pozwolił na zbudowanie obszernej bazy danych odpowiednio opisanych zapisów bronchoskopijnych, umożliwiając budowę modelu statystycznego. Dla wybranych zmian zostały zbudowane odpowiednie modele skoringowe i w dwóch przypadkach otrzymane wyniki pozwalają na rozważenie ich stosowania w algorytmie przeszukiwania bazy danych. Zebrane dane i standard MPEG-7 MPEG-7 jest standardem zaproponowanym przez MPEG (MovingPicturesExpertGroup). W przeciwieństwie do standardów MPEG-1, MPEG-2 i MPEG-4 nie opisuje on sposobu kompresji obrazu wideo, lecz definiuje formalny sposób opisu jego zawartości. Pojedynczy deskryptor został tak zaprojektowany, aby wydobywać pewne określone cechy obrazu lub dźwięku. W modelowaniu wykorzystane zostały cztery deskryptory koloru: ColourLayoutDescriptor (CLD) reprezentuje przestrzenny rozkład koloru. Zawiera 192 wartości pogrupowane w trzy klasy reprezentujące odpowiednie składowe koloru ( ). ColourStructureDescriptor (CSD) reprezentuje łącznie rozkład koloru i lokalną strukturę przestrzenną, w modelowaniu wykorzystane zostały 32 wartości ( ). Dominant ColourDescriptor (DCD) opisuje najczęściej występujące kolory w ramce. Ich liczba waha się od jednego do siedmiu. Dla każdego koloru (opisanego przez, gdzie oznacza składową koloru (Y, V lub U), a jest indeksem koloru) dostępne są dodatkowe informacje, np. wariancja koloru. Scalable ColourDescriptor (SCD) transformata Haara histogramu kolorów reprezentowana przez 256 wartości ( ). Wykorzystane zostały także dwa deskryptory tekstury. Edge Histogram Descriptor (EHD) zlicza krawędzie w różnych partiach obrazu i pod różnymi kierunkami. Zawiera 80 wartości ( ). TextureBrowsingDescriptor (TBD) reprezentuje teksturę w taki sposób, w jaki postrzega je człowiek, czyli jej regularność, gładkość i kierunkowość. Reprezentowany jest przez 5 wartości ( ). Ostatnim wykorzystanym deksryptorem był Region ShapeDescriptor (RSD) reprezentujący kształty. Jest on reprezentowany przez 62 wartości ( ). 95
3 Dysponując takim zestawem każdy blok ramki jest reprezentowany przez 683 wartości liczbowe. Ze względu na fakt, że niektóre z nich okazały się przyjmować stałe wartości, zostały usunięte ze zbioru predyktorów. Metodologia skoringowa Dzięki deskryptorom standardu MPEG-7 każda ramka obrazu jest reprezentowana przez dosyć dużą liczbę zmiennych. Podobnie jak przy modelowaniu innych zjawisk część zmiennych jest, a część nie jest powiązana istotną zależnością z modelowaną zmienną. Ze względu na dużą liczbę zmiennych konieczne było zastosowanie aparatu statystycznego w celu wyłonienia najlepszych kandydatów na zmienne objaśniające. Wiele różnych technik doboru zmiennych można znaleźć zarówno w literaturze, jak i w oprogramowaniu statystycznym. W tym przypadku należy jednak wziąć pod uwagę fakt, że zbiór danych był silnie niezbalansowany znacznie więcej przypadków nie wykazywało zmian patologicznych. Zły wybór zmiennych może skutkować zbudowaniem dobrego modelu dla danych uczących, który dawałby jednak słabe i niestabilne wyniki na zbiorze testowym. Problem prób niezbalansowanych pojawia się nie tylko w medycynie, ale także w analizie ryzyka, wykrywaniu nadużyć (fraud detection), skoringu kredytowym czy analizie lojalności klientów (churn). Można wykorzystać pewne nieliniowe techniki modelowania, jak np. drzewa wzmacniane, jednak zdecydowano się pozostać przy prostszym modelu liniowym. Celem budowy modelu skoringowego jest przewidywanie, czy kredyt zostanie spłacony przez daną osobę czy firmę. Predykcja (skoring - punktacja) bazuje na populacji kredytów, dla których znana jest już informacja, czy zostały spłacone czy nie. Należy zauważyć, że zbiór kredytów, podobnie jak zbiór pacjentów, jest mocno niezbalansowany jedynie mały odsetek osób nie spłaca zaciągniętego zobowiązania. Warto zaznaczyć, że poprawnie zbudowany i dobrze dopasowany model skoringowy jest modelem stabilnym, łatwym we wdrażaniu oraz szybkim w działaniu, a sam proces jego budowy rozwiązuje wiele problemów, które można napotkać przy budowie nie tylko modeli liniowych: braki danych, obserwacje odstające, nietypowe, zależności nieliniowe. Metodologia skoringowa jest dosyć obszerna i znacznie wykracza poza ramy tego artykułu zostanie jednak pokrótce nakreślona 1. 1 Więcej informacji wraz z przykładami zastosowań można znaleźć na stronie 96
4 Modelowana zmienna jest dwustanowa reprezentowana przez: 1 zły niespłacony kredyt, wystąpiła zmiana chorobowa, śmierć pacjenta, defraudacja, odejście klienta, 0 dobry przeciwieństwo znaczenia zły spłacony kredyt, brak zmian chorobowych, przeżycie pacjenta, lojalny klient. Proces budowy karty skoringowej może zostać podzielony na kroki, każdy z nich jest wykonywany z wykorzystaniem odpowiedniego modułu Zestawu Skoringowego dostępnego jako rozszerzenie programu STATISTICA. Rys. 1. Zarys metodologii skoringowej. Kroki wykorzystane w modelowaniu. Kluczowym elementem budowy modelu skoringowego jest regresja logistyczna i jej skalowanie. Gdy jest gotowy model logistyczny, jest on przekształcany na punktację w taki sposób, aby co N punktów szansa bycia dobrym podwajała się. Dzięki tej operacji punktacja ma bardzo silną interpretację w terminach szans często wykorzystywanych nie tylko w medycynie. W pierwszym kroku naszej analizy należy zidentyfikować, które ze zmiennych objaśniających będą najlepsze do budowy modelu. W tym celu dla każdej z nich zostanie obliczona miara IV Information Value zgodnie ze wzorem: gdzie n-oznacza liczbę przedziałów zmiennej, a Dobryi Zły oznacza odpowiednie liczności przypadków w danej klasie. Otrzymana liczba może być interpretowana jako siła związku danej zmiennej ze zmienną zależną. 97
5 W drugim kroku należy odrzucić część zmiennych, będziemy kierować się dwoma kryteriami zmienne powinny mieć wysoką wartość IV oraz nie powinny być silnie skorelowane. Krok ten zależy w dużej mierze od analityka, ponieważ nie ma twardych reguł określających, co silna korelacja oznacza. Ostateczny zbiór zmiennych powinien ich zawierać około 10 do 12. Krok trzeci to dyskretyzacja zmiennych ilościowych i ewentualna rekategoryzacja zmiennych jakościowych, ponieważ modele skoringowe budowane są dla danych dyskretnych. Proces ten nazywamy tworzeniem atrybutów, a wynikowe klasy atrybutami. Przejście ze zmiennej ciągłej na wartości dyskretne może być postrzegane jako utrata informacji w praktyce utrata ta jest minimalna. Najlepsze rezultaty przy tworzeniu atrybutów uzyskuje się łącząc wiedzę ekspercką (np. lekarza) i metody statystyczne. W przypadku deskryptorów standardu MPEG-7 bardzo trudno byłoby pulmonologowi wskazać odpowiedni sposób kategoryzacji. Z tego względu wykorzystano wbudowany w Zestaw Skoringowy automatyczny algorytm konstrukcji atrybutów, bazujący na algorytmie CHAID oraz mierze WoE (Weight of Evidence). WoE to miara statystyczna bardzo użyteczna przy ocenie atrybutu bazująca na logarytmie ilorazu szans. Zauważmy, że silna nierównowaga w danym atrybucie, np. 90% przypadków z krwawieniem i tylko 10% bez, oznacza wysokie (co do wartości bezwzględnej) wartości WoE, natomiast jeżeli procent ten wynosiłby około 50% - WoE byłoby bardzo bliskie zeru. Dzięki kategoryzacji oraz WoE, atrybuty mogą być postrzegane jako stymulanty lub destymulanty konkretnego zachowania klienta lub zmiany chorobowej. Estymacja modelu Nagrania zebrane i opisane przez specjalistów w projekcie BRONCHOVID zawierają znaczną liczbę różnych zmian w płucach, które można zaobserwować podczas badania. Niektóre z nich mogą występować pojedynczo, niektóre grupami. Taka struktura bazy danych jest trudniejsza w analizie, ponieważ jeżeli zaobserwowano zmianę a, nie możemy na 100% wykluczyć występowania zmiany b, ponieważ czasem mogą one występować razem. Analiza została ograniczona do zdarzeń, które nigdy nie występują jednocześnie. Problemem, który napotkano, była także nadreprezentacja niektórych ramek. Ze względu na fakt, że baza danych nie została zbudowana tylko do automatycznego wykrywania zmian patologicznych, niektóre - bardziej interesujące lekarza - zmiany mogły występować na kilkudziesięciu, podczas gdy inne zaledwie na kilku ramkach. Wykorzystanie wszystkich ramek dla danej zmiany mogłoby skutkować zbudowaniem modelu bardzo 98
6 dobrze dopasowanego do danych uczących, ale z nikłymi możliwościami generalizacji. Przyjęte zostało ograniczenie trzech ramek na pojedyncze badanie. Rys. 4. Przykład zmian (ciemna obwódka oznacza wewnątrzoskrzelową masę guza, a jasna wydatną siatkę naczyń). Kolejnym problem był rozmiar rozpoznawanej zmiany. Większość z nich pokrywa zwykle mniej niż połowę ramki (ekranu). Z tego powodu wykorzystanie deskryptorów dla całej ramki owocowałoby bardzo słabym modelem. W zastosowanym rozwiązaniu każda ramka została podzielona na kwadraty o boku 64 pikseli. Z bloków tych zostały wybrane takie, na których pożądana zmiana pokrywa przynajmniej 80% powierzchni. blo- Baza danych, którą wykorzystano w procesie budowy modelu, składała się z ków obrazu. Do modelowania wybrano: poszerzenie ostrogi, zwężenie światła/zamknięcie oskrzela, bladość śluzówki, wewnątrzoskrzelowa masa guza, naciek śluzówki, poszerzenie naczyń, ropna wydzielina, zanik śluzówki, krwawienie, wybroczyny w błonie śluzowej. 99
7 Zbiór bloków obrazu został podzielony na część uczącą (75%) oraz testową (25%) i dla każdej z rozważanych zmian został zbudowany model. Dla ośmiu z nich nie udało się zbudować satysfakcjonującego modelu. W dwóch przypadkach otrzymane wyniki pozwalają na ewentualne wdrożenie modelu. Krwawienie Model został zbudowany z wykorzystaniem przedstawionej metodologii skoringowej. Wybrano predyktorów. Korelacja między wybranymi zmiennymi jest nie wyższa niż i zwykle nie przekracza. 1,00-0,73-0,74-0,42-0,27-0,38-0,23-0,56-0,27-0,21-0,19 0,01-0,73 1,00 0,71 0,50 0,37 0,40 0,29 0,59 0,46 0,51 0,42-0,36-0,74 0,71 1,00 0,47 0,28 0,43 0,23 0,67 0,13 0,25 0,25-0,16-0,42 0,50 0,47 1,00 0,55 0,27 0,53 0,33 0,27 0,27 0,13-0,12-0,27 0,37 0,28 0,55 1,00 0,18 0,25 0,14 0,29 0,27 0,13-0,10-0,38 0,40 0,43 0,27 0,18 1,00 0,24 0,24 0,22 0,16 0,13-0,08-0,23 0,29 0,23 0,53 0,25 0,24 1,00 0,05 0,27 0,20 0,12-0,05-0,56 0,59 0,67 0,33 0,14 0,24 0,05 1,00-0,06-0,06-0,04-0,16-0,27 0,46 0,13 0,27 0,29 0,22 0,27-0,06 1,00 0,52 0,39-0,41-0,21 0,51 0,25 0,27 0,27 0,16 0,20-0,06 0,52 1,00 0,44-0,42-0,19 0,42 0,25 0,13 0,13 0,13 0,12-0,04 0,39 0,44 1,00-0,30 0,01-0,36-0,16-0,12-0,10-0,08-0,05-0,16-0,41-0,42-0,30 1,00 Należy zauważyć, że skoring jest obliczany dla każdego bloku ramki. Aby zaklasyfikować bloki do danej klasy krwawienie lub brak krwawienia, musi zostać określony tzw. poziom odcięcia (ang. cut-off level), dzięki metodologii skoringowej poziom ten może zostać wybrany przez specjalistę na podstawie wykresu ROC i w razie potrzeby łatwo zmieniony. 100
8 1,0 0,9 0,8 0,7 Sensitivity 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1-Specificity Rys. 5. Wykres ROC dla zmiany Krwawienie. Bladość śluzówki Model dla bladości śluzówki został zbudowany podobnie jak model dla krwawienia z wykorzystaniem metodologii skoringowej. Tym razem wybrano 11 najlepszych predyktorów, których macierz korelacji znajduje się poniżej. 1,00 0,44 0,25 0,45 0,66 0,06-0,09 0,16-0,09-0,35-0,37 0,44 1,00 0,55 0,27 0,33 0,01-0,12 0,27 0,02-0,17-0,34 0,25 0,55 1,00 0,18 0,14-0,07-0,09 0,27 0,04-0,09-0,24 0,45 0,27 0,18 1,00 0,24-0,03-0,05 0,16-0,06-0,22-0,26 0,66 0,33 0,14 0,24 1,00 0,51-0,22-0,06-0,01-0,39-0,45 0,06 0,01-0,07-0,03 0,51 1,00-0,11-0,07-0,04-0,28-0,28-0,09-0,12-0,09-0,05-0,22-0,11 1,00 0,03-0,28 0,05 0,10 0,16 0,27 0,27 0,16-0,06-0,07 0,03 1,00 0,02 0,11 0,09-0,09 0,02 0,04-0,06-0,01-0,04-0,28 0,02 1,00 0,49 0,05-0,35-0,17-0,09-0,22-0,39-0,28 0,05 0,11 0,49 1,00 0,41-0,37-0,34-0,24-0,26-0,45-0,28 0,10 0,09 0,05 0,41 1,00 101
9 Podobnie jak poprzednio korelacje są nie wyższe niż i zwykle niższe niż. Analogicznie jak w przypadku krwawienia, poziom odcięcia można łatwo zmienić, a wyboru można dokonać na podstawie krzywej ROC. 1,0 0,9 0,8 0,7 Sensitivity 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1-Specificity Rys. 6. Wykres ROC dla zmiany Bladość śluzówki. Wnioski Pokazano, że korzystając z deskryptorów standard MPEG-7 i modeli skoringowych, można w efektywny sposób rozpoznawać różne rodzaje schorzeń wykrywanych podczas bronchoskopii. Otrzymane modele charakteryzują się wysoką czułością i specyficznością, a poziom odcięcia może zostać łatwo zmieniony. Warto zauważyć prostotę modelu skoringowego oraz łatwość i szybkość wyliczania skoringu. W badaniach tylko dwa modele z ośmiu okazały się dość dobre, aby można je było stosować. W pozostałych przypadkach możliwości poprawy były jednak widoczne, zebranie większej liczby przypadków uczących pozwoliłoby znacznie poprawić skuteczność modelowania. Modele te zostaną zrekalibrowane po zebraniu odpowiedniej ilości danych. Literatura 1. Siddiqi N., Credit Risk Scorecards: Developing And Implementing Intelligent Credit Scoring, Wiley&Sons, Bausell R.B., Li Y.-F., Power Analysis for Experimental Research. A Practical Guide for the Biological, Medical and Social Sciences, Cambridge University Press,
10 3. Quinn G.P., Keough M. J., Experimental Design and Data Analysis for Biologists, Cambridge University Press, Maddala G.S., Ekonometria, Wydawnictwo Naukowe PWN, Sobczyk M., Statystyka, wyd. 5 uzupełnione, PWN,
Metody scoringowe w regresji logistycznej
Metody scoringowe w regresji logistycznej Andrzej Surma Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego 19 listopada 2009 AS (MIMUW) Metody scoringowe w regresji logistycznej 19
BUDOWA MODELU SCORINGOWEGO DO E-POŻYCZKI Z WYKORZYSTANIEM NARZĘDZI STATISTICA
BUDOWA MODELU SCORINGOWEGO DO E-POŻYCZKI Z WYKORZYSTANIEM NARZĘDZI STATISTICA Kamila Karnowska i Katarzyna Cioch, SKOK im. Franciszka Stefczyka Wykorzystanie metod scoringowych do oceny punktowej klientów
WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA
WSPOMAGANIE ANALIZY DANYCH ZA POMOCĄ NARZĘDZI STATISTICA Janusz Wątroba i Grzegorz Harańczyk, StatSoft Polska Sp. z o.o. Zakres zastosowań analizy danych w różnych dziedzinach działalności biznesowej i
Scoring kredytowy w pigułce
Analiza danych Data mining Sterowanie jakością Analityka przez Internet Scoring kredytowy w pigułce Mariola Kapla Biuro Informacji Kredytowej S.A. StatSoft Polska Sp. z o.o. ul. Kraszewskiego 36 30-110
WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno
WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:
PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY
PRAKTYCZNY SKORING - NIE TYLKO KREDYTOWY Piotr Wójtowicz, Grzegorz Migut StatSoft Polska Jakie są różnice pomiędzy osobami prawidłowo regulującymi swoje zobowiązania a niechętnie spłacającymi swoje długi,
Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek
Sztuczna Inteligencja w medycynie projekt (instrukcja) Bożena Kostek Cel projektu Celem projektu jest przygotowanie systemu wnioskowania, wykorzystującego wybrane algorytmy sztucznej inteligencji; Nabycie
PRZYKŁAD WYKORZYSTANIA MODELI SKORINGOWYCH W MEDYCYNIE
PRZYKŁAD WYKORZYSTANIA MODELI SKORINGOWYCH W MEDYCYNIE Grzegorz Migut, StatSoft Polska Sp. z o.o. Jednym z szerzej wykorzystywanych typów modeli statystycznych są modele klasyfikacyjne, gdzie modelowana
Zaawansowana eksploracja danych - sprawozdanie nr 1 Rafał Kwiatkowski 89777, Poznań
Zaawansowana eksploracja danych - sprawozdanie nr 1 Rafał Kwiatkowski 89777, Poznań 6.11.1 1 Badanie współzależności atrybutów jakościowych w wielowymiarowych tabelach danych. 1.1 Analiza współzależności
Wprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU
Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów
Statystyka i Analiza Danych
Warsztaty Statystyka i Analiza Danych Gdańsk, 20-22 lutego 2014 Zastosowania wybranych technik regresyjnych do modelowania współzależności zjawisk Janusz Wątroba StatSoft Polska Centrum Zastosowań Matematyki
StatSoft profesjonalny partner w zakresie analizy danych
Analiza danych Data mining Sterowanie jakością Analityka przez Internet StatSoft profesjonalny partner w zakresie analizy danych StatSoft Polska Sp. z o.o. StatSoft Polska Sp. z o.o. ul. Kraszewskiego
Aproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska
Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii Rzadkie stosowanie narzędzi statystycznych Pisma Karla Poppera
DLACZEGO GORSZA METODA JEST CZASEM LEPSZA, CZYLI REGRESJA LOGISTYCZNA W WYKRYWANIU WYŁUDZEŃ ODSZKODOWAŃ
DLACZEGO GORSZA METODA JEST CZASEM LEPSZA, CZYLI REGRESJA LOGISTYCZNA W WYKRYWANIU WYŁUDZEŃ ODSZKODOWAŃ Barbara Leśniarek-Woźniak, TUiR WARTA S.A. Wyłudzenia odszkodowań w sektorze ubezpieczeniowym są
Statystyka I. Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy)
Statystyka I Regresja dla zmiennej jakościowej - wykład dodatkowy (nieobowiązkowy) 1 Zmienne jakościowe qzmienne jakościowe niemierzalne kategorie: np. pracujący / bezrobotny qzmienna binarna Y=0,1 qczasami
Wskaźnik kondycji finansowej kredytobiorcy. Aspekty metodologiczne.
Wskaźnik kondycji finansowej kredytobiorcy. Aspekty metodologiczne. dr Anna Nowak-Czarnocka Zastosowania statystyki i data mining w badaniach naukowych Warszawa, 12 października 2016 Pole badawcze Ryzyko
Analiza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Modelowanie glikemii w procesie insulinoterapii
Dawid Kaliszewski Modelowanie glikemii w procesie insulinoterapii Promotor dr hab. inż. Zenon Gniazdowski Cel pracy Zbudowanie modelu predykcyjnego przyszłych wartości glikemii diabetyka leczonego za pomocą
KREATOR REGRESJI LOGISTYCZNEJ
KREATOR REGRESJI LOGISTYCZNEJ Grzegorz Migut, StatSoft Polska Sp. z o.o. W niniejszym opracowaniu zaprezentowany zostanie przykład budowy modelu regresji logistycznej za pomocą Kreatora Regresji Logistycznej.
MODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
Odzyskać pożyczone. Przyjrzyjmy się praktycznym aspektom modelowania ryzyka kredytowego. Grzegorz Migut StatSoft Polska sp. z o.o., Dział Konsultingu
Autorzy Jadwiga Żarna Can-Pack SA, Dział Zarządzania Ryzykiem Grzegorz Migut StatSoft Polska sp. z o.o., Dział Konsultingu Ilustracja Maciej Grzesiak 53 Odzyskać pożyczone Przyjrzyjmy się praktycznym aspektom
ALGORYTMY SZTUCZNEJ INTELIGENCJI
ALGORYTMY SZTUCZNEJ INTELIGENCJI Sieci neuronowe 06.12.2014 Krzysztof Salamon 1 Wstęp Sprawozdanie to dotyczy ćwiczeń z zakresu sieci neuronowych realizowanym na przedmiocie: Algorytmy Sztucznej Inteligencji.
Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna
Regresja wieloraka Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna zmienna niezależna (można zobrazować
Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Widzenie komputerowe (computer vision)
Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja
Optymalizacja Automatycznych Testów Regresywnych
Optymalizacja Automatycznych Testów Regresywnych W Organizacji Transformującej do Agile Adam Marciszewski adam.marciszewski@tieto.com Agenda Kontekst projektu Typowe podejście Wyzwania Cel Założenia Opis
Regresja linearyzowalna
1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:
Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy
Rozpoznawanie obrazów na przykładzie rozpoznawania twarzy Wykorzystane materiały: Zadanie W dalszej części prezentacji będzie omawiane zagadnienie rozpoznawania twarzy Problem ten można jednak uogólnić
Sposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA
METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji
Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji Michał Witczak Data Mining 20 maja 2012 r. 1. Wstęp Dostarczone zostały nam 4 pliki, z których dwa stanowiły zbiory uczące
Analiza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Wykład 4: Statystyki opisowe (część 1)
Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można
Wykład 5: Statystyki opisowe (część 2)
Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz
Metody Prognozowania
Wprowadzenie Ewa Bielińska 3 października 2007 Plan 1 Wprowadzenie Czym jest prognozowanie Historia 2 Ciągi czasowe Postępowanie prognostyczne i prognozowanie Predykcja długo- i krótko-terminowa Rodzaje
Analiza głównych składowych- redukcja wymiaru, wykł. 12
Analiza głównych składowych- redukcja wymiaru, wykł. 12 Joanna Jędrzejowicz Instytut Informatyki Konieczność redukcji wymiaru w eksploracji danych bazy danych spotykane w zadaniach eksploracji danych mają
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 5 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
Inteligentna analiza danych
Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki
Przykład eksploracji danych o naturze statystycznej Próba 1 wartości zmiennej losowej odległość
Dwie metody Klasyczna metoda histogramu jako narzędzie do postawienia hipotezy, jaki rozkład prawdopodobieństwa pasuje do danych Indukcja drzewa decyzyjnego jako metoda wykrycia klasyfikatora ukrytego
Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817
Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres
Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki
Analiza czynnikowa Kolejna z analiz wielozmiennowych Jej celem jest eksploracja danych, poszukiwanie pewnych struktur, które mogą utworzyć wskaźniki Budowa wskaźnika Indeks był banalny I miał wady: o Czy
MODELE SKORINGOWE W BIZNESIE I NAUCE
MODELE SKORINGOWE W BIZNESIE I NAUCE Grzegorz Migut, StatSoft Polska Sp. z o.o. Jednym z szerzej wykorzystywanych typów modeli statystycznych są modele klasyfikacyjne, gdzie modelowana zmienna zależna
PLAN SZKOLEŃ Femap. Nasza oferta: Solid Edge najefektywniejszy dostępny obecnie na rynku system CAD klasy mid-range,
PLAN SZKOLEŃ Femap PLAN SZKOLEŃ Femap Firma GM System Integracja Systemów Inżynierskich Sp. z o.o. została założona w 2001 roku. Zajmujemy się dostarczaniem systemów CAD/CAM/CAE/PDM. Jesteśmy jednym z
Przedmiot statystyki. Graficzne przedstawienie danych.
Przedmiot statystyki. Graficzne przedstawienie danych. dr Mariusz Grządziel 23 lutego 2009 Przedmiot statystyki Statystyka dzieli się na trzy części: -zbieranie danych; -opracowanie i kondensacja danych
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ. Analiza regresji i korelacji
Statystyka i opracowanie danych Ćwiczenia 5 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ MODEL REGRESJI WIELORAKIEJ MODEL REGRESJI LINIOWEJ Analiza regresji
Przetwarzanie obrazu
Przetwarzanie obrazu Przegląd z uwzględnieniem obrazowej bazy danych Tatiana Jaworska Jaworska@ibspan.waw.pl www.ibspan.waw.pl/~jaworska Umiejscowienie przetwarzania obrazu Plan prezentacji Pojęcia podstawowe
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 8 Regresja wielokrotna Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X 1, X 2, X 3,...) na zmienną zależną (Y).
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ
REGRESJA I KORELACJA MODEL REGRESJI LINIOWEJ Korelacja oznacza fakt współzależności zmiennych, czyli istnienie powiązania pomiędzy nimi. Siłę i kierunek powiązania określa się za pomocą współczynnika korelacji
ALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
Estymacja parametrów w modelu normalnym
Estymacja parametrów w modelu normalnym dr Mariusz Grządziel 6 kwietnia 2009 Model normalny Przez model normalny będziemy rozumieć rodzine rozkładów normalnych N(µ, σ), µ R, σ > 0. Z Centralnego Twierdzenia
Metody probabilistyczne
Metody probabilistyczne 13. Elementy statystki matematycznej I Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 17.01.2019 1 / 30 Zagadnienia statystki Przeprowadzamy
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
SKORING JAKO NARZĘDZIE WSPIERAJĄCE SPÓŁDZIELCZE KASY OSZCZĘDNOŚCIOWO-KREDYTOWE W SPEŁNIENIU NOWYCH WYMAGAŃ NADZORCZYCH
SKORING JAKO NARZĘDZIE WSPIERAJĄCE SPÓŁDZIELCZE KASY OSZCZĘDNOŚCIOWO-KREDYTOWE W SPEŁNIENIU NOWYCH WYMAGAŃ NADZORCZYCH Katarzyna Cioch, Towarzystwo Zarządzające SKOK Sp. z o.o. SKA Spółdzielcze kasy oszczędnościowo
W1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07. Przedmiot statystyki
Przedmiot statystyki. Graficzne przedstawienie danych. Wykład-26.02.07 Statystyka dzieli się na trzy części: Przedmiot statystyki -zbieranie danych; -opracowanie i kondensacja danych (analiza danych);
Wprowadzenie do analizy dyskryminacyjnej
Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela
Skalowalność obliczeń równoległych. Krzysztof Banaś Obliczenia Wysokiej Wydajności 1
Skalowalność obliczeń równoległych Krzysztof Banaś Obliczenia Wysokiej Wydajności 1 Skalowalność Przy rozważaniu wydajności przetwarzania (obliczeń, komunikacji itp.) często pojawia się pojęcie skalowalności
Metody Ilościowe w Socjologii
Metody Ilościowe w Socjologii wykład 2 i 3 EKONOMETRIA dr inż. Maciej Wolny AGENDA I. Ekonometria podstawowe definicje II. Etapy budowy modelu ekonometrycznego III. Wybrane metody doboru zmiennych do modelu
Regresja i Korelacja
Regresja i Korelacja Regresja i Korelacja W przyrodzie często obserwujemy związek między kilkoma cechami, np.: drzewa grubsze są z reguły wyższe, drewno iglaste o węższych słojach ma większą gęstość, impregnowane
Niepewności pomiarów
Niepewności pomiarów Międzynarodowa Organizacja Normalizacyjna (ISO) w roku 1995 opublikowała normy dotyczące terminologii i sposobu określania niepewności pomiarów [1]. W roku 1999 normy zostały opublikowane
2
1 2 3 4 5 Dużo pisze się i słyszy o projektach wdrożeń systemów zarządzania wiedzą, które nie przyniosły oczekiwanych rezultatów, bo mało kto korzystał z tych systemów. Technologia nie jest bowiem lekarstwem
Przetwarzanie obrazów rastrowych macierzą konwolucji
Przetwarzanie obrazów rastrowych macierzą konwolucji 1 Wstęp Obrazy rastrowe są na ogół reprezentowane w dwuwymiarowych tablicach złożonych z pikseli, reprezentowanych przez liczby określające ich jasność
Wojciech Skwirz
1 Regularyzacja jako metoda doboru zmiennych objaśniających do modelu statystycznego. 2 Plan prezentacji 1. Wstęp 2. Część teoretyczna - Algorytm podziału i ograniczeń - Regularyzacja 3. Opis wyników badania
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 7 Analiza korelacji - współczynnik korelacji Pearsona Cel: ocena współzależności między dwiema zmiennymi ilościowymi Ocenia jedynie zależność liniową. r = cov(x,y
WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH:
WYKRESY SPORZĄDZANE W UKŁADZIE WSPÓŁRZĘDNYCH: Zasada podstawowa: Wykorzystujemy możliwie najmniej skomplikowaną formę wykresu, jeżeli to możliwe unikamy wykresów 3D (zaciemnianie treści), uwaga na kolory
SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk
SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY Autorzy: M. Lewicka, K. Stańczyk Kraków 2008 Cel pracy projekt i implementacja systemu rozpoznawania twarzy, który na podstawie
Krótki kurs data mining. StatSoft Polska, Kraszewskiego 36, Kraków, tel
Krótki kurs data mining StatSoft Polska, Kraszewskiego 36, 30-110 Kraków, www.statsoft.pl, tel. 12 4284300. e-mail:info@statsoft.pl Informacje ogólne Co to jest data mining Wykorzystywane modele Metodyka
DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE:
DOKUMENT INFORMACYJNY COMARCH BUSINESS INTELLIGENCE: DATAMINING 1 S t r o n a WSTĘP Czyli jak zastąpić wróżenie z fusów i przysłowiowego nosa, statystyką i modelami ekonometrycznymi. Niniejszy dokument,
Współliniowość zmiennych objaśniających: test Walda i test Studenta w badaniu istotności zmiennych objaśniających - przykłady.
Współliniowość zmiennych objaśniających: test Walda i test Studenta w badaniu istotności zmiennych objaśniających - przykłady. Przykład: Test Walda a test Studenta w badaniu istotności zmiennych objaśniających.
Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład II 2017/2018
Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład II bogumil.konopka@pwr.edu.pl 2017/2018 Określenie rzeczywistej dokładności modelu Zbiór treningowym vs zbiór testowy Zbiór treningowy
Analiza regresji - weryfikacja założeń
Medycyna Praktyczna - portal dla lekarzy Analiza regresji - weryfikacja założeń mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie (Kierownik Zakładu: prof.
Zmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
STATISTICA DECISIONING PLATFORM, CZYLI JAK PODEJMOWAĆ DECYZJE W EPOCE BIG DATA
STATISTICA DECISIONING PLATFORM, CZYLI JAK PODEJMOWAĆ DECYZJE W EPOCE BIG DATA Mirosław Popieluch, StatSoft Polska Sp. z o.o. Gromadzenie coraz większych ilości danych w każdej dziedzinie życia i gospodarki
Systemy pomiarowo-diagnostyczne. Metody uczenia maszynowego wykład III 2016/2017
Systemy pomiarowo-diagnostyczne Metody uczenia maszynowego wykład III bogumil.konopka@pwr.edu.pl 2016/2017 Wykład III - plan Regresja logistyczna Ocena skuteczności klasyfikacji Macierze pomyłek Krzywe
Praktyczne aspekty stosowania metody punktów funkcyjnych COSMIC. Jarosław Świerczek
Praktyczne aspekty stosowania metody punktów funkcyjnych COSMIC Jarosław Świerczek Punkty funkcyjne Punkt funkcyjny to metryka złożoności oprogramowania wyznaczana w oparciu o określające to oprogramowanie
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów re
Wykład 4 Wybór najlepszej procedury. Estymacja parametrów regresji z wykorzystaniem metody bootstrap. Wrocław, 22.03.2017r Wybór najlepszej procedury - podsumowanie Co nas interesuje przed przeprowadzeniem
WYKORZYSTANIE SKORINGU DO PRZEWIDYWANIA WYŁUDZEŃ KREDYTÓW W INVEST-BANKU
WYKORZYSTANIE SKORINGU DO PRZEWIDYWANIA WYŁUDZEŃ KREDYTÓW W INVEST-BANKU Bartosz Wójcicki Naczelnik Wydziału Analiz i Prewencji Przestępstw, Invest-Bank S.A. Grzegorz Migut StatSoft Polska Sp. z o.o. Problem
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych Hipoteza Test statystyczny Poziom istotności Testy jednostronne i dwustronne Testowanie równości wariancji test F-Fishera Testowanie równości wartości średnich test t-studenta
RAPORT Z POLSKIEGO BADANIA PROJEKTÓW IT 2010
RAPORT Z POLSKIEGO BADANIA PROJEKTÓW IT 2010 Odpowiada na pytania: Jaka część projektów IT kończy się w Polsce sukcesem? Jak wiele projektów sponsorowanych jest przez instytucje publiczne? Czy kończą się
Kilka uwag o testowaniu istotności współczynnika korelacji
341 Zeszyty Naukowe Wyższej Szkoły Bankowej we Wrocławiu Nr 20/2011 Piotr Peternek Uniwersytet Ekonomiczny we Wrocławiu Marek Kośny Uniwersytet Ekonomiczny we Wrocławiu Kilka uwag o testowaniu istotności
WYMAGANIE EDUKACYJNE Z MATEMATYKI W KLASIE II GIMNAZJUM. dopuszczającą dostateczną dobrą bardzo dobrą celującą
1. Statystyka odczytać informacje z tabeli odczytać informacje z diagramu 2. Mnożenie i dzielenie potęg o tych samych podstawach 3. Mnożenie i dzielenie potęg o tych samych wykładnikach 4. Potęga o wykładniku
Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA
Opis zakładanych efektów kształcenia na studiach podyplomowych Nazwa studiów: BIOSTATYSTYKA PRAKTYCZNE ASPEKTY STATYSTYKI W BADANIACH MEDYCZNYCH Typ studiów: doskonalące Symbol Efekty kształcenia dla studiów
Priorytetyzacja przypadków testowych za pomocą macierzy
Priorytetyzacja przypadków testowych za pomocą macierzy W niniejszym artykule przedstawiony został problem przyporządkowania priorytetów do przypadków testowych przed rozpoczęciem testów oprogramowania.
Karta (sylabus) modułu/przedmiotu Inżynieria Materiałowa Studia II stopnia Specjalność: Inżynieria Powierzchni
Karta (sylabus) modułu/przedmiotu Inżynieria Materiałowa Studia II stopnia Specjalność: Inżynieria Powierzchni Przedmiot: Statystyczne Sterowanie Procesami Rodzaj przedmiotu: Obowiązkowy Kod przedmiotu:
Analiza przeżycia. Czym zajmuje się analiza przeżycia?
ANALIZA PRZEŻYCIA Analiza przeżycia Czym zajmuje się analiza przeżycia? http://www.analyticsvidhya.com/blog/2014/04/survival-analysis-model-you/ Analiza przeżycia Jest to inaczej analiza czasu trwania
Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych (X1, X2, X3,...) na zmienną zależną (Y).
Statystyka i opracowanie danych Ćwiczenia 12 Izabela Olejarczyk - Wożeńska AGH, WIMiIP, KISIM REGRESJA WIELORAKA Regresja wielokrotna jest metodą statystyczną, w której oceniamy wpływ wielu zmiennych niezależnych
ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ.
ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ. LICZBA TEMAT GODZIN LEKCYJNYCH Potęgi, pierwiastki i logarytmy (8 h) Potęgi 3 Pierwiastki 3 Potęgi o wykładnikach
istocie dziedzina zajmująca się poszukiwaniem zależności na podstawie prowadzenia doświadczeń jest o wiele starsza: tak na przykład matematycy
MODEL REGRESJI LINIOWEJ. METODA NAJMNIEJSZYCH KWADRATÓW Analiza regresji zajmuje się badaniem zależności pomiędzy interesującymi nas wielkościami (zmiennymi), mające na celu konstrukcję modelu, który dobrze
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej
7. Estymacja parametrów w modelu normalnym(14.04.2008) Pojęcie losowej próby prostej Definicja 1 n-elementowa losowa próba prosta nazywamy ciag n niezależnych zmiennych losowych o jednakowych rozkładach
SAS wybrane elementy. DATA MINING Część III. Seweryn Kowalski 2006
SAS wybrane elementy DATA MINING Część III Seweryn Kowalski 2006 Algorytmy eksploracji danych Algorytm eksploracji danych jest dobrze zdefiniowaną procedurą, która na wejściu otrzymuje dane, a na wyjściu
WYKORZYSTANIE SKORINGU MARKETINGOWEGO DO OPTYMALIZACJI KAMPANII SPRZEDAŻOWYCH
WYKORZYSTANIE SKORINGU MARKETINGOWEGO DO OPTYMALIZACJI KAMPANII SPRZEDAŻOWYCH Grzegorz Migut, StatSoft Polska Sp. z o.o. Znajomość wzorców zachowania klientów oraz czynników, jakie na nie wpływają, jest
Stochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych
PROJEKT: Analiza kluczowych parametrów turbin wiatrowych Projekt jest wykonywany z wykorzystaniem pakietu statystycznego STATISTICA. Praca odbywa się w grupach 2-3 osobowych. Aby zaliczyć projekt, należy
Państwowa Wyższa Szkoła Zawodowa w Suwałkach SYLLABUS na rok akademicki 2014/2015
Tryb studiów Niestacjonarne Nazwa kierunku studiów Finanse i Rachunkowość Poziom studiów Stopień pierwszy Rok studiów/ semestr II/4 Państwowa Wyższa Szkoła Zawodowa w Suwałkach SYLLABUS na rok akademicki