ZAAWANSOWANE METODY ANALIZ STATYSTYCZNYCH red. Ewa Frątczak



Podobne dokumenty
Spis treści. Przedmowa Monika Książek Rozdział I Analiza danych jakościowych... 25

Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski

PODYPLOMOWE STUDIA ZAAWANSOWANE METODY ANALIZY DANYCH I DATA MINING W BIZNESIE

4.1. Wprowadzenie Podstawowe definicje Algorytm określania wartości parametrów w regresji logistycznej...74

SZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie

Spis treści 3 SPIS TREŚCI

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Szkolenia SAS Cennik i kalendarz 2017

Opis zakładanych efektów kształcenia na studiach podyplomowych WIEDZA

Statystyka w zarzadzaniu / Amir D. Aczel, Jayavel Sounderpandian. Wydanie 2. Warszawa, Spis treści

Metody Ilościowe w Socjologii

SPIS TEŚCI CZĘŚĆ I RACHUNEK PRAWDOPODOBIEŃSTWA

Wprowadzenie do teorii ekonometrii. Wykład 1 Warunkowa wartość oczekiwana i odwzorowanie liniowe

Statystyka opisowa. Wykład V. Regresja liniowa wieloraka

Importowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22

REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój

Zaawansowane metody analiz statystycznych

SPIS TREŚCI. Do Czytelnika... 7

Cena netto (PLN) IV kwartał. Cena netto (PLN) Podstawy SAS INTRO

Przedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.

PRZEWODNIK PO PRZEDMIOCIE

L.p Nazwa przedmiotu Kod przedmiotu Osoba(y) prowadząca(e) WDP PDP WIR DAW BDZ

Własności statystyczne regresji liniowej. Wykład 4

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Podstawy statystyki dla psychologów. Podręcznik akademicki. Wydanie drugie poprawione. Wiesław Szymczak

Eksperyment jako metoda badawcza

Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 16 zaliczenie z oceną

Wstęp do rachunku prawdopodobieństwa. Cz. 1 / William Feller. wyd. 6, dodr. 4. Warszawa, Spis treści

NOWY PROGRAM STUDIÓW 2016/2017 SYLABUS PRZEDMIOTU AUTORSKIEGO: Wprowadzenie do teorii ekonometrii. Część A

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WYDZIAŁ BUDOWNICTWA LĄDOWEGO I WODNEGO

Zakup oprogramowania SAS

Statystyka w zarządzaniu : pełny wykład / Amir D. Aczel. wyd. 1, dodr. 5. Warszawa; Spis treści

Analiza współzależności zjawisk. dr Marta Kuc-Czarnecka

weryfikacja hipotez dotyczących parametrów populacji (średnia, wariancja) założenie: znany rozkład populacji (wykorzystuje się dystrybuantę)

R dla każdego : zaawansowane analizy i grafika statystyczna / Jared P. Lander. Warszawa, Spis treści

Statystyka SYLABUS A. Informacje ogólne

Państwowa Wyższa Szkoła Zawodowa w Suwałkach SYLLABUS na rok akademicki 2014/2015

Sylabus do programu kształcenia obowiązującego od roku akademickiego 2014/15

Zadanie 1 Zakładając liniową relację między wydatkami na obuwie a dochodem oszacować MNK parametry modelu: y t. X 1 t. Tabela 1.

3. Modele tendencji czasowej w prognozowaniu

MODELOWANIE POLSKIEJ GOSPODARKI Z PAKIETEM R Michał Rubaszek

KARTA KURSU. Kod Punktacja ECTS* 1

RACHUNEK PRAWDOPODOBIE STWA

Karta (sylabus) modułu/przedmiotu Inżynieria Materiałowa Studia II stopnia Specjalność: Inżynieria Powierzchni

Narzędzia statystyczne i ekonometryczne. Wykład 1. dr Paweł Baranowski

KILKA UWAG DO ANALZY ROZKŁADU PRAWDOPODOBIEŃSTWA INFORMACJI RYNKOWYCH **

Algorytmy i bazy danych (wykład obowiązkowy dla wszystkich)

Systemy Wspomagania Decyzji

Liczba godzin Punkty ECTS Sposób zaliczenia. ćwiczenia 30 zaliczenie z oceną

Wstęp do rachunku prawdopodobieństwa. Cz. 2 / William Feller. wyd. 4, dodr. 3. Warszawa, Spis treści

Analiza danych. TEMATYKA PRZEDMIOTU

ZAKRES TEMATYCZNY EGZAMINU LICENCJACKIEGO

Wydział Matematyki. Testy zgodności. Wykład 03

Rozpoznawanie obrazów

Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak

Statystyka matematyczna i ekonometria

Metody systemowe i decyzyjne w informatyce

Zakup oprogramowania SAS CIS-10/2014 ZAŁĄCZNIK NR 1 DO SIWZ. str. 1. Załącznik nr 1 do SIWZ

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Ekonometria. Modelowanie zmiennej jakościowej. Jakub Mućk. Katedra Ekonomii Ilościowej

Recenzenci Stefan Mynarski, Waldemar Tarczyński. Redaktor Wydawnictwa Anna Grzybowska. Redaktor techniczny Barbara Łopusiewicz. Korektor Barbara Cibis

Analiza statystyczna. Microsoft Excel 2010 PL.

Uczelnia Łazarskiego Wydział Medyczny Kierunek Lekarski

WERYFIKACJA MODELI MODELE LINIOWE. Biomatematyka wykład 8 Dr Wioleta Drobik-Czwarno

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI

Metody systemowe i decyzyjne w informatyce

Modele DSGE. Jerzy Mycielski. Maj Jerzy Mycielski () Modele DSGE Maj / 11

Statystyka matematyczna I Teoria podejmowania decyzji

studia stacjonarne w/ćw zajęcia zorganizowane: 30/15 3,0 praca własna studenta: 55 Godziny kontaktowe z nauczycielem akademickim: udział w wykładach

Mikroekonometria 6. Mikołaj Czajkowski Wiktor Budziński

METODY STATYSTYCZNE W BIOLOGII

Stanisław Cichocki. Natalia Nehrebecka

Inżynieria Środowiska. II stopień ogólnoakademicki. przedmiot podstawowy obowiązkowy polski drugi. semestr zimowy

Stanisław Cichocki. Natalia Nehrebecka

STUDIA I MONOGRAFIE NR

Weryfikacja hipotez statystycznych za pomocą testów statystycznych

Data wydruku: Dla rocznika: 2015/2016. Opis przedmiotu

Regresja wieloraka Ogólny problem obliczeniowy: dopasowanie linii prostej do zbioru punktów. Najprostszy przypadek - jedna zmienna zależna i jedna

Korelacja krzywoliniowa i współzależność cech niemierzalnych

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

EKONOMIA STUDIA DRUGIEGO STOPNIA. Przedmiot: Analiza finansowa/analiza finansowa przedsiębiorstwa

Rachunek prawdopodobieństwa WZ-ST1-AG--16/17Z-RACH. Liczba godzin stacjonarne: Wykłady: 15 Ćwiczenia: 30. niestacjonarne: Wykłady: 9 Ćwiczenia: 18

Quick Launch Manual:

Automatyczne rozpoznawanie mowy - wybrane zagadnienia / Ryszard Makowski. Wrocław, Spis treści

Zastosowanie symulacji Monte Carlo do zarządzania ryzykiem przedsięwzięcia z wykorzystaniem metod sieciowych PERT i CPM

Etapy modelowania ekonometrycznego

Wykład Ćwiczenia Laboratorium Projekt Seminarium 30

Inżynieria danych I stopień Praktyczny Studia stacjonarne Wszystkie specjalności Katedra Ekonomii i Finansów Dr Katarzyna Brzozowska-Rup

KARTA PRZEDMIOTU. 12. PRZEDMIOTOWE EFEKTY KSZTAŁCENIA Odniesienie do kierunkowych efektów kształcenia (symbol)

Temat: BADANIE NIEZALEśNOŚCI DWÓCH CECH JAKOŚCIOWYCH TEST CHI KWADRAT. Anna Rajfura 1

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Stanisław Cichocki. Natalia Nehrebecka

Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska. Anna Stankiewicz Izabela Słomska

12. Przynależność do grupy przedmiotów: Blok przedmiotów matematycznych

Część 2. Teoretyczne i praktyczne aspekty wybranych metod analiz ilościowych w ekonomii i zarządzaniu

Transkrypt:

Tytuł: Autor: ZAAWANSOWANE METODY ANALIZ STATYSTYCZNYCH red. Ewa Frątczak Wstęp Zaawansowane metody analiz statystycznych przenoszą analizy statystyczne na kolejny wyższy poziom. Określenie tego wyższego poziomu pozostawiamy indywidualnie każdemu Czytelnikowi. Wśród wielu prezentowanych metod i modeli w tym podręczniku są przedstawione modele mieszane - przegląd ogólny ich teorii i przykłady aplikacji. Autor cytowanego podręcznika E. Demidenko mówi o modelach mieszanych następująco: Mixed model methodology brings statistics to the next level. Każdy z autorów poszczególnych rozdziałów (biogramy znajdują się w końcowej części podręcznika) ma za sobą doświadczenia praktyczne związane z uczestnictwem w projekcie/projektach, gdzie metody i wiedza teoretyczna były i są weryfikowane w praktyce; są to z reguły projekty w instytucjach bankowych, ubezpieczeniowych, telekomunikacyjnych, resortach państwowych - urzędach centralnych, ministerstwach. Żeby nie wymieniać wszystkich projektów, wspomnę o jednym z nich, z którym związani są statystycy i demografowie - mianowicie Narodowym Spisie Powszechnym 2011, który realizowany był odmiennie od dotychczasowych spisów i był oparty na nowych technologiach pozyskiwania informacji. W pozyskiwaniu tych informacji wykorzystano liczne dostępne rejestry, w których zagadnienie jakości danych (data quality) było niezwykle ważne. Podręcznik składa się z siedmiu rozdziałów prezentujących różne metody i techniki analityczne. Każdy z rozdziałów stanowi odrębną całość. Struktura każdego z rozdziałów pomyślana została tak, że najpierw przedstawiona jest część teoretyczna - opis metody, modeli, kolejno estymacja i weryfikacja, a po opisie teoretycznym przedstawiane są wybrane przykłady zastosowań. Cechą wspólną wszystkich rozdziałów jest to, że zamieszczone w książce przykłady empiryczne (analityczne) przedstawione są w Systemie SAS, który jest zdaniem autorów jedną z najlepszych platform analitycznych z doskonałą dokumentacją naukową i dobrze sprawdzonymi produktami. SAS jest liderem w branży oprogramowania i narzędzi analitycznych dla zaawansowanych analiz biznesowych, ponadto jest największym dostawcą na rynku business intelligence. Więcej na temat możliwości SAS Czytelnik znajdzie na stronach: http://www.sas.com/ oraz http://www.sas.com/offices/europe/poland/. Kolejne rozdziały podręcznika przedstawiają następujące zagadnienia: Rozdział I. Analiza zmiennych jakościowych Rozdział II. Analiza klas ukrytych Rozdział III. Modele mieszane Rozdział IV. Wybrane zagadnienia estymacji bayesowskiej Rozdział V. Data Mining

Rozdział VI. Jakość danych Na końcu publikacji Czytelnik znajdzie streszczenie kolejnych rozdziałów w wersji polskiej i angielskiej oraz biogramy autorów poszczególnych rozdziałów. Spis treści PRZEDMOWA ROZDZIAŁ I. ANALIZA DANYCH JAKOŚCIOWYCH (Monika Książek) I. Teoria I.1. Wprowadzenie I.2. Jednowymiarowa analiza zmiennych jakościowych I.3. Analiza zależności zmiennych jakościowych I.3.1.Test równości proporcji I.3.2. Miary zależności I.3.3. Testy niezależności I.3.4. Testy i mierniki dla zmiennych porządkowych I.3.5. Analiza zależności dwóch zmiennych jakościowych w warstwach wyznaczanych przez inne zmienne jakościowe I.4. Modele log-liniowe I.5. Zmienne jakościowe jako zmienne objaśniające I.5.1. Kodowanie zmiennych jakościowych I.5.2. Problemy związane z obecnością zmiennych jakościowych w modelu I.5.3. Interakcje zmiennych jakościowych I.5.4. Korzyści ze zmiany skali pomiaru zmiennych I.6. Zmienne jakościowe jako zmienne objaśniane I.6.1. Uogólnione modele liniowe dla zmiennych jakościowych I.6.2. Interpretacja parametrów I.6.3. Badanie istotności statystycznej parametrów

I.6.4. Ocena jakości dopasowania modelu II. Przykłady II.1. Analiza jednowymiarowa II.2. Analiza tabeli 2 2 II.3. Analiza tabeli 2 2 w podgrupach II.4. Model log-liniowy II.5. Kodowanie II.6. Binarna regresja logistyczna II.7. Wielomianowa i porządkowa regresja logistyczna II.8. Uwzględnianie wpływów nieliniowych II.9. Interakcje ROZDZIAŁ II. ANALIZA ZMIENNYCH UKRYTYCH (Iga Sikorska) I. Model klas ukrytych (LCA) I.1. Wprowadzenie I.2. Zapis modelu I.2.1. Założenia modelu klas ukrytych I.2.2. Parametry modelu klas ukrytych I.3. Estymacja modelu klas ukrytych I.3.1. Estymacja parametrów w SAS I.4. Weryfikacja modelu klas ukrytych I.4.1. Braki danych I.4.2. Ograniczenia nakładane na parametry I.4.3. Liczba klas ukrytych I.4.4. Interpretacja klas ukrytych

I.4.5. Homogeniczność i rozróżnialność modeli klas ukrytych I.5. Zmienne grupujące w modelu klas ukrytych I.6. Zmienne kontrolne w modelu klas ukrytych I.6.1. Weryfikacja modelu ze zmiennymi kontrolnymi I.7. Procedury LCA i LTA I.8. Przykład modelu klas ukrytych II. Model stanów ukrytych (LTA) II.1. Wprowadzenie II.2. Zapis modelu II.3. Estymacja i weryfikacja modelu stanów ukrytych II.3.1. Braki danych II.3.2. Ograniczenia nakładane na parametry II.4. Zmienne grupujące w modelu stanów ukrytych II.5. Zmienne kontrolne w modelu stanów ukrytych II.6. Przykład modelu stanów ukrytych ROZDZIAŁ III. MODELE MIESZANE (Ewa Frątczak, Małgorzata Mianowska) I. Podstawy teoretyczne I.1. Liniowy model mieszany I.1.1. Wprowadzenie I.1.2. Zapis liniowego modelu mieszanego I.1.3. PROC GLM i PROC MIXED I.1.4. PROC HPMIXED I.1.5. Diagnostyka i strategie budowy modelu I.2. Uogólniony model mieszany

I.2.1. Wprowadzenie I.2.2. Zapis uogólnionego liniowego modelu mieszanego I.2.3. Procedura GLIMMIX i metody estymacji I.3. Nieliniowy model mieszany I.3.1. Wprowadzenie I.3.2. Zapis nieliniowego modelu mieszanego I.3.3. Procedura NLMIXED i metoda estymacji I.4. Podsumowanie II. Przykłady estymacji modeli mieszanych Wprowadzenie II.1. Przykład 1 - model liniowy i liniowy model mieszany II.2. Przykład 2 - liniowy model mieszany z interakcją II.3. Przykład 3 - model hierarchiczny II.4. Przykład 4 - uogólniony liniowy model mieszany i model nieliniowy II.5. Przykład 5 - estymacja modelu mieszanego w Enterprise Guide Załącznik 1. Teoria liniowych modeli mieszanych 1. Wprowadzenie 2. Zapis macierzowy 3. Określenie postaci modeli mieszanych 3.1. Ogólna postać liniowego modelu mieszanego 3.2. Rozkłady warunkowe i brzegowe 3.3. Przykład: Krzywa wzrostu z symetryczną strukturą kowariancji 3.4. Przykład: Układ podzielonych poletek (Split-Plot Design) 4. Estymacja parametrów, predykcja efektów losowych

4.1. Estymacja beta i prognoza u: równania modelu mieszanego 4.2. Efekty losowe, grzbietowe oraz kurczenie 4.3. Wszystko o metodzie SWEEP 4.4. Największa wiarygodność i ograniczona największa wiarygodność dla parametrów kowariancji 5. Własności statystyczne 6. Wybór postaci modelu 6.1. Porównania modeli z wykorzystaniem testów ilorazu wiarygodności 6.2. Porównania modeli z wykorzystaniem kryteriów informacyjnych 7. Wnioskowanie i statystyki testujące 7.1. Wnioskowanie o parametrach kowariancji 7.2. Wnioskowanie o efektach stałych i losowych 8. Prace cytowane w załączniku ROZDZIAŁ IV. WYBRANE ZAGADNIENIA ESTYMACJI BAYESOWSKIEJ (Wioletta Grzenda) I. Elementy teorii statystyki bayesowskiej I.1. Metody bayesowskie I.1.1. Twierdzenie Bayesa I.1.2. Rozkłady a priori I.1.3. Wnioskowanie bayesowskie I.1.4. Uwagi ogólne dotyczące metod bayesowskich I.2. Metody Monte Carlo oparte na łańcuchach Markowa I.2.1. Wybrane własności łańcuchów Markowa I.2.2. Algorytm Metropolisa i algorytm Metropolisa-Hastingsa I.2.3. Próbnik Gibbsa I.2.4. Algorytm próbkowania adaptacyjnego z odrzucaniem

I.2.5. Zagadnienia dotyczące wyboru realizacji łańcucha Markowa I.2.6. Ocena zbieżności łańcuchów Markowa I.2.7. Testy zbieżności łańcuchów Markowa II. Przykłady zastosowań II.1. Materiał empiryczny II.2. Model regresji Poissona w ujęciu bayesowskim II.3. Bayesowska estymacja uogólnionych modeli liniowych w systemie SAS II.4. Przykłady bayesowskiej estymacji modeli regresji Poissona II.4.1.Model Poissona z nieinformacyjnymi rozkładami normalnymi a priori II.4.2. Model Poissona z informacyjnym rozkładem normalnym a priori i nieinformacyjnymi rozkładami normalnymi a priori ROZDZIAŁ V. DATA MINING (Kamil Konikiewicz) 1. Wprowadzenie do aplikacji SAS Enterprise Miner 2. Opis danych 3. Podział danych 4. Eksploracja danych 5. Drzewa decyzyjne 5.1. Postać modelu 5.2. Budowa modelu 5.3. Dobór zmiennych i przygotowanie danych 5.4. Lasy losowe 6. Regresja logistyczna 6.1. Postać modelu 6.2. Przygotowanie danych 7. Sieci neuronowe MLP

7.1. Postać modelu 7.2. Uczenie sieci 8. Ocena i wybór modelu 8.1. Statystyki dopasowania 8.2. Przepróbkowanie 8.3. Scoring ROZDZIAŁ VI. WYBRANE ZAGADNIENIA JAKOŚCI DANYCH (Ewa Falkiewicz- Szporer, Łukasz Leszewski) I. Podstawowe pojęcia I.1. Cechy dobrej jakości danych I.2. Źródła złej jakości danych I.3. Etapy tworzenia i transformacji informacji II. Metodologia zarządzania jakością danych III. Filary zarządzania jakością danych III.1. Tworzenie otoczenia sprzyjającego jakości danych III.2. Rozwiązania organizacyjne III.3. Zapewnienie standardów w organizacji III.4. Monitorowanie i mierzenie jakości danych III.5. Rola hurtowni danych III.6. Technologia i narzędzia IV. Etapy procesu czyszczenia danych IV.1. Profilowanie IV.2. Czyszczenie danych IV.3. Integracja danych IV.4. Wzbogacanie danych

IV.5. Monitorowanie danych V. Narzędzia i techniki jakości danych V.1. DataFlux dfpower Studio V.2. DataFlux Integration Server V.3. SAS Data Integration Studio VI. Standaryzacja danych VI.1. Tworzenie schematów standaryzacyjnych VI.2. Definicje standaryzacyjne VII. Przykład zastosowania - implementacja procesów czyszczenia danych VII.1. Profilowanie VII.2. Standaryzacja VII.3. Integracja danych VIII. Podsumowanie STRESZCZENIA - ABSTRACTCS BIOGRAMY - BIOGRAMS