O czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich
|
|
- Feliks Janowski
- 5 lat temu
- Przeglądów:
Transkrypt
1 O czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich mgr Aleksander Nosarzewski Szkoła Główna Handlowa w Warszawie pod kierunkiem naukowym dr hab. Bogumiła Kamińskiego, prof. SGH
2 Problem Potrzeba miary określającej różnice między partiami politycznymi odległość ideologiczna Zastosowanie: funkcja informacyjna dane wejściowe do dalszych badań (np. badanie siły partii jako potencjalnych koalicjantów indeksy siły w teorii gier) przy zastosowaniu modelu STM dodatkowo weryfikacja obietnic i programów partii Problemy z dotychczasowymi podejściami: oparte na wiedzy eksperckiej (subiektywność) oparte na badaniach ankietowych (badanie elektoratu zamiast samych polityków oraz interpolacja wyników na całą populację na podstawie względnie małej próby) Cel pracy: analiza eksploracyjna tematów poruszanych w Sejmie zaproponowanie obiektywnej miary różnic ideologicznych między partiami 2
3 Dane Stenogramy posiedzeń sejmowych Web scraping stron internetowych Sejmu z wykorzystaniem rvest Tekst przemówień oraz metadane: imię i nazwisko mówcy, przynależność partyjna, kadencja Sejmu, data przemówienia Korpus obejmuje kadencje: od 5. ( ) do 8. ( ) Obróbka danych: usunięcie cyfr i znaków specjalnych konwersja na minuskuły usunięcie tzw. stop words sprowadzenie słów do podstawowej formy gramatycznej usunięcie słów zbyt częstych (> dokumentów) i zbyt rzadkich (<200 dokumentów) przemówień unikalnych słów 3
4 Metodologia Wykorzystanie przemówień sejmowych jako mających bezpośredni wpływ na dyskurs polityczny oraz kształtowanie prawa w kraju Model STM ekstrahowanie głównych tematów pojawiających się w przemówieniach sejmowych wielowymiarowe rozkłady prawdopodobieństwa nad otrzymanymi tematami Odległość Bhattacharyyi metryka określająca różnice między wielowymiarowymi rozkładami prawdopodobieństwa dobre zachowanie dla modelu STM Skalowanie wielowymiarowe wizualizacja wielowymiarowej przestrzeni w układzie kartezjańskim zachowuje główne zależności elementy podobne do siebie znajdują się w sąsiedztwie, zaś wraz z oddalaniem w sensie euklidesowym zróżnicowanie między obiektami rośnie 4
5 Strukturalny Model Tematyczny ang. StructuralTopic Model (STM) Klasa modeli: modele tematyczne (topic models) Trzypoziomowy Bayesowski model hierarchiczny Modelowanie nienadzorowane (obiektywność): nie jest wymagany ręcznie tagowany zbiór uczący badacz określa jedynie liczbę ekstrahowanych tematów, a następnie ocenia wyniki pod kątem użyteczności oraz interpretowalności W przeciwieństwie do wcześniejszych metod pozwala na: przypisywanie wielu tematów do pojedynczego dokumentu uzależnienie otrzymanych wyników od metadanych (kadencja Sejmu oraz przynależność partyjna mówcy) uzależnić można: częstość występowania tematów ich kontekst (słownictwo używane do mówienia o nich) efekty metadanych mogą, ale nie muszą być uwzględnione przez model 5
6 Proces generujący dane 1. Dla każdego dokumentu losujemy proporcje w jakich dany temat w nim występuje z rozkładu:! " ~$%&'%()*+,-. /0 = 2 4 ", 7) 2. Dla każdego tematu w danym dokumencie określamy kontekst występowania tematów: 8 ",9 ;<= ) +? 9 +? 9@ +? AB(9,DE ) 3. Dla każdego elementu dokumentu (wyrazu) losujemy temat: F ",G ~HI+JKL%)K*+,! " 4. Po przypisaniu tematu do elementu losujemy obserwację słowa ze słownictwa danego tematu: M ",G ~HI+JKL%)K*+, 8 ",9BN 6
7 Wybór postaci modelu 7
8 Otrzymane tematy 3 tematy odrzucone z dalszej analizy: techniczne oraz pozbawione interpretacji 13 tematów interpretowalnych 8
9 Otrzymane tematy 9
10 Częstości tematów Ze względu na kadencję Sejmu 10
11 Częstości tematów Ze względu na partię polityczną 11
12 Macierz odległości Odległości ideologiczne 8. Kadencja (aktualna) Średnie odległości 12
13 Mapa partii 13
14 Dane kontaktowe Aleksander Nosarzewski /in/aleksander-nosarzewski 14
15 Dziękuję za uwagę. 15
Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych
Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych Probabilistic Topic Models Jakub M. TOMCZAK Politechnika Wrocławska, Instytut Informatyki 30.03.2011, Wrocław Plan 1. Wstęp
Bardziej szczegółowoData Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Bardziej szczegółowoHierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Bardziej szczegółowoAnaliza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
Bardziej szczegółowoAnaliza zawartości a analiza treści jako metody badawcze. mgr Magdalena Szpunar
Analiza zawartości a analiza treści jako metody badawcze mgr Magdalena Szpunar Znaczenie analizy zawartości Najbardziej widocznym i dostępnym przejawem działania mediów są niesione przezeń przekazy Bodźcami
Bardziej szczegółowoEkstrakcja informacji oraz stylometria na usługach psychologii Część 2
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej
Bardziej szczegółowo1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
Bardziej szczegółowoMetody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Bardziej szczegółowoCo to jest grupowanie
Grupowanie danych Co to jest grupowanie 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Szukanie grup, obszarów stanowiących lokalne gromady punktów Co to jest grupowanie
Bardziej szczegółowoPodstawy statystyki matematycznej w programie R
Podstawy statystyki matematycznej w programie R Piotr Ćwiakowski Wydział Fizyki Uniwersytetu Warszawskiego Zajęcia 1. Wprowadzenie 1 marca 2017 r. Program R Wprowadzenie do R i badań statystycznych podstawowe
Bardziej szczegółowoCBOS CENTRUM BADANIA OPINII SPOŁECZNEJ OPINIE O ODEBRANIU ANDRZEJOWI LEPPEROWI IMMUNITETU POSELSKIEGO BS/28/2002 KOMUNIKAT Z BADAŃ WARSZAWA, LUTY 2002
CBOS CENTRUM BADANIA OPINII SPOŁECZNEJ SEKRETARIAT OŚRODEK INFORMACJI 629-35 - 69, 628-37 - 04 693-46 - 92, 625-76 - 23 UL. ŻURAWIA 4A, SKR. PT.24 00-503 W A R S Z A W A TELEFAX 629-40 - 89 INTERNET http://www.cbos.pl
Bardziej szczegółowoSkalowanie wielowymiarowe idea
Skalowanie wielowymiarowe idea Jedną z wad metody PCA jest możliwość używania jedynie zmiennych ilościowych, kolejnym konieczność posiadania pełnych danych z doświadczenia(nie da się użyć PCA jeśli mamy
Bardziej szczegółowoWielowymiarowa Analiza Korespondencji. Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS. Joanna Ciecieląg, Marek Pęczkowski WNE UW
Wielowymiarowa Analiza Korespondencji Wielowymiarowa Analiza Danych z wykorzystaniem pakietu SPSS Joanna Ciecieląg, Marek Pęczkowski WNE UW ANALIZA KORESPONDENCJI opisowa i eksploracyjna technika analizy
Bardziej szczegółowoMetody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium MATLAB Zadanie nr 2 κ-nn i Naive Bayes autorzy: M. Zięba, J.M. Tomczak, A. Gonczarek, S. Zaręba Cel zadania Celem zadania jest implementacja klasyfikatorów
Bardziej szczegółowoSPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization
Wrocław University of Technology SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization Jakub M. Tomczak Studenckie Koło Naukowe Estymator jakub.tomczak@pwr.wroc.pl 4.1.213 Klasteryzacja Zmienne
Bardziej szczegółowoKryteria oceniania w klasie 2 Szkoły Podstawowej nr 1 w Miechowie
Kryteria oceniania w klasie 2 Szkoły Podstawowej nr 1 w Miechowie ZNAK GRAFICZNY OCENA WYRAŻONA PUNKTAMI KRYTERIA OCENIANIA 6 p. - wypowiada się wspaniale na każdy temat; - posiada wiedzę z różnych dziedzin
Bardziej szczegółowoRozpoznawanie obrazów
Rozpoznawanie obrazów Laboratorium Python Zadanie nr 2 κ-nn i Naive Bayes autorzy: M. Zięba, J.M. Tomczak, A. Gonczarek, S. Zaręba, J. Kaczmar Cel zadania Celem zadania jest implementacja klasyfikatorów
Bardziej szczegółowoKRYTERIA OCENIANIA W KLASIE II rok szkolny 2014/2015
KRYTERIA OCENIANIA W KLASIE II rok szkolny 2014/2015 EDUKACJA POLONISTYCZNA PISANIE - dba o prawidłowy i bardzo staranny kształt liter i cyfr; - potrafi samodzielnie napisać kilka zdań na każdy temat,
Bardziej szczegółowoWarszawa, wrzesień 2010 BS/131/2010 OCENY WSPÓŁPRACY W KOALICJI RZĄDOWEJ PO-PSL
Warszawa, wrzesień 2010 BS/131/2010 OCENY WSPÓŁPRACY W KOALICJI RZĄDOWEJ PO-PSL Znak jakości przyznany CBOS przez Organizację Firm Badania Opinii i Rynku 4 lutego 2010 roku Fundacja Centrum Badania Opinii
Bardziej szczegółowoKlasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Bardziej szczegółowoWstęp... 9. Podstawowe oznaczenia stosowane w książce... 13
Spis treści Wstęp... 9 Podstawowe oznaczenia stosowane w książce... 13 1. PODEJŚCIE SYMBOLICZNE W BADANIACH EKONOMICZ- NYCH... 15 1.1. Uwagi dotyczące przyjętych w rozdziale konwencji nomenklaturowych.
Bardziej szczegółowoObrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego
IBS PAN, Warszawa 9 kwietnia 2008 Obrona rozprawy doktorskiej Neuro-genetyczny system komputerowy do prognozowania zmiany indeksu giełdowego mgr inż. Marcin Jaruszewicz promotor: dr hab. inż. Jacek Mańdziuk,
Bardziej szczegółowoEksploracja danych. Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Grupowanie wykład 1
Grupowanie Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Grupowanie wykład 1 Sformułowanie problemu Dany jest zbiór obiektów (rekordów). Znajdź naturalne pogrupowanie
Bardziej szczegółowoMetody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak
Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin Henryk Bujak e-mail: h.bujak@ihar.edu.pl Ocena różnorodności fenotypowej Różnorodność fenotypowa kolekcji roślinnych zasobów
Bardziej szczegółowoElementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Bardziej szczegółowoAlgorytmy, które estymują wprost rozkłady czy też mapowania z nazywamy algorytmami dyskryminacyjnymi.
Spis treści 1 Wstęp: generatywne algorytmy uczące 2 Gaussowska analiza dyskryminacyjna 2.1 Gaussowska analiza dyskryminacyjna a regresja logistyczna 3 Naiwny Klasyfikator Bayesa 3.1 Wygładzanie Laplace'a
Bardziej szczegółowoKorpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Bardziej szczegółowoWPŁYW TECHNOLOGII INFORMACYJNYCH NA POZIOM KSZTAŁCENIA STUDENTÓW KIERUNKU INFORMATYKA
Michał Krupski WPŁYW TECHNOLOGII INFORMACYJNYCH NA POZIOM KSZTAŁCENIA STUDENTÓW KIERUNKU INFORMATYKA Prezentacja dysertacji doktorskiej przygotowanej pod kierunkiem dr hab. inż. prof. Społecznej Akademii
Bardziej szczegółowoPrzedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii
SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane
Bardziej szczegółowoStatystyka od podstaw Janina Jóźwiak, Jarosław Podgórski
Statystyka od podstaw Janina Jóźwiak, Jarosław Podgórski Książka jest nowoczesnym podręcznikiem przeznaczonym dla studentów uczelni i wydziałów ekonomicznych. Wykład podzielono na cztery części. W pierwszej
Bardziej szczegółowoAnaliza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania
Analiza skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania Analiza Skupień Elementy składowe procesu grupowania obiekt Ekstrakcja cech Sprzężenie zwrotne Grupowanie klastry Reprezentacja
Bardziej szczegółowoKurs Chemometrii Poznań 28 listopad 2006
Komisja Nauk Chemicznych Polskiej Akademii Nauk Oddział w Poznaniu Wydział Technologii Chemicznej Politechniki Poznańskiej w Poznaniu GlaxoSmithKline Pharmaceuticals S.A. w Poznaniu Stowarzyszenie ISPE
Bardziej szczegółowoStatystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Bardziej szczegółowoJak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw
Jak długo żyją spółki na polskiej giełdzie? Zastosowanie statystycznej analizy przeżycia do modelowania upadłości przedsiębiorstw dr Karolina Borowiec-Mihilewicz Uniwersytet Ekonomiczny we Wrocławiu Zastosowania
Bardziej szczegółowoSystemy uczące się Lab 4
Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego
Bardziej szczegółowoNarzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Bardziej szczegółowoALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
Bardziej szczegółowoPrzykładowa analiza danych
Przykładowa analiza danych W analizie wykorzystano dane pochodzące z publicznego repozytorium ArrayExpress udostępnionego na stronach Europejskiego Instytutu Bioinformatyki (http://www.ebi.ac.uk/). Zbiór
Bardziej szczegółowoWskaźniki i dynamiczna alokacja pamięci. Spotkanie 4. Wskaźniki. Dynamiczna alokacja pamięci. Przykłady
Wskaźniki i dynamiczna alokacja pamięci. Spotkanie 4 Dr inż. Dariusz JĘDRZEJCZYK Wskaźniki Dynamiczna alokacja pamięci Przykłady 11/3/2016 AGH, Katedra Informatyki Stosowanej i Modelowania 2 Wskaźnik to
Bardziej szczegółowoSYMULACJE NUMERYCZNE W OCENIE RYZYKA
SYMULACJE NUMERYCZNE W OCENIE RYZYKA Dr Marek Biesiada Instytut Medycyny Pracy i Zdrowia Środowiskowego, Sosnowiec Główną trudnością metodologiczną w procesie ocen ryzyka zdrowotnego jest złożoność oddziaływań
Bardziej szczegółowoW1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
Bardziej szczegółowoUNIWERSYTET ŚLĄSKI W KATOWICACH
UNIWERSYTET ŚLĄSKI W KATOWICACH STUDIUM PRAKTYCZNEJ NAUKI JĘZYKÓW OBCYCH FORMAT EGZAMINU: EGZAMIN CERTYFIKUJĄCY Z JĘZYKA OBCEGO, POZIOM B2 Egzamin sprawdza znajomość języka obcego ogólnego na poziomie
Bardziej szczegółowoALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Eksploracja danych Algorytmy klastujące Problem 3 Mając daną chmurę punktów chcielibyśmy zrozumieć ich
Bardziej szczegółowoNarzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Bardziej szczegółowoAnaliza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Bardziej szczegółowoEWALUACJA JAKO ELEMENT PROCESU UCZENIA SIĘ ORGANIZACJI -MODEL DLA ADMINISTRACJI PUBLICZNEJ
EWALUACJA JAKO ELEMENT PROCESU UCZENIA SIĘ ORGANIZACJI -MODEL DLA ADMINISTRACJI PUBLICZNEJ Jakub Rok EUROREG UW Toruń 26.06.2013 Plan prezentacji Kontekst Koncepcja uczenia się organizacji Diagnoza organizacyjnego
Bardziej szczegółowoKlasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących
Klasyfikacja w oparciu o metrykę budowaną poprzez dystrybuanty empiryczne na przestrzeni wzorców uczących Cezary Dendek Wydział Matematyki i Nauk Informacyjnych PW Plan prezentacji Plan prezentacji Wprowadzenie
Bardziej szczegółowoEksploracja danych - wykład VIII
I Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska 2 grudnia 2016 1/31 1 2 2/31 (ang. affinity analysis) polega na badaniu atrybutów lub cech, które są ze sobą powiązane. Metody
Bardziej szczegółowoRecenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak
Recenzenci: prof. dr hab. Henryk Domański dr hab. Jarosław Górniak Redakcja i korekta Bogdan Baran Projekt graficzny okładki Katarzyna Juras Copyright by Wydawnictwo Naukowe Scholar, Warszawa 2011 ISBN
Bardziej szczegółowoSYMULACJE WYNIKÓW WYBORÓW W UKŁADZIE JOW
SYMULACJE WYNIKÓW WYBORÓW W UKŁADZIE JOW Przemysław Śleszyński Instytut Geografii i Przestrzennego Zagospodarowania PAN Seminarium Zakładu Geografii Miast i Ludności IGiPZ PAN IDEA JEDNOMANDATOWYCH OKRĘGÓW
Bardziej szczegółowoKonkurencyjność Polski w procesie pogłębiania integracji europejskiej i budowy gospodarki opartej na wiedzy
w Konkurencyjność Polski w procesie pogłębiania integracji europejskiej i budowy gospodarki opartej na wiedzy redakcja naukowa Tomasz Michalski Krzysztof Piech SZKOŁA GŁÓWNA HANDLOWA W WARSZAWIE WARSZAWA
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowoOGÓLNE KRYTERIA OCENIANIA POSZCZEGÓLNYCH SPRAWNOŚCI JĘZYKOWYCH
OGÓLNE KRYTERIA OCENIANIA POSZCZEGÓLNYCH SPRAWNOŚCI JĘZYKOWYCH Poziom oczekiwanych osiągnięć uczniów w zakresie sprawności rozumienia ze słuchu (listening comprehension) czasem zrozumieć ogólny sens wypowiedzi
Bardziej szczegółowo13. Interpretacja wyników testowych
13. Interpretacja wyników testowych q testowanie a diagnozowanie psychologiczne q interpretacja wyników testu q interpretacja kliniczna a statystyczna q interpretacja ukierunkowana na kryteria lub normy
Bardziej szczegółowoStatystyka w pracy badawczej nauczyciela
Statystyka w pracy badawczej nauczyciela Wykład 1: Terminologia badań statystycznych dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyka (1) Statystyka to nauka zajmująca się zbieraniem, badaniem
Bardziej szczegółowoPrzykładowe funkcje przejścia używane przy budowie sztucznych neuronów
Przykładowe funkcje przejścia używane przy budowie sztucznych neuronów Funkcja Wzór funkcji Wzór pochodnej Sigmoida f(s)=1/(1+e -(β*s) ) f (s)=β*(1- f(s))* f(s) Funkcje przejścia neuronu powinno się rozpatrywać
Bardziej szczegółowoPorównanie modeli statystycznych. Monika Wawrzyniak Katarzyna Kociałkowska
Porównanie modeli statystycznych Monika Wawrzyniak Katarzyna Kociałkowska Jaka jest miara podobieństwa? Aby porównywać rozkłady prawdopodobieństwa dwóch modeli statystycznych możemy użyć: metryki dywergencji
Bardziej szczegółowoBudowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego
Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Dorota Witkowska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wprowadzenie Sztuczne
Bardziej szczegółowoStatystyka. #6 Analiza wariancji. Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik. rok akademicki 2015/ / 14
Statystyka #6 Analiza wariancji Aneta Dzik-Walczak Małgorzata Kalbarczyk-Stęclik rok akademicki 2015/2016 1 / 14 Analiza wariancji 2 / 14 Analiza wariancji Analiza wariancji jest techniką badania wyników,
Bardziej szczegółowoEwelina Henek, Agnieszka Wypych, Zbigniew Ustrnul. Instytut Meteorologii i Gospodarki Wodnej Państwowy Instytut Badawczy (IMGW-PIB)
Ewelina Henek, Agnieszka Wypych, Zbigniew Ustrnul Instytut Meteorologii i Gospodarki Wodnej Państwowy Instytut Badawczy (IMGW-PIB) IT SYSTEM GŁÓWNE KOMPONENTY SYSTEMU ISOK: Dane LIDAR (4- punktów/m ; >00
Bardziej szczegółowoDobre praktyki dotyczące współpracy zamawiających i wykonawców ewaluacji Na podstawie opracowania zespołu Na Straży Sondaży.
Dobre praktyki dotyczące współpracy zamawiających i wykonawców ewaluacji Na podstawie opracowania zespołu Na Straży Sondaży. Spotkanie GSE PO KL oraz ZSEPS, Kraków, 26.02.2015 r. Przetarg na badanie. Dwa
Bardziej szczegółowoANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH
ANALIZA WIELOPOZIOMOWA JAKO NARZĘDZIE WSPARCIA POLITYK PUBLICZNYCH - Adrian Gorgosz - Paulina Tupalska ANALIZA WIELOPOZIOMOWA (AW) Multilevel Analysis Obecna od lat 80. Popularna i coraz częściej stosowana
Bardziej szczegółowoPsychometria Test jako narzędzie diagnozy psychologicznej. Podstawowe pojęcia. W 3
Psychometria Test jako narzędzie diagnozy psychologicznej. Podstawowe pojęcia. W 3 dr Łukasz Michalczyk 1 Test Psychologiczny to narzędzie przeznaczone do pomiaru cech, stanów psychicznych lub postaw.
Bardziej szczegółowoGrupowanie Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633
Grupowanie Grupowanie 7 6 5 4 y 3 2 1 0-3 -2-1 0 1 2 3 4 5-1 -2-3 -4 x Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633 Wprowadzenie Celem procesu grupowania jest podział zbioru
Bardziej szczegółowoKlasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,
Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której
Bardziej szczegółowoWYNIKI EGZAMINU GIMNAZJALNEGO Z JĘZYKA ANGIELSKIEGO ROK SZKOLNY 2016/2017
WYNIKI EGZAMINU GIMNAZJALNEGO Z JĘZYKA ANGIELSKIEGO ROK SZKOLNY 2016/2017 Egzamin gimnazjalny poziom podstawowy Arkusz składał się z 40 zadań zamkniętych różnego typu (wyboru wielokrotnego, prawda/fałsz
Bardziej szczegółowoWykład 4. Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym. 2. Rozkłady próbkowe. 3. Centralne twierdzenie graniczne
Wykład 4 Plan: 1. Aproksymacja rozkładu dwumianowego rozkładem normalnym 2. Rozkłady próbkowe 3. Centralne twierdzenie graniczne Przybliżenie rozkładu dwumianowego rozkładem normalnym Niech Y ma rozkład
Bardziej szczegółowoTesty nieparametryczne
Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów
Bardziej szczegółowoKorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk
KorBa Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk ALLPPT.com _ Free PowerPoint Templates, Diagrams and Charts PODSTAWOWE
Bardziej szczegółowoSieci Kohonena Grupowanie
Sieci Kohonena Grupowanie http://zajecia.jakubw.pl/nai UCZENIE SIĘ BEZ NADZORU Załóżmy, że mamy za zadanie pogrupować następujące słowa: cup, roulette, unbelievable, cut, put, launderette, loveable Nie
Bardziej szczegółowoPostawy wobec ryzyka
Postawy wobec ryzyka Wskaźnik Sharpe a przykład zintegrowanej miary rentowności i ryzyka Konstrukcja wskaźnika odwołuje się do klasycznej teorii portfelowej Markowitza, której elementem jest mapa ryzyko
Bardziej szczegółowoAlgorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Bardziej szczegółowoRaportowanie badań jakościowych i ilościowych. Ukryte podobieństwa i wyraźne różnice. Pisanie naukowe jest:
Raportowanie badań jakościowych i ilościowych. Ukryte podobieństwa i wyraźne różnice Emilia Soroko Instytut Psychologii UAM kwiecień 2008 Pisanie naukowe jest: 1. działalnością publiczną 2. czynnością
Bardziej szczegółowoJak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu
XXVIII Letnia Szkoła Naukowa Metodologii Nauk Empirycznych Zakopane, 12-14.05.2014 Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu Maciej Zaborowicz Instytut Inżynierii
Bardziej szczegółowoProgram warsztatów CLARIN-PL
W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19
Bardziej szczegółowoWnioskowanie bayesowskie
Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,
Bardziej szczegółowoANALIZA BEZPIECZEŃSTWA SIL I HAZOP W ENERGETYCE NA WYBRANYCH PRZYKŁADACH
ANALIZA BEZPIECZEŃSTWA SIL I HAZOP W ENERGETYCE NA WYBRANYCH PRZYKŁADACH ZARYS PROBLEMÓW PRAKTYCZNYCH I SPOSOBÓW PODEJŚCIA Tadeusz Konieczniak Dyrektor ds. Rozwoju J.T.C. S.A. TECHNOLOGIA PROCESU Ogólne
Bardziej szczegółowoSzczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)
Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego
Bardziej szczegółowoPrawne, organizacyjne i techniczne aspekty budowy IIP w temacie zagospodarowanie przestrzenne
Prawne, organizacyjne i techniczne aspekty budowy IIP w temacie zagospodarowanie przestrzenne Magdalena Zagrzejewska Zastępca Dyrektora Departamentu Polityki Przestrzennej w Ministerstwie Infrastruktury
Bardziej szczegółowoKryteria ocen z języka hiszpańskiego
Kryteria ocen z języka hiszpańskiego Klasa I OCENA BARDZO DOBRA Uczeń opanował w stopniu bardzo dobrym materiał zarówno leksykalny jak i gramatyczny. Uczeń stosuje poprawny szyk wyrazów w zdaniu, formułuje
Bardziej szczegółowoKlasyfikacja metodą Bayesa
Klasyfikacja metodą Bayesa Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski warunkowe i bezwarunkowe 1. Klasyfikacja Bayesowska jest klasyfikacją statystyczną. Pozwala przewidzieć prawdopodobieństwo
Bardziej szczegółowoLosowe zmienne objaśniające. Rozszerzenia KMRL. Rozszerzenia KMRL
MNK z losową macierzą obserwacji Równanie modelu y = X β + ε Jeżeli X zawiera elementy losowe to należy sprawdzić czy E(b β) = E[(X X ) 1 X ε]? = E[(X X ) 1 X ]E(ε) Przypomnienie: Nieskorelowane zmienne
Bardziej szczegółowoPopulacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część
Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu
Bardziej szczegółowoCzym jest analiza skupień?
Statystyczna analiza danych z pakietem SAS Analiza skupień metody hierarchiczne Czym jest analiza skupień? wielowymiarowa technika pozwalająca wykrywać współzależności między obiektami; ściśle związana
Bardziej szczegółowoSTRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.
STRESZCZENIE rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne. Zasadniczym czynnikiem stanowiącym motywację dla podjętych w pracy rozważań
Bardziej szczegółowoTEORETYCZNE PODSTAWY INFORMATYKI
1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Wykład 16 2 Data Science: Uczenie maszynowe Uczenie maszynowe: co to znaczy? Metody Regresja Klasyfikacja Klastering
Bardziej szczegółowoStatystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.
Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru
Bardziej szczegółowoAnaliza składowych głównych idea
Analiza składowych głównych idea Analiza składowych głównych jest najczęściej używanym narzędziem eksploracyjnej analizy danych. Na metodę tę można spojrzeć jak na pewną technikę redukcji wymiarowości
Bardziej szczegółowoSzanowna Pani Marszałek! Na podstawie art. 193 ust. 1 i 2 Uchwały Sejmu Rzeczypospolitej Polskiej z dnia 30 lipca 1992 r.
Szanowna Pani Marszałek! Na podstawie art. 193 ust. 1 i 2 Uchwały Sejmu Rzeczypospolitej Polskiej z dnia 30 lipca 1992 r. Regulamin Sejmu Rzeczypospolitej Polskiej (t.j. M.P. Nr 5, poz. 47, z późn. zm.)
Bardziej szczegółowoBadania Statystyczne
Statystyka Opisowa z Demografią oraz Biostatystyka Badania Statystyczne Aleksander Denisiuk denisjuk@euh-e.edu.pl Elblaska Uczelnia Humanistyczno-Ekonomiczna ul. Lotnicza 2 82-300 Elblag oraz Biostatystyka
Bardziej szczegółowoAgnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Bardziej szczegółowoKRYTERIA WEWNATRZSZKOLNEGO SYSTEMU OPISOWEGO OCENIANIA WIADOMOŚCI I UMIEJĘTNOSCI UCZNIA KLASY II CELUJACY ( 6 ) EDUKACJA PLASTYCZNO- TECHNICZNA
KRYTERIA WEWNATRZSZKOLNEGO SYSTEMU OPISOWEGO OCENIANIA WIADOMOŚCI I UMIEJĘTNOSCI UCZNIA KLASY II CELUJACY ( 6 ) - czyta poprawnie, płynnie, w odpow. tempie, z właściwą intonacją (nowy tekst), - w pełni
Bardziej szczegółowoProste metody przetwarzania obrazu
Operacje na pikselach obrazu (operacje punktowe, bezkontekstowe) Operacje arytmetyczne Dodanie (odjęcie) do obrazu stałej 1 Mnożenie (dzielenie) obrazu przez stałą Operacje dodawania i mnożenia są operacjami
Bardziej szczegółowoInteligentna analiza danych
Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki
Bardziej szczegółowoEGZAMIN MAGISTERSKI, 18 września 2013 Biomatematyka
Biomatematyka Liczebność populacji pewnego gatunku jest modelowana przez równanie różnicowe w którym N k stałymi. rn 2 n N n+1 =, A+Nn 2 oznacza liczebność populacji w k tej generacji, a r i A są dodatnimi
Bardziej szczegółowoREGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO. Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój
1 REGRESJA LINIOWA Z UOGÓLNIONĄ MACIERZĄ KOWARIANCJI SKŁADNIKA LOSOWEGO Aleksander Nosarzewski Ekonometria bayesowska, prowadzący: dr Andrzej Torój 2 DOTYCHCZASOWE MODELE Regresja liniowa o postaci: y
Bardziej szczegółowoDZISIAJ.
ZMIENNE DZISIAJ METODĄ INDUKCJI: Co to są zmienne? Czym różni się zmienna zależna od zmiennej niezależnej? Co to są poziomy pomiaru? Jakie są poszczególne poziomy pomiarów? PRZYKŁAD WIEK: 28 LAT ZAWÓD:
Bardziej szczegółowoMonitoring głównych serwisów informacyjnych w czasie kampanii parlamentarnej 2011 roku. Metodologia badania
Monitoring głównych serwisów informacyjnych w czasie kampanii parlamentarnej 2011 roku Metodologia badania Pracownia Teorii Zmiany Społecznej IS UW dla Fundacji im. Stefana Batorego Zespół badawczy: Prof.
Bardziej szczegółowoAnaliza składowych głównych
Analiza składowych głównych Wprowadzenie (1) W przypadku regresji naszym celem jest predykcja wartości zmiennej wyjściowej za pomocą zmiennych wejściowych, wykrycie związku między wielkościami wejściowymi
Bardziej szczegółowoCzym są badania jakościowe? David Silverman : Interpretacja danych jakościowych
Czym są badania jakościowe? David Silverman : Interpretacja danych jakościowych Główne zagadnienia Kiedy porównujemy badania ilościowe i jakościowe, znajdujemy głownie róŝne rozłoŝenie akcentów między
Bardziej szczegółowo