Zajęcia nr VII poznajemy Rattle i pakiet R.
|
|
- Marek Szydłowski
- 5 lat temu
- Przeglądów:
Transkrypt
1 Okno główne Rattle wygląda następująco: Zajęcia nr VII poznajemy Rattle i pakiet R. Widzimy główne zakładki: Data pozwala odczytad dane z różnych źródeł danych (pliki TXT, CSV) i inne bazy danych. Jak widzimy po wczytaniu zbioru IRIS.TXT użytkownik widzi jakie zmienne są w analizowanym zbiorze, jakiego typu (tutaj numeryczne), która zmienna została wybrana jako zmienna objaśniania (wtedy przy takiej zmiennej mamy
2 znacznik TARGET), pewne zmienne możemy ignorowad w analizach (kolumna IGNORE). Widzimy także w kolumnie COMMENT ile dany atrybut (cecha) ma unikalnych wartości, ile wartości brakujących. Klikając przycisk VIEW otrzymujemy podgląd zbioru danych: Z kolei klikając przycisk EDIT możemy edytowad analizowany zbiór danych. W ramach statystyk [type = summary] podsumowujących zastosowad możemy: Explore pozwoli przejrzed dane, dokonad podstawowych statystyki: Summary statystyki podsumowujące Describe statystyki opisujące Basics statystyki podstawowe Kurtosis mówi, jaka jest kurioza w analizowanym zbiorze Skewness mówi o skośności danych w zbiorze Show Missing jeśli jest zaznaczone uwzględnia braki w danych podczas analizy
3 Statystyki podsumowujące zazwyczaj dostarczają ogólnych informacji o danych. Możemy zobaczyd typ każdej danej, wartości minimalne, maksymalne, średnie oraz medianę i pierwszy oraz trzeci kwartyl. Klikając w opcję Describe
4 Z kolei wybierając opcję basic W ramach metod rozkładów danych [type = distribution] zastosowad możemy: Wybierając np. opcję Box plot wygenerujemy wykresy pudełkowe dla wybranych zmiennych. Np. zaznaczając opcje Box plot dla zmiennej X5.1 i X0.2 otrzymamy następujące wykresy.
5 Zaznaczając opcję histogram dla tych samych zmiennych otrzymamy następujące wykresy:
6 Klikacjąc w zakładce Explore opcję Coorelation możemy obliczyd korelację zachodzącą między wszystkimi zmiennymi w analizowanym zbiorze. Oprócz graficznej wizualizacji tej korelacji mamy także informację o konkretnych wartościach korelacji oraz o użytej do jej pomiaru metryce (czy to była miara Spearmana, Kendalla czy Pearsona). Wybierając opcję Principal Components w zakładce Explore docieramy do analizy składowych głównych (Principal Component Analysis):
7 Zadanie 1. Przejrzed zasoby Internetu i zapoznad się z celem metody analizy składowych głównych. Student powinien wiedzied do czego służy ta metoda, jakie ma wady i zalety, w jakich zastosowaniach najczęściej się ją spotyka, oraz jakie są jej wymagania co do danych podlegających takiej analizie. Omijamy zakładkę TEST służy ona do testowania hipotez statystycznych a tym się zajmowad na tym przedmiocie nie będziemy!!! Przechodzimy do zakładki TRANSFORM. Mamy tu do czynienia z różnymi metodami transformacji danych, ich normalizacji i skalowania. Tutaj student winien przypomnied sobie treśd zajęd gdzie była mowa o normalizacji danych a także radzenia sobie z niekompletnością danych. W zakładce transform dostępnych jest szereg narzędzi zarówno do zadania normalizacji jak i zadania wypełniania braków w danych. Zakładka CLUSTER pozwoli na zastosowanie analizy skupieo do wydobywania wiedzy z danych. W tym celu student powinien przejrzed zasoby Internetu i zdobyd informacje wstępne o tym co jest celem analizy skupieo, co ona daje w efekcie.
8 Zakładkę PREDICTIVE będziemy z pewnością analizowad na zajęciach z PED. Bardzo popularną metodą analizy danych jest metoda generowania drzew decyzyjnych. Metoda ta pozwala na szybką klasyfikację danych. W powiększeniu: A klikając teraz opcję (przycisk) [Draw]otrzymujemy drzewo decyzyjne postaci:
9 Które można już zapisad w wybranym formacie: JPG, png czy PDF. Zadanie do wykonania: 1. Dla swojego zbioru danych proszę wygenerowad skrócone charakterystyki, i dla wybranej cechy opisującej obiekty w tym zbiorze podad wartośd minimalną i maksymalną, a następnie wyrysowad dla niej odpowiednio wykres pudełkowy. Dla innej cechy (nie numerycznej) proszona podstawie charakterystyk opisowych podad wartośd dominującą w zbiorze, jaki ma ona zakres procentowy, i wyrysowad odpowiedni wykres dla niej. 2. Dla tego samego zbioru proszę przeskalowad wartości dla wybranej cechy nie numerycznej w kilku możliwych metodach. 3. Sprawdzid między którymi zmiennymi istnieje największa korelacja dodatnia bądź ujemna, a między którymi jest brak korelacji.
Metody wypełniania braków w danych ang. Missing values in data
Analiza danych wydobywanie wiedzy z danych III Metody wypełniania braków w danych ang. Missing values in data W rzeczywistych zbiorach danych dane są często nieczyste: - niekompletne (brakujące ważne atrybuty,
Bardziej szczegółowoLABORATORIUM 3. Jeśli p α, to hipotezę zerową odrzucamy Jeśli p > α, to nie mamy podstaw do odrzucenia hipotezy zerowej
LABORATORIUM 3 Przygotowanie pliku (nazwy zmiennych, export plików.xlsx, selekcja przypadków); Graficzna prezentacja danych: Histogramy (skategoryzowane) i 3-wymiarowe; Wykresy ramka wąsy; Wykresy powierzchniowe;
Bardziej szczegółowoLaboratorium nr Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby:
Laboratorium nr 1 CZĘŚĆ I : STATYSTYKA OPISOWA : 1. Wyznaczyć podstawowe statystyki (średnia, mediana, IQR, min, max) dla próby: 6,9,1,2,5,2,6,2,1,0,1,4,5,6,3,7,3,2,2,3,8,5,3,4,8,0,8,0,5,1,6,4,8,0,3,2
Bardziej szczegółowoMetody wykrywania odchyleo w danych. Metody wykrywania braków w danych. Korelacja. PED lab 4
Metody wykrywania odchyleo w danych. Metody wykrywania braków w danych. Korelacja. PED lab 4 Co z danymi oddalonymi? Błędne dane typu dochód z minusem na początku: to błąd we wprowadzaniu danych, czy faktyczny
Bardziej szczegółowoWprowadzenie do analizy dyskryminacyjnej
Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela
Bardziej szczegółowoStochastyczne Metody Analizy Danych. PROJEKT: Analiza kluczowych parametrów turbin wiatrowych
PROJEKT: Analiza kluczowych parametrów turbin wiatrowych Projekt jest wykonywany z wykorzystaniem pakietu statystycznego STATISTICA. Praca odbywa się w grupach 2-3 osobowych. Aby zaliczyć projekt, należy
Bardziej szczegółowoSposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
Bardziej szczegółowo1. Wprowadzenie do oprogramowania gretl. Wprowadzanie danych.
Laboratorium z ekonometrii (GRETL) 1. Wprowadzenie do oprogramowania gretl. Wprowadzanie danych. Okno startowe: Póki nie wczytamy jakiejś bazy danych (lub nie stworzymy własnej), mamy dostęp tylko do dwóch
Bardziej szczegółowoZadanie Tworzenie próbki z rozkładu logarytmiczno normalnego LN(5, 2) Plot Probability Distributions
Zadanie 1. 1 Wygenerować 200 elementowa próbkę z rozkładu logarytmiczno-normalnego o parametrach LN(5,2). Utworzyć dla tej próbki: - szereg rozdzielczy - histogramy liczebności i częstości - histogramy
Bardziej szczegółowoData Mining z wykorzystaniem programu Rapid Miner
Data Mining z wykorzystaniem programu Rapid Miner Michał Bereta www.michalbereta.pl Program Rapid Miner jest dostępny na stronie: http://rapid-i.com/ Korzystamy z bezpłatnej wersji RapidMiner Community
Bardziej szczegółowoKNIME podstawy obsługi programu. Pracownia Chemometrii Środowiska Katedra Chemii i Radiochemii Środowiska Wydział Chemii UG
KNIME podstawy obsługi programu Pracownia Chemometrii Środowiska Katedra Chemii i Radiochemii Środowiska Wydział Chemii UG KNIME KNIME jest programem działającym na licencji GNU można go pobrać za darmo
Bardziej szczegółowoWykład 4: Statystyki opisowe (część 1)
Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można
Bardziej szczegółowoEksploracja danych w środowisku R
Eksploracja danych w środowisku R Moi drodzy, niniejszy konspekt nie omawia eksploracji danych samej w sobie. Nie dowiecie się tutaj o co chodzi w generowaniu drzew decyzyjnych czy grupowaniu danych. Te
Bardziej szczegółowoSatysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie
Satysfakcja z życia rodziców dzieci niepełnosprawnych intelektualnie Zadanie Zbadano satysfakcję z życia w skali 1 do 10 w dwóch grupach rodziców: a) Rodzice dzieci zdrowych oraz b) Rodzice dzieci z niepełnosprawnością
Bardziej szczegółowoTemat zajęć: ANALIZA DANYCH ZBIORU EKSPORT. Część I: analiza regresji
Temat zajęć: ANALIZA DANYCH ZBIORU EKSPORT Część I: analiza regresji Krok 1. Pod adresem http://zsi.tech.us.edu.pl/~nowak/adb/eksport.txt znajdziesz zbiór danych do analizy. Zapisz plik na dysku w dowolnej
Bardziej szczegółowoSpis treści. LaboratoriumV: Podstawy korelacji i regresji. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych
1 LaboratoriumV: Podstawy korelacji i regresji Spis treści Laboratorium V: Podstawy korelacji i regresji...1 Wiadomości ogólne...2 1. Wstęp teoretyczny....2 1.1 Korelacja....2 1.2 Funkcja regresji....5
Bardziej szczegółowoAnaliza Statystyczna
Lekcja 5. Strona 1 z 12 Analiza Statystyczna Do analizy statystycznej wykorzystać można wbudowany w MS Excel pakiet Analysis Toolpak. Jest on instalowany w programie Excel jako pakiet dodatkowy. Oznacza
Bardziej szczegółowoKLASYFIKACJA. Słownik języka polskiego
KLASYFIKACJA KLASYFIKACJA Słownik języka polskiego Klasyfikacja systematyczny podział przedmiotów lub zjawisk na klasy, działy, poddziały, wykonywany według określonej zasady Klasyfikacja polega na przyporządkowaniu
Bardziej szczegółowob) Umiejętność wykonania analizy zależności zmiennych i interpretacji uzyskanych wyników.
Cele: a) Umiejętność przeprowadzenia analizy struktury wybranego zbioru obserwacji Obliczanie miar tendencji centralnych, miar rozproszenia, współczynnika skośności i miary spłaszczenia z wykorzystaniem
Bardziej szczegółowoStatystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności. dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl
Statystyka w pracy badawczej nauczyciela Wykład 4: Analiza współzależności dr inż. Walery Susłow walery.suslow@ie.tu.koszalin.pl Statystyczna teoria korelacji i regresji (1) Jest to dział statystyki zajmujący
Bardziej szczegółowoMATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ
MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ Opracowała: Milena Suliga Wszystkie pliki pomocnicze wymienione w treści
Bardziej szczegółowoDane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą w oddzielnej kolumnie.
STATISTICA INSTRUKCJA - 1 I. Wprowadzanie danych Podstawowe / Nowy / Arkusz Dane dotyczące wartości zmiennej (cechy) wprowadzamy w jednej kolumnie. W przypadku większej liczby zmiennych wprowadzamy każdą
Bardziej szczegółowoJak sprawdzić normalność rozkładu w teście dla prób zależnych?
Jak sprawdzić normalność rozkładu w teście dla prób zależnych? W pliku zalezne_10.sta znajdują się dwie zmienne: czasu biegu przed rozpoczęciem cyklu treningowego (zmienna 1) oraz czasu biegu po zakończeniu
Bardziej szczegółowoINFORMATYKA W SELEKCJI
INFORMATYKA W SELEKCJI INFORMATYKA W SELEKCJI - zagadnienia 1. Dane w pracy hodowlanej praca z dużym zbiorem danych (Excel) 2. Podstawy pracy z relacyjną bazą danych w programie MS Access 3. Systemy statystyczne
Bardziej szczegółowo1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:
Wariancja z populacji: Podstawowe miary rozproszenia: 1 1 s x x x x k 2 2 k 2 2 i i n i1 n i1 Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: 1 k 2 s xi x n 1 i1 2 Przykład 38,
Bardziej szczegółowoWEKA klasyfikacja z użyciem sztucznych sieci neuronowych
WEKA klasyfikacja z użyciem sztucznych sieci neuronowych 1 WEKA elementy potrzebne do zadania WEKA (Data mining software in Java http://www.cs.waikato.ac.nz/ml/weka/) jest narzędziem zawierającym zbiór
Bardziej szczegółowoBadanie zależności skala nominalna
Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność
Bardziej szczegółowo1. Cele eksploracyjnej analizy danych Rapid Miner zasady pracy i wizualizacja danych Oracle Data Miner -zasady pracy.
Spis treści: 1. Cele eksploracyjnej analizy danych...1 2. Rapid Miner zasady pracy i wizualizacja danych...3 3. Oracle Data Miner -zasady pracy.12 3.1 ODM PL/SQL.......12 3.2 ODM JAVA API......12 3.2.1
Bardziej szczegółowoPrzykład Rezygnacja z usług operatora
Przykład Rezygnacja z usług operatora Zbiór CHURN Zbiór zawiera dane o 3333 klientach firmy telefonicznej razem ze wskazaniem, czy zrezygnowali z usług tej firmy Dane pochodzą z UCI Repository of Machine
Bardziej szczegółowoRaport pochodzi z portalu
B3.1 Wartość dodana Analiza szczegółowa obszaru B3 rozpoczyna się od oceny sektorów/sekcji/działów gospodarki regionu pod względem spełnienia podstawowego kryterium wzrostu i innowacyjności. Pierwszym
Bardziej szczegółowoMODELE LINIOWE. Dr Wioleta Drobik
MODELE LINIOWE Dr Wioleta Drobik MODELE LINIOWE Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą
Bardziej szczegółowoPodstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica
Podstawowe operacje i rodzaje analiz dostępne w pakiecie Statistica 1. Zarządzanie danymi. Pierwszą czynnością w pracy z pakietem Statistica jest zazwyczaj wprowadzenie danych do arkusza. Oprócz możliwości
Bardziej szczegółowoStatystyka. Wykład 7. Magdalena Alama-Bućko. 16 kwietnia Magdalena Alama-Bućko Statystyka 16 kwietnia / 35
Statystyka Wykład 7 Magdalena Alama-Bućko 16 kwietnia 2017 Magdalena Alama-Bućko Statystyka 16 kwietnia 2017 1 / 35 Tematyka zajęć: Wprowadzenie do statystyki. Analiza struktury zbiorowości miary położenia
Bardziej szczegółowoWprowadzenie do analizy korelacji i regresji
Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących
Bardziej szczegółowoRok akademicki: 2013/2014 Kod: ZIE n Punkty ECTS: 6. Poziom studiów: Studia I stopnia Forma i tryb studiów: -
Nazwa modułu: Statystyka opisowa i ekonomiczna Rok akademicki: 2013/2014 Kod: ZIE-1-205-n Punkty ECTS: 6 Wydział: Zarządzania Kierunek: Informatyka i Ekonometria Specjalność: - Poziom studiów: Studia I
Bardziej szczegółowoOutlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej.
Temat: WYKRYWANIE ODCHYLEO W DANYCH Outlier to dana (punkt, obiekt, wartośd w zbiorze) znacznie odstająca od reszty. prezentacji punktów odstających jest rysunek poniżej. Przykładem Box Plot wygodną metodą
Bardziej szczegółowoPrzewodnik po pakiecie R / Przemysław Biecek. Wyd. 4 rozsz. Wrocław, Spis treści
Przewodnik po pakiecie R / Przemysław Biecek. Wyd. 4 rozsz. Wrocław, 2017 Spis treści 1. Wprowadzenie 1 1.1. Data science, czyli dlaczego warto poznać R 1 1.2. Jak wygląda praca z programem R 4 1.2.1.
Bardziej szczegółowoenova Systemowe Narzędzia Projektowe
enova Systemowe Narzędzia Projektowe Sebastian Wabnik Spis treści Opis rozwiązania...3 Dostęp do narzędzia...3 Wywoływanie narzędzia...4 Zakładka Logi czasu...4 SQL Stat...5 Zakładka Liczniki...7 Zakładka
Bardziej szczegółowoWykład 5: Statystyki opisowe (część 2)
Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz
Bardziej szczegółowoĆWICZENIE 1 Statystyka opisowa. Testowanie zgodności STATYSTYKA OPISOWA wstępna analiza danych I. Miary położenia: Mediana Moda
ĆWICZENIE 1 Statystyka opisowa. Testowanie zgodności Przedmiotem statystyki jest zbieranie, prezentacja oraz analiza danych opisujących zjawiska losowe. Badaniu statystycznemu podlega próbka losowa pobrana
Bardziej szczegółowoProgramy LeftHand - Obsługa plików JPK. Luty 2017
Programy LeftHand - Obsługa plików JPK Luty 2017 Spis treści 1. Wstęp... 2 2. Pierwsze uruchomienie funkcji JPK... 2 3. Generowanie plików JPK... 9 4. Wysyłanie plików JPK... 10 5. Pobieranie i drukowanie
Bardziej szczegółowoQtiplot. dr Magdalena Posiadała-Zezula
Qtiplot dr Magdalena Posiadała-Zezula Magdalena.Posiadala@fuw.edu.pl www.fuw.edu.pl/~mposiada Start! qtiplot poza rysowaniem wykresów pozwala też na zaawansowaną obróbkę danych.! qtiplot jest silnie wzorowany
Bardziej szczegółowoProgramy LeftHand - Obsługa plików JPK. Wrzesień 2016
Programy LeftHand - Obsługa plików JPK Wrzesień 2016 Spis treści 1. Wstęp...2 2. Pierwsze uruchomienie funkcji JPK...2 3. Generowanie plików JPK...9 4. Wysyłanie plików JPK...10 5. Pobieranie i drukowanie
Bardziej szczegółowoLaboratorium 11. Regresja SVM.
Laboratorium 11 Regresja SVM. 1. Uruchom narzędzie Oracle Data Miner i połącz się z serwerem bazy danych. 2. Z menu głównego wybierz Activity Build. Na ekranie powitalnym kliknij przycisk Dalej>. 3. Z
Bardziej szczegółowoauthor: Andrzej Dudek
Edytor wprowadzone polecenia zostają w oknie edytora I mogą być uruchamiana poprzez CTRL+R lub Run (tylko zaznaczone linie, z wyświetlaniem wykonywanych linii kodu) lub poprzez Source (zawsze całość, bez
Bardziej szczegółowoGraficzna prezentacja danych statystycznych
Szkolenie dla pracowników Urzędu Statystycznego nt. Wybrane metody statystyczne w analizach makroekonomicznych Katowice, 12 i 26 czerwca 2014 r. Dopasowanie narzędzia do typu zmiennej Dobór narzędzia do
Bardziej szczegółowoDrzewa decyzyjne w SAS Enterprise Miner
Drzewa decyzyjne w SAS Enterprise Miner Aneta Ptak-Chmielewska Instytut Statystyki i Demografii Zakład Analizy Historii Zdarzeń i Analiz Wielopoziomowych www.sgh.waw.pl/zaklady/zahziaw 1 struktura ćwiczeń
Bardziej szczegółowoZJAZD 4. gdzie E(x) jest wartością oczekiwaną x
ZJAZD 4 KORELACJA, BADANIE NIEZALEŻNOŚCI, ANALIZA REGRESJI Analiza korelacji i regresji jest działem statystyki zajmującym się badaniem zależności i związków pomiędzy rozkładami dwu lub więcej badanych
Bardziej szczegółowoMiary asymetrii STATYSTYKA OPISOWA. Dr Alina Gleska. Instytut Matematyki WE PP. 6 marca 2018
STATYSTYKA OPISOWA Dr Alina Gleska Instytut Matematyki WE PP 6 marca 2018 1 pozwalaja określić, czy jednostki zbiorowości maja tendencje do skupiania się przy niskich wartościach cechy (tzw. asymetria
Bardziej szczegółowoPozyskiwanie wiedzy z danych
Pozyskiwanie wiedzy z danych dr Agnieszka Goroncy Wydział Matematyki i Informatyki UMK PROJEKT WSPÓŁFINANSOWANY ZE ŚRODKÓW UNII EUROPEJSKIEJ W RAMACH EUROPEJSKIEGO FUNDUSZU SPOŁECZNEGO Pozyskiwanie wiedzy
Bardziej szczegółowoZałożenia do analizy wariancji. dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW
Założenia do analizy wariancji dr Anna Rajfura Kat. Doświadczalnictwa i Bioinformatyki SGGW anna_rajfura@sggw.pl Zagadnienia 1. Normalność rozkładu cechy Testy: chi-kwadrat zgodności, Shapiro-Wilka, Kołmogorowa-Smirnowa
Bardziej szczegółowoInstrukcja korzystania z portalu. Diagnoza z Nową Erą
Instrukcja korzystania z portalu Diagnoza z Nową Erą Spis treści 1. Przypisanie szkoły do nauczyciela 2. Przypisanie klas do nauczyciela 3. Wybór testu diagnostycznego 4. Realizacja diagnozy 5. Ocena testów
Bardziej szczegółowoNaszym zadaniem jest rozpatrzenie związków między wierszami macierzy reprezentującej poziomy ekspresji poszczególnych genów.
ANALIZA SKUPIEŃ Metoda k-means I. Cel zadania Zadaniem jest analiza zbioru danych, gdzie zmiennymi są poziomy ekspresji genów. Podczas badań pobrano próbki DNA od 36 różnych pacjentów z chorobą nowotworową.
Bardziej szczegółowoTestowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;
LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny
Bardziej szczegółowoStatystyki opisowe i szeregi rozdzielcze
Statystyki opisowe i szeregi rozdzielcze - ćwiczenia ĆWICZENIA Piotr Ciskowski ramka-wąsy przykład 1. krwinki czerwone Stanisz W eksperymencie farmakologicznym analizowano oddziaływanie pewnego preparatu
Bardziej szczegółowoPorównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
Bardziej szczegółowoSTATYSTYKA POWTORZENIE. Dr Wioleta Drobik-Czwarno
STATYSTYKA POWTORZENIE Dr Wioleta Drobik-Czwarno Populacja Próba Parametry EX, µ Statystyki średnia D 2 X, δ 2 S 2 wnioskowanie DX, δ p ρ S w r...... JAK POWSTAJE MODEL MATEMATYCZNY Dane eksperymentalne
Bardziej szczegółowoPodstawy statystyki matematycznej w programie R
Podstawy statystyki matematycznej w programie R Piotr Ćwiakowski Wydział Fizyki Uniwersytetu Warszawskiego Zajęcia 1. Wprowadzenie 1 marca 2017 r. Program R Wprowadzenie do R i badań statystycznych podstawowe
Bardziej szczegółowoPrzedmowa Wykaz symboli Litery alfabetu greckiego wykorzystywane w podręczniku Symbole wykorzystywane w zagadnieniach teorii
SPIS TREŚCI Przedmowa... 11 Wykaz symboli... 15 Litery alfabetu greckiego wykorzystywane w podręczniku... 15 Symbole wykorzystywane w zagadnieniach teorii mnogości (rachunku zbiorów)... 16 Symbole stosowane
Bardziej szczegółowoMail: Pokój 214, II piętro
Wykład 2 Mail: agnieszka.nowak@us.edu.pl Pokój 214, II piętro http://zsi.tech.us.edu.pl/~nowak Predykcja zdolność do wykorzystania wiedzy zgromadzonej w systemie do przewidywania wartości dla nowych danych,
Bardziej szczegółowoSTATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE
STATYSTYKA - PRZYKŁADOWE ZADANIA EGZAMINACYJNE 1 W trakcie badania obliczono wartości średniej (15,4), mediany (13,6) oraz dominanty (10,0). Określ typ asymetrii rozkładu. 2 Wymień 3 cechy rozkładu Gauss
Bardziej szczegółowoNiestandardowa tabela częstości
raportowanie Niestandardowa tabela częstości Przemysław Budzewski Predictive Solutions Do czego dążymy W Generalnym Sondażu Społecznym USA w 1991 roku badaniu poddano respondentów należących do szeregu
Bardziej szczegółowoWykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)
Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy) Co na dzisiejszym wykładzie: definicje, sposoby wyznaczania i interpretacja STATYSTYK OPISOWYCH prezentacja
Bardziej szczegółowoPORADNIK DLA NAUCZYCIELI AKADEMICKICH SGGW WERYFIKACJA OSIĄGANIA ZAKŁADANYCH EFEKTÓW KSZTAŁCENIA
PORADNIK DLA NAUCZYCIELI AKADEMICKICH SGGW WERYFIKACJA OSIĄGANIA ZAKŁADANYCH EFEKTÓW KSZTAŁCENIA Opracował: dr Mariusz Maciejczak Pełnomocnik Rektora ds. JakościKształcenia UWAGA! 1. Weryfikację osiągania
Bardziej szczegółowoAnaliza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Bardziej szczegółowoStatystyka Matematyczna Anna Janicka
Statystyka Matematyczna Anna Janicka wykład I, 22.02.2016 STATYSTYKA OPISOWA, cz. I Kwestie techniczne Kontakt: ajanicka@wne.uw.edu.pl Dyżur: strona z materiałami z przedmiotu: wne.uw.edu.pl/azylicz akson.sgh.waw.pl/~aborata
Bardziej szczegółowoTomography Tracking Instrukcja użytkownika
Tomography Tracking Instrukcja użytkownika 1 Spis treści 1. Wymagania... 3 2. Pierwsze uruchomienie... 3 3. Główne okno aplikacji... 3 4. Menu podręczne... 4 a. Zakładka File... 4 b. Zakładka Edit... 4
Bardziej szczegółowoAleksander Galisz. Gf aktura 1.0. Podręcznik użytkownika 2011-07-19
Aleksander Galisz Gf aktura 1.0 Podręcznik użytkownika 2011-07-19 1 Spis treści 1. Wymagania systemowe... 4 2. Instalacja... 4 2.1. Instalacja.NET Framework 3.5 SP1... 4 2.2. Instalacja programu Wkhtmltopdf...
Bardziej szczegółowoInstrukcja obsługi elektronicznego formularza harmonogramu w ZSI SEZAM
Instrukcja obsługi elektronicznego formularza harmonogramu w ZSI SEZAM 1. Zakładki Harmonogram i Harmonogram projekty kluczowe Po zalogowaniu się do ZSI SEZAM użytkownik ma w menu do wyboru szereg zakładek.
Bardziej szczegółowoMateriał dotyczy generowania różnego typu wykresów w środowisku R.
Materiał dotyczy generowania różnego typu wykresów w środowisku R. Pamiętajmy, że niektóre typy wykresów są dedykowane do pewnych typów danych. Na potrzeby ćwiczeń początkowych załadujemy sobie zbiór danych
Bardziej szczegółowoStatystyczne metody analizy danych przy użyciu środowiska R
Statystyczne metody analizy danych przy użyciu środowiska R Agnieszka Nowak - Brzezińska Instytut Informatyki, Uniwersytet Śląski Wybrane zagadnienia Plan wystąpienia 1. Wprowadzenie. 2. Środowisko R.
Bardziej szczegółowoANALIZA DANYCH PIERWOTNYCH mgr Małgorzata Kromka
ANALIZA DANYCH PIERWOTNYCH mgr Małgorzata Kromka Wprowadzenie do SPSS PRACA SOCJALNA Rok 1 Czym jest SPSS? SPSS to bardzo rozbudowany program. Pozwala sprawnie pracować ze zbiorami danych, analizować własne
Bardziej szczegółowoAnaliza współzależności zjawisk. dr Marta Kuc-Czarnecka
Analiza współzależności zjawisk dr Marta Kuc-Czarnecka Wprowadzenie Prawidłowości statystyczne mają swoje przyczyny, w związku z tym dla poznania całokształtu badanego zjawiska potrzebna jest analiza z
Bardziej szczegółowoWykład 1. Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy
Wykład Podstawowe pojęcia Metody opisowe w analizie rozkładu cechy Zbiorowość statystyczna - zbiór elementów lub wyników jakiegoś procesu powiązanych ze sobą logicznie (tzn. posiadających wspólne cechy
Bardziej szczegółowoMAH GPS. Krótki podręcznik użytkownika. Adam Sosnowski Glen sp. Z o.o. wersja 1.1 grudzieo 2010
MAH GPS Krótki podręcznik użytkownika Spis treści Adres i uruchomienie strony... 2 Instrukcja działania strony:... 2 Ekrany aplikacji :... 3 Logowanie do systemu:... 3 Podgląd zarejestrowanych wizyt...
Bardziej szczegółowoWEKA klasyfikacja z użyciem sztucznych sieci neuronowych
WEKA klasyfikacja z użyciem sztucznych sieci neuronowych 1 WEKA elementy potrzebne do zadania WEKA (Data mining software in Java http://www.cs.waikato.ac.nz/ml/weka/) jest narzędziem zawierającym zbiór
Bardziej szczegółowoKorelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego
Korelacja oznacza współwystępowanie, nie oznacza związku przyczynowo-skutkowego Współczynnik korelacji opisuje siłę i kierunek związku. Jest miarą symetryczną. Im wyższa korelacja tym lepiej potrafimy
Bardziej szczegółowoWYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd
WYKŁADY ZE STATYSTYKI MATEMATYCZNEJ wykład 2 - statystyka opisowa cd Agata Boratyńska Agata Boratyńska Statystyka matematyczna, wykład 2 1 / 20 MIARY ROZPROSZENIA, Wariancja Wariancją z próby losowej X
Bardziej szczegółowoPolicealna Szkoła Handlowa Rok I Wymiar godzin: 30 jednostek dydaktycznych Nr programu nauczania: 341(06)/SP/MEN/ (technik rachunkowości)
Plan pracy dydaktycznej (jest to wstępna wersja planu, który będzie doskonalony) STATYSTYKA Technikum/Liceum Handlowe dla Dorosłych Klasa I Wymiar godzin: 1 godz. w tygodniu w sem. I i II. (bloki tematyczne:
Bardziej szczegółowoMetody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2
Metody matematyczne w analizie danych eksperymentalnych - sygnały, cz. 2 Dr hab. inż. Agnieszka Wyłomańska Faculty of Pure and Applied Mathematics Hugo Steinhaus Center Wrocław University of Science and
Bardziej szczegółowoImportowanie danych do SPSS Eksportowanie rezultatów do formatu MS Word... 22
Spis treści Przedmowa do wydania pierwszego.... 11 Przedmowa do wydania drugiego.... 15 Wykaz symboli.... 17 Litery alfabetu greckiego wykorzystywane w podręczniku.... 17 Symbole wykorzystywane w zagadnieniach
Bardziej szczegółowoTWORZENIE ANKIETY ZA POMOCĄ SERWISU PB ONLINE
PB ONLINE Sp. z o.o. TWORZENIE ANKIETY ZA POMOCĄ SERWISU PB ONLINE PRZEWODNIK Zawartość 1. Informacje wstępne... 4 1.1. WŁAŚCIWOŚCI ANKIETY... 4 1.2. PODSTAWOWE INFORMACJE O ANKIECIE... 5 1.3. OPCJE DODATKOWE...
Bardziej szczegółowoMIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy
MIARY POŁOŻENIA Opisują średni lub typowy poziom wartości cechy. Określają tą wartość cechy, wokół której skupiają się wszystkie pozostałe wartości badanej cechy. Wśród nich można wyróżnić miary tendencji
Bardziej szczegółowoMariusz Piotrowski Barbara Fatyga Zespół Węzła Centralnego OŻK-SB
Mariusz Piotrowski Barbara Fatyga Zespół Węzła Centralnego OŻK-SB INSTRUKCJA - PRZYKŁAD PRACY Z DANYMI MOJEJ POLIS Przygotowanie tabeli z danymi: Struktura wykształcenia kobiet w powiecie olsztyńskim na
Bardziej szczegółowoPODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA
PODSTAWOWE ANALIZY I WIZUALIZACJA Z WYKORZYSTANIEM MAP W STATISTICA Krzysztof Suwada, StatSoft Polska Sp. z o.o. Wstęp Wiele różnych analiz dotyczy danych opisujących wielkości charakterystyczne bądź silnie
Bardziej szczegółowoKARTA KURSU. (do zastosowania w roku ak. 2015/16) Kod Punktacja ECTS* 4
KARTA KURSU (do zastosowania w roku ak. 2015/16) Nazwa Statystyka 1 Nazwa w j. ang. Statistics 1 Kod Punktacja ECTS* 4 Koordynator Dr hab. Tadeusz Sozański (koordynator, wykłady) Dr Paweł Walawender (ćwiczenia)
Bardziej szczegółowoStatystyczne metody analizy danych. Agnieszka Nowak - Brzezińska
Statystyczne metody analizy danych Agnieszka Nowak - Brzezińska SZEREGI STATYSTYCZNE SZEREGI STATYSTYCZNE odpowiednio usystematyzowany i uporządkowany surowy materiał statystyczny. Szeregi statystyczne
Bardziej szczegółowo7.4 Automatyczne stawianie prognoz
szeregów czasowych za pomocą pakietu SPSS Następnie korzystamy z menu DANE WYBIERZ OBSERWACJE i wybieramy opcję WSZYSTKIE OBSERWACJE (wówczas wszystkie obserwacje są aktywne). Wreszcie wybieramy z menu
Bardziej szczegółowo2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych.
Laboratorium z ekonometrii (GRETL) 2. Wprowadzenie do oprogramowania gretl. Podstawowe operacje na danych. 2.1 Zaimportuj dane z pliku zatrudnienie.csv z przecinkiem jako separatorem danych i kropką jako
Bardziej szczegółowoPomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś.
Pomiary urodzeń według płci noworodka i województwa.podział na miasto i wieś. Województwo Urodzenia według płci noworodka i województwa. ; Rok 2008; POLSKA Ogółem Miasta Wieś Pozamałżeńskie- Miasta Pozamałżeńskie-
Bardziej szczegółowoMetodyka wykonania kartogramu z podziałem na klasy wg punktów charakterystycznych wraz z opracowaniem kartogramicznej legendy.
Metodyka wykonania kartogramu z podziałem na klasy wg punktów charakterystycznych wraz z opracowaniem kartogramicznej legendy. 1. Otwieramy warstwę powiaty.shp w programie Quantum GIS. Ikona służy do dodawania
Bardziej szczegółowo( x) Równanie regresji liniowej ma postać. By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : Gdzie:
ma postać y = ax + b Równanie regresji liniowej By obliczyć współczynniki a i b należy posłużyć się następującymi wzorami 1 : xy b = a = b lub x Gdzie: xy = też a = x = ( b ) i to dane empiryczne, a ilość
Bardziej szczegółowo1. Opis tabelaryczny. 2. Graficzna prezentacja wyników. Do technik statystyki opisowej można zaliczyć:
Wprowadzenie Statystyka opisowa to dział statystyki zajmujący się metodami opisu danych statystycznych (np. środowiskowych) uzyskanych podczas badania statystycznego (np. badań terenowych, laboratoryjnych).
Bardziej szczegółowoInżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium VIII: Analiza kanoniczna
1 Laboratorium VIII: Analiza kanoniczna Spis treści Laboratorium VIII: Analiza kanoniczna... 1 Wiadomości ogólne... 2 1. Wstęp teoretyczny.... 2 Przykład... 2 Podstawowe pojęcia... 2 Założenia analizy
Bardziej szczegółowoElementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
Bardziej szczegółowoJeśli wcześniej było wybierane połączenie z bazą danych w oknie Połączenia pokaże się jego nazwa, jeśli nie należy dodad Nowe połączenie.
Wstawianie punktów adresowych Dodawanie warstwy wektorowej punktów adresowych... 1 Dodawanie warstwy Google Satellite (WMS z plugina OpenLayers)... 2 Dodawanie warstwy ortofotomapa (WMS z GUGiK)... 3 Dodawanie
Bardziej szczegółowoTransport II stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny) Studia stacjonarne (stacjonarne / niestacjonarne)
Załącznik nr 7 do Zarządzenia Rektora nr../12 z dnia.... 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Metody probabilistyczne w transporcie Nazwa modułu w języku angielskim Probabilistic
Bardziej szczegółowoW1. Wprowadzenie. Statystyka opisowa
W1. Wprowadzenie. Statystyka opisowa dr hab. Jerzy Nakielski Zakład Biofizyki i Morfogenezy Roślin Plan wykładu: 1. O co chodzi w statystyce 2. Etapy badania statystycznego 3. Zmienna losowa, rozkład
Bardziej szczegółowoρ siła związku korelacyjnego brak słaba średnia silna bardzo silna
Ćwiczenie 4 ANALIZA KORELACJI, BADANIE NIEZALEŻNOŚCI Analiza korelacji jest działem statystyki zajmującym się badaniem zależności pomiędzy rozkładami dwu lub więcej badanych cech w populacji generalnej.
Bardziej szczegółowo