Sprawozdanie - Case Study Analiza skupień na danych opisujących piłkarzy

Wielkość: px
Rozpocząć pokaz od strony:

Download "Sprawozdanie - Case Study Analiza skupień na danych opisujących piłkarzy"

Transkrypt

1 Sprawozdanie - Case Study Analiza skupień na danych opisujących piłkarzy Politechnika Poznańska Wydział Informatyki, TPD Tomasz Cichowicz Filip Rytwiński

2 Spis treści 1. Spis treści 2. Wstęp a. Uwagi początkowe b. Opis danych 3. Analiza danych a. Badanie zależności między zmiennymi b. Badanie zmienności atrybutów c. Standaryzacja wartości atrybutów d. Punkty odstające 4. Analiza skupień a. Analiza z użyciem hierarchicznych algorytmów aglomeracyjnych b. Analiza metodami podziałowo-optymalizacyjnymi 5. Opis skupień 6. Podsumowanie 7. Załącznik - dane źródłowe Wstęp W ramach tego studium przypadku należało dokonać analizy skupień, aby zapoznać się z różnymi metodami grupowania i sposobami doboru parametrów do nich. Uwagi początkowe Podczas wykonywania ćwiczenia używano oprogramowania Microsoft Excel 2013 oraz StatSoft Statistica w wersji 10. Wykorzystano algorytmy z dziedziny analizy skupień oraz funkcje statystyczne (statystyki opisowe) w implementacji Statistica. Excel posłużył jedynie jako narzędzie do przygotowania zbioru danych. Opis danych Zgodnie z poleceniem wybrano dane o wielu atrybutach. W celu uproszczenia analizy skupień wszystkie atrybuty są atrybutami liczbowymi. Zdecydowano się wybrać dane o piłkarzach z sezonu 2012/2013. Wybór piłkarzy kierowano osobistymi preferencjami zespołu przeprowadzającego poniższe studium przypadku. Wybrano piłkarzy głównie z pierwszych jedenastek dwóch drużyn: Realu Madryt i FC Barcelony. Listę graczy uzupełniono również o kilka znaczących postaci z angielskiej Premier League i hiszpańskiej Primera Divison. 2

3 Celowo wybrano graczy zróżnicowanych, grających na różnych pozycjach oraz o różnych stylach gry. Uwzględniono gwiazdy światowego futbolu, jak i zawodników mniej znanych, jednak każdy z graczy uczestniczy w różnych rozgrywkach na najwyższym poziomie. Analizowane statystyki meczowe są sumą wszystkich rozgrywek, w których gracz brał udział od początku sezonu 2012/2013 do końca roku Naszą intuicją jest, że zawodnicy będą różnić się ze względu na pozycję. Wszystkie dane pozyskano z serwisu transfermarkt.pl. W zbiorze danych nie występują braki wartości dla atrybutów. Dane zamieszczono w załączniku. Każdy z 39 graczy opisany jest przez 14 atrybutów wymienionych poniżej: Wiek, Wzrost, Wartość rynkowa, Liczba meczów, Liczba bramek strzelonych, Liczba bramek samobójczych, Liczba asyst, Żółte kartki, Dwie żółte kartki w jednym meczu, Czerwone kartki, Zmieniający (wchodzący) - liczba sytuacji, kiedy gracz zmieniał innego gracza, Zmieniany (schodzący) - liczba sytuacji, kiedy gracz był zmieniany przez innego gracza, Średnia liczba minut na jedną bramkę (jeśli gracz nie zdobył żadnej bramki w sezonie przyjęto wartość 0), Liczba minut spędzonych na boisku. Analiza danych Badanie zależności między zmiennymi Na początku wykonano analizę zależności pomiędzy atrybutami. W związku z faktem, iż wszystkie atrybuty są numeryczne wyliczono macierz korelacji między nimi. Na podstawie analizy otrzymanej macierzy postanowiono usunąć atrybut "liczba minut spędzonych na boisku". Do decyzji tej przyczynił się współczynnik korelacji z atrybutem "liczba meczów" o wartości 0,7 oraz słabsze korelacje z atrybutami "liczba żółtych kartek" (0,43) oraz "zmieniający (wchodzący)" (-0,561). Usunięto również atrybut wywiedziony "średnia liczba minut na jedną bramkę". Wyliczano go zgodnie ze wzorem: "liczba minut spędzonych na boisku"/"liczba bramek strzelonych". 3

4 Badanie zmienności atrybutów Przed rozpoczęciem analizy skupień na wybranym zbiorze danych wykonano analizę zmienności atrybutów. Wyliczenie podstawowych statystyk, takich jak odchylenie standardowe, wariancja oraz współczynnik zmienności, pozwoliło zredukować liczbę atrybutów o kolejne trzy: "dwie żółte kartki", "czerwone kartki" i "bramki samobójcze", otrzymując końcowo 9 atrybutów do dalszej analizy. Ww. atrybuty odrzucono ze względu na odchylenie standardowe bliskie zeru, przez co klasyczny współczynnik zmienności również był blisku zeru. Innymi słowy, dla odrzuconych atrybutów zróżnicowanie wartości było bardzo małe, przez co nie pełniłyby one dobrej roli dyskryminującej dla grupy obserwacji. Standaryzacja wartości atrybutów Charakterystyka danych wymusiła na zespole przeprowadzającym poniższe studium przypadku standaryzację wartości wszystkich atrybutów. Wynikało to z ogromnych różnic w rzędach wielkości pomiędzy poszczególnymi atrybutami (wartość rynkową graczy wyrażano w milionach euro, podczas gdy liczba bramek strzelonych nie przekraczała 36). Standaryzację wykonano przy użyciu oprogramowania Statistica. Wszystkie atrybuty traktowano z taką samą wagą. Punkty odstające Przed rozpoczęciem analizy skupień poddano badaniu występowanie w zbiorze danych punktów odstających. W tym celu wykonano analizę metodą Single Link Agglomerative Clustering do utworzenia drzewa hierarhicznego, na podstawie którego otrzymano dwa przykłady znacząco odstające od pozostałych. 4

5 Rys. 1 - analiza metodą Single Link Agglomerative Clustering Punkty te to rekordy opisujące Lionela Messiego i Cristiano Ronaldo. Postanowiono jednak uwzględnić obie te obserwacje w dalszej analizie, gdyż wspomniana wyżej dwójka uważana jest przez wielu za najlepszych obecnie piłkarzy na świecie, stąd znacząca odległość od pozostałych graczy. Analiza skupień Analiza z użyciem hierarchicznych algorytmów aglomeracyjnych W pierwszym kroku odnajdywania skupień w wybranym zbiorze danych wykorzystano algorytm aglomeracyjny zaimplementowane w pakiecie StatSoft Statistica. Krok ten miał na celu ułatwienie doboru liczby skupień dla dalszej analizy algorytmem k-średnich. Algorytm ten można sterować przez dobór metryki odległości i metody łączenia skupień. Początkowo korzystano z odległości euklidesowej i metody łączenia skupień poprzez pojedyncze wiązanie (rys. 1). Niestety charakterystyka otrzymanego drzewa pokazywałą, iż możliwe skupienia nie są od siebie znacząco oddalone. Niepoprawność modelu potwierdziła 5

6 również wiedza ekspercka, która nie pozwoliła znaleźć żadnych merytorycznych cech wspólnych dla możliwych skupień. Rys. 2 - wykres odległości wiązania względem etapów wiązania dla algorytmu aglomeracyjnego wykorzystującego odległość euklidesową i metodę łączenia poprzez pojedyncze wiązania Wykres na rysunku 2. ukazuje niską jakość otrzymanego modelu w kontekście kryterium zmienności międzyskupieniowej. Można na nim również zaobserwować wspomniane wcześniej dwa punkty osobliwe (nagły skok przy końcu wykresu). Podobne wyniki osiągnięto również używając metryki euklidesowej wraz z metodą pełnego wiązania, lecz powstało tam mniej grup, choć zlokalizowanych dalej od siebie (wyniki przedstawiono na rysunku 3). Z jednej strony ułatwiało to interpretację otrzymanych wyników, lecz uznaliśmy taki dendrogram za w dalszym ciągu niewystarczający. 6

7 Rys. 3 - Otrzymane drzewo (po lewej) i wykres odległości wiązania względem etapów wiązania (po prawej) dla algorytmu algomeracyjnego, odległość euklidesowa, pełne wiązania W dalszych krokach postanowiono wykonać analizę korzystając z innych metryk oraz innych metod łączenia skupień. Zbadano wiele kombinacji parametrów, ale najlepszą w sensie jakościowym (wykres odległości wiązania w kolejnych etapach), jak i wiedzy eksperckiej okazała się metoda minimalnej wariancji Warda w połączeniu z metryką r-pearsona. Przy użyciu tych algorytmów udało się uzyskać model, który bardzo nas ucieszył, gdyż otrzymane grupy dzieliły piłkarzy ze względu na zajmowane przez nich pozycje na boisku i ich kluczowość dla całej drużyny (liderzy drużyny, zawodnicy podstawowi, czy rezerwowi). Drzewo uzyskane w tym przypadku przedstawia rysunek 4. 7

8 Rys. 4 - wynik algorytmu aglomeracyjnego dla metody Warda w połączeniu z metryką 1-r Pearsona Z powyższego diagramu widać, iż grupy powstające w procesie analizy skupień są wyraźnie od siebie oddzielone. Na podstawie kształtu otrzymanego drzewa można wyciągnąć wniosek, iż otrzymywane w kolejnych krokach grupy są równomierne jeśli chodzi o gęstość występowania w nich elementów zbioru wejściowego. Wskazuje na to kształt drzewa, który przypomina drzewo zrównoważone. Choć powstałe skupienia początkowo są niewielkie to odpowiednie przycięcie powstałego drzewa doprowadzi do powstania kilku skupień o sensownej merytorycznie zawartości. Kolejnym argumentem wspierającym tezę o dobrym pogrupowaniu badanych przykładów jest kształt wykresu odległości wiązania względem etapów wiązania przedstawiony na rysunku 5. Analiza rysunków 4 i 5. wskazuje na istnienie od 4 do 5 odległych od siebie skupień. 8

9 Rys. 5 - wykres odległości wiązania dla metody Warda w połączeniu z metryką 1-r Pearsona Analiza metodami podziałowo-optymalizacyjnymi Każda podziałowo-optymalizacyjna metoda analizy skupień na wejściu wymaga podania parametrów. W wypadku poniższego studium przypadku postanowiono użyć metody k-średnich. Metoda ta na wejściu wymaga podania oczekiwanej ilości skupień, liczby iteracji oraz kryterium wyboru początkowych obserwacji. W związku z tym, iż w poprzedniej części ćwiczenia zauważono, iż obserwacje są względnie blisko siebie postanowiono wybrać początkowe położenia centroidów maksymalizujące odległość międzyskupieniową. Na podstawie otrzymanych w poprzednim punkcie dendrogramów wyznaczono liczbę k. Zgodnie z najbardziej obiecującymi wynikami (metoda minimalnej wariancji Warda z metryką r-pearsona) badania przeprowadzano używając k ϵ {4, 5, 6, 7}. Chęć sprawdzenia wyników algorytmu dla liczby skupień 6 i 7 podyktowana była także wynikami otrzymanymi dla metody pełnego wiązania przy użyciu metryki euklidesowej. 9

10 Jako pierwsze przedstawmy wyniki algorytmu dla k = 7. Dokładne przydziały do grup opisane zostaną w ostatnim punkcie sprawozdania. Otrzymane w tym przypadku grupy jedynie częściowo dają się wytłumaczyć wiedzą ekspercką, a dodatkowo nie można ich w łatwy sposób dyskryminować między sobą, co pokazuje wykres na rysunku 6. Rys. 6 - wykres średnich każdego skupienia dla k = 7 Wykres ten ukazuje, iż istnieje jedna grupa oddalona znacznie od innych, w momencie gdy 6 pozostałych nie daje się jednoznacznie rozdzielić używając wiedzy eksperckiej. Dodatkowo warto zaznaczyć, iż oddalona grupa jest jednoelementowa - jest to punkt odstający (Lionel Messi). Dla k ϵ {6, 5} otrzymano wyniki bardzo podobne, jak w przypadku k = 7. Grupy w dalszym ciągu były bliskie sobie, lecz udało się zauważyć trend, który pokazywał, iż wraz ze zmniejszaniem k, skupienia są bardziej wyraziste jeśli chodzi o "klasę" tworzących ją zawodników. 10

11 Rys. 7 - Wykresy średnich dla każdego skupienia dla k ϵ {5, 6} Jeśli chodzi o miary jakościowe, to zgodnie z przypuszczeniami wraz ze zmniejszaniem się k, malała zmienność międzyskupieniowa i zwiększała się zmienność wewnątrzskupieniowa, co początkowo nas zaniepokoiło, lecz biorąc pod uwagę otrzymywane wyniki postanowiliśmy kontynuować eksperyment. Wyniki te przedstawiono w tabeli 1. k Średnia odległość międzyskupieniowa Średnia odległość wewnątrzskupieniowa 4 16, , , , , , , ,43221 Tab. 1 - średnie odległości międzyskupieniowe i wewnątrzskupieniowe dla różnych k Idąc krok dalej, dla k = 4, udało się osiągnąć niemalże idealną klasyfikację zawodników, która opisana zostanie w ostatnim punkcie poniższego sprawozdania. Jak łatwo zauważyć k = 4, jest wartością wskazaną przez algorytm hierarchiczny (metoda minimalnej wariancji Warda i metryka 1-r Pearsona) i od początku była faworytem przy doborze parametrów dla algorytmu podziałowo-optymalizacyjnego. Na rysunku 8 przedstawiono wykres średnich w otrzymanych grupach. 11

12 Rys. 8 - Wykres średnich dla każdego skupienia dla k = 4 Jak widać na powyższym, grupy są od siebie wyraźniej odseparowane. Dodatkowo utworzony przez algorytm model tłumaczy rzeczywistość, co jest potwierdzeniem poprawności doboru liczby skupień dla algorytmu. Opis skupień 1 Cristiano Ronaldo, Falcao, Lionel Messi, Zlatan Ibrahimovic, Robin van Persie, Robert Lewandowski 2 Álvaro Arbeloa, Carles Puyol, Victor Valdés, Iker Casillas, David Villa, Adriano, Xavi, Dani Alves 3 Mesut Özil, Ángel Di María, Karim Benzema, Alexis Sanchez, Stephan El Shaarawy, Pedro, Jordi Alba 4 José María Callejón, Christial Tello, Martin Montoya, Gonzalo Higuaín, Alex Song 12

13 5 Marcelo, Wayne Rooney, Cesc Fabregas, Andres Iniesta 6 Pepe, Sergio Ramos, Sergio Busquets, Xabi Alonso, Javier Mascherano 7 Sami Khedira, David de Gea, Gerard Pique, Joe Hart Tab. 2 - skupienia odczytane z dendrogramu z rysunku 4 dla odległości 2 Na początku opiszmy wynik działania algorytmu hierarchicznego z metodą Warda i metryką 1- r Pearsona. Pierwsze ze skupień zawiera wybitnych piłkarzy grających w ofensywie, przez co możemy powiedzić, iż jego centroid przedstawia profil świetnego napastnika. Skupienie 4 to gracze rezerwowi i kontuzjowani, natomiast klasa 6 przedstawia graczy z pola o nastawieniu typowo defensywnym. Niestety kolejne skupienia nie posiadają już tak jednoznacznej charakterystyki. Zawierają one graczy zarówno atakujących, bramkarzy, obrońców jak i rezerwowych. Widać pewne tendencje - np. skupienie drugie to obrońcy i bramkarze, a trzecie i piąte to pomocnicy i napastnicy z błędnie zaklasyfikowanymi bocznymi obrońcami. Nie widzimy jednoznacznych zależności od wzrostu czy wieku. Jedynymi silnymi regułami opisującymi grupy jest liczba bramek i wartość rynkowa gracza, co widać szczególnie po pierwszej grupie, w mniejszym stopniu po kolejnych. 1 Gonzalo Higuaín, Marcelo, Xavi, Alex Song, Martin Montoya, Dani Alves, Adriano, Jordi Alba, Carles Puyol 2 Cristiano Ronaldo, Falcao, Zlatan Ibrahimovic, Robin van Persie, Wayne Rooney, Robert Lewandowski, Lionel Messi 3 Pepe, Sergio Ramos, Álvaro Arbeloa, Sami Khedira, Xabi Alonso, Victor Valdés Sergio Busquets, Javier Mascherano, Gerard Pique, Iker Casillas, Joe Hart, David de Gea 4 Mesut Özil, José María Callejón, Ángel Di María, Karim Benzema, Stephan El Shaarawy, David Villa, Pedro, Alexis Sanchez, Christial Tello, Cesc Fabregas, Andres Iniesta Tab. 3 - skupienia otrzymane w wyniku działania algorytmu k-średnich dla k = 4; wyróżniono graczy najbliższych środkowi centroidu Wynik działania algorytmu k-średnich przedstawiony w tabeli 3 dla najmniejszego z badanych k jest najbardziej korzystny, pomimo że niektóre klasy zostały lekko wymieszane. Analizując wspomnianą tabelę oraz rysunek 8, można zauważyć, iż pierwsza klasa prezentuje graczy rezerwowych, kontuzjowanych w sezonie 2012/2013 oraz bocznych obrońców. Cechują ich ogólnie niskie statystyki. Druga z odnalezionych klas to napastnicy, typowi strzelcy bramek, gwiazdy zespołów, a co za tym idzie zawodnicy najdroższi. Skupienie trzecie to zawodnicy odpowiedzialni za strefę obronną, także bramkarze. Charakteryzują się sporym wzrostem oraz niską liczbą bramek i asyst. Ostatnią, czwartą klasę reprezentują pomocnicy i napastnicy nie będący "typowymi 9", a więc wracający często do środka pola. Są oni najczęściej autorami ostatnich podań oraz często wymieniają się, ze względu na spory dystans, który muszą 13

14 pokonać w każdym meczu. Dodatkowo w ramach ciekawostki, graczy podkreślonych w tabeli 3 traktować możemy jako średni obraz piłkarza w danej grupie. Idąc tym tropem, Pepe przedstawia model średniego, jeśli chodzi o wartości badanych atrybutów, obrońcy. Podsumowanie Na podstawie rzeczywistych danych wejściowych udało się uzyskać zadziwiająco dobre wyniki analizy skupień. Otrzymano grupy opisujące funkcje piłkarzy na boisku i w drużynie. Eksperyment wykazał, iż wykorzystanie jedynie algorytmu AHC nie było wystarczające, gdyż otrzymane grupy nie były interpretowalne w kontekście posiadanej przez nas wiedzy eksperckiej. Natomiast na jego podstawie wyznaczono parametr k, dzięki któremu osiągnięto bardzo dobre wyniki przy użyciu algorytmu k-średnich. Pomimo pogorszania zmienności wewnątrz i między skupieniowych sensownym w kontekście interpretacji wyników okazała się wartość k = 4. Gorsze wartości owych statystyk skutkowały mieszaniem się niektórych informacji. Przykładowo nie ma rozróżnienia pomiędzy bramkarzem, a obrońcą, lecz nie występują grupy, które trudno jednoznacznie opisać jakościowo. Jak opisano w poniższym studium przypadku, grupowanie nie było determinowane przez jeden, bądź dwa atrybuty, lecz okazało się skomplikowane i złożone (model obrońcy, a model napastnika). Załącznik - dane źródłowe Legenda atrybutów: 1. Imię i nazwisko 2. Wiek 3. Wzrost 4. Wartość rynkowa 5. Mecze 6. Bramki 7. Bramki samobójcze 8. Asysty 9. Żółte kartki 10. Dwie żółte kartki 11. Czerwone kartki 12. Zmieniający (wchodzący) 13. Zmieniany (schodzący) 14. Minuty na boisku 15. Minuty na bramkę 14

15 Mesut Özil José María Callejón Ángel Di María Cristiano Ronaldo Karim Benzema Gonzalo Higuaín Pepe Sergio Ramos Marcelo Álvaro Arbeloa Sami Khedira Xabi Alonso Falcao Zlatan Ibrahimovic Stephan El Shaarawy Robin van Persie Wayne Rooney Robert Lewandowski Victor Valdés Lionel Messi David Villa Pedro

16 Alexis Sanchez Christial Tello Cesc Fabregas Andres Iniesta Xavi Alex Song Sergio Busquets Martin Montoya Dani Alves Adriano Jordi Alba Javier Mascherano Carles Puyol Gerard Pique Iker Casillas Joe Hart David de Gea

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817

Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Analiza Danych Sprawozdanie regresja Marek Lewandowski Inf 59817 Zadanie 1: wiek 7 8 9 1 11 11,5 12 13 14 14 15 16 17 18 18,5 19 wzrost 12 122 125 131 135 14 142 145 15 1 154 159 162 164 168 17 Wykres

Bardziej szczegółowo

Inteligentna analiza danych

Inteligentna analiza danych Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki

Bardziej szczegółowo

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA

METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA METODY CHEMOMETRYCZNE W IDENTYFIKACJI ŹRÓDEŁ POCHODZENIA AMFETAMINY Waldemar S. Krawczyk Centralne Laboratorium Kryminalistyczne Komendy Głównej Policji, Warszawa (praca obroniona na Wydziale Chemii Uniwersytetu

Bardziej szczegółowo

Hierarchiczna analiza skupień

Hierarchiczna analiza skupień Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym

Bardziej szczegółowo

Wykład 4: Statystyki opisowe (część 1)

Wykład 4: Statystyki opisowe (część 1) Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można

Bardziej szczegółowo

Mecz nr 1 POLSKA - GRECJA : 1-1. Strzelcy bramek: Lewandowski, Salpingidis. Wyniki wytypowane przez uczestników: Wytypowane

Mecz nr 1 POLSKA - GRECJA : 1-1. Strzelcy bramek: Lewandowski, Salpingidis. Wyniki wytypowane przez uczestników: Wytypowane Mecz nr 1 POLSKA - GRECJA : 1-1 Strzelcy bramek: Lewandowski, Salpingidis i wytypowane przez uczestników: 2-1 - 0 2-1 - 0 Mecz nr 2 ROSJA - CZECHY : 4-1 Strzelcy bramek: Dżagojew, Dżagojew, Szyrokow, Pawluczenko,

Bardziej szczegółowo

Zachowania odbiorców. Grupa taryfowa G

Zachowania odbiorców. Grupa taryfowa G Zachowania odbiorców. Grupa taryfowa G Autor: Jarosław Tomczykowski Biuro PTPiREE ( Energia elektryczna luty 2013) Jednym z założeń wprowadzania smart meteringu jest optymalizacja zużycia energii elektrycznej,

Bardziej szczegółowo

Mecz piłki nożnej Europa vs Ameryka Południowa

Mecz piłki nożnej Europa vs Ameryka Południowa Mecz piłki nożnej Europa vs Ameryka Południowa Urealniając taki mecz należałoby wskazać rzeczywiste ramy czasowe, kiedy taki spektakl mógłby się odbyć. Na pewno teraz, kiedy trwa sezon przygotowawczy,

Bardziej szczegółowo

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu

Bardziej szczegółowo

STATYSTYKA I DOŚWIADCZALNICTWO

STATYSTYKA I DOŚWIADCZALNICTWO STATYSTYKA I DOŚWIADCZALNICTWO Wykład 9 Analiza skupień wielowymiarowa klasyfikacja obiektów Metoda, a właściwie to zbiór metod pozwalających na grupowanie obiektów pod względem wielu cech jednocześnie.

Bardziej szczegółowo

Wprowadzenie do analizy dyskryminacyjnej

Wprowadzenie do analizy dyskryminacyjnej Wprowadzenie do analizy dyskryminacyjnej Analiza dyskryminacyjna to zespół metod statystycznych używanych w celu znalezienia funkcji dyskryminacyjnej, która możliwie najlepiej charakteryzuje bądź rozdziela

Bardziej szczegółowo

ALGORYTMY SZTUCZNEJ INTELIGENCJI

ALGORYTMY SZTUCZNEJ INTELIGENCJI ALGORYTMY SZTUCZNEJ INTELIGENCJI Sieci neuronowe 06.12.2014 Krzysztof Salamon 1 Wstęp Sprawozdanie to dotyczy ćwiczeń z zakresu sieci neuronowych realizowanym na przedmiocie: Algorytmy Sztucznej Inteligencji.

Bardziej szczegółowo

Marian Maciocha. Żelazny skład rozwiązanie zadania dla Czytelników

Marian Maciocha. Żelazny skład rozwiązanie zadania dla Czytelników Marian Maciocha Żelazny skład rozwiązanie zadania dla Czytelników Zadanie: W pewnym klubie piłki nożnej uprawnionych do gry w barwach tego klubu jest 19 zawodników: 3 bramkarzy, 7 obrońców, 5 pomocników

Bardziej szczegółowo

Techniki grupowania danych w środowisku Matlab

Techniki grupowania danych w środowisku Matlab Techniki grupowania danych w środowisku Matlab 1. Normalizacja danych. Jedne z metod normalizacji: = = ma ( y =, rσ ( = ( ma ( = min = (1 + e, min ( = σ wartość średnia, r współczynnik, σ odchylenie standardowe

Bardziej szczegółowo

Grupowanie Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633

Grupowanie Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633 Grupowanie Grupowanie 7 6 5 4 y 3 2 1 0-3 -2-1 0 1 2 3 4 5-1 -2-3 -4 x Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633 Wprowadzenie Celem procesu grupowania jest podział zbioru

Bardziej szczegółowo

IV Turniej Oldbojów w Piłce Nożnej. o Puchar Burmistrza Gminy Rymanów.

IV Turniej Oldbojów w Piłce Nożnej. o Puchar Burmistrza Gminy Rymanów. IV Turniej Oldbojów w Piłce Nożnej o Puchar Burmistrza Gminy Rymanów. ORLIK KLIMKÓWKA 3 września 2016r. godz. 15:00 Turniej Oldbojów w Piłce Nożnej o Puchar Burmistrza Gminy Rymanów w ramach programu Moje

Bardziej szczegółowo

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy

MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy MIARY POŁOŻENIA Opisują średni lub typowy poziom wartości cechy. Określają tą wartość cechy, wokół której skupiają się wszystkie pozostałe wartości badanej cechy. Wśród nich można wyróżnić miary tendencji

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Eksploracja danych Co to znaczy eksploracja danych Klastrowanie (grupowanie) hierarchiczne Klastrowanie

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

HALOWY TURNIEJ PIŁKI NOŻNEJ

HALOWY TURNIEJ PIŁKI NOŻNEJ I HALOWY TURNIEJ PIŁKI NOŻNEJ ROCZNIK 2005 I MŁODSI O PUCHAR GAZETY ZAMOJSKIEJ ZAMOŚĆ 14 GRUDNIA 2014R. PRZEPISY GRY INFORMACJE OGÓLNE: miejsce rozgrywek - Ośrodek Sportu i Rekreacji w Zamościu, ul. Królowej

Bardziej szczegółowo

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41

Statystyka. Wykład 4. Magdalena Alama-Bućko. 13 marca Magdalena Alama-Bućko Statystyka 13 marca / 41 Statystyka Wykład 4 Magdalena Alama-Bućko 13 marca 2017 Magdalena Alama-Bućko Statystyka 13 marca 2017 1 / 41 Na poprzednim wykładzie omówiliśmy następujace miary rozproszenia: Wariancja - to średnia arytmetyczna

Bardziej szczegółowo

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część

Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część Populacja generalna (zbiorowość generalna) zbiór obejmujący wszystkie elementy będące przedmiotem badań Próba (podzbiór zbiorowości generalnej) część populacji, którą podaje się badaniu statystycznemu

Bardziej szczegółowo

Wykład 5: Statystyki opisowe (część 2)

Wykład 5: Statystyki opisowe (część 2) Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz

Bardziej szczegółowo

Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska

Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska Algorytmy rozpoznawania obrazów 11. Analiza skupień dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Analiza skupień Określenia: analiza skupień (cluster analysis), klasteryzacja (clustering), klasyfikacja

Bardziej szczegółowo

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne)

Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Korzystanie z podstawowych rozkładów prawdopodobieństwa (tablice i arkusze kalkulacyjne) Przygotował: Dr inż. Wojciech Artichowicz Katedra Hydrotechniki PG Zima 2014/15 1 TABLICE ROZKŁADÓW... 3 ROZKŁAD

Bardziej szczegółowo

3. Wojewódzkie zróżnicowanie zatrudnienia w ochronie zdrowia w latach Opis danych statystycznych

3. Wojewódzkie zróżnicowanie zatrudnienia w ochronie zdrowia w latach Opis danych statystycznych 3. Wojewódzkie zróżnicowanie zatrudnienia w ochronie zdrowia w latach 1995-2005 3.1. Opis danych statystycznych Badanie zmian w potencjale opieki zdrowotnej można przeprowadzić w oparciu o dane dotyczące

Bardziej szczegółowo

Analiza gry defensywnej zespołów w meczu ligowym Real Madryt - FC Barcelona runda jesienna sezonu 2010/2011

Analiza gry defensywnej zespołów w meczu ligowym Real Madryt - FC Barcelona runda jesienna sezonu 2010/2011 Analiza gry defensywnej zespołów w meczu ligowym Real Madryt - FC Barcelona runda jesienna sezonu 2010/2011 Analiza gry defensywnej zespołu Real Madryt Tab.1 Charakterystyka liczbowa odbiorów piłki w poszczególnych

Bardziej szczegółowo

Analiza składowych głównych. Wprowadzenie

Analiza składowych głównych. Wprowadzenie Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących

Bardziej szczegółowo

ZASADY UCZESTNICTWA W TURNIEJU PRZEPISY I ZASADY GRY

ZASADY UCZESTNICTWA W TURNIEJU PRZEPISY I ZASADY GRY ZASADY UCZESTNICTWA W TURNIEJU 1. Przed rozpoczęciem turnieju opiekunowie drużyn (trener, kierownik) zobowiązani są do dostarczenia organizatorowi składów zespołów z wyszczególnieniem numerów, z jakimi

Bardziej szczegółowo

Algorytm grupowania danych typu kwantyzacji wektorów

Algorytm grupowania danych typu kwantyzacji wektorów Algorytm grupowania danych typu kwantyzacji wektorów Wstęp Definicja problemu: Typowe, problemem często spotykanym w zagadnieniach eksploracji danych (ang. data mining) jest zagadnienie grupowania danych

Bardziej szczegółowo

W tym celu korzystam z programu do grafiki wektorowej Inkscape 0.46.

W tym celu korzystam z programu do grafiki wektorowej Inkscape 0.46. 1. Wprowadzenie Priorytetem projektu jest zbadanie zależności pomiędzy wartościami średnich szybkości przemieszczeń terenu, a głębokością eksploatacji węgla kamiennego. Podstawowe dane potrzebne do wykonania

Bardziej szczegółowo

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33

Statystyka. Wykład 4. Magdalena Alama-Bućko. 19 marca Magdalena Alama-Bućko Statystyka 19 marca / 33 Statystyka Wykład 4 Magdalena Alama-Bućko 19 marca 2018 Magdalena Alama-Bućko Statystyka 19 marca 2018 1 / 33 Analiza struktury zbiorowości miary położenia ( miary średnie) miary zmienności (rozproszenia,

Bardziej szczegółowo

Wykład 4 Związki i zależności

Wykład 4 Związki i zależności Wykład 4 Związki i zależności Rozważmy: Dane z dwiema lub więcej zmiennymi Zagadnienia do omówienia: Zmienne objaśniające i zmienne odpowiedzi Wykres punktowy Korelacja Prosta regresji Słownictwo: Zmienna

Bardziej szczegółowo

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium IX: Analiza skupień

Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych. Laboratorium IX: Analiza skupień 1 Laboratorium IX: Analiza skupień Spis treści Laboratorium IX: Analiza skupień... 1 Wiadomości ogólne... 2 1. Wstęp teoretyczny.... 2 1.1. Wprowadzenie.... 2 1.2. Metody hierarchiczne analizy skupień....

Bardziej szczegółowo

MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY

MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY MODELOWANIE KOSZTÓW USŁUG ZDROWOTNYCH PRZY WYKORZYSTANIU METOD STATYSTYCZNYCH mgr Małgorzata Pelczar 6 Wprowadzenie Reforma służby zdrowia uwypukliła problem optymalnego ustalania kosztów usług zdrowotnych.

Bardziej szczegółowo

Statystyki opisowe i szeregi rozdzielcze

Statystyki opisowe i szeregi rozdzielcze Statystyki opisowe i szeregi rozdzielcze - ćwiczenia ĆWICZENIA Piotr Ciskowski ramka-wąsy przykład 1. krwinki czerwone Stanisz W eksperymencie farmakologicznym analizowano oddziaływanie pewnego preparatu

Bardziej szczegółowo

Naszym zadaniem jest rozpatrzenie związków między wierszami macierzy reprezentującej poziomy ekspresji poszczególnych genów.

Naszym zadaniem jest rozpatrzenie związków między wierszami macierzy reprezentującej poziomy ekspresji poszczególnych genów. ANALIZA SKUPIEŃ Metoda k-means I. Cel zadania Zadaniem jest analiza zbioru danych, gdzie zmiennymi są poziomy ekspresji genów. Podczas badań pobrano próbki DNA od 36 różnych pacjentów z chorobą nowotworową.

Bardziej szczegółowo

Idea. Algorytm zachłanny Algorytmy hierarchiczne Metoda K-średnich Metoda hierarchiczna, a niehierarchiczna. Analiza skupień

Idea. Algorytm zachłanny Algorytmy hierarchiczne Metoda K-średnich Metoda hierarchiczna, a niehierarchiczna. Analiza skupień Idea jest narzędziem analizy danych służącym do grupowania n obiektów, opisanych za pomocą wektora p-cech, w K niepustych, rozłącznych i możliwie jednorodnych grup skupień. Obiekty należące do danego skupienia

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe

Typy zmiennych. Zmienne i rekordy. Rodzaje zmiennych. Graficzne reprezentacje danych Statystyki opisowe Typy zmiennych Graficzne reprezentacje danych Statystyki opisowe Jakościowe charakterystyka przyjmuje kilka możliwych wartości, które definiują klasy Porządkowe: odpowiedzi na pytania w ankiecie ; nigdy,

Bardziej szczegółowo

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak

Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin. Henryk Bujak Metody statystyczne wykorzystywane do oceny zróżnicowania kolekcji genowych roślin Henryk Bujak e-mail: h.bujak@ihar.edu.pl Ocena różnorodności fenotypowej Różnorodność fenotypowa kolekcji roślinnych zasobów

Bardziej szczegółowo

Otrzymaliśmy w ten sposób ograniczenie na wartości parametru m.

Otrzymaliśmy w ten sposób ograniczenie na wartości parametru m. Dla jakich wartości parametru m dziedziną funkcji f ( x) = x + mx + m 1 jest zbiór liczb rzeczywistych? We wzorze funkcji f(x) pojawia się funkcja kwadratowa, jednak znajduje się ona pod pierwiastkiem.

Bardziej szczegółowo

OTWARTE MISTRZOSTWA DĄBROWY TARNOWSKIEJ W HALOWEJ PIŁCE NOZNEJ REGULAMIN

OTWARTE MISTRZOSTWA DĄBROWY TARNOWSKIEJ W HALOWEJ PIŁCE NOZNEJ REGULAMIN OTWARTE MISTRZOSTWA DĄBROWY TARNOWSKIEJ W HALOWEJ PIŁCE NOZNEJ REGULAMIN Organizator MLKS Dąbrovia Dąbrowa Tarnowska i Urząd Miasta Dąbrowa Tarnowska Miejsce Hala Sportowa Agaty Mróz-Olszewskiej Dąbrowa

Bardziej szczegółowo

Algorytm grupowania danych typu kwantyzacji wektorów

Algorytm grupowania danych typu kwantyzacji wektorów Algorytm grupowania danych typu kwantyzacji wektorów Wstęp Definicja problemu: Typowe, rozważane dotychczas problemy koncentrowały się na nauczeniu na podstawie zbioru treningowego i zbioru etykiet klasyfikacji

Bardziej szczegółowo

REGULAMIN AMATORSKIEJ LIGI PIŁKI NOŻNEJ O PUCHAR DYREKTORA PARKU WODNEGO Relax

REGULAMIN AMATORSKIEJ LIGI PIŁKI NOŻNEJ O PUCHAR DYREKTORA PARKU WODNEGO Relax REGULAMIN AMATORSKIEJ LIGI PIŁKI NOŻNEJ O PUCHAR DYREKTORA PARKU WODNEGO Relax I. ORGANIZATOR Park Wodny Relax Świdwin oraz KOZPN. II. PRZEPISY OGÓLNE a) Miejscem rozgrywek Świdwińskiej Ligi Piłki Nożnej

Bardziej szczegółowo

DATA I MIEJSCE: o godz. 9:00 rozpoczęcie turnieju, hala sportowa im. A. Gołasia w Ostrołęce ul. Traugutta.

DATA I MIEJSCE: o godz. 9:00 rozpoczęcie turnieju, hala sportowa im. A. Gołasia w Ostrołęce ul. Traugutta. III Ogólnopolski Turniej Piłki Nożnej Korona Mazovia Cup - rocznik 2010 i młodsi organizowany przez OTS KORONA OSTROŁĘKA przy wsparciu URZĘDU MARSZAŁKOWSKIEGO WOJEWÓDZTWA MAZOWIECKIEGO DATA I MIEJSCE:

Bardziej szczegółowo

4.3 Grupowanie według podobieństwa

4.3 Grupowanie według podobieństwa 4.3 Grupowanie według podobieństwa Przykłady obiektów to coś więcej niż wektory wartości atrybutów. Reprezentują one poszczególne rasy psów. Ważnym pytaniem, jakie można sobie zadać, jest to jak dobrymi

Bardziej szczegółowo

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40

Statystyka. Wykład 5. Magdalena Alama-Bućko. 26 marca Magdalena Alama-Bućko Statystyka 26 marca / 40 Statystyka Wykład 5 Magdalena Alama-Bućko 26 marca 2018 Magdalena Alama-Bućko Statystyka 26 marca 2018 1 / 40 Uwaga Gdy współczynnik zmienności jest większy niż 70%, czyli V s = s x 100% > 70% (co świadczy

Bardziej szczegółowo

ANALIZA SPRZEDAŻY: - rozproszenia

ANALIZA SPRZEDAŻY: - rozproszenia KOŁO NAUKOWE CONTROLLINGU UNIWERSYTET ZIELONOGÓRSKI ANALIZA SPRZEDAŻY: - rozproszenia - koncentracji - sezonowości Spis treści Wstęp... 3 Analiza rozproszenia sprzedaży... 4 Analiza koncentracji sprzedaży...

Bardziej szczegółowo

NOWE WYTYCZNE I INTERPRETACJE PRZEPISÓW GRY W PIŁKĘ RĘCZNĄ. Obowiązujące od 01 lipca 2018 r.

NOWE WYTYCZNE I INTERPRETACJE PRZEPISÓW GRY W PIŁKĘ RĘCZNĄ. Obowiązujące od 01 lipca 2018 r. NOWE WYTYCZNE I INTERPRETACJE PRZEPISÓW GRY W PIŁKĘ RĘCZNĄ. Obowiązujące od 01 lipca 2018 r. OSTATNIE 30 SEKUND Sprytna taktyka ma kluczowe znaczenie w ostatnich 30 sekundach meczu. Przyjęcie nowych wyjaśnień

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel:

1 n. s x x x x. Podstawowe miary rozproszenia: Wariancja z populacji: Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: Wariancja z populacji: Podstawowe miary rozproszenia: 1 1 s x x x x k 2 2 k 2 2 i i n i1 n i1 Czasem stosuje się też inny wzór na wariancję z próby, tak policzy Excel: 1 k 2 s xi x n 1 i1 2 Przykład 38,

Bardziej szczegółowo

Czym jest analiza skupień?

Czym jest analiza skupień? Statystyczna analiza danych z pakietem SAS Analiza skupień metody hierarchiczne Czym jest analiza skupień? wielowymiarowa technika pozwalająca wykrywać współzależności między obiektami; ściśle związana

Bardziej szczegółowo

Poznań, 14 grudnia 2002. Case Study 2 Analiza skupień

Poznań, 14 grudnia 2002. Case Study 2 Analiza skupień Poznań, 14 grudnia 2002 Case Study 2 Analiza skupień Celem ćwiczenia jest przeprowadzenie procesu grupowania / analizy skupień dla jednego z wybranych zbiorów danych (tj. dostarczonych przez prowadzącego).

Bardziej szczegółowo

Przykładowe ćwiczenia stosowane w treningu techniczno-taktycznym na Wyspach Brytyjskich.

Przykładowe ćwiczenia stosowane w treningu techniczno-taktycznym na Wyspach Brytyjskich. Przykładowe ćwiczenia stosowane w treningu techniczno-taktycznym na Wyspach Brytyjskich. Opracowanie Kamil Socha Obserwując angielski futbol nie moŝna się oprzeć wraŝeniu, Ŝe oglądamy mecz w przyspieszonym

Bardziej szczegółowo

Metody analizy skupień Wprowadzenie Charakterystyka obiektów Metody grupowania Ocena poprawności grupowania

Metody analizy skupień Wprowadzenie Charakterystyka obiektów Metody grupowania Ocena poprawności grupowania Wielowymiarowe metody segmentacji CHAID Metoda Automatycznej Detekcji Interakcji CHAID Cele CHAID Dane CHAID Przebieg analizy CHAID Parametry CHAID Wyniki Metody analizy skupień Wprowadzenie Charakterystyka

Bardziej szczegółowo

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych

Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo

Bardziej szczegółowo

I jr*» iiiii»iiim«i PRZEDMECZOWA KWIECIEŃ

I jr*» iiiii»iiim«i PRZEDMECZOWA KWIECIEŃ I jr*» v I iiiii»iiim«i PRZEDMECZOWA KWIECIEŃ 2011 25 KULISY NOWOCZESNEGO TRENINGU Rozgrzewka przedmeczowa jest jednym z kluczowych momentów wpływających na przebieg i wynik rywalizacji w każdym sporcie.

Bardziej szczegółowo

3. Organizacja rozgrzewki jak na rysunku- dowolne podania pomiędzy zawodnikami w sposób określony przez trenera, po wykonaniu podania zawodnicy wykonu

3. Organizacja rozgrzewki jak na rysunku- dowolne podania pomiędzy zawodnikami w sposób określony przez trenera, po wykonaniu podania zawodnicy wykonu 1. Organizacja rozgrzewki jak na rysunku. Wymiana podań i zatrzymanie piłki zmiana miejsc następuje poprzez wykonanie ćwiczenia w ruchu wg schematu. Na sygnał trenera zmiana zawodników środkowych i skrajnych.

Bardziej szczegółowo

Wykład 3. Rozkład normalny

Wykład 3. Rozkład normalny Funkcje gęstości Rozkład normalny Reguła 68-95-99.7 % Wykład 3 Rozkład normalny Standardowy rozkład normalny Prawdopodobieństwa i kwantyle dla rozkładu normalnego Funkcja gęstości Frakcja studentów z vocabulary

Bardziej szczegółowo

Skrypt 29. Statystyka. Opracowanie L2

Skrypt 29. Statystyka. Opracowanie L2 Projekt Innowacyjny program nauczania matematyki dla liceów ogólnokształcących współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego Skrypt 29 Statystyka 1. Przypomnienie

Bardziej szczegółowo

Rozstęp Pozycyjne Odchylenie ćwiartkowe Współczynnik zmienności

Rozstęp Pozycyjne Odchylenie ćwiartkowe Współczynnik zmienności Miary zmienności: Miary zmienności Klasyczne Wariancja Odchylenie standardowe Odchylenie przeciętne Współczynnik zmienności Rozstęp Pozycyjne Odchylenie ćwiartkowe Współczynnik zmienności 2 Spróbujmy zastanowić

Bardziej szczegółowo

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej) 1 Podział ze względu na zakres danych użytych do wyznaczenia miary Miary opisujące

Bardziej szczegółowo

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change Raport 4/2015 Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change autor: Michał Osmoła INIME Instytut nauk informatycznych i matematycznych

Bardziej szczegółowo

RAPORT ZBIORCZY z diagnozy umiejętności matematycznych

RAPORT ZBIORCZY z diagnozy umiejętności matematycznych RAPORT ZBIORCZY z diagnozy umiejętności matematycznych przeprowadzonej w klasach szóstych szkół podstawowych Analiza statystyczna Wskaźnik Wartość wskaźnika Wyjaśnienie Liczba uczniów Liczba uczniów, którzy

Bardziej szczegółowo

Sulmierzycka Liga Halowej Piłki Nożnej. III edycja 2015/2016. o Puchar Przewodniczącego Rady Gminy w Sulmierzycach

Sulmierzycka Liga Halowej Piłki Nożnej. III edycja 2015/2016. o Puchar Przewodniczącego Rady Gminy w Sulmierzycach Sulmierzycka Liga Halowej Piłki Nożnej III edycja 2015/2016 o Puchar Przewodniczącego Rady Gminy w Sulmierzycach R e g u l a m i n I. CEL: 1.Wyłonienie najlepszych drużyn Sulmierzyckiej Ligi Halowej Piłki

Bardziej szczegółowo

Arkusz kalkulacyjny Excel

Arkusz kalkulacyjny Excel Arkusz kalkulacyjny Excel Ćwiczenie 1. Sumy pośrednie (częściowe). POMOC DO ĆWICZENIA Dzięki funkcji sum pośrednich (częściowych) nie jest konieczne ręczne wprowadzanie odpowiednich formuł. Dzięki nim

Bardziej szczegółowo

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV

Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną

Bardziej szczegółowo

Elementy statystyki wielowymiarowej

Elementy statystyki wielowymiarowej Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych

Bardziej szczegółowo

I Ogólnopolski turniej halowej piłki nożnej GOOL CUP rocznik 2009 i młodsi organizowany przez Akademię Młodego Piłkarza Gool

I Ogólnopolski turniej halowej piłki nożnej GOOL CUP rocznik 2009 i młodsi organizowany przez Akademię Młodego Piłkarza Gool I Ogólnopolski turniej halowej piłki nożnej GOOL CUP rocznik 2009 i młodsi organizowany przez Akademię Młodego Piłkarza Gool DATA I MIEJSCE: 17.12.2017 o godz. 9:00 rozpoczęcie turnieju, hala sportowa

Bardziej szczegółowo

Agnieszka Nowak Brzezińska Wykład III

Agnieszka Nowak Brzezińska Wykład III Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe

Bardziej szczegółowo

KONSPEKT JEDNOSTKI TRENINGOWEJ

KONSPEKT JEDNOSTKI TRENINGOWEJ KONSPEKT JEDNOSTKI TRENINGOWEJ Temat: Kształtowanie wytrzymałości specjalnej w ćwiczeniach techniki i małych grach taktycznych w okresie przygotowania specjalnego. Czas: 120 min. Grupa wiekowa: U 18 Ilość

Bardziej szczegółowo

Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór.

Zadanie 1. Za pomocą analizy rzetelności skali i wspólczynnika Alfa- Cronbacha ustalić, czy pytania ankiety stanowią jednorodny zbiór. L a b o r a t o r i u m S P S S S t r o n a 1 W zbiorze Pytania zamieszczono odpowiedzi 25 opiekunów dzieci w wieku 8. lat na następujące pytania 1 : P1. Dziecko nie reaguje na bieżące uwagi opiekuna gdy

Bardziej szczegółowo

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy)

Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy) Wykład 3. Metody opisu danych (statystyki opisowe, tabele liczności, wykresy ramkowe i histogramy) Co na dzisiejszym wykładzie: definicje, sposoby wyznaczania i interpretacja STATYSTYK OPISOWYCH prezentacja

Bardziej szczegółowo

Konferencja Trenerska Lubuskiego Związku Piłki Nożnej

Konferencja Trenerska Lubuskiego Związku Piłki Nożnej Konferencja Trenerska Lubuskiego Związku Piłki Nożnej Trening pokazowy 25/11/2012 Lubsko Rafał Ulatowski Kształtowanie zdolności motorycznych z akcentem szybkości i wytrzymałości dostosowanych do treningu

Bardziej szczegółowo

Sterowanie procesem i jego zdolność. Zbigniew Wiśniewski

Sterowanie procesem i jego zdolność. Zbigniew Wiśniewski Sterowanie procesem i jego zdolność Zbigniew Wiśniewski Wybór cech do kart kontrolnych Zaleca się aby w pierwszej kolejności były brane pod uwagę cechy dotyczące funkcjonowania wyrobu lub świadczenia usługi

Bardziej szczegółowo

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide.

Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide. Ćwiczenie: Wprowadzenie do obsługi programu statystycznego SAS Enterprise Guide. Statystyka opisowa w SAS Enterprise Guide. 1. Załóż we własnym folderze podfolder o nazwie cw2 i przekopiuj do niego plik

Bardziej szczegółowo

Badanie zależności skala nominalna

Badanie zależności skala nominalna Badanie zależności skala nominalna I. Jak kształtuje się zależność miedzy płcią a wykształceniem? II. Jak kształtuje się zależność między płcią a otyłością (opis BMI)? III. Jak kształtuje się zależność

Bardziej szczegółowo

Regresja linearyzowalna

Regresja linearyzowalna 1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:

Bardziej szczegółowo

Regulamin Kieleckiej Amatorskiej Ligi Piłkarskiej

Regulamin Kieleckiej Amatorskiej Ligi Piłkarskiej Regulamin Kieleckiej Amatorskiej Ligi Piłkarskiej Informacje ogólne 1. Organizatorem rozgrywek jest Ludowy Uczniowski Katolicki Klub Sportowy LUKKS Kielce 2. Mecze odbywają się na sztucznym boisku przy

Bardziej szczegółowo

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) Praca z danymi zaczyna się od badania rozkładu liczebności (częstości) zmiennych. Rozkład liczebności (częstości) zmiennej to jakie wartości zmienna

Bardziej szczegółowo

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia

Wykład 2. Statystyka opisowa - Miary rozkładu: Miary położenia Wykład 2 Statystyka opisowa - Miary rozkładu: Miary położenia Podział miar Miary położenia (measures of location): 1. Miary tendencji centralnej (measures of central tendency, averages): Średnia arytmetyczna

Bardziej szczegółowo

Pro Evolution Soccer 2008

Pro Evolution Soccer 2008 Nieoficjalny polski poradnik GRY-OnLine do gry Pro Evolution Soccer 2008 autor: Maciej maciek_ssi Bajorek (c) 2007 GRY-OnLine sp. z o.o. Producent Konami, Wydawca Konami, Wydawca PL CD Projekt Prawa do

Bardziej szczegółowo

Konspekt lekcji treningowej. Przykładowy małe gry i gry pomocnicze w treningu piłkarza (gry zadaniowe) Opracowanie Maciej Cieślik

Konspekt lekcji treningowej. Przykładowy małe gry i gry pomocnicze w treningu piłkarza (gry zadaniowe) Opracowanie Maciej Cieślik Konspekt lekcji treningowej Przykładowy małe gry i gry pomocnicze w treningu piłkarza (gry zadaniowe) Opracowanie Maciej Cieślik a. małe gry Gra 1 na 1 na 4 bramki. Gra 2 na 2 na dwie bramki. Gra 1 na

Bardziej szczegółowo

REGULAMIN TURNIEJU PIŁKI NOŻNEJ

REGULAMIN TURNIEJU PIŁKI NOŻNEJ REGULAMIN TURNIEJU PIŁKI NOŻNEJ 1. W Turnieju mogą wziąć udział drużyny, które zostały zgłoszone do dnia 15 sierpnia 2013 r. Zgłoszenia drużyn po tym terminie nie będą przyjmowane. 2. Zgłoszenia drużyny

Bardziej szczegółowo

Eksploracja danych. Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Grupowanie wykład 1

Eksploracja danych. Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Grupowanie wykład 1 Grupowanie Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Grupowanie wykład 1 Sformułowanie problemu Dany jest zbiór obiektów (rekordów). Znajdź naturalne pogrupowanie

Bardziej szczegółowo

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY)

STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) STATYSTYKA OPISOWA. LICZBOWE CHARAKTERYSTYKI(MIARY) Dla opisania rozkładu badanej zmiennej, korzystamy z pewnych charakterystyk liczbowych. Dzielimy je na cztery grupy.. Określenie przeciętnej wartości

Bardziej szczegółowo

Konspekt zajęć sportowych dla kategorii: ORLIK data: r.

Konspekt zajęć sportowych dla kategorii: ORLIK data: r. Konspekt zajęć sportowych dla kategorii: ORLIK data:29.02.2016r. Prowadzący: Marek Siatrak (AMO Jelenia Góra) Miejsce zajęć: Boisko Orlik ZSOiT ul. Jana Pawła II Temat zajęć: Rozwijanie inteligencji piłkarskiej

Bardziej szczegółowo

Małe gry z akcentem na fazy przejściowe

Małe gry z akcentem na fazy przejściowe Małe gry z akcentem na fazy przejściowe Ćwiczenie nr 1 Gra na utrzymanie piłki 4x4+4 Zawodnicy czerwoni grają na utrzymanie piłki z zewnętrznymi, zdobywają punkt za wymianę określonej przez trenera ilości

Bardziej szczegółowo

Modelowanie glikemii w procesie insulinoterapii

Modelowanie glikemii w procesie insulinoterapii Dawid Kaliszewski Modelowanie glikemii w procesie insulinoterapii Promotor dr hab. inż. Zenon Gniazdowski Cel pracy Zbudowanie modelu predykcyjnego przyszłych wartości glikemii diabetyka leczonego za pomocą

Bardziej szczegółowo

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Prezentacja materiału statystycznego Szeroko rozumiane modelowanie i prognozowanie jest zwykle kluczowym celem analizy danych. Aby zbudować model wyjaśniający relacje pomiędzy różnymi aspektami rozważanego

Bardziej szczegółowo

Kształtowanie szybkości Starty w parach ze strzałem. U 14 U 16

Kształtowanie szybkości Starty w parach ze strzałem. U 14 U 16 Kształtowanie szybkości Starty w parach ze strzałem. U 14 U 16-3 - 3-3 - 3-2 - 12-8 - 4-4 Rozgrzewka. Ćwiczenie I Zawodnicy podzieleni na cztery grupy ustawieni są w odległości 10 m. od stojaków. Czterech

Bardziej szczegółowo

PROPOZYCJE FORM I ORGANIZACJI MAŁYCH GIER W RÓŻNYCH KRAJACH NA ŚWIECIE

PROPOZYCJE FORM I ORGANIZACJI MAŁYCH GIER W RÓŻNYCH KRAJACH NA ŚWIECIE PROPOZYCJE FORM I ORGANIZACJI MAŁYCH GIER W RÓŻNYCH KRAJACH NA ŚWIECIE / FOOTBALL FEDERATION AUSTRALIA / I. Zaobserwowane korzyści z małych gier statystyka Obserwując różne gry 4x4, 7x7, 11x11 udowodniono,

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Eksploracja danych Algorytmy klastujące Problem 3 Mając daną chmurę punktów chcielibyśmy zrozumieć ich

Bardziej szczegółowo

Podstawy grupowania danych w programie RapidMiner Michał Bereta

Podstawy grupowania danych w programie RapidMiner Michał Bereta Podstawy grupowania danych w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Grupowanie hierarchiczne Grupowanie (analiza skupieo, ang. clustering) ma na celu automatyczne wykrycie grup istniejących

Bardziej szczegółowo

Podstawy statystyki - ćwiczenia r.

Podstawy statystyki - ćwiczenia r. Zadanie 1. Na podstawie poniższych danych wyznacz i zinterpretuj miary tendencji centralnej dotyczące wysokości miesięcznych zarobków (zł): 1290, 1500, 1600, 2250, 1400, 1600, 2500. Średnia arytmetyczna

Bardziej szczegółowo

Wykład 5: Analiza dynamiki szeregów czasowych

Wykład 5: Analiza dynamiki szeregów czasowych Wykład 5: Analiza dynamiki szeregów czasowych ... poczynając od XIV wieku zegar czynił nas najpierw stróżów czasu, następnie ciułaczy czasu, i wreszcie obecnie - niewolników czasu. W trakcie tego procesu

Bardziej szczegółowo

Agnieszka Nowak Brzezińska

Agnieszka Nowak Brzezińska Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia

Bardziej szczegółowo

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona;

Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; LABORATORIUM 4 Testowanie hipotez dla dwóch zmiennych zależnych. Moc testu. Minimalna liczność próby; Regresja prosta; Korelacja Pearsona; dwie zmienne zależne mierzalne małe próby duże próby rozkład normalny

Bardziej szczegółowo