Drzewa klasykacyjne Konspekt do zaj : Statystyczne metody analizy danych
|
|
- Michał Osiński
- 8 lat temu
- Przeglądów:
Transkrypt
1 Drzewa klasykacyjne Konspekt do zaj : Statystyczne metody analizy danych Agnieszka Nowak-Brzezi«ska 11 stycznia Wprowadzenie Drzewa klasykacyjne 1 jako reprezentacja wiedzy o klasykacji s do± atrakcyjne i popularno±, jak ciesz si wykorzystuj ce je algorytmy uczenia si poj, jest uzasadniona ich istotnymi zaletami. Po pierwsze, mog one reprezentowa dowolnie zªo»one poj cia pojedyncze i wielokrotne, je±li tylko ich de- nicje mo»na wyrazi w zale»no±ci od atrybutów u»ywanych do opisu przykªadów. Mówi c bardziej precyzyjnie, za pomoc drzewa, mo»e by reprezentowana dowolna funkcja odwzorowuj ca warto±ci wszystkich okre±lonych na dziedzinie atrybutów na zbiór kategorii, czyli dowolna dopuszczalna hipoteza. Reprezentacja wykorzystuj ca drzewa, jest przy tym, dla typowych poj, do± efektywna pami ciowo, a tak»e, co na pewno zasªuguje na uwag, drzewa takie umo»liwiaj niezwykle efektywn implementacj procesu klasykowania przykªadów. Ponadto istnieje ªatwe przej±cie od drzewa do reprezentacji reguªowej uwa»anej przez wielu, za najbardziej czyteln. Cel zaj Celem zaj jest poznanie metod budowy i analizy drzew klasykacyjnych przy u»yciu ±rodowiska R. 2 Drzewa klasykacyjne Drzewem decyzyjnym (klasykacyjnym) okre±limy drzewo reprezentuj ce proces podziaªu zbioru obiektów na jednorodne klasy. W takim drzewie wewn trzne w zªy b d opisywa sposób dokonania podziaªu na jednorodne klasy (dokonywany w oparciu o warto±ci cech obiektów), a li±cie klasom, do których obiekty nale». Z kolei kraw dzie drzewa reprezentuj warto±ci cech, na podstawie których dokonano podziaªu. Przykªad drzewa decyzyjnego przedstawia rysunek Proces tworzenia drzewa Celem jest oczywi±cie zbudowanie drzewa jak najmniejszego (o minimalnej liczbie w zªów), po to by by otrzymane reguªy klasykacji byªy jak najprostsze. Bardzo ogólna posta algorytmu skªada si z nast puj cych kroków: 1W literaturze cz ±ciej mo»emy spotka okre±lenia: drzewo decyzyjne. W statystyce cz sto tak»e: drzewa regresyjne, drzewa dyskryminacyjne 1
2 stopa procentowa wzrost zysk przedsi biorstwa spadek Ceny akcji spadaj poziom cen akcji spadek Ceny akcji spadaj wzrost spadek stopa procentowa Ceny akcji rosn Rysunek 1: Drzewo decyzyjne - klasykacyjne wzrost wzrost zysk przedsi biorstwa 1. Maj c zbiór obiektów S, sprawd¹, czy nale» one do tej samej klasy. Je±li tak, to zako«cz prac. 2. W przeciwnym przypadku rozwa» wszystkie mo»liwe podziaªy zbioru S na podzbiory S 1, S 2,...S n tak, aby byªy one jak najbardziej jednorodne. 3. Dokonaj oceny jako±ci ka»dego z tych podziaªów zgodnie z przyj tym kryterium i wybierz najlepszy z nich. 4. Podziel zbiór S w wybrany sposób. 5. Wykonaj kroki 1-4 rekurencyjnie dla ka»dego z podzbiorów. Na podstawie drzewa klasykacyjnego mo»na ªatwo sformuªowa reguªy przynale»no±ci obiektów do klas w odniesieniu do drzewa przedstawionego na rysunku 1: ˆ W przypadku spadku cen akcji: "je»eli stopa procentowa ro±nie i zyski przedsi biorstw spadaj to ceny akcji spadaj " ˆ w przypadku wzrostu cen akcji: "je»eli stopa procentowa spada, lub je±li stopa procentowa ro±nie ale jednocze±nie rosn zyski przedsi biorstw rosn to ceny akcji rosn." 2.2 Rodzaje drzew klasykacyjnych Ró»nice dotycz postaci funkcji oceniaj cej jako±ci podziaªu, sposobu klasykacji obiektów o brakuj cych warto±ciach cech, itd. Najbardziej elementarny podziaª drzew decyzyjnych to podziaª na: ˆ drzewa binarne, w których z ka»dego wewn trznego w zªa wychodz jedynie dwie kraw dzie, 2
3 ˆ drzewa niebinarne - gdzie z w zªa mog wychodzic wi cej ni» dwie kraw dzie. Tabela 1 2 prezentuje znane algorytmy budowy drzew klasykacyjnych z podziaªem na binarne i dowolne. Najpopularniejsze stosowane algorytmy to: Tablica 1: Rodzaje algorytmów tworzenia drzew decyzyjnych NAZWA ROK AUTORZY RODZAJ DRZEWA CLS 1996 Hunt,Marin, Stone binarne ACLS 1982 Paterson, Niblett binarne ID Quinlan dowolne CART 1984 Brieman, Friedman Olshen, Stone binarne ASSISTANT 1985 Kononenko binarne ID Schlimmer, Fisdher dowolne PLS 1986 Rendell dowolne C Quinlan dowolne GID Chengf, Fayyad,Irani dowolne ID Utgo dowolne LMDT 1991 Brodley, Utgo binarne, wielowymiarowe CHAID 1993 SPSSInc. dowolne IND 1993 Bruntine, Caruana dowolne SADT 1993 Heat,Kasif,Salzberg binarne, wielowymiarowe SE-LEARN 1993 Rymonn dowolne OC Murthy binarne, wielowymiarowe 1. ID3 - cechuj cy si prostot, ale wymagaj cy kompletnych danych i nie pozwalaj cy na szum w danych. Ponadto zakªada,»e dane s danymi dyskretnymi, nie za± ci gªymi. 2. C b d cy rozszerzeniem algorytmu ID3 i rozwi zuj cy wi kszo± problemów algorytmu ID3 (braki w danych, dane ci gªe, mo»liwo± przycinania drzew gdy si zbytnio rozrastaj (ang. pruning)). 3. CART (Classication and Regression Trees) - stosuje w budowie drzewa indeks Giniego, miar entropii i reguª podziaªu na dwie cz ±ci (twoing rule). Cech charakterystyczn metody jest nadmierny rozrost drzewa i przycinanie (pruning) poszczególnych gaª zi w celu redukcji opisu li±ci (przy nieznacznym wzro±cie bª du klasykacji). Pozwala to na porównanie modelu rozbudowanego i modelu ze zredukowan liczb w zªów, czasami bowiem o jako±ci drzewa nie decyduje trafno± predykcji, ale przydatno± wygenerowanych reguª. 4. CHAID to algorytm AID (Automatic Interaction Detection) wykorzystuj cy test niezale»no±ci chi-kwadrat. Na ka»dym etapie podziaªu drzewa tworzy si tabel kontyngencji, w której zestawia si zmienn obja±nian (zale»n ) i obja±niaj c. Je±li zmienna obja±niana ma d > 2 kategorii, a obja±niaj ca c > 2 kategorii, to d»y si do redukcji tabeli kontyngencji o wymiarach d c do bardziej istotnej (z punktu widzenia testu 2 ródªo: Gatnar E.: Symboliczne metody klasykacji danych, PWN, 1998, Polska 3
4 niezale»no±ci chi-kwadrat) o wymiarach d j, przez ª czenie w dozwolony sposób kategorii zmiennej obja±niaj cej. Oryginalny CHAID pozwala budowa modele dyskryminacyjne, czyli takie, których zmienna obja±niana jest zmienn nominaln. 2.3 Cel budowy drzew Drzewo budujemy po to by potem móc klasykowa nowe przypadki (przyszªe obserwacje), o których nie mamy informacji o przynale»no±ci klasowej. Budowane drzewo powinno by jak najmniejsze, wi kszo± algorytmów dodatkowo dokonuje porz dkowania drzewa (prunning), polegaj cego na usuwaniu tych jego fragmentów, które maj niewielkie znaczenie dla jako±ci rezultatów klasy- kacji. 2.4 Problemy? Ka»dy algorytm tworz cy drzewa klasykacyjne musi zatem rozwi za 3 problemy: ˆ jak wybra jedn lub kilka cech, w oparciu o które nast pi podziaª zbioru obiektów? ˆ kiedy zako«czy podziaª pozostaªego podzbioru obiektów? ˆ w jaki sposób przydzieli obiekty znajduj ce si w li±ciu drzewa do pewnej klasy? 3 Wa»ne aspekty budowy drzewa Zasadniczym problemem jest wybór wªa±ciwego atrybutu do zbudowania ca- ªego testu. Najlepszy wybór to wybór takiego atrybutu, dla którego skrócimy ±cie»k w drzewie prowadz c przez ten w zeª do li±ci wskazuj cych klas decyzyjn.w tym celu, niezb dny jest wybór pewniej miary oceniaj cej, np. miar przyrostu informacji (ang. information gain). Wykorzystywane jest przy tym zjawisko entropii. Je±li S b dzie zbiorem ucz cym zawieraj cym n przykªadów nale» cych do jednej z k klas decyzyjnych oznaczonych przez K 1,..., K k, a n i oznacza liczebno± klasy K i, wówczas entropia zwi zana z klasykacj zbioru S jest zdeniowana jako: Ent(S) = k p i lg 2 p i, gdzie p i jest prawdopodobie«stwem,»e losowo wybrany przykªad z S nale»y do klasy K i, estymowanym jako n i n. Entropia podziaªu zbioru przykªadów S ze wzgl du na atrybut a jest zdeniowana jako: Ent(S a) = p j=1 i=1 n Sj n Ent(S j). Mo»na stwierdzi,»e entropia Ent(S a) jest ±redni wa»on dla entropii poszczególnych podzbiorów S j. Im mniejsza warto± Ent(S a), tym wi ksza jednorodno± klasykacji dla przykªadów podzielonych na podzbiory. Przyrost 4
5 informacji wynikaj cy z zastosowania atrybutu a do zbudowania testu dziel - cego zbiór przykªadów ucz cych S jest zdeniowany jako ró»nica: Gain(S, a) = Ent(S) Ent(S a). 3.1 Przykªad tworzenia drzewa Zaªó»my,»e chcemy klasykowa klientów sklepu elektronicznego pod wzgl dem tego czy kupi komputer czy nie. Elementy tego zbioru zestawiono w tabeli 2. Tablica 2: Zbiór przykªadów ucz cych opisuj cych grup klientów sklepu elektronicznego lp Dochody Student Pªe Kupuje komputer 1 ±rednie tak m»czyzna tak 2 ±rednie nie kobieta nie 3 wysokie tak kobieta tak 4 niskie tak m»czyzna nie 5 niskie tak kobieta nie 6 ±rednie tak kobieta tak 7 niskie nie kobieta nie 8 ±rednie nie m»czyzna nie W±ród przykªadów wyst puje binarna klasykacja. W zwi zku z tym miara entropii dla zbioru S wyra»a si wzorem: Ent(S) = p T ak lg 2 p T ak p Nie lg 2 p Nie Zbiór 8 przykªadów skªada si z 3 przykªadów decyzji T ak i 5 na decyzj Nie. Odpowiednie prawdopodobie«stwa s równe p tak = 3/8 oraz p nie = 5/8. Warto± entropii zwi zanej z binarn klasykacj rozwa»anego zbioru przykªadów jest nast puj ca: Ent(S) = (3/8) lg 2 (3/8) (5/8) lg 2 (5/8) = = Je±li wybierzemy atrybut dochody do zbudowania korzenia drzewa, a ma on 3 warto±ci: {niskie, rednie, wysokie}. Pierwszy podzbiór Sniskie = {4, 5, 7} zawiera 3 przykªady, które nale» do klasy decyzyjnej N ie. Drugi podzbiór S±rednie {1, 2, 6, 8} zawiera po 2 przykªady z obu klas, podczas, gdy podzbiór Swysokie = {3} zªo»ony jest z jednego przykªady z klasy T ak. Warto± entropii warunkowej ze wzgl du na ten atrybut jest nast puj ca: Ent(S dochody) = 3 8 Ent(S niskie ) Ent(S ±rednie ) Ent(S wysokie ) = (3 8 ( 0 log log 2 1)+ 4 8 ( 1 2 log log )+ 1 8 ( 0 log log 2 1) = = 0.5 Przyrost informacji: GainInf ormation(s, dochody) = Ent(S) Ent(S dochody) = = Warto±ci miar przyrostu informacji wynikaj cych z zastosowania pozostaªych 5
6 dochody niskie wysokie ±rednie nie tak student tak tak nie nie Rysunek 2: Drzewo decyzyjne dla poj cia "kupuj komputer". atrybutów do budowy korzenia drzewa s nast puj ce: Gain(S, student) = oraz Gain(S, pªe ) = Podzbiory przykªadów przypisane gaª ziom odpowiadaj cym warto±ciom niskie oraz wysokie maj jednoznaczne przydziaªy do klas decyzyjnych, dlatego te ga- ª zie mo»na zako«czy li± mi etykietowanymi odpowiednio klasami tak i nie. W przypadku podzbiorów przykªadów S rednie = {1, 2, 6, 8} nale»y rekurencyjnie wywoªa algorytm. Z dwóch rozwa»anych atrybutów korzystniejszy przyrost informacji pozwala osi gn atrybut student, którego warto±ci jednoznacznie rozdzielaj podzbiór przykªadów na klas tak(przykªady 1,6) oraz klas nie (odpowiednio pozostaªe przykªady 2,8) Problem z miar Information Gain Niestety miara przyrostu informacji (ang. gain) maj c dwa atrybuty do wyboru, wybierze ten o wi kszej liczbie warto±ci. Nie jest to po» dana wªa±ciwo±, zwªaszcza w sytuacjach mocnego zró»nicowania liczno±ci dziedzin atrybutów opisuj cych analizowane przykªady. Je±li rozwa»ymy skrajny przypadek, w którym pewien atrybut b, oznaczaj cy np. dat urodzin, ma tyle ró»nych warto±ci, ile jest przykªadów ucz cych, atrybut ten zostanie wybrany do zbudowania testu w w ¹le drzewa, gdy» maksymalizuje on warto± miary Gain(S, b). W rezultacie ka»dy z podzbiorów S i zawiera b dzie pojedynczy przykªad, co doprowadzi do stworzenia pªaskiego i równocze±nie bardzo szerokiego drzewa. Takie drzewo odwzorowuje dane ucz ce, lecz niestety jest maªo czytelne dla u»ytkownika i równocze±nie nie jest u»yteczne do predykcji klasykacji tych przykªadów, które nie s reprezentowane w zbiorze ucz cym. Je±li rozwa»ymy test z wykorzystaniem atrybutu b, który oznaczaª pytanie o dat urodzin, to zauwa»my, ze takie pytanie pozostanie bez odpowiedzi dla nowych przykªadów z inn warto±ci daty ni» te, które wyst piªy w zbiorze ucz cym Inne miary wyboru atrybutów do podziaªu drzewa W±ród innych mo»liwych do zastosowania miar wyboru atrybutu do podziaªu drzewa s : ˆ Split information zwana podziaªem informacji zaproponowana przez Quinlana, oceniaj ca podziaª zbioru przykªadów ze wzgl du na warto±ci z 6
7 dziedziny atrybutu a. Jest zdeniowana w nast puj cy sposób: Split(S a) = r j=1 S j S lg S j 2 S, gdzie S j jest podzbiorem przykªadów opisanych j-t warto±ci atrybutu a, r jest liczb ró»nych warto±ci w dziedzinie tego atrybutu. ˆ ilorazem przyrostu informacji(ang.gain ratio) zaproponowana równie» przez Quinlana jako miara do normalizacji przyrostu informacji i oceny jako±ci testu w w ¹le: Gainratio(S a) = Gain(S a) Split(S a). Zasada wyboru atrybutu do stworzenia w zªa w algorytmie indukcji drzew jest niezmieniona, tzn. zawsze wybiera b dziemy ten atrybut, który pozwala maksymalizowa warto± miary Gain ratio. 4 Binaryzacja drzew decyzyjnych W przypadku, gdy mamy do czynienia z bardziej zró»nicowanymi danymi, (nie tylko jako±ciowymi) o maªym zbiorze warto±ci, cz sto modykuje si podstawowy schemat algorytmu, tak, aby generowa binarne drzewa decyzyjne. Binarne drzewo decyzyjne charakteryzuje si tym,»e z ka»dego jego wewn trznego w zªa wychodz jedynie dwie kraw dzie, czyli ka»dy zbiór przykªadów zwi zany z w zªem dzieli si na dwa rozª czne podzbiory. Taki rodzaj drzew ogranicza wyst pienie zjawiska fragmentacji danych, tj. stopniowego podziaªu zbioru przykªadów na coraz mniejsze podzbiory, które mog zawiera zbyt maª liczb przykªadów. Konstruowanie binarnych drzew decyzyjnych wi»e si z innymi sposobami tworzenia testów do umieszczenia w w ¹le drzew, tak, aby odpowiedzi na test byªy zawsze dwuwarto±ciowe, np. prawda lub faªsz. 5 Post powanie w przypadku brakuj cych warto±ci atrybutów Rzeczywiste dane mog zawiera nieznane (niezdeniowane) warto±ci cz ±ci atrybutów (ang. unknown values of attributes) dla niektórych obiektów. Sytuacje takie mog wynika z bª dów podczas rejestracji danych, zagubienia zapisów b d¹ niedost pno±ci pewnych informacji. Wyst powanie niezdeniowanych warto±ci atrybutów wpªywa zarówno na sam proces budowy drzewa, jak i na pó¹niejsze u»ycie go do klasykowania nowych lub testowych obiektów. Cz ± metod stosowana jest we wst pnym przetwarzaniu danych przed u»yciem wªa±ciwego algorytmu indukcji. Wiele z nich jest ukierunkowanych na zast powanie nieznanej warto±ci atrybutu dla okre±lonego przykªadu warto±ci z dziedziny tego atrybutu. U»ywa si najcz ±ciej wyst puj cej warto±ci atrybutu, okre±lonej na podstawie przykªadów z peªnym opisem lub podzbioru tych przykªadów nale» cych do tej samej klasy decyzyjnej co analizowany przykªad. 7
8 6 Budowa i analiza drzew klasykacyjnych w ±rodowisku R W pakiecie R metoda wyznaczania drzew decyzyjnych dost pna jest w wielu ró»- nych funkcjach. Popularnie wykorzystywane s funkcje tree(tree), rpart(rpart) oraz cpart(party). Szczegóªowe opisy pakietów s dost pne w lokalizacjach: ˆ tree ˆ rpart zaktualizowany 3 stycznia 2010 roku: org/web/packages/rpart/rpart.pdf. Gdyby±my chcieli zbudowa drzewo klasykacyjne dla dobrze znanego nam ju» zbioru iris, przy czym jako zbiór ucz cy wybra chcielibysmy pierwsze 75 obserwacji formuªa ±rodowiska R do wykonania tego zadania b dzie miaªa posta nast puj c : > sub <-c(sample(1:150,75)) > library(rpart) > fit<-rpart(species~.,data=iris,subset=sub) Efektem b dzie tekstowo rozpisane drzewo z zagnie»d»eniami odpowiadaj cymi zagnie»d»eniom w drzewie (podw zªy). > fit n= 75 node), split, n, loss, yval, (yprob) * denotes terminal node 1) root setosa ( ) 2) Petal.Length< setosa ( ) * 3) Petal.Length>= virginica ( ) 6) Petal.Width< versicolor ( ) * 7) Petal.Width>= virginica ( ) * Opis drzewa ma odpowiedni format: node), split, n, loss, yval, (yprob) * denotes terminal node gdzie: node) oznacza numer w zªa, split - nazw cechy, która dokonaªa podziaªu, n - liczb elementów danego w zªa, loss - liczb bª dnie klasykowanych elementów stosuj c reguª wi kszo±ciow. yval b dzie odpowiada warto±ci predykcji przynale»no±ci klasowej na podstawie reguªy wi kszo±ciowej, (yprob) z kolei b dzie przedstawia wektor estymatorów prawdopodobie«stw przynale»no- ±ci do danej klasy. Nazwy klas b d uporz dkowane leksykogracznie. W opisie takim * oznacza element b d cy li±ciem w drzewie. Widzimy zatem,»e drzewo tak utworzone ma 7 w zªów licz c z korzeniem drzewa. Widzimy tak»e,»e pierwszym atrybutem wybranym do budowy drzewa jest cecha Petal.Length, która w przypadku, gdy warto± Petal.Length jest mniejsza od 2.45 od razu prowadzi do klasykacji obiektu speªniaj cego ten warunek do klasy setosa. Takich elementów znaleziono 26. Je±li za± warto± Petal.Length jest wi ksza 8
9 b d¹ równa warto±ci 2.45 wówczas b dziemy musieli sprawdzi dodatkowy warunek dla cechy Petal.Width. Gdy teraz warto± tej cechy b dzie mniejsza ni» 1.55 obiekt zostanie przypisany do klasy versicolor, w przeciwnym przypadku do klasy virginica. Nale»y zwróci uwag na fakt,»e takie drzewo zbudowano do 75 elementów ze zbioru iris. Dla innego drzewa, chocia»by o wi kszym rozmiarze powstaªe drzewo mo»e wygl da zupeªnie inaczej. Jednak, je±li takie przedstawienie drzewa decyzyjnego utworzonego dla zbioru iris jest dla nas nieczytelne mo»emy wykorzysta zasoby dodatkowych pakietów ±rodowiska R, np rattle, który po zainstalowaniu musi by oczywi±cie zaªadowany do ±rodowiska R. Dokonujemy tego wywoªuj c jedn komend R: > library(rattle) Teraz wywoªuj c ju» komend pakietu rattle o nazwie drawtreenodes a konkretnie: drawtreenodes(fit, col = NULL, nodeinfo = FALSE,decimals = 2, print.levels = TRUE, new = TRUE) otrzymujemy w efekcie drzewo takie jak przedstawia to rysunek 3. Petal.Length < > Petal.Width < > 1.55 setosa 26 obs 100% 6 versicolor 22 obs 100% 7 virginica 27 obs 92.6% Rysunek 3: Drzewo decyzyjne Mo»emy tak»e posili si standardowymi funkcjami ±rodowiska R, które dostarczaj bardzo szczegóªowych wyników. Co ciekawe wyrysowanie wynikowego drzewa jest mo»liwe przez wywoªanie kolejno po sobie dwóch komend R: plot(fit) oraz text(fit). Efektem tego b dzie otrzymane drzewo decyzyjne w tzw. formacie tekstowym. Szczegóªowych wyników za± dostarcza funkcja summary, której wywoªanie i wyniki tego wywoªania mo»emy zauwa»y poni»ej. > summary(fit) Call: rpart(formula = Species ~., data = iris, subset = sub) 9
10 n= 75 CP nsplit rel error xerror xstd Node number 1: 75 observations, complexity param= predicted class=setosa expected loss= class counts: probabilities: left son=2 (26 obs) right son=3 (49 obs) Primary splits: Petal.Length < 2.45 to the left, improve= , (0 missing) Petal.Width < 0.8 to the left, improve= , (0 missing) Sepal.Length < 5.55 to the left, improve= , (0 missing) Sepal.Width < 3.25 to the right, improve= , (0 missing) Surrogate splits: Petal.Width < 0.8 to the left, agree=1.000, adj=1.000, (0 split) Sepal.Length < 5.45 to the left, agree=0.880, adj=0.654, (0 split) Sepal.Width < 3.25 to the right, agree=0.867, adj=0.615, (0 split) Node number 2: 26 observations predicted class=setosa expected loss=0 class counts: probabilities: Node number 3: 49 observations, complexity param= predicted class=virginica expected loss= class counts: probabilities: left son=6 (22 obs) right son=7 (27 obs) Primary splits: Petal.Width < 1.55 to the left, improve= , (0 missing) Petal.Length < 4.85 to the left, improve= , (0 missing) Sepal.Length < 6.25 to the left, improve= , (0 missing) Sepal.Width < 2.95 to the left, improve= , (0 missing) Surrogate splits: Petal.Length < 4.75 to the left, agree=0.939, adj=0.864, (0 split) Sepal.Length < 5.75 to the left, agree=0.755, adj=0.455, (0 split) Sepal.Width < 2.45 to the left, agree=0.653, adj=0.227, (0 split) Node number 6: 22 observations predicted class=versicolor expected loss=0 class counts: probabilities: Node number 7: 27 observations predicted class=virginica expected loss= class counts: probabilities: > 10
11 Graczne przedstawienie reguªy klasykacyjnej zadanej przez drzewo mo»- liwe jest dzi ki instrukcji R postaci rpart(y~x,data="",cp=0.03,minisplit=5), która dla naszego zbioru iris mo»e wygl da nast puj co: rpart(species~.,data=iris,cp=0.03) n= 150 node), split, n, loss, yval, (yprob) * denotes terminal node 1) root setosa ( ) 2) Petal.Length< setosa ( ) * 3) Petal.Length>= versicolor ( ) 6) Petal.Width< versicolor ( ) * 7) Petal.Width>= virginica ( ) * > Zagadnieniem niezwykle istotnym jest okre±lenie kryterium budowy drzewa optymalnego. Nale»y sobie zada pytanie, co rozumiemy przez drzewo optymalne, czy jest to drzewo o najmniejszej liczbie w zªów, czy mo»e drzewo o najmniejszej wysoko±ci, czy jeszcze inne warunki b d okre±la optymalno± drzewa? Proponujemy, wykorzystanie informacji o bª dach krosswalidacyjnych. Przy u»yciu funkcji printcp mo»emy otrzyma informacje o wielko±ciach poddrzew optymalnych w zale»no±ci od warto±ci cp (patrz na kod poni»ej). > printcp(fit) Classification tree: rpart(formula = Species ~., data = iris, subset = sub) Variables actually used in tree construction: [1] Petal.Length Petal.Width Root node error: 49/75 = n= 75 CP nsplit rel error xerror xstd > plotcp(fit) > Efektem b dzie wªa±nie wykres tych bª dow krosswalidacyjnych (rysunek 4) Funkcja printcp zwraca warto± xerror, która jest ilorazem SSE cv dla danego drzewa i SSE dla korzenia. Zwraca te» bª d standardowy std (xstd). B dziemy ostatecznie wybiera jedn z dwóch opcji: 1. drzewo z najmniejsz warto±ci xerror (xerror min ), 2. drzewo o najmniejszej liczbie podziaªów, gdzie xerror < xerror min + xstd min. 11
12 size of tree X val Relative Error Inf cp Rysunek 4: Wykres bª dów krosswalidacyjnych Minimalna warto± xerror w naszym przypadku to , wi c drzewo o minimalnej liczbie li±ci musi mie xerror mniejszy ni» xerror min + xstd min = = Czyli szukamy drzewa, które ma warto± xerror mniejsz ni» B dzie to opcja z 1 lub 2 podziaªami. 7 Bibliograa Opracowanie przygotowano w oparciu o prace: 1. J. Koronacki, J. wik: Statystyczne systemy ucz ce si, wydanie drugie, Exit, Warsaw, 2008, rozdziaª J. wik, J. Mielniczuk: Statystyczne systemy ucz ce si - wiczenia w oparciu o pakiet R, Ocyna Wydawnicza PW, Warszawa, Biecek P.: Na przeªaj przez Data Mining, naprzelajprzezdm.pdf 4. Koronacki J. and Mielniczuk J., Statystyka dla studentów kierunków technicznych i przyrodniczych. Wydawnictwa Naukowo-Techniczne, Warszawa, Polska,
Konspekt do zajęć: Statystyczne metody analizy danych. Agnieszka Nowak-Brzezińska 14 maja 2012
Drzewa klasyfikacyjne Konspekt do zajęć: Statystyczne metody analizy danych Agnieszka Nowak-Brzezińska 14 maja 2012 1 Wprowadzenie Drzewa klasyfikacyjne 1 jako reprezentacja wiedzy o klasyfikacji są dość
Bardziej szczegółowoDane dotyczą parametrów wydolnościowych mężczyzn zmierzonych podczas biegu na 1,5 mili. Zmienną objaśnianą jest Oxygen (pobór tlenu podczas biegu).
Zbiór fitness Przedmiotem zainteresowania będzie zbiór fitness. Dane dotyczą parametrów wydolnościowych mężczyzn zmierzonych podczas biegu na 1,5 mili. Zmienną objaśnianą jest Oxygen (pobór tlenu podczas
Bardziej szczegółowoListy i operacje pytania
Listy i operacje pytania Iwona Polak iwona.polak@us.edu.pl Uniwersytet l ski Instytut Informatyki pa¹dziernika 07 Który atrybut NIE wyst puje jako atrybut elementów listy? klucz elementu (key) wska¹nik
Bardziej szczegółowoMetody numeryczne i statystyka dla in»ynierów
Kierunek: Automatyka i Robotyka, II rok Wprowadzenie PWSZ Gªogów, 2009 Plan wykªadów Wprowadzenie, podanie zagadnie«, poj cie metody numerycznej i algorytmu numerycznego, obszar zainteresowa«i stosowalno±ci
Bardziej szczegółowoWST P DO TEORII INFORMACJI I KODOWANIA. Grzegorz Szkibiel. Wiosna 2013/14
WST P DO TEORII INFORMACJI I KODOWANIA Grzegorz Szkibiel Wiosna 2013/14 Spis tre±ci 1 Kodowanie i dekodowanie 4 1.1 Kodowanie a szyfrowanie..................... 4 1.2 Podstawowe poj cia........................
Bardziej szczegółowoANALIZA NUMERYCZNA. Grzegorz Szkibiel. Wiosna 2014/15
ANALIZA NUMERYCZNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Metoda Eulera 3 1.1 zagadnienia brzegowe....................... 3 1.2 Zastosowanie ró»niczki...................... 4 1.3 Output do pliku
Bardziej szczegółowoSystemy decyzyjne Wykªad 5: Drzewa decyzyjne
Nguyen Hung Son () W5: Drzewa decyzyjne 1 / 38 Systemy decyzyjne Wykªad 5: Drzewa decyzyjne Nguyen Hung Son Przykªad: klasyfikacja robotów Nguyen Hung Son () W5: Drzewa decyzyjne 2 / 38 Przykªad: drzewo
Bardziej szczegółowoWYKŁAD: DRZEWA KLASYFIKACYJNE I REGRESYJNE. Metoda CART. MiNI PW
WYKŁAD: DRZEWA KLASYFIKACYJNE I REGRESYJNE. Metoda CART MiNI PW Drzewa służą do konstrukcji klasyfikatorów prognozujących Y {1, 2,..., g} na podstawie p-wymiarowego wektora atrybutów (dowolne atrybuty:
Bardziej szczegółowoDrzewa decyzyjne, metody budowania, zastosowania
Wydzia Elektroniki Politechniki Wroc awskiej Kierunek: Informatyka Specjalno : In ynieria Systemów Informatycznych Praca zaliczeniowa do kursu Informatyka systemów autonomicznych Drzewa decyzyjne, metody
Bardziej szczegółowoMetodydowodzenia twierdzeń
1 Metodydowodzenia twierdzeń Przez zdanie rozumiemy dowolne stwierdzenie, które jest albo prawdziwe, albo faªszywe (nie mo»e by ono jednocze±nie prawdziwe i faªszywe). Tradycyjnie b dziemy u»ywali maªych
Bardziej szczegółowoWykªad 6: Model logitowy
Wykªad 6: Model logitowy Ekonometria Stosowana SGH Model logitowy 1 / 18 Plan wicze«1 Modele zmiennej jako±ciowej idea 2 Model logitowy Specykacja i interpretacja parametrów Dopasowanie i restrykcje 3
Bardziej szczegółowoZadania z kolokwiów ze Wst pu do Informatyki. Semestr II.
Zadania z kolokwiów ze Wst pu do Informatyki. Semestr II. Poni»sze zadania s wyborem zada«z kolokwiów ze Wst pu do Informatyki jakie przeprowadziªem w ci gu ostatnich lat. Marek Zawadowski Zadanie 1 Napisz
Bardziej szczegółowoA = n. 2. Ka»dy podzbiór zbioru sko«czonego jest zbiorem sko«czonym. Dowody tych twierdze«(elementarne, lecz nieco nu» ce) pominiemy.
Logika i teoria mnogo±ci, konspekt wykªad 12 Teoria mocy, cz ± II Def. 12.1 Ka»demu zbiorowi X przyporz dkowujemy oznaczany symbolem X obiekt zwany liczb kardynaln (lub moc zbioru X) w taki sposób,»e ta
Bardziej szczegółowoGranular Computing 9999 pages 15 METODY SZTUCZNEJ INTELIGENCJI - PROJEKTY
Granular Computing 9999 pages 15 METODY SZTUCZNEJ INTELIGENCJI - PROJEKTY PB 2 PB 1 Projekt z wyznaczania reduktów zbioru Liczba osób realizuj cych projekt: 1-2 osoby 1. Wczytanie danych w formatach arf,
Bardziej szczegółowoLab. 02: Algorytm Schrage
Lab. 02: Algorytm Schrage Andrzej Gnatowski 5 kwietnia 2015 1 Opis zadania Celem zadania laboratoryjnego jest zapoznanie si z jednym z przybli»onych algorytmów sªu» cych do szukania rozwi za«znanego z
Bardziej szczegółowoLaboratorium z przedmiotu MED. Lab1 - wprowadzenie
Laboratorium z przedmiotu MED Lab1 - wprowadzenie Grzegorz Protaziuk Konsultacje: środa godz. 11.00 12.00 pok. 301 Gmach EiTI email: gprotazi@elka.pw.edu.pl (w temacie mejla proszę dodać frazę MED) www.ii.pw.edu.pl/~gprotazi
Bardziej szczegółowo1 Bª dy i arytmetyka zmiennopozycyjna
1 Bª dy i arytmetyka zmiennopozycyjna Liczby w pami ci komputera przedstawiamy w ukªadzie dwójkowym w postaci zmiennopozycyjnej Oznacza to,»e s one postaci ±m c, 01 m < 1, c min c c max, (1) gdzie m nazywamy
Bardziej szczegółowoEkonometria. wiczenia 8 Modele zmiennej jako±ciowej. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej
Ekonometria wiczenia 8 Modele zmiennej jako±ciowej (8) Ekonometria 1 / 25 Plan wicze«1 Modele zmiennej jako±ciowej 2 Model logitowy Specykacja i interpretacja parametrów Dopasowanie i restrykcje 3 Predykcja
Bardziej szczegółowoLekcja 9 - LICZBY LOSOWE, ZMIENNE
Lekcja 9 - LICZBY LOSOWE, ZMIENNE I STAŠE 1 Liczby losowe Czasami spotkamy si z tak sytuacj,»e b dziemy potrzebowa by program za nas wylosowaª jak ± liczb. U»yjemy do tego polecenia: - liczba losowa Sprawd¹my
Bardziej szczegółowoWYKŁAD: DRZEWA KLASYFIKACYJNE I REGRESYJNE. METODA CART. Zaawansowane Metody Uczenia Maszynowego
WYKŁAD: DRZEWA KLASYFIKACYJNE I REGRESYJNE. METODA CART Zaawansowane Metody Uczenia Maszynowego Drzewa służą do konstrukcji klasyfikatorów prognozujących Y {1, 2,..., g} na podstawie p-wymiarowego wektora
Bardziej szczegółowoSTATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH
STATYSTYCZNE MODELOWANIE DANYCH BIOLOGICZNYCH WYKŠAD 4 03 listopad 2014 1 / 47 Plan wykªadu 1. Testowanie zaªo»e«o proporcjonalnym hazardzie w modelu Cox'a 2. Wybór zmiennych do modelu Cox'a 3. Meta analiza
Bardziej szczegółowoPodstawowe pojęcia: Populacja. Populacja skończona zawiera skończoną liczbę jednostek statystycznych
Podstawowe pojęcia: Badanie statystyczne - zespół czynności zmierzających do uzyskania za pomocą metod statystycznych informacji charakteryzujących interesującą nas zbiorowość (populację generalną) Populacja
Bardziej szczegółowoEkonometria. wiczenia 1 Regresja liniowa i MNK. Andrzej Torój. Instytut Ekonometrii Zakªad Ekonometrii Stosowanej
Ekonometria wiczenia 1 Regresja liniowa i MNK (1) Ekonometria 1 / 25 Plan wicze«1 Ekonometria czyli...? 2 Obja±niamy ceny wina 3 Zadania z podr cznika (1) Ekonometria 2 / 25 Plan prezentacji 1 Ekonometria
Bardziej szczegółowoEkonometria - wykªad 8
Ekonometria - wykªad 8 3.1 Specykacja i werykacja modelu liniowego dobór zmiennych obja±niaj cych - cz ± 1 Barbara Jasiulis-Goªdyn 11.04.2014, 25.04.2014 2013/2014 Wprowadzenie Ideologia Y zmienna obja±niana
Bardziej szczegółowoPodstawy modelowania w j zyku UML
Podstawy modelowania w j zyku UML dr hab. Bo»ena Wo¹na-Szcze±niak Akademia im. Jan Dªugosza bwozna@gmail.com Wykªad 8 Diagram pakietów I Diagram pakietów (ang. package diagram) jest diagramem strukturalnym,
Bardziej szczegółowoEkonometria Bayesowska
Ekonometria Bayesowska Wykªad 9: Metody numeryczne: MCMC Andrzej Torój 1 / 17 Plan wykªadu Wprowadzenie 1 Wprowadzenie 3 / 17 Plan prezentacji Wprowadzenie 1 Wprowadzenie 3 3 / 17 Zastosowanie metod numerycznych
Bardziej szczegółowoMetody dowodzenia twierdze«
Metody dowodzenia twierdze«1 Metoda indukcji matematycznej Je±li T (n) jest form zdaniow okre±lon w zbiorze liczb naturalnych, to prawdziwe jest zdanie (T (0) n N (T (n) T (n + 1))) n N T (n). 2 W przypadku
Bardziej szczegółowoRelacj binarn okre±lon w zbiorze X nazywamy podzbiór ϱ X X.
Relacje 1 Relacj n-argumentow nazywamy podzbiór ϱ X 1 X 2... X n. Je±li ϱ X Y jest relacj dwuargumentow (binarn ), to zamiast (x, y) ϱ piszemy xϱy. Relacj binarn okre±lon w zbiorze X nazywamy podzbiór
Bardziej szczegółowoKLASYCZNE ZDANIA KATEGORYCZNE. ogólne - orzekaj co± o wszystkich desygnatach podmiotu szczegóªowe - orzekaj co± o niektórych desygnatach podmiotu
➏ Filozoa z elementami logiki Na podstawie wykªadów dra Mariusza Urba«skiego Sylogistyka Przypomnij sobie: stosunki mi dzy zakresami nazw KLASYCZNE ZDANIA KATEGORYCZNE Trzy znaczenia sªowa jest trzy rodzaje
Bardziej szczegółowoProjektowanie bazy danych
Projektowanie bazy danych Pierwszą fazą tworzenia projektu bazy danych jest postawienie definicji celu, założeo wstępnych i określenie podstawowych funkcji aplikacji. Każda baza danych jest projektowana
Bardziej szczegółowoPodstawy modelowania w j zyku UML
Podstawy modelowania w j zyku UML dr hab. Bo»ena Wo¹na-Szcze±niak Akademia im. Jan Dªugosza bwozna@gmail.com Wykªad 2 Zwi zki mi dzy klasami Asocjacja (ang. Associations) Uogólnienie, dziedziczenie (ang.
Bardziej szczegółowoWYKŁAD: DRZEWA KLASYFIKACYJNE I REGRESYJNE. METODA CART. Zaawansowane Metody Uczenia Maszynowego
WYKŁAD: DRZEWA KLASYFIKACYJNE I REGRESYJNE. METODA CART Zaawansowane Metody Uczenia Maszynowego Drzewa służą do konstrukcji klasyfikatorów prognozujących Y {1, 2,..., g} na podstawie p-wymiarowego wektora
Bardziej szczegółowoEdycja geometrii w Solid Edge ST
Edycja geometrii w Solid Edge ST Artykuł pt.: " Czym jest Technologia Synchroniczna a czym nie jest?" zwracał kilkukrotnie uwagę na fakt, że nie należy mylić pojęć modelowania bezpośredniego i edycji bezpośredniej.
Bardziej szczegółowo1 Metody iteracyjne rozwi zywania równania f(x)=0
1 Metody iteracyjne rozwi zywania równania f()=0 1.1 Metoda bisekcji Zaªó»my,»e funkcja f jest ci gªa w [a 0, b 0 ]. Pierwiastek jest w przedziale [a 0, b 0 ] gdy f(a 0 )f(b 0 ) < 0. (1) Ustalmy f(a 0
Bardziej szczegółowoWzorce projektowe kreacyjne
Wzorce projektowe kreacyjne Krzysztof Ciebiera 14 pa¹dziernika 2005 1 1 Wst p 1.1 Podstawy Opis Ogólny Podstawowe informacje Wzorce kreacyjne sªu» do uabstrakcyjniania procesu tworzenia obiektów. Znaczenie
Bardziej szczegółowoEDUKARIS - O±rodek Ksztaªcenia
- O±rodek Ksztaªcenia Zabrania si kopiowania i rozpowszechniania niniejszego regulaminu przez inne podmioty oraz wykorzystywania go w dziaªalno±ci innych podmiotów. Autor regulaminu zastrzega do niego
Bardziej szczegółowoWnioskowanie Boolowskie i teoria zbiorów przybli»onych
Wnioskowanie Boolowskie i teoria zbiorów przybli»onych 4 Zbiory przybli»one Wprowadzenie do teorii zbiorów przybli»onych Zªo»ono± problemu szukania reduktów 5 Wnioskowanie Boolowskie w obliczaniu reduktów
Bardziej szczegółowoALGORYTM RANDOM FOREST
SKRYPT PRZYGOTOWANY NA ZAJĘCIA INDUKOWANYCH REGUŁ DECYZYJNYCH PROWADZONYCH PRZEZ PANA PAWŁA WOJTKIEWICZA ALGORYTM RANDOM FOREST Katarzyna Graboś 56397 Aleksandra Mańko 56699 2015-01-26, Warszawa ALGORYTM
Bardziej szczegółowo1. Wprowadzenie do C/C++
Podstawy Programowania :: Roman Grundkiewicz :: 014 Zaj cia 1 1 rodowisko Dev-C++ 1. Wprowadzenie do C/C++ Uruchomienie ±rodowiska: Start Programs Developments Dev-C++. Nowy projekt: File New Project lub
Bardziej szczegółowoJAO - J zyki, Automaty i Obliczenia - Wykªad 1. JAO - J zyki, Automaty i Obliczenia - Wykªad 1
J zyki formalne i operacje na j zykach J zyki formalne s abstrakcyjnie zbiorami sªów nad alfabetem sko«czonym Σ. J zyk formalny L to opis pewnego problemu decyzyjnego: sªowa to kody instancji (wej±cia)
Bardziej szczegółowo2 Liczby rzeczywiste - cz. 2
2 Liczby rzeczywiste - cz. 2 W tej lekcji omówimy pozostaªe tematy zwi zane z liczbami rzeczywistymi. 2. Przedziaªy liczbowe Wyró»niamy nast puj ce rodzaje przedziaªów liczbowych: (a) przedziaªy ograniczone:
Bardziej szczegółowoBash i algorytmy. Elwira Wachowicz. 20 lutego
Bash i algorytmy Elwira Wachowicz elwira@ifd.uni.wroc.pl 20 lutego 2012 Elwira Wachowicz (elwira@ifd.uni.wroc.pl) Bash i algorytmy 20 lutego 2012 1 / 16 Inne przydatne polecenia Polecenie Dziaªanie Przykªad
Bardziej szczegółowoBaza danych - Access. 2 Budowa bazy danych
Baza danych - Access 1 Baza danych Jest to zbiór danych zapisanych zgodnie z okre±lonymi reguªami. W w»szym znaczeniu obejmuje dane cyfrowe gromadzone zgodnie z zasadami przyj tymi dla danego programu
Bardziej szczegółowoStatystyka matematyczna
Statystyka matematyczna Aleksandra Ki±lak-Malinowska akis@uwm.edu.pl http://wmii.uwm.edu.pl/ akis/ Czym zajmuje si statystyka? Statystyka zajmuje si opisywaniem i analiz zjawisk masowych otaczaj cej czªowieka
Bardziej szczegółowoRekurencyjne struktury danych
Andrzej Jastrz bski Akademia ETI Dynamiczny przydziaª pami ci Pami, która jest przydzielana na pocz tku dziaªania procesu to: pami programu czyli instrukcje programu pami statyczna zwi zana ze zmiennymi
Bardziej szczegółowoModele wielorównaniowe. Problem identykacji
Modele wielorównaniowe. Problem identykacji Ekonometria Szeregów Czasowych SGH Identykacja 1 / 43 Plan wykªadu 1 Wprowadzenie 2 Trzy przykªady 3 Przykªady: interpretacja 4 Warunki identykowalno±ci 5 Restrykcje
Bardziej szczegółowoKonspekt lekcji otwartej
Konspekt lekcji otwartej Przedmiot: Temat lekcji: informatyka Modelowanie i symulacja komputerowa prawidłowości w świecie liczb losowych Klasa: 2 g Data zajęć: 21.12.2004. Nauczyciel: Roman Wyrwas Czas
Bardziej szczegółowoUczenie Wielowarstwowych Sieci Neuronów o
Plan uczenie neuronu o ci gªej funkcji aktywacji uczenie jednowarstwowej sieci neuronów o ci gªej funkcji aktywacji uczenie sieci wielowarstwowej - metoda propagacji wstecznej neuronu o ci gªej funkcji
Bardziej szczegółowoEkonometria - wykªad 1
Ekonometria - wykªad 1 0. Wprowadzenie Barbara Jasiulis-Goªdyn 28.02.2014 2013/2014 Ekonometria Literatura [1] B. Borkowski, H. Dudek, W. Szczesny, Ekonometria. Wybrane Zaganienia, PWN, Warszawa 2003.
Bardziej szczegółowoListy Inne przykªady Rozwi zywanie problemów. Listy w Mathematice. Marcin Karcz. Wydziaª Matematyki, Fizyki i Informatyki.
Wydziaª Matematyki, Fizyki i Informatyki 10 marca 2008 Spis tre±ci Listy 1 Listy 2 3 Co to jest lista? Listy List w Mathematice jest wyra»enie oddzielone przecinkami i zamkni te w { klamrach }. Elementy
Bardziej szczegółowoROZWIĄZANIA PRZYKŁADOWYCH ZADAŃ. KORELACJA zmiennych jakościowych (niemierzalnych)
ROZWIĄZANIA PRZYKŁADOWYCH ZADAŃ KORELACJA zmiennych jakościowych (niemierzalnych) Zadanie 1 Zapytano 180 osób (w tym 120 mężczyzn) o to czy rozpoczynają dzień od wypicia kawy czy też może preferują herbatę.
Bardziej szczegółowoUczenie maszyn. Projekt: Porównanie algorytmów tworzenia drzew decyzyjnych. Politechnika Wrocławska. Michał Płodowski Michał Suszko
Politechnika Wrocławska Projekt: Porównanie algorytmów tworzenia drzew decyzyjnych Uczenie maszyn Michał Płodowski 163763 Michał Suszko 171132 Kamil Markuszewski 171016 1. WSTĘP... 2 2. CEL PROJEKTU...
Bardziej szczegółowoGranular Computing 9999 pages 15 METODY SZTUCZNEJ INTELIGENCJI - PROJEKTY
Granular Computing 9999 pages 15 METODY SZTUCZNEJ INTELIGENCJI - PROJEKTY PB 2 PB 1 Projekt z grupowania danych - Rough k-medoids Liczba osób realizuj cych projekt: 1 osoba 1. Wczytanie danych w formatach
Bardziej szczegółowoWdrożenie modułu płatności eservice dla systemu Virtuemart 2.0.x
Wdrożenie modułu płatności eservice dla systemu Virtuemart 2.0.x Wersja 02 Styczeń 2016 Centrum Elektronicznych Usług Płatniczych eservice Sp. z o.o. Spis treści 1. Wstęp... 3 1.1. Przeznaczenie dokumentu...
Bardziej szczegółowoWstawianie gotowych rysunków w texu - informacje podstawowe.
Wstawianie gotowych rysunków w texu - informacje podstawowe. By móc wstawi rysunek musimy w preambule pliku dopisa odpowiedni pakiet komend : \usepackage. W przypadku graki doª czamy pakiet:graphicx, (nieco
Bardziej szczegółowoUczenie Maszynowe: reprezentacja wiedzy, wybór i ocena modelu, drzewa decyzjne
Uczenie Maszynowe: reprezentacja, wybór i ocena modelu, drzewa decyzjne Plan reprezentacja reguªy decyzyjne drzewa decyzyjne i algorytm ID3 zªo»ono± modelu wybór i ocena modelu przetrenowanie i sposoby
Bardziej szczegółowoMetody statystyczne w biologii - Wykªad 8. Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t
Metody statystyczne w biologii - Wykªad 8 Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t Plan wykªadu Regresja logistyczna 1. Podstawy teoretyczne i przykªady zastosowania
Bardziej szczegółowoWST P DO TEORII INFORMACJI I KODOWANIA. Grzegorz Szkibiel. Wiosna 2013/14
WST P DO TEORII INFORMACJI I KODOWANIA Grzegorz Szkibiel Wiosna 203/4 Spis tre±ci Kodowanie i dekodowanie 4. Kodowanie a szyfrowanie..................... 4.2 Podstawowe poj cia........................
Bardziej szczegółowoSVN - wprowadzenie. 1 Wprowadzenie do SVN. 2 U»ywanie SVN. Adam Krechowicz. 16 lutego Podstawowe funkcje. 2.1 Windows
SVN - wprowadzenie Adam Krechowicz 16 lutego 2013 1 Wprowadzenie do SVN SVN SubVersion jest systemem kontroli wersji pozwalaj cym wielu u»ytkownikom na swobodne wspóªdzielenie tych samych plików. Pozwala
Bardziej szczegółowoPrzykªady problemów optymalizacji kombinatorycznej
Przykªady problemów optymalizacji kombinatorycznej Problem Komiwoja»era (PK) Dane: n liczba miast, n Z +, c ji, i, j {1,..., n}, i j odlegªo± mi dzy miastem i a miastem j, c ji = c ij, c ji R +. Zadanie:
Bardziej szczegółowoZbiory i odwzorowania
Zbiory i odwzorowania 1 Sposoby okre±lania zbiorów 1) Zbiór wszystkich elementów postaci f(t), gdzie t przebiega zbiór T : {f(t); t T }. 2) Zbiór wszystkich elementów x zbioru X speªniaj cych warunek ϕ(x):
Bardziej szczegółowoMatematyka wykªad 1. Macierze (1) Andrzej Torój. 17 wrze±nia 2011. Wy»sza Szkoªa Zarz dzania i Prawa im. H. Chodkowskiej
Matematyka wykªad 1 Macierze (1) Andrzej Torój Wy»sza Szkoªa Zarz dzania i Prawa im. H. Chodkowskiej 17 wrze±nia 2011 Plan wykªadu 1 2 3 4 5 Plan prezentacji 1 2 3 4 5 Kontakt moja strona internetowa:
Bardziej szczegółowoIn»ynierskie zastosowania statystyki wiczenia
Uwagi: 27012014 poprawiono kilka literówek, zwi zanych z przedziaªami ufno±ci dla wariancji i odchylenia standardowego In»ynierskie zastosowania statystyki wiczenia Przedziaªy wiarygodno±ci, testowanie
Bardziej szczegółowoJak usprawnić procesy controllingowe w Firmie? Jak nadać im szerszy kontekst? Nowe zastosowania naszych rozwiązań na przykładach.
Jak usprawnić procesy controllingowe w Firmie? Jak nadać im szerszy kontekst? Nowe zastosowania naszych rozwiązań na przykładach. 1 PROJEKTY KOSZTOWE 2 PROJEKTY PRZYCHODOWE 3 PODZIAŁ PROJEKTÓW ZE WZGLĘDU
Bardziej szczegółowoBazy danych. Andrzej Łachwa, UJ, 2013 andrzej.lachwa@uj.edu.pl www.uj.edu.pl/web/zpgk/materialy 9/15
Bazy danych Andrzej Łachwa, UJ, 2013 andrzej.lachwa@uj.edu.pl www.uj.edu.pl/web/zpgk/materialy 9/15 Przechowywanie danych Wykorzystanie systemu plików, dostępu do plików za pośrednictwem systemu operacyjnego
Bardziej szczegółowowiczenie nr 3 z przedmiotu Metody prognozowania kwiecie«2015 r. Metodyka bada«do±wiadczalnych dr hab. in». Sebastian Skoczypiec Cel wiczenia Zaªo»enia
wiczenie nr 3 z przedmiotu Metody prognozowania kwiecie«2015 r. wiczenia 1 2 do wiczenia 3 4 Badanie do±wiadczalne 5 pomiarów 6 7 Cel Celem wiczenia jest zapoznanie studentów z etapami przygotowania i
Bardziej szczegółowoSubversion - jak dziaªa
- jak dziaªa Krótka instrukcja obsªugi lstelmach@gmail.com Stelmisoft 12/07/2010 1 1 2 1 2 3 1 2 3 4 1 2 3 4 5 1 2 3 4 5 6 Spis tre±ci Czym jest Czym jest repozytorium 1 Czym jest Czym jest repozytorium
Bardziej szczegółowoNumeryczne zadanie wªasne
Rozdziaª 11 Numeryczne zadanie wªasne W tym rozdziale zajmiemy si symetrycznym zadaniem wªasnym, tzn. zadaniem znajdowania warto±ci i/lub wektorów wªasnych dla macierzy symetrycznej A = A T. W zadaniach
Bardziej szczegółowoEksploracja Danych. Wprowadzenie. (c) Marcin Sydow
Wprowadzenie Proponowane podr czniki T.Hastie, R.Tibshirani et al. An Introduction to Statistical Learning I.Witten et al. Data Mining S.Marsland Machine Learning J.Koronacki, J.Mielniczuk Statystyka dla
Bardziej szczegółowoWykªad 4. Funkcje wielu zmiennych.
Wykªad jest prowadzony w oparciu o podr cznik Analiza matematyczna 2. Denicje, twierdzenia, wzory M. Gewerta i Z. Skoczylasa. Wykªad 4. Funkcje wielu zmiennych. Zbiory na pªaszczy¹nie i w przestrzeni.
Bardziej szczegółowoWykªad 7. Ekstrema lokalne funkcji dwóch zmiennych.
Wykªad jest prowadzony w oparciu o podr cznik Analiza matematyczna 2. Denicje, twierdzenia, wzory M. Gewerta i Z. Skoczylasa. Wykªad 7. Ekstrema lokalne funkcji dwóch zmiennych. Denicja Mówimy,»e funkcja
Bardziej szczegółowoEkonometria Bayesowska
Ekonometria Bayesowska Wykªad 6: Bayesowskie ª czenie wiedzy (6) Ekonometria Bayesowska 1 / 21 Plan wykªadu 1 Wprowadzenie 2 Oczekiwana wielko± modelu 3 Losowanie próby modeli 4 wiczenia w R (6) Ekonometria
Bardziej szczegółowo1. Wprowadzenie do C/C++
Podstawy Programowania - Roman Grundkiewicz - 013Z Zaj cia 1 1 rodowisko Dev-C++ 1. Wprowadzenie do C/C++ Uruchomienie ±rodowiska: Start Programs Developments Dev-C++. Nowy projekt: File New Project lub
Bardziej szczegółowoCharakterystyka systemów plików
Charakterystyka systemów plików Systemy plików są rozwijane wraz z systemami operacyjnymi. Windows wspiera systemy FAT oraz system NTFS. Różnią się one sposobem przechowywania informacji o plikach, ale
Bardziej szczegółowoAlgorytmy klasyfikacji
Algorytmy klasyfikacji Konrad Miziński Instytut Informatyki Politechnika Warszawska 6 maja 2015 1 Wnioskowanie 2 Klasyfikacja Zastosowania 3 Drzewa decyzyjne Budowa Ocena jakości Przycinanie 4 Lasy losowe
Bardziej szczegółowoInteligentna analiza danych
Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki
Bardziej szczegółowoPOLITECHNIKA WROCŠAWSKA WYDZIAŠ ELEKTRONIKI PRACA DYPLOMOWA MAGISTERSKA
POLITECHNIKA WROCŠAWSKA WYDZIAŠ ELEKTRONIKI Kierunek: Specjalno± : Automatyka i Robotyka (AIR) Robotyka (ARR) PRACA DYPLOMOWA MAGISTERSKA Podatny manipulator planarny - budowa i sterowanie Vulnerable planar
Bardziej szczegółowoStatystyka. Šukasz Dawidowski. Instytut Matematyki, Uniwersytet l ski
Statystyka Šukasz Dawidowski Instytut Matematyki, Uniwersytet l ski Statystyka Statystyka: nauka zajmuj ca si liczbowym opisem zjawisk masowych oraz ich analizowaniem, zbiory informacji liczbowych. (Sªownik
Bardziej szczegółowoJednowarstwowe Sieci Neuronowe jako. klasykatory do wielu klas. (c) Marcin Sydow
Plan dyskretny perceptron i jego ograniczenia inne funkcje aktywacji wielo-klasykacja przy pomocy jedno-warstwowe sieci neuronowej ograniczenia jedno-warstwowej sieci neuronowej miary ewaluacyjne dla klasykacji
Bardziej szczegółowoARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15
ARYTMETYKA MODULARNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Denicja kongruencji i jej podstawowe wªasno±ci 3 2 Systemy pozycyjne 8 3 Elementy odwrotne 12 4 Pewne zastosowania elementów odwrotnych
Bardziej szczegółowoElementarna statystyka Dwie próby: porównanie dwóch proporcji (Two-sample problem: comparing two proportions)
Elementarna statystyka Dwie próby: porównanie dwóch proporcji (Two-sample problem: comparing two proportions) Alexander Bendikov Uniwersytet Wrocªawski 25 maja 2016 Elementarna statystyka Dwie próby: porównanie
Bardziej szczegółowoEksploracja danych. Wykªad 8 Drzewa decyzyjne 1 / 260
Eksploracja danych Wykªad 8 Drzewa decyzyjne 1 / 260 Drzewa decyzyjne Drzewa decyzyjne (okre±lane równie» jako drzewa klasykacyjne lub regresyjne) s tradycyjnym narz dziem eksploracji danych i klasycznym
Bardziej szczegółowoPropozycja integracji elementów ±wiata gry przy u»yciu drzew zachowa«
Praca cz ±ciowo sponsorowana przez Ministerstwo Nauki i Szkolnictwa Wy»szego, grant nr N N519 172337, Integracyjna metoda wytwarzania aplikacji rozproszonych o wysokich wymaganiach wiarygodno±ciowych.
Bardziej szczegółowoWst p do informatyki. Systemy liczbowe. Piotr Fulma«ski. 21 pa¹dziernika 2010. Wydziaª Matematyki i Informatyki, Uniwersytet Šódzki, Polska
Wst p do informatyki Systemy liczbowe Piotr Fulma«ski Wydziaª Matematyki i Informatyki, Uniwersytet Šódzki, Polska 21 pa¹dziernika 2010 Spis tre±ci 1 Liczby i ich systemy 2 Rodzaje systemów liczbowych
Bardziej szczegółowoHotel Hilberta. Zdumiewaj cy ±wiat niesko«czono±ci. Marcin Kysiak. Festiwal Nauki, 20.09.2011. Instytut Matematyki Uniwersytetu Warszawskiego
Zdumiewaj cy ±wiat niesko«czono±ci Instytut Matematyki Uniwersytetu Warszawskiego Festiwal Nauki, 20.09.2011 Nasze do±wiadczenia hotelowe Fakt oczywisty Hotel nie przyjmie nowych go±ci, je»eli wszystkie
Bardziej szczegółowoLekcja 8 - ANIMACJA. 1 Polecenia. 2 Typy animacji. 3 Pierwsza animacja - Mrugaj ca twarz
Lekcja 8 - ANIMACJA 1 Polecenia Za pomoc Baltiego mo»emy tworzy animacj, tzn. sprawia by obraz na ekranie wygl daª jakby si poruszaª. Do animowania przedmiotów i tworzenia animacji posªu» nam polecenia
Bardziej szczegółowoElementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for regression) / 13
Elementarna statystyka Wnioskowanie o regresji (Inference for regression) Alexander Bendikov Uniwersytet Wrocªawski 2 czerwca 2016 Elementarna statystyka Wnioskowanie o regresji (Inference 2 czerwca for
Bardziej szczegółowoprzewidywania zapotrzebowania na moc elektryczn
do Wykorzystanie do na moc elektryczn Instytut Techniki Cieplnej Politechnika Warszawska Slide 1 of 20 do Coraz bardziej popularne staj si zagadnienia zwi zane z prac ¹ródªa energii elektrycznej (i cieplnej)
Bardziej szczegółowoCAŠKOWANIE METODAMI MONTE CARLO Janusz Adamowski
III. CAŠKOWAIE METODAMI MOTE CARLO Janusz Adamowski 1 1 azwa metody Podstawowym zastosowaniem w zyce metody Monte Carlo (MC) jest opis zªo-»onych ukªadów zycznych o du»ej liczbie stopni swobody. Opis zªo»onych
Bardziej szczegółowoModel obiektu w JavaScript
16 marca 2009 E4X Paradygmat klasowy Klasa Deniuje wszystkie wªa±ciwo±ci charakterystyczne dla wybranego zbioru obiektów. Klasa jest poj ciem abstrakcyjnym odnosz cym si do zbioru, a nie do pojedynczego
Bardziej szczegółowoPrzekroje Dedekinda 1
Przekroje Dedekinda 1 O liczbach wymiernych (tj. zbiorze Q) wiemy,»e: 1. zbiór Q jest uporz dkowany relacj mniejszo±ci < ; 2. zbiór liczb wymiernych jest g sty, tzn.: p, q Q : p < q w : p < w < q 3. 2
Bardziej szczegółowoAplikacje bazodanowe. Laboratorium 1. Dawid Poªap Aplikacje bazodanowe - laboratorium 1 Luty, 22, / 37
Aplikacje bazodanowe Laboratorium 1 Dawid Poªap Aplikacje bazodanowe - laboratorium 1 Luty, 22, 2017 1 / 37 Plan 1 Informacje wst pne 2 Przygotowanie ±rodowiska do pracy 3 Poj cie bazy danych 4 Relacyjne
Bardziej szczegółowoARYTMETYKA MODULARNA. Grzegorz Szkibiel. Wiosna 2014/15
ARYTMETYKA MODULARNA Grzegorz Szkibiel Wiosna 2014/15 Spis tre±ci 1 Denicja kongruencji i jej podstawowe wªasno±ci 3 2 Systemy pozycyjne 8 3 Elementy odwrotne 12 4 Pewne zastosowania elementów odwrotnych
Bardziej szczegółowoPodstawy statystycznego modelowania danych Analiza prze»ycia
Podstawy statystycznego modelowania danych Analiza prze»ycia Tomasz Suchocki Uniwersytet Przyrodniczy we Wrocªawiu Katedra Genetyki i Ogólnej Hodowli Zwierz t Plan wykªadu 1. Wprowadzenie 2. Hazard rate
Bardziej szczegółowoRegulamin rekrutacji do Gimnazjum w Chwaliszewie na rok szkolny 2016/2017
Regulamin rekrutacji do Gimnazjum w Chwaliszewie na rok szkolny 2016/2017 Podstawa prawna: 1. Ustawy z dnia 7 września 1991 r. o systemie oświaty (Dz.U. z 2015 r. poz. 2156 z późn zm.) 2. Rozporządzenie
Bardziej szczegółowoKONCEPCJA NAUCZANIA PRZEDMIOTU RACHUNKOWOŚĆ SKOMPUTERYZOWANA" NA WYDZIALE ZARZĄDZANIA UNIWERSYTETU GDAŃSKIEGO
KONCEPCJA NAUCZANIA PRZEDMIOTU RACHUNKOWOŚĆ SKOMPUTERYZOWANA" NA WYDZIALE ZARZĄDZANIA UNIWERSYTETU GDAŃSKIEGO Grzegorz Bucior Uniwersytet Gdański, Katedra Rachunkowości 1. Wprowadzenie Rachunkowość przedsiębiorstwa
Bardziej szczegółowoZaawansowana adresacja IPv4
Zaawansowana adresacja IPv4 LAN LAN... MAN... LAN Internet Zagadnienia: podział sieci na równe podsieci (RFC 950, 1985 r.) technologia VLSM (RFC 1009, 1987 r.) technologia CIDR (RFC 1517-1520, 1993 r.)
Bardziej szczegółowoZarządzanie projektami. wykład 1 dr inż. Agata Klaus-Rosińska
Zarządzanie projektami wykład 1 dr inż. Agata Klaus-Rosińska 1 DEFINICJA PROJEKTU Zbiór działań podejmowanych dla zrealizowania określonego celu i uzyskania konkretnego, wymiernego rezultatu produkt projektu
Bardziej szczegółowoAUTOR MAGDALENA LACH
PRZEMYSŁY KREATYWNE W POLSCE ANALIZA LICZEBNOŚCI AUTOR MAGDALENA LACH WARSZAWA, 2014 Wstęp Celem raportu jest przedstawienie zmian liczby podmiotów sektora kreatywnego na obszarze Polski w latach 2009
Bardziej szczegółowo