ZASTOSOWANIE METODY CZĄSTKOWYCH NAJMNIEJSZYCH KWADRATÓW (PLS) DO KLASYFIKACJI DANYCH MIKROMACIERZOWYCH
|
|
- Henryk Lis
- 7 lat temu
- Przeglądów:
Transkrypt
1 SUDIA INFORMAICA 7 Volume 8 Number (7) Paweł BŁASZCZYK Unwersytet Śląsk, Instytut Matematyk Katarzyna SĄPOR Poltechnka Śląska, Instytut Inormatyk ZASOSOANIE MEODY CZĄSKOYCH NAJMNIEJSZYCH KADRAÓ (PLS) DO KLASYFIKACJI DANYCH MIKROMACIERZOYCH Streszczene. artykule przedstawono wyprowadzene metody cząstkowych namneszych kwadratów (PLS) e zastosowane w klasykac danych mkromacerzowych. tym celu porównano ze sobą dwe metody klasykac lnową dyskrymnacę Fshera (FLD) oraz metodę cząstkowych namneszych kwadratów (PLS). Jako dane mkromacerzowe wykorzystano symulowane zbory danych oraz dane bologczne. Słowa kluczowe: metoda namneszych cząstkowych kwadratów, lnowa dyskrymnaca Fshera, eksperyment mkromacerzowy, uczene nadzorowane AN APPLICAION OF PARIAL LEAS SQUARES MEHOD (PLS) FOR CLASSIFICAION OF MICROARRAY DAA Summary. In ths paper we present marthematcal ntroducton o Partal Least Squares metod (PLS) and applcaton or classcaton mcroarray data. o do ths applcaton two classcaton methods was compared Fsher lnear dscrmnant (FLD) and partal Least Squares (PLS) appled to classcaton o mcroarray data are compared. he smulaton and bologcal datasets are used as a mcroarray gene expresson data. Keywords: Partal Least Square (PLS), Fsher Lnear Dscrmnant (FLD), mcroarray experment, supervsed learnng
2 3 P. Błaszczyk, K. Stąpor. stęp eksperymentach genetycznych predykca, klasykaca klasteryzaca są podstawowym metodam wykorzystywanym do analzy nterpretac danych mkromacerzowych. Dane mkromacerzowe charakteryzuą sę tym, że zazwycza lczba cech opsuących próbkę est rzędu klku czy nawet klkunastu tysęcy znaczne przekracza lczbę próbek, których est ne węce nż klkadzesąt. Klasykaca próbek w take sytuac może dawać ałszywe wynk. Z tego powodu ważne est zmneszene wymaru przestrzen cech (genów). Cel ten można osągnąć poprzez wstępną selekcę lub też poprzez ekstrakcę cech. artykule tym zamemy sę tylko metodam ekstrakc cech. Jedną z takch metod est metoda namneszych cząstkowych kwadratów (PLS). wórcą te metody, która znadue szeroke zastosowane np. w chemometr, est H. old [,,, 3]. Metodę tę można wykorzystać także w celu klasykac próbek. artykule tym koncentruemy sę na dwóch metodach klasykac. Przedstawamy wyprowadzena matematyczne lnowe dyskrymnac Fshera oraz metody namneszych cząstkowych kwadratów, oraz porównuemy e ze sobą. Obe metody porównuemy zarówno na danych bologcznych, ak symulowanych danych mkromacerzowych. celu estymac sprawnośc klasykac użyemy metody k - krotne waldac krzyżowe oraz metody Jackkne. Żadna z opsanych metod ne zależy od specykac mkromacerzy. rzeczywstośc ednak dane mkromacerzowe mogą wymagać odpowedne obróbk wstępne. artykule tym, przed wykonanem eksperymentu porównana, dane mkromacerzowe zostały poddane normalzac. artykule wykorzystuemy zarówno przetworzone dane symulowane, ak dane bologczne.. Metody Nech x :,..., N,,... L oznacza macerz pozomów ekspres genów, gdze wersze odpowadaą kolenym genom, natomast kolumny odpowadaą ndywdualnym próbkom. Ponadto, nech y y, {,},..., L y będą elementam kolumnowego wektora przynależnośc do klas Y. artykule tym będzemy rozważać edyne problem dwuklasowy. Klasy będzemy oznaczać przez C {y : y } oraz C {y : y }.
3 Zastosowane metody cząstkowych namneszych kwadratów 33.. Lnowa Dyskrymnaca Fshera (FLD) Lnowa dyskrymnaca Fshera (FLD) est szczególnym przypadkem lnowe unkc dyskrymnacyne (LDA), służące do znadywana nalepsze hperpłaszczyzny rozdzelaące dane. Lnowa dyskrymnaca Fshera została opsana w ksążkach [3, 6, 5, 4, 5]. yprowadzene metody LDA FLD przedstawmy w dodatku A, ponże natomast przedstawmy algorytm FLD: Nech x :,..., N,,... L będze zborem testowym rozmaru L, gdze x est wartoścą -te cechy w -te próbce, natomast nech y,..., y L, y {,} będą etyketam klas. Ponadto załóżmy, że mamy unkcę lnową o postac h( ) v, () gdze est -tym wektorem kolumnowym macerzy odpowadaącym -te próbce. Załóżmy, że eśl wartość unkc h ( ) >, to klasykowany element należy do klasy C, w przecwnym wypadku do klasy C. Celem naszym est znalezene optymalnych współczynnków oraz progu v. Nech oraz będą odpowedno warancą oraz średną w -te klase. Rozważmy następuącą unkcę kryteralną: { C ( ), () gdze E h( ) C } oraz Var{ h( ) } dla,. Funkcę tę nazywamy kryterum Fshera. Merzy ona różncę dwóch średnch znormalzowanych poprzez warance. Korzystaąc z równana na postać optymalnych współczynnków w metodze LDA (patrz Dodatek A), otrzymuemy następuące równane: [ Σ Σ ] ( M M ), (3) gdze: M E{ C} wektor wartośc oczekwane, Σ E{( M )( M ) C} macerz kowaranc dla klasy C :,... Metoda cząstkowych namneszych kwadratów (PLS) wórcą metody PLS est H. old [,,, 3]. Powstała ona uż w 975 roku. elokrotne poprawana była tematem welu artykułów. artykule tym operamy sę na algorytme zaproponowanym przez Höskuldssona w artykule z 988 roku []. Metoda cząstkowych namneszych kwadratów określa zwązek lnowy pomędzy macerzą próbek a wektorem przynależnośc do klas Y ] [ y :... L. metodze te przymuemy założena, że macerz próbek oraz wektor Y są znormalzowane, tak aby wartość średna w każde kolumne
4 34 P. Błaszczyk, K. Stąpor była równa. Szukamy takego wektora wag, który est rozwązanem następuące unkc celu: w przy warunku k w w ( w, Y ) arg max cov (4) w w dla każdego k. (5) Maksymalna lczba komponentów uzyskanych tą metodą est równa rank, gdze -ty komponent est kombnacą lnową cech z macerzy. Ponże przedstawmy algorytm teracyny NIPALS zaproponowany przez Höskuldssona []:. Dla... ustaw u na wektor Y oraz wykona krok -9,. w u /( u u) oraz znormalzu w, 3. t w. 4. c Y t /( t t) oraz znormalzu c, 5.. u Y c /( c c) oraz dź do 6. eśl est zbeżne, w przecwnym wypadku powróć do, 6. p t /( t t), 7. b u t /( t t), 8. tp, 9. Y Y btc, gdze est lczbą komponentów. Następne przy użycu klasyczne metody cząstkowych namneszych kwadratów oblczamy współczynnk regres następuąco: w p w c [ ]. (6) Klasykaca tą metodą odbywa sę w sposób następuący: Ytest sgn( test ). (7) Szczegóły dotyczące wyprowadzena metody PLS przedstawono w Dodatku B..3. Estymaca błędów Dla każdego zboru danych klasykowalśmy próbk za pomocą metod opsanych powyże. celu estymac pozomu błędu wykorzystalśmy metodę Jackkne, która est szczególnym przypadkem metody bootstrap opsane w artykule [5], oraz metodę k - krotne waldac krzyżowe opsane także w artykule [5]. Metoda Jackkne została wykorzystana w sposób następuący: losowo wybralśmy poedynczą próbkę zboru testowego, nauczylśmy klasykator na pozostałych próbkach, a wybraną próbkę klasykowalśmy w celu oblczena wartośc błędu. Błąd był równy, eśl dana próbka została zaklasykowana poprawne, lub, eśl wybrana próbka została sklasykowana błędne. Krok ten został powtórzony
5 Zastosowane metody cząstkowych namneszych kwadratów 35 razy, za każdym razem wyberaąc w ten sposób edną próbkę z pełnego zboru próbek. Błąd ER J oblczony tą metodą est średną arytmetyczną błędów z wcześneszych kroków. Zatem, błąd ten ma postać: ER J n n er( ), (8) gdze n est lczbą powtórzeń, natomast er() est błędem w -te terac. artykule tym przyęlśmy wartość n równą. Metoda k-krotne waldac krzyżowe została wykorzystana następuąco: losowo podzellśmy zbór na k podzborów równego rozmaru. Uczylśmy klasykator k razy, za każdym razem zbór trenngowy tworzyło k podzborów, natomast pomnęty zbór klasykowalśmy na wcześne nauczonym klasykatorze w celu oblczena błędu. Krok ten powtarzalśmy dla każdego z k podzborów. Błąd oblczony z wykorzystanem te metody ER CV est średną arytmetyczną błędów dla każdego z k podzborów. Zatem, błąd ten ma postać: ER CV k k er( ), (9) gdze k est lczbą podzborów, natomast er() est błędem w -te terac. artykule tym przyęlśmy wartość k równą 5. celu znalezena końców przedzałów unośc wykorzystalśmy percentyle ER CV oraz ER J rozkładu błędu. Dla estymac rozkładu wykorzystalśmy wartośc ER CV oraz ER J estymowanych w sposób opsany powyże. Dla ustalonego pozomu stotnośc α przedzał unośc został określony poprzez α / oraz α / percentyl, zatem przedzał unośc est postac: ( p ) CI p, () α / ; α / gdze p α / est α / percentylem. 3. ynk eksperymentu 3.. Bazy danych Metody opsane w perwsze sekc zostały porównane na klku symulowanych zborach danych mkromacerzowych. Naperw zostały przygotowane dwe grupy danych, składaące sę z 5 próbek (wektorów) zaweraące genów. Zbór IS5 zaweraący 5% () genów różncuących został wygenerowany za pomocą metod opsanych w artykule [] z wykorzystanem rozkładów normalnych o zadanych parametrach przedstawonych w tabel. ylko ostatne 3 wersze reprezentuą różne pozomy ekspres genów.
6 36 P. Błaszczyk, K. Stąpor abela Średne oraz odchylena standardowe użyte w zborach IS5 Grupa Grupa μ μ -8, -8, -,4 -, , -6,, -8, -8,5, -,4 -,7 Przymuemy ednakowe prawdopodobeństwo dla każdego modelu z perwszych 3 werszy tabel dla określena genów neróżncuących oraz dla ostatnch 3 werszy tabel dla określena genów różncuących. o znaczy, że eśl wygenerowany gen został określony ako DEG (eden ze genów dla zboru IS5), to wybralśmy eden z trzech ostatnch werszy tabel z ednakowym prawdopodobeństwem /3 wygenerowalśmy pozomy ekspres dla 5 próbek z grupy oraz 5 próbek z grupy, wykorzystuąc rozkłady normalne z parametram zadanym wybranym werszem tabel. Na przykład, nech est ednym z genów różncuących oraz wybrany został ostatn wersz tabel w celu wygenerowana pozomów ekspres genów. o znaczy, że wygenerowalśmy 5 lczb dla perwsze grupy z rozkładu normalnego N(-;.4) oraz 5 lczb dla grupy z rozkładu normalnego N(-;,7). Dla genów neróżncuących wybralśmy eden z perwszych 3 werszy tabel z ednakowym prawdopodobeństwem /3 oraz wygenerowalśmy pozomy ekspres dla wszystkch 3 próbek z tego samego rozkładu normalnego o parametrach wyznaczonych przez wybrany wersz z tabel. ygenerowalśmy także zbór danych CS, zaweraący próbek należących do perwsze grupy oraz 9 próbek należących do druge grupy. Każda próbka zawera genów, proporca genów różncuących do neróżncuących została ustawona na %, to znaczy że mamy genów różncuących w tych zborach. Naperw nezależne wygenerowalśmy każdą wartość macerzy 4 z rozkładu standardowego normalnego. Następne dodalśmy wartość do perwszych genów w perwsze grupe w celu modelowana genów różncuących. Perwszych genów w perwsze grupe ma rozkład normalny ze średną równą. Ponadto, wszystke elementy całe macerzy są stochastyczne nezależne. Następne wygenerowalśmy nezależne 4 losowych lczb a,..., a 4 z rozkładu normalnego standardowego. Dla ustalonego współczynnka korelac ρ, dla każdego elementu generowane macerzy zastosowalśmy następuącą transormacę: x : ρa ρ x, gdze,..., est numerem genu natomast,,...,4 numerem próbk, tak że dla dowolnych oraz mamy (, ) Corr x x ρ. ykorzystuąc procedurę opsaną powyże,
7 Zastosowane metody cząstkowych namneszych kwadratów 37 wygenerowalśmy zbory testowe trenngowe CS, ze współczynnkem korelac odpowedno na pozome,. Ponadto, porównalśmy każdą z omawanych metod na zborze bologcznym leukema dostępnym pod adresem [6] oraz zborze colon dostępnym pod adresem [7]. Zbór leukema zawera pozomy ekspres typów bałaczk: ostre lmatyczne (ALL) oraz ostre szpkowe (AML). Zbór trenngowy zawera 38 próbek (7 ALL AML), natomast zbór testowy zawera 34 próbk ( ALL 4 AML). obu zborach próbk składaą sę z 79 genów. Zbór colon zawera pozomy ekspres genów pogrupowane w klasy. Klasa perwsza zawera pozomy ekspres genów 4 próbek pochodzących z chore częśc okrężncy, natomast próbk pochodzą od tych samych pacentów, ale ze zdrowe częśc okrężncy. 3.. ynk Do porównana ze sobą obu metod zastosowalśmy dokładne tak sam schemat eksperymentu zarówno dla danych symulowanych, ak danych bologcznych. Naperw dla każdego zboru danych oblczylśmy wartośc p-value przymuąc lość permutac równą tys. tym celu wykorzystalśmy metodę unadusted p-value opsaną w artykułach [4, 8]. Następne wybralśmy te geny (cechy), których wartość p-value, była mnesza nż.. ak wybrane dane poddalśmy wstępne obróbce. Zostały one znormalzowane. Następne tak przetworzone dane wykorzystalśmy do klasykac za pomocą obu opsanych metod. Estymac błędu dokonalśmy za pomocą metody k-krotne waldac krzyżowe dla parametru k5 oraz metody Jackkne. Dokonalśmy estymac przedzału unośc na pozome, Dane bologczne Dla danych bologcznych zastosowalśmy schemat eksperymentu opsany powyże. przypadku zboru colon wybralśmy 8 genów, których wartośc p-value były mnesze nż,. zborze leukema takch genów wybralśmy 86. Dane zostały poddane normalzac. Dla tak obrobonych danych zbudowalśmy klasykator oparty na metodze FLD opsane w punkce. oraz klasykator PLS opsany w punkce. tego artykułu. Błąd klasykac estymowalśmy metodam Jackkne oraz k-krotne waldac krzyżowe. Dla zboru danych leukema przy klasykac metodą PLS osągnęte wynk ne zależały od lośc komponentów. Estymowane obema metodam były do sebe bardzo zblżone. Średn pozom błędu estymowany metodą Jackkne wynosł,7 w przedzale unośc [,6;,8]. Błąd szacowany, drugą z metod, metodą k-krotne waldac krzyżowe był newele gorszy. Znaczne gorsze wynk uzyskalśmy przy klasykac metodą FLD. ówczas pozomy błędów estymowanych metodą Jackkne oraz k-krotne waldac krzyżowe wynoszą odpowedno,676 w przedzale [,588;,735] oraz,764 w przedzale unośc [,588;
8 38 P. Błaszczyk, K. Stąpor,7647]. tabel przedstawono przyporządkowane próbek do klas za pomocą obu metod oraz porównane ch z aktyczną przynależnoścą do klas. abela ynk klasykac zboru leukema metodam FLD oraz PLS Nr. próbk Klasa FLD PLS Nr. próbk Klasa FLD PLS abela 3 ynk klasykac zboru colon metodam FLD oraz PLS Nr. próbk Klasa FLD PLS Nr. próbk Klasa FLD PLS Klasykuąc zbór danych colon metodą FLD, zauważylśmy dużą różncę w pozome błędu szacowanego obema opsanym metodam. Różnce te sęgały nawet % były korzystnesze w przypadku estymac metodą Jackkne. Średn błąd estymowany tą metodą wynosł, zawerał sę w przedzale [,;,5], natomast pozom błędu estymowany me-
9 Zastosowane metody cząstkowych namneszych kwadratów 39 todą k-krotne waldac krzyżowe wynosł,58 należał do przedzału [,;,58]. ynk uzyskane przy klasykac metodą PLS po raz koleny były lepsze nż te uzyskane poprzez klasykacę metodą FLD. Średn błąd wynosł,48-,968 odpowedno dla estymac metodą Jackkne oraz k-krotne waldac krzyżowe. tabel 3 przedstawono przyporządkowane próbek do klas uzyskanych przy klasykac zboru colon Dane symulowane Przed przystąpenem do eksperymentu dla obu zborów symulowanych oblczylśmy wartośc p-value dla tys. permutac, po czym wybralśmy tylko te geny (cechy), których wartośc p-value były mnesze nż.. Dla zborów CS oraz IS5 było to odpowedno 44 oraz 97 genów. Otrzymane dane poddalśmy wstępne obróbce. Zostały one poddane normalzac. Dla danych symulowanych naperw zbudowalśmy klasykator PLS. Estymuąc pozom błędu dwoma opsanym w sekc 3 metodam, uzyskalśmy bardzo zblżone wynk dla każde lczby komponentów w algorytme PLS. ynk estymac pozomu błędu uzyskane metodą Jackkne dla zboru CS wynoszą średno,75, a przedzał unośc est równy [,5;,6]. Zarówno pozom błędu, ak końce przedzału unośc ne różną sę znaczne w zależnośc od lczby komponentów. Odchylene wynos zaledwe,5. ynk te różną sę ednak od tych uzyskanych metodą k-krotne waldac krzyżowe. Pozom błędu estymowany tą metodą est wyższy wynos średno, dla przedzału unośc [,;,5]. Sytuacę odwrotną mamy w przypadku zboru IS5, gdze lepsze wynk uzyskalśmy estymuąc pozom błędu metodą Jackkne. Szacowany średn pozom błędu wynosł, w przedzale [;,5]. ynk uzyskane metodą k-krotne waldac krzyżowe ne odbegaą ednak w sposób drastyczny. Średn pozom błędu wynos,667, natomast przedzał unośc [,6;,]. Porównuąc te wynk z tym uzyskanym przy klasykac tych samych zborów metodą FLD, wdzmy znaczącą różncę. Pozomy błędu estymowane obema metodam są nezadowalaące są na pozome,45 do,5 odpowedno dla zborów CS oraz IS5. Bardzo złe wynk uzyskane za pomocą metody FLS sugeruą, że zanm metoda ta będze wykorzystywana ako klasykator, należałoby dokonać dodatkowe obróbk danych, na przykład poprzez selekcę, albo użyć algorytmu PLS do redukc wymaru przestrzen, po czym zastosować metodę FLD. 4. nosk Podsumowuąc, w artykule tym porównalśmy dwe metody klasykac danych mkromacerzowych metodę namneszych cząstkowych kwadratów (PLS) oraz lnową dyskrymnacę Fshera (FLD). Metoda cząstkowych namneszych kwadratów (PLS) okazała sę
10 4 P. Błaszczyk, K. Stąpor być znacząco lepsza od metody lnowe dyskrymnac Fshera (FLD). Ponadto, algorytm PLS posłużył do klasykac danych, ednak można sę zastanowć nad sposobem wykorzystana go edyne do redukc wymaru, po czym klasykować nną z metod, na przykład za pomocą lnowe dyskrymnac Fshera. Poneważ wynkem algorytmu PLS są komponenty będące lnową kombnacą cech w perwotnym zborze danych, rezultaty uzyskane w wynku tego eksperymentu mogą być bardzo dobre. Dobre wynk uzyskane przy klasykac zborów IS5 oraz CS, przy których tworzenu ważny był współczynnk korelac, potwerdzaą skuteczność metody PLS. Chocaż korelaca ne była duża, zbór został dobrze rozpoznawany, a estymowany błąd był na akceptowalnym pozome. Być może zastosowane dodatkowe obróbk danych poprawłoby akoś klasykac. 5. Dodatk 5.. Dodatek A celu lepszego zrozumena metody FLD opsane w punkce artykułu wyprowadzmy teraz metodę lnowe dyskrymnac (LDA), z które to wywodz sę metoda FLD. zagadnenu klasykac lnowe reguła decyzyna ma następuącą postać: eśl h ( ) v >, wówczas C, w przecwnym wypadku C. ( Funkca h ) est lnowa nazywamy ą lnową unkcą dyskrymnacyną. Naszym zadanem est znalezene optymalnych współczynnków ] [,..., N. Z równana () wynka, że N-wymarowy wektor est rzutowany na wektor, a zmenna y w rzutowane ednowymarowe przestrzen h est klasykowana do klasy C albo klasy C. Jeśl zmenna ma rozkład normalny, wtedy h ) także ma rozkład normalny. ówczas błąd w przestrzen h est określony przez E h( ) C } oraz Var{ h( ) }. Natomast eśl ( { C ne ma rozkładu normalnego, a h ) est sumą n składnków, to korzystaąc z centralnego twerdzena grancznego zmenna ( może być blska rozkładow normalnemu dla wystarczaąco dużego N. artośc oczekwane oraz warance dla h ) maą następuącą postać: { v () E h( ) C} E{ C} v M Var{ h( ) C } E{( M )( M ) C } Σ () Nech teraz (,,, ) będze unkcą kryteralną, którą będzemy mnmalzować albo maksymalzować w celu znalezena optymalnych wartośc współczynnków. Korzy- (
11 Zastosowane metody cząstkowych namneszych kwadratów 4 staąc z twerdzena o pochodne unkc złożone, oblczymy pochodne unkc względem oraz v. ówczas:, (3) v v v v v. (4) Na mocy () oraz () otrzymuemy: Σ oraz M, (5) v oraz v, (6) zatem dokonuąc odpowednch podstaweń oraz przyrównuąc (3) (4) do zera, otrzymuemy: Σ Σ M M, (7). (8) Poneważ błąd w rzutowane przestrzen zależy tylko od kerunku wektora a ne od ego rozmaru, dla uproszczena możemy usunąć wszystke stałe, przez które mnożymy. Stad po wstawenu uproszczenu otrzymuemy: [ ] ( ) ) ( M M s s Σ Σ, (9) gdze / / / s. () Przymmy teraz za unkcę kryteralną unkcę Fshera o postac (). Przypomnmy, że est ona dana wzorem ) (. Korzystaąc z wcześneszych wyprowadzeń, oblczmy pochodne unkc względem oraz. ówczas otrzymuemy: ) ( ) (, ()
12 4 P. Błaszczyk, K. Stąpor a stąd wobec wzoru () otrzymuemy s /. ówczas optymalne współczynnk maą następuącą postać: Σ Σ ( M M ). () Poneważ w różncy ne występue składnk v, węc lnowa dyskrymnaca Fshera ne zależy od progu v. 5.. Dodatek B Metoda cząstkowych namneszych kwadratów określa zwązek lnowy pomędzy macerzą próbek a wektorem przynależnośc do klas Y [ y :... L]. metodze te przymuemy założena, że macerz próbek oraz wektor Y są znormalzowane. Szukamy takego wektora wag, który est rozwązanem unkc celu określone wzorem (4) przy warunku (5). Przypomnmy, że wzory te maą postać odpowedno w k w w ( w, Y ) arg max cov, w w dla każdego k. Naszym perwszym zadanem est znalezene kerunku maksmum kowaranc. tym celu należy dokonać dekompozyc na wartośc syngularne macerzy Y. Po dekompozyc uzyskuemy macerz o postac: Y UΣV. (3) Macerz Σ est macerzą dagonalną, gdze wartośc na przekątne są postac λ, przy czym... dla wartośc własnych λ macerzy Y. Ponadto, V oraz > U są macerzam ortogonalnym, czyl spełnaą warunk V V I oraz U U I. Algorytm PLS wybera kerunek wyznaczony przez wektor syngularny, odpowadaący nawększe wartośc syngularne. spółczynnk regres w przypadku perwszego komponentu wynos bv, gdze b, (4) u u a v,u są perwszym wektoram syngularnym, natomast est perwszą wartoścą syngularną dane macerzy, podczas gdy aproksymaca Y est dana wzorem b u v. Dokonamy teraz rzutowana macerzy Y na przestrzeń ortogonalną do wektora u. Poneważ macerz rzutu na znormalzowany wektor w ma postać I ww, (5)
13 Zastosowane metody cząstkowych namneszych kwadratów 43 a węc otrzymuemy uu uu uu I I (6) u u u u u u yberamy teraz teracyne nowy kerunek. ynkem będze wektor wartośc następne zmenne ukryte ortogonalne do wektora u. ektor ten będze kombnacą wszystkch kolumn nowe macerzy ortogonalnych do tego wektora. Po usunęcu u maksymalna kowaranca nowe macerzy mus być co namne tak duża ak druga wartość syngularna orygnalne macerzy. LIERAURA. Basten P., Vnz V. E., enenhaus M.: PLS generalsed lnear regresson. Computatonal Statstcs & Data Analyss, 48 (5), pp Broberg P.: Statstcal methods or rankng derentaally expressed genes. Genome Bology 3, $:R4. 3. Duda R. O., Hart P. E., Stork D. G.: Pattern classcaton ed. ley, New York. 4. Dudot S., Yang Y. H., Callow M. J., Speed.P.: Statstcal methods or dentyng derentally expressed genes n replcated cdna mcroarray experments. echncal Report 578, Department o Statstcs, UC Berkeley, CA,. 5. Eron B.: Estmatng the error rate o predcton rule mprovement on cross-valdaton. Journal o the Amercan Statstcal Assocaton, 983, Vol. 78, No Fukunaga K.: Introducton to statstcal pattern recognton. Academc Press Proessonal, New York Garthwate P. H.: An nterpretaton o Partal Least Squares. Journal o the Ameran Statstcal Assocaton, March 994, 89, 45, ABI/INFORM Global, pp.. 8. Ge Y., Dudot S., Speed. P.: Resamplng-based multple testng or mcroarray data analyss. echncal Report 663, Department o Statstcs, UC Berkeley, CA, Gelad P., Kowalsk B. R.: Partal Least-Squares Regresson: A tutoral, Analytca Chemca Acta, 85 (986), 7.. Helland I. S.: Partal Least Squares Regresson and Statctcal Models, Scand. J. Statst 7, 99, pp Höskuldsson A.: PLS Regresson methods, Journal o Chemometrcs. vol (988), pp. 8.. Höskuldsson A.: Varable and subset selecton n PLS regresson. Chemometrcs and Intellgent labolatory Systems, 55 (), pp
14 44 P. Błaszczyk, K. Stąpor 3. Lu Z., an J. P., Chen D.: Cancer Classcaton wth Partal Least Square Algorthm and Proteomc Data. 4. Lu Z., Chen D., an J. P.: Classcaton o Proteomc Data wth Multclass Logstc Partal Least Square Algorthm. 5. Marques de Sa J. P.: Pattern recognton. Concepts, methods, and applcatons, Sprnger,. 6. Nguyen D. V., Rocke D. M.: umor classdcaton by Partal Least Square usng mcroarray gene expresson data. Bonormatcs, Vol. 8, No.,, pp Nguyen D. V., Rocke D. M., On Partal Least Square dmenson reducton or mcroarraybased classcaton: a smulaton study. Computatonal Statstc & Data Analyss, 46, 4, pp Rospal R., reo L. J.: Kernel Partal Least Square Regresson n Reproducng Kernel Hlbert Space. 9. Selln N., Versand O.: Partal Least Square Modelng n Research on Educatonal Achevement.. old H.: Sot Modelng by Latent Varables: he Non-Lnear Iteratve Partal Least Squares (NIPALS) Approach, Perspectves n Probablty and Statstcs. Papers n Honour o M. S. Bartlett, London 975, pp old S., Martens H., old H.: he multvarate calbraton problem n chemstry solved by the PLS method. Proc. Con. Matrx Pencls, (A. Ruhe and B. Kagström, eds.), March 98, Lecture Notes n Mathematcs, Sprnger Verlag, Hedelberg, pp old S., Ruhe A., old H.: he collnearty problem n lnear regesson. he partal least squares (PLS) approach to generalzed nverses. SIAM J. Sc. Stat. Comput. Vol. 5, No. 3, Septembre old S., Söström M., Erksson L.: PLS-regresson: a basc tool o chemometrcs, Chemometrcs and Intellgent labolatory Systems, 58,, pp Vapnk V. N.: Statstcal Learnng heory. ley, New York Vapnk V. N.: he nature o statstcal learnng theory ed. Sprnger, Recenzent: Dr nż. Krzyszto Fuglewcz płynęło do Redakc 4 maa 7 r.
15 Zastosowane metody cząstkowych namneszych kwadratów 45 Abstract In ths paper classcaton method appled to gene classcaton was compared. e concentrate on the Partal Least Square (PLS) and Fsher Lnear Dscrmnant methods. e presented mathematcal ntroductons to these methods and dscussed the results o the classcaton. Mathematcal dervaton o these methods was shown n appendx. Error rates and condence ntervals was estmated by ackkne and k-old cross valdaton methods. For the comparson perormance o classers derent types o dataset was used. Smulaton data ncluded expresson levels n 3 samples or the IS5 datasets and n 4 samples or CS datasets. Bologcal datasets leukema and colon, used n ths artcle was avalable on webste [6] and on [7]. e notced that perormance o PLS method s much hgher than perormance o FLD method. Good perormance o PLS on the smulaton dataset, where correlaton coecent was mportant, prooed that ths method had good ecency. e notced that that FLD method should be used rather ater PLS method wtch can be used only or reduce dmenson than as a classer. Adresy Paweł BŁASZCZYK, Unwersytet Śląsk, Instytut Matematyk, ul. Bankowa 4, 4-7 Katowce, Polska, pblaszcz@math.us.edu.pl Katarzyna SĄPOR: Poltechnka Śląska, Instytut Inormatyk, ul. Akademcka 6, 44- Glwce, Polska, katarzyna.stapor@polsl.pl
Plan wykładu: Typowe dane. Jednoczynnikowa Analiza wariancji. Zasada: porównać zmienność pomiędzy i wewnątrz grup
Jednoczynnkowa Analza Waranc (ANOVA) Wykład 11 Przypomnene: wykłady zadana kursu były zaczerpnęte z podręcznków: Statystyka dla studentów kerunków techncznych przyrodnczych, J. Koronack, J. Melnczuk, WNT
Bardziej szczegółowoWeryfikacja hipotez dla wielu populacji
Weryfkacja hpotez dla welu populacj Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Intelgencj Metod Matematycznych Wydzał Informatyk Poltechnk Szczecńskej 5. Parametryczne testy stotnośc w
Bardziej szczegółowoZaawansowane metody numeryczne Komputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych
Zaawansowane metody numeryczne Komputerowa analza zagadneń różnczkowych 1. Układy równań lnowych P. F. Góra http://th-www.f.uj.edu.pl/zfs/gora/ semestr letn 2006/07 Podstawowe fakty Równane Ax = b, x,
Bardziej szczegółowoProblemy jednoczesnego testowania wielu hipotez statystycznych i ich zastosowania w analizie mikromacierzy DNA
Problemy jednoczesnego testowana welu hpotez statystycznych ch zastosowana w analze mkromacerzy DNA Konrad Furmańczyk Katedra Zastosowań Matematyk SGGW Plan referatu Testowane w analze mkromacerzy DNA
Bardziej szczegółowoW praktyce często zdarza się, że wyniki obu prób możemy traktować jako. wyniki pomiarów na tym samym elemencie populacji np.
Wykład 7 Uwaga: W praktyce często zdarza sę, że wynk obu prób możemy traktować jako wynk pomarów na tym samym elemence populacj np. wynk x przed wynk y po operacj dla tego samego osobnka. Należy wówczas
Bardziej szczegółowoRÓWNOWAGA STACKELBERGA W GRACH SEKWENCYJNYCH
Stansław KOWALIK e-mal: skowalk@wsb.edu.pl Wyższa Szkoła Bznesu Dąbrowa Górncza RÓWNOWAGA STACKELBERGA W GRACH SEKWENCYJNYCH Streszczene Praca dotyczy nekooperacynych sekwencynych ger dwuosobowych o sume
Bardziej szczegółowoProjekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE
Inormatyka Podstawy Programowana 06/07 Projekt 6 6. ROZWIĄZYWANIE RÓWNAŃ NIELINIOWYCH CAŁKOWANIE NUMERYCZNE 6. Równana algebraczne. Poszukujemy rozwązana, czyl chcemy określć perwastk rzeczywste równana:
Bardziej szczegółowoWielokategorialne systemy uczące się i ich zastosowanie w bioinformatyce. Rafał Grodzicki
Welokategoralne systemy uząe sę h zastosowane w bonformatye Rafał Grodzk Welokategoralny system uząy sę (multlabel learnng system) Zbór danyh weśowyh: d X = R Zbór klas (kategor): { 2 } =...Q Zbór uząy:
Bardziej szczegółowoPodstawy teorii falek (Wavelets)
Podstawy teor falek (Wavelets) Ψ(). Transformaca Haara (97).. Przykład pewne metody zapsu obrazu Transformaca Haara Przykład zapsu obrazu -D Podstawy matematyczne transformac Algorytmy rozkładana funkc
Bardziej szczegółowoZaawansowane metody numeryczne
Wykład 9. jej modyfkacje. Oznaczena Będzemy rozpatrywać zagadnene rozwązana następującego układu n równań lnowych z n newadomym x 1... x n : a 11 x 1 + a 12 x 2 +... + a 1n x n = b 1 a 21 x 1 + a 22 x
Bardziej szczegółowoDiagonalizacja macierzy kwadratowej
Dagonalzacja macerzy kwadratowej Dana jest macerz A nân. Jej wartośc własne wektory własne spełnają równane Ax x dla,..., n Każde z równań własnych osobno można zapsać w postac: a a an x x a a an x x an
Bardziej szczegółowo) będą niezależnymi zmiennymi losowymi o tym samym rozkładzie normalnym z następującymi parametrami: nieznaną wartością 1 4
Zadane. Nech ( X, Y ),( X, Y ), K,( X, Y n n ) będą nezależnym zmennym losowym o tym samym rozkładze normalnym z następującym parametram: neznaną wartoścą oczekwaną EX = EY = m, warancją VarX = VarY =
Bardziej szczegółowoWykład 2: Uczenie nadzorowane sieci neuronowych - I
Wykład 2: Uczene nadzorowane sec neuronowych - I Algorytmy uczena sec neuronowych Na sposób dzałana sec ma wpływ e topologa oraz funkconowane poszczególnych neuronów. Z reguły topologę sec uznae sę za
Bardziej szczegółowoAnaliza danych OGÓLNY SCHEMAT. http://zajecia.jakubw.pl/ Dane treningowe (znana decyzja) Klasyfikator. Dane testowe (znana decyzja)
Analza danych Dane trenngowe testowe. Algorytm k najblższych sąsadów. Jakub Wróblewsk jakubw@pjwstk.edu.pl http://zajeca.jakubw.pl/ OGÓLNY SCHEMAT Mamy dany zbór danych podzelony na klasy decyzyjne, oraz
Bardziej szczegółowoSTATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH
STATYSTYKA MATEMATYCZNA WYKŁAD 5 WERYFIKACJA HIPOTEZ NIEPARAMETRYCZNYCH 1 Test zgodnośc χ 2 Hpoteza zerowa H 0 ( Cecha X populacj ma rozkład o dystrybuance F). Hpoteza alternatywna H1( Cecha X populacj
Bardziej szczegółowo65120/ / / /200
. W celu zbadana zależnośc pomędzy płcą klentów ch preferencjam, wylosowano kobet mężczyzn zadano m pytane: uważasz za lepszy produkt frmy A czy B? Wynk były następujące: Odpowedź Kobety Mężczyźn Wolę
Bardziej szczegółowo( ) ( ) 2. Zadanie 1. są niezależnymi zmiennymi losowymi o. oraz. rozkładach normalnych, przy czym EX. i σ są nieznane. 1 Niech X
Prawdopodobeństwo statystyka.. r. Zadane. Zakładamy, że,,,,, 5 są nezależnym zmennym losowym o rozkładach normalnych, przy czym E = μ Var = σ dla =,,, oraz E = μ Var = 3σ dla =,, 5. Parametry μ, μ σ są
Bardziej szczegółowoStanisław Cichocki Natalia Nehrebecka. Zajęcia 4
Stansław Cchock Natala Nehrebecka Zajęca 4 1. Interpretacja parametrów przy zmennych zerojedynkowych Zmenne 0-1 Interpretacja przy zmennej 0 1 w modelu lnowym względem zmennych objaśnających Interpretacja
Bardziej szczegółowoBadanie współzależności dwóch cech ilościowych X i Y. Analiza korelacji prostej
Badane współzależnośc dwóch cech loścowych X Y. Analza korelacj prostej Kody znaków: żółte wyróżnene nowe pojęce czerwony uwaga kursywa komentarz 1 Zagadnena 1. Zwązek determnstyczny (funkcyjny) a korelacyjny.
Bardziej szczegółowoKlasyfkator lnowy Wstęp Klasyfkator lnowy jest najprostszym możlwym klasyfkatorem. Zakłada on lnową separację lnowy podzał dwóch klas mędzy sobą. Przedstawa to ponższy rysunek: 5 4 3 1 0-1 - -3-4 -5-5
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 6
Stansław Cchock Natala Nehrebecka Wykład 6 1 1. Zastosowane modelu potęgowego Przekształcene Boxa-Coxa 2. Zmenne cągłe za zmenne dyskretne 3. Interpretacja parametrów przy zmennych dyskretnych 1. Zastosowane
Bardziej szczegółowoSZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW
SZACOWANIE NIEPEWNOŚCI POMIARU METODĄ PROPAGACJI ROZKŁADÓW Stefan WÓJTOWICZ, Katarzyna BIERNAT ZAKŁAD METROLOGII I BADAŃ NIENISZCZĄCYCH INSTYTUT ELEKTROTECHNIKI ul. Pożaryskego 8, 04-703 Warszawa tel.
Bardziej szczegółowoProblem plecakowy (KNAPSACK PROBLEM).
Problem plecakowy (KNAPSACK PROBLEM). Zagadnene optymalzac zwane problemem plecakowym swą nazwę wzęło z analog do sytuac praktyczne podobne do problemu pakowana plecaka. Chodz o to, by zapakować maksymalne
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 7
Stansław Cchock Natala Nehrebecka Wykład 7 1 1. Zmenne cągłe a zmenne dyskretne 2. Interpretacja parametrów przy zmennych dyskretnych 1. Zmenne cągłe a zmenne dyskretne 2. Interpretacja parametrów przy
Bardziej szczegółowoBADANIA OPERACYJNE. Podejmowanie decyzji w warunkach niepewności. dr Adam Sojda
BADANIA OPERACYJNE Podejmowane decyzj w warunkach nepewnośc dr Adam Sojda Teora podejmowana decyzj gry z naturą Wynk dzałana zależy ne tylko od tego, jaką podejmujemy decyzję, ale równeż od tego, jak wystąp
Bardziej szczegółowo11/22/2014. Jeśli stała c jest równa zero to takie gry nazywamy grami o sumie zerowej.
/22/24 Dwuosobowe gry o sume zero DO NAUCZENIA I ZAPAMIĘTANIA: Defnca zaps ger o sume zero, adaptaca ogólnych defnc. Punkt sodłowy Twerdzena o zwązkach punktu sodłowego z koncepcam rozwązań PRZYPOMNIENIE:
Bardziej szczegółowoWykład 2: Uczenie nadzorowane sieci neuronowych - I
Wykład 2: Uczene nadzorowane sec neuronowych - I Algorytmy uczena sec neuronowych Na sposób dzałana sec ma wpływ e topologa oraz funkconowane poszczególnych neuronów. Z reguły topologę sec uznae sę za
Bardziej szczegółowoNatalia Nehrebecka. Zajęcia 4
St ł Cchock Stansław C h k Natala Nehrebecka Zajęca 4 1. Interpretacja parametrów przy zmennych zerojedynkowych Zmenne 0 1 Interpretacja przy zmennej 0 1 w modelu lnowym względem zmennych objaśnających
Bardziej szczegółowoPattern Classification
attern Classfcaton All materals n these sldes were taken from attern Classfcaton nd ed by R. O. Duda,. E. Hart and D. G. Stork, John Wley & Sons, 000 wth the permsson of the authors and the publsher Chapter
Bardziej szczegółowoWykład 1 Zagadnienie brzegowe liniowej teorii sprężystości. Metody rozwiązywania, metody wytrzymałości materiałów. Zestawienie wzorów i określeń.
Wykład Zagadnene brzegowe lnowe teor sprężystośc. Metody rozwązywana, metody wytrzymałośc materałów. Zestawene wzorów określeń. Układ współrzędnych Kartezańsk, prostokątny. Ose x y z oznaczono odpowedno
Bardziej szczegółowoKlasyfikatory liniowe Linear classifiers
Klasyfkatory lnowe Lnear classfers JERZY STEFANOWSKI Insttute of Computng Scences, Poznań Unversty of Technology UMSN slady wykładu Wersa 2010 Plan 1. Lnowe klasyfkatory 2. Klasyczne lnowa analza dyskrymnacyna
Bardziej szczegółowoWPŁYW PARAMETRÓW DYSKRETYZACJI NA NIEPEWNOŚĆ WYNIKÓW POMIARU OBIEKTÓW OBRAZU CYFROWEGO
Walenty OWIECZKO WPŁYW PARAMETRÓW DYSKRETYZACJI A IEPEWOŚĆ WYIKÓW POMIARU OBIEKTÓW OBRAZU CYFROWEGO STRESZCZEIE W artykule przedstaono ynk analzy nepenośc pomaru ybranych cech obektu obrazu cyfroego. Wyznaczono
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 6
Stansław Cchock Natala Nehrebecka Wykład 6 1 1. Interpretacja parametrów przy zmennych objaśnających cągłych Semelastyczność 2. Zastosowane modelu potęgowego Model potęgowy 3. Zmenne cągłe za zmenne dyskretne
Bardziej szczegółowoStatystyka. Zmienne losowe
Statystyka Zmenne losowe Zmenna losowa Zmenna losowa jest funkcją, w której każdej wartośc R odpowada pewen podzbór zboru będący zdarzenem losowym. Zmenna losowa powstaje poprzez przyporządkowane każdemu
Bardziej szczegółowoGrupowanie. Wprowadzenie. Metody hierarchiczne. Modele mieszane (mixture models) Metody najmniejszych kwadratów. Zastosowania
Grupowane Wprowadzene Metody herarchczne Modele meszane (mxture models) Metoda Expectaton-maxmzaton (EM) Metody namneszych kwadratów Krytera akośc grupowana Algorytm k-średnch Zastosowana Statstcal Pattern
Bardziej szczegółowoNatalia Nehrebecka. Zajęcia 3
St ł Cchock Stansław C h k Natala Nehrebecka Zajęca 3 1. Dobroć dopasowana równana regresj. Współczynnk determnacj R Dk Dekompozycja warancj zmennej zależnej ż Współczynnk determnacj R. Zmenne cągłe a
Bardziej szczegółowoZASTOSOWANIE KLASYCZNEGO ALGORYTMU GENETYCZNEGO DO ROZWIĄZANIA ZBILANSOWANEGO ZAGADNIENIA TRANSPORTOWEGO
Studa Materały. Mscellanea Oeconomcae Rok 6, Nr 2/22 Wydzał Zarządzana Admnstrac Unwersytetu Jana Kochanowskego w Kelcach Z a r z ą d z a n e f n a n s e Rafał Prońko ZASTOSOWANIE KLASYCZNEGO ALGORYTMU
Bardziej szczegółowoRozwiązywanie zadań optymalizacji w środowisku programu MATLAB
Rozwązywane zadań optymalzacj w środowsku programu MATLAB Zagadnene optymalzacj polega na znajdowanu najlepszego, względem ustalonego kryterum, rozwązana należącego do zboru rozwązań dopuszczalnych. Standardowe
Bardziej szczegółowoStatystyka Inżynierska
Statystyka Inżynerska dr hab. nż. Jacek Tarasuk AGH, WFIS 013 Wykład DYSKRETNE I CIĄGŁE ROZKŁADY JEDNOWYMIAROWE Zmenna losowa, Funkcja rozkładu, Funkcja gęstośc, Dystrybuanta, Charakterystyk zmennej, Funkcje
Bardziej szczegółowoProgramowanie Równoległe i Rozproszone
Programowane Równoległe Rozproszone Wykład Programowane Równoległe Rozproszone Lucjan Stapp Wydzał Matematyk Nauk Informacyjnych Poltechnka Warszawska (l.stapp@mn.pw.edu.pl) /38 PRR Wykład Chcemy rozwązać
Bardziej szczegółowoPrawdopodobieństwo i statystyka r.
Prawdopodobeństwo statystya.05.00 r. Zadane Zmenna losowa X ma rozład wyładnczy o wartośc oczewanej, a zmenna losowa Y rozład wyładnczy o wartośc oczewanej. Obe zmenne są nezależne. Oblcz E( Y X + Y =
Bardziej szczegółowoWstęp do metod numerycznych Faktoryzacja SVD Metody iteracyjne. P. F. Góra
Wstęp do metod numerycznych Faktoryzacja SVD Metody teracyjne P. F. Góra http://th-www.f.uj.edu.pl/zfs/gora/ 2013 Sngular Value Decomposton Twerdzene 1. Dla każdej macerzy A R M N, M N, stneje rozkład
Bardziej szczegółowo1. Wstęp. 2. Macierz admitancyjna.
1. Wstęp. Znaomość stanu pracy SEE est podstawowym zagadnenem w sterowanu pracą systemu na wszystkch etapach: proektowana, rozwou, planowana stanów pracy oraz w czase beżące eksploatac. Kontrola rozpływów
Bardziej szczegółowoAnaliza ryzyka kosztowego robót remontowo-budowlanych w warunkach niepełnej informacji
Analza ryzyka kosztowego robót remontowo-budowlanych w warunkach nepełne nformac Mgr nż. Mchał Bętkowsk, dr nż. Andrze Pownuk Wydzał Budownctwa Poltechnka Śląska w Glwcach Mchal.Betkowsk@polsl.pl, Andrze.Pownuk@polsl.pl
Bardziej szczegółowoSYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 7. KLASYFIKATORY BAYESA Częstochowa 4 Dr hab. nż. Grzegorz Dudek Wydzał Elektryczny Poltechnka Częstochowska TWIERDZENIE BAYESA Wedza pozyskwana przez metody probablstyczne ma
Bardziej szczegółowoKURS STATYSTYKA. Lekcja 1 Statystyka opisowa ZADANIE DOMOWE. www.etrapez.pl Strona 1
KURS STATYSTYKA Lekcja 1 Statystyka opsowa ZADANIE DOMOWE www.etrapez.pl Strona 1 Część 1: TEST Zaznacz poprawną odpowedź (tylko jedna jest prawdzwa). Pytane 1 W statystyce opsowej mamy pełne nformacje
Bardziej szczegółowoMATEMATYKA POZIOM ROZSZERZONY Kryteria oceniania odpowiedzi. Arkusz A II. Strona 1 z 5
MATEMATYKA POZIOM ROZSZERZONY Krytera ocenana odpowedz Arkusz A II Strona 1 z 5 Odpowedz Pytane 1 2 3 4 5 6 7 8 9 Odpowedź D C C A B 153 135 232 333 Zad. 10. (0-3) Dana jest funkcja postac. Korzystając
Bardziej szczegółowoPokazać, że wyżej zdefiniowana struktura algebraiczna jest przestrzenią wektorową nad ciałem
Zestaw zadań : Przestrzene wektorowe. () Wykazać, że V = C ze zwykłym dodawanem jako dodawanem wektorów operacją mnożena przez skalar : C C C, (z, v) z v := z v jest przestrzeną lnową nad całem lczb zespolonych
Bardziej szczegółowo5. Pochodna funkcji. lim. x c x c. (x c) = lim. g(c + h) g(c) = lim
5. Pocodna funkcj Defncja 5.1 Nec f: (a, b) R nec c (a, b). Jeśl stneje granca lm x c x c to nazywamy ją pocodną funkcj f w punkce c oznaczamy symbolem f (c) Twerdzene 5.1 Jeśl funkcja f: (a, b) R ma pocodną
Bardziej szczegółowoZESZYTY NAUKOWE INSTYTUTU POJAZDÓW 2(88)/2012
ZESZYTY NAUKOWE INSTYTUTU POJAZDÓW (88)/01 Hubert Sar, Potr Fundowcz 1 WYZNACZANIE ASOWEGO OENTU BEZWŁADNOŚCI WZGLĘDE OSI PIONOWEJ DLA SAOCHODU TYPU VAN NA PODSTAWIE WZORU EPIRYCZNEGO 1. Wstęp asowy moment
Bardziej szczegółowoDobór zmiennych objaśniających
Dobór zmennych objaśnających Metoda grafowa: Należy tak rozpąć graf na werzchołkach opsujących poszczególne zmenne, aby występowały w nm wyłączne łuk symbolzujące stotne korelacje pomędzy zmennym opsującym.
Bardziej szczegółowoKURS STATYSTYKA. Lekcja 6 Regresja i linie regresji ZADANIE DOMOWE. www.etrapez.pl Strona 1
KURS STATYSTYKA Lekcja 6 Regresja lne regresj ZADANIE DOMOWE www.etrapez.pl Strona 1 Część 1: TEST Zaznacz poprawną odpowedź (tylko jedna jest prawdzwa). Pytane 1 Funkcja regresj I rodzaju cechy Y zależnej
Bardziej szczegółowoAnaliza rodzajów skutków i krytyczności uszkodzeń FMECA/FMEA według MIL STD - 1629A
Analza rodzajów skutków krytycznośc uszkodzeń FMECA/FMEA według MIL STD - 629A Celem analzy krytycznośc jest szeregowane potencjalnych rodzajów uszkodzeń zdentyfkowanych zgodne z zasadam FMEA na podstawe
Bardziej szczegółowo= σ σ. 5. CML Capital Market Line, Rynkowa Linia Kapitału
5 CML Catal Market Lne, ynkowa Lna Katału Zbór ortolo o nalny odchylenu standardowy zbór eektywny ozważy ortolo złożone ze wszystkch aktywów stnejących na rynku Załóży, że jest ch N A * P H P Q P 3 * B
Bardziej szczegółowoInstrukcja do ćwiczeń laboratoryjnych z przedmiotu: Badania operacyjne. Temat ćwiczenia: Problemy rozkroju materiałowego, zagadnienia dualne
Instrukca do ćwczeń laboratorynych z przedmotu: Badana operacyne Temat ćwczena: Problemy rozkrou materałowego, zagadnena dualne Zachodnopomorsk Unwersytet Technologczny Wydzał Inżyner Mechanczne Mechatronk
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 6
Stansław Cchock Natala Nehrebecka Wykład 6 1 1. Zastosowane modelu potęgowego Model potęgowy Przekształcene Boxa-Coxa 2. Zmenne cągłe za zmenne dyskretne 3. Interpretacja parametrów przy zmennych dyskretnych
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka. Wykład 11
Stansław Cchock Natala Nehrebecka Wykład 11 1 1. Testowane hpotez łącznych 2. Testy dagnostyczne Testowane prawdłowośc formy funkcyjnej: test RESET Testowane normalnośc składnków losowych: test Jarque-Berra
Bardziej szczegółowoHipotezy o istotności oszacowao parametrów zmiennych objaśniających ˆ ) ˆ
WERYFIKACJA HIPOTEZY O ISTOTNOŚCI OCEN PARAMETRÓW STRUKTURALNYCH MODELU Hpoezy o sonośc oszacowao paramerów zmennych objaśnających Tesowane sonośc paramerów zmennych objaśnających sprowadza sę do nasępującego
Bardziej szczegółowoKomputerowa analiza zagadnień różniczkowych 1. Układy równań liniowych
Komputerowa analza zagadneń różnczkowych 1. Układy równań lnowych P. F. Góra http://th-www.f.uj.edu.pl/zfs/gora/ semestr letn 2007/08 Podstawowe fakty Równane Ax = b, x, b R N, A R N N (1) ma jednoznaczne
Bardziej szczegółowoMETODA UNITARYZACJI ZEROWANEJ Porównanie obiektów przy ocenie wielokryterialnej. Ranking obiektów.
Opracowane: Dorota Mszczyńska METODA UNITARYZACJI ZEROWANEJ Porównane obektów przy ocene welokryteralnej. Rankng obektów. Porównane wybranych obektów (warantów decyzyjnych) ze względu na różne cechy (krytera)
Bardziej szczegółowoSortowanie szybkie Quick Sort
Sortowane szybke Quck Sort Algorytm sortowana szybkego opera sę na strateg "dzel zwycęża" (ang. dvde and conquer), którą możemy krótko scharakteryzować w trzech punktach: 1. DZIEL - problem główny zostae
Bardziej szczegółowoSZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA WYKŁAD 18. ALGORYTMY EWOLUCYJNE - ZASTOSOWANIA Częstochowa 2014 Dr hab. nż. Grzegorz Dudek Wydzał Elektryczny Poltechnka Częstochowska ZADANIE ZAŁADUNKU Zadane załadunku plecakowe
Bardziej szczegółowoKrzywa wieża w Pizie. SAS Data Step. Przykład (2) Wykład 13 Regresja liniowa
Bonformatyka - rozwój oferty edukacyjnej Unwersytetu Przyrodnczego we Wrocławu projekt realzowany w ramac Programu Operacyjnego Kaptał Ludzk współfnansowanego ze środków Europejskego Funduszu Społecznego
Bardziej szczegółowoSprawozdanie powinno zawierać:
Sprawozdane pownno zawerać: 1. wypełnoną stronę tytułową (gotowa do ćw. nr 0 na strone drugej, do pozostałych ćwczeń zameszczona na strone 3), 2. krótk ops celu dośwadczena, 3. krótk ops metody pomaru,
Bardziej szczegółowoZESZYTY NAUKOWE INSTYTUTU POJAZDÓW 5(96)/2013
ZESZYTY NAUKOWE NSTYTUTU POJAZDÓW 5(96)/2013 Hubert Sar, Potr Fundowcz 1 WYZNACZANE MASOWEGO MOMENTU BEZWŁADNOŚC WZGLĘDEM OS PODŁUŻNEJ DLA SAMOCHODU TYPU VAN NA PODSTAWE WZORÓW DOŚWADCZALNYCH 1. Wstęp
Bardziej szczegółowoPrzykład 5.1. Kratownica dwukrotnie statycznie niewyznaczalna
rzykład.. Kratownca dwukrotne statyczne newyznaczana oecene: korzystaąc z metody sł wyznaczyć sły w prętach ponższe kratowncy. const Rozwązane zadana rozpoczynamy od obczena stopna statyczne newyznaczanośc
Bardziej szczegółowoFunkcje i charakterystyki zmiennych losowych
Funkcje charakterystyk zmennych losowych Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Intelgencj Metod Matematycznych Wydzał Informatyk Poltechnk Szczecńskej 5. Funkcje zmennych losowych
Bardziej szczegółowoSztuczne sieci neuronowe. Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyki, p. 311
Sztuczne sec neuronowe Krzysztof A. Cyran POLITECHNIKA ŚLĄSKA Instytut Informatyk, p. 311 Wykład 6 PLAN: - Repetto (brevs) - Sec neuronowe z radalnym funkcjam bazowym Repetto W aspekce archtektury: zajmowalśmy
Bardziej szczegółowo1.1. Uprość opis zdarzeń: 1.2. Uprościć opis zdarzeń: a) A B A Uprościć opis zdarzeń: 1.4. Uprościć opis zdarzeń:
.. Uprość ops zdarzeń: a) A B, A \ B b) ( A B) ( A' B).. Uproścć ops zdarzeń: a) A B A b) A B, ( A B) ( B C).. Uproścć ops zdarzeń: a) A B A B b) A B C ( A B) ( B C).4. Uproścć ops zdarzeń: a) A B, A B
Bardziej szczegółowoBadania operacyjne w logistyce i zarządzaniu produkcją
Państwowa Wyższa Szkoła Zawodowa w Nowym Sączu Badana operacyne w logstyce zarządzanu produkcą cz. I Andrze Woźnak Nowy Sącz Komtet Redakcyny doc. dr Zdzsława Zacłona przewodncząca, prof. dr hab. nż. Jarosław
Bardziej szczegółowoProcedura normalizacji
Metody Badań w Geograf Społeczno Ekonomcznej Procedura normalzacj Budowane macerzy danych geografcznych mgr Marcn Semczuk Zakład Przedsęborczośc Gospodark Przestrzennej Instytut Geograf Unwersytet Pedagogczny
Bardziej szczegółowoStanisław Cichocki. Natalia Nehrebecka Katarzyna Rosiak-Lada. Zajęcia 3
Stansław Cchock Natala Nehrebecka Katarzyna Rosak-Lada Zajęca 3 1. Dobrod dopasowana równana regresj. Współczynnk determnacj R 2 Dekompozycja warancj zmennej zależnej Współczynnk determnacj R 2 2. Zmenne
Bardziej szczegółowoPortfele zawierające walor pozbawiony ryzyka. Elementy teorii rynku kapitałowego
Portel nwestycyjny ćwczena Na podst. Wtold Jurek: Konstrukcja analza rozdzał 5 dr chał Konopczyńsk Portele zawerające walor pozbawony ryzyka. lementy teor rynku kaptałowego 1. Pożyczane penędzy amy dwa
Bardziej szczegółowoKrzysztof Borowski Zastosowanie metody wideł cenowych w analizie technicznej
Krzysztof Borowsk Zastosowane metody wdeł cenowych w analze technczne Wprowadzene Metoda wdeł cenowych została perwszy raz ogłoszona przez Alana Andrewsa 1 w roku 1960. Trzy lne wchodzące w skład metody
Bardziej szczegółowoPraca podkładu kolejowego jako konstrukcji o zmiennym przekroju poprzecznym zagadnienie ekwiwalentnego przekroju
Praca podkładu kolejowego jako konstrukcj o zmennym przekroju poprzecznym zagadnene ekwwalentnego przekroju Work of a ralway sleeper as a structure wth varable cross-secton - the ssue of an equvalent cross-secton
Bardziej szczegółowoZestaw zadań 4: Przestrzenie wektorowe i podprzestrzenie. Liniowa niezależność. Sumy i sumy proste podprzestrzeni.
Zestaw zadań : Przestrzene wektorowe podprzestrzene. Lnowa nezależność. Sumy sumy proste podprzestrzen. () Wykazać, że V = C ze zwykłym dodawanem jako dodawanem wektorów operacją mnożena przez skalar :
Bardziej szczegółowoKomputerowe generatory liczb losowych
. Perwszy generator Komputerowe generatory lczb losowych 2. Przykłady zastosowań 3. Jak generuje sę lczby losowe przy pomocy komputera. Perwszy generator lczb losowych L. H. C. Tppet - 927 Ksąż ążka -
Bardziej szczegółowoI. Elementy analizy matematycznej
WSTAWKA MATEMATYCZNA I. Elementy analzy matematycznej Pochodna funkcj f(x) Pochodna funkcj podaje nam prędkość zman funkcj: df f (x + x) f (x) f '(x) = = lm x 0 (1) dx x Pochodna funkcj podaje nam zarazem
Bardziej szczegółowoXXX OLIMPIADA FIZYCZNA ETAP III Zadanie doświadczalne
XXX OLIMPIADA FIZYCZNA ETAP III Zadane dośwadczalne ZADANIE D Nazwa zadana: Maszyna analogowa. Dane są:. doda półprzewodnkowa (krzemowa) 2. opornk dekadowy (- 5 Ω ), 3. woltomerz cyfrowy, 4. źródło napęca
Bardziej szczegółowoEvaluation of estimation accuracy of correlation functions with use of virtual correlator model
Jadwga LAL-JADZIAK Unwersytet Zelonogórsk Instytut etrolog Elektrycznej Elżbeta KAWECKA Unwersytet Zelonogórsk Instytut Informatyk Elektronk Ocena dokładnośc estymacj funkcj korelacyjnych z użycem modelu
Bardziej szczegółowoSYSTEMY UCZĄCE SIĘ WYKŁAD 5. LINIOWE METODY KLASYFIKACJI. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSEMY UCZĄCE SIĘ WYKŁAD 5. LINIOWE MEODY KLASYFIKACJI Częstochowa 4 Dr hab. nż. Grzegorz Dude Wydzał Eletryczny Poltechna Częstochowsa FUNKCJE FISHEROWSKA DYSKRYMINACYJNE DYSKRYMINACJA I MASZYNA LINIOWA
Bardziej szczegółowoZarządzanie ryzykiem w przedsiębiorstwie i jego wpływ na analizę opłacalności przedsięwzięć inwestycyjnych
dr nż Andrze Chylńsk Katedra Bankowośc Fnansów Wyższa Szkoła Menedżerska w Warszawe Zarządzane ryzykem w rzedsęborstwe ego wływ na analzę ołacalnośc rzedsęwzęć nwestycynych w w w e - f n a n s e c o m
Bardziej szczegółowo7. Wykład VII: Warunki Kuhna-Tuckera
Wocech Grega, Metody Optymalzac 7 Wykład VII: Warunk Kuhna-Tuckera 7 Warunk koneczne stnena ekstremum Rozważane est zadane z ogranczenam nerównoścowym w postac: mn F( x ) x X X o F( x ), o { R x : h n
Bardziej szczegółowoSZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA WYKŁAD 15. ALGORYTMY GENETYCZNE Częstochowa 014 Dr hab. nż. Grzegorz Dudek Wydzał Elektryczny Poltechnka Częstochowska TERMINOLOGIA allele wartośc, waranty genów, chromosom - (naczej
Bardziej szczegółowoNatalia Nehrebecka. Wykład 2
Natala Nehrebecka Wykład . Model lnowy Postad modelu lnowego Zaps macerzowy modelu lnowego. Estymacja modelu Wartośd teoretyczna (dopasowana) Reszty 3. MNK przypadek jednej zmennej . Model lnowy Postad
Bardziej szczegółowoBadanie współzaleŝności dwóch cech ilościowych X i Y. Analiza korelacji prostej. Badanie zaleŝności dwóch cech ilościowych. Analiza regresji prostej
Badane współzaleŝnośc dwóch cech loścowych X Y. Analza korelacj prostej Badane zaleŝnośc dwóch cech loścowych. Analza regresj prostej Kody znaków: Ŝółte wyróŝnene nowe pojęce czerwony uwaga kursywa komentarz
Bardziej szczegółowoAnaliza danych. Analiza danych wielowymiarowych. Regresja liniowa. Dyskryminacja liniowa. PARA ZMIENNYCH LOSOWYCH
Analza danych Analza danych welowymarowych. Regresja lnowa. Dyskrymnacja lnowa. Jakub Wróblewsk jakubw@pjwstk.edu.pl http://zajeca.jakubw.pl/ PARA ZMIENNYCH LOSOWYCH Parę zmennych losowych X, Y możemy
Bardziej szczegółowoPrawdopodobieństwo i statystyka r.
Zadae. W ure zajduje sę 5 kul, z których 5 jest bałych czarych. Losujemy bez zwracaa kolejo po jedej kul. Kończymy losowae w momece, kedy wycągęte zostaą wszystke czare kule. Oblcz wartość oczekwaą lczby
Bardziej szczegółowoĆwiczenie 10. Metody eksploracji danych
Ćwczene 10. Metody eksploracj danych Grupowane (Clusterng) 1. Zadane grupowana Grupowane (ang. clusterng) oznacza grupowane rekordów, obserwacj lub przypadków w klasy podobnych obektów. Grupa (ang. cluster)
Bardziej szczegółowoPROGNOZOWANIE SPRZEDAŻY Z ZASTOSOWANIEM ROZKŁADU GAMMA Z KOREKCJĄ ZE WZGLĘDU NA WAHANIA SEZONOWE
STUDIA I PRACE WYDZIAŁU NAUK EKONOMICZNYCH I ZARZĄDZANIA NR 36 Krzysztof Dmytrów * Marusz Doszyń ** Unwersytet Szczecńsk PROGNOZOWANIE SPRZEDAŻY Z ZASTOSOWANIEM ROZKŁADU GAMMA Z KOREKCJĄ ZE WZGLĘDU NA
Bardziej szczegółowoKier. MTR Programowanie w MATLABie Laboratorium Ćw. 12
Ker. MTR Programowane w MATLABe Laboratorum Ćw. Analza statystyczna grafczna danych pomarowych. Wprowadzene MATLAB dysponuje weloma funcjam umożlwającym przeprowadzene analzy statystycznej pomarów, czy
Bardziej szczegółowoRachunek prawdopodobieństwa i statystyka W 11: Analizy zależnościpomiędzy zmiennymi losowymi Model regresji wielokrotnej
Rachunek prawdopodobeństwa statstka W 11: Analz zależnoścpomędz zmennm losowm Model regresj welokrotnej Dr Anna ADRIAN Paw B5, pok 407 adan@agh.edu.pl Model regresj lnowej Model regresj lnowej prostej
Bardziej szczegółowoLaboratorium ochrony danych
Laboratorum ochrony danych Ćwczene nr Temat ćwczena: Cała skończone rozszerzone Cel dydaktyczny: Opanowane programowej metody konstruowana cał skończonych rozszerzonych GF(pm), poznane ch własnośc oraz
Bardziej szczegółowoAnaliza regresji modele ekonometryczne
Analza regresj modele ekonometryczne Klasyczny model regresj lnowej - przypadek jednej zmennej objaśnającej. Rozpatrzmy klasyczne zagadnene zależnośc pomędzy konsumpcją a dochodam. Uważa sę, że: - zależność
Bardziej szczegółowoTEORIA PORTFELA MARKOWITZA
TEORIA PORTFELA MARKOWITZA Izabela Balwerz 28 maj 2008 1 Wstęp Teora portfela została stworzona w 1952 roku przez amerykańskego ekonomstę Harry go Markowtza Opera sę ona na mnmalzacj ryzyka nwestycyjnego
Bardziej szczegółowoAPROKSYMACJA QUASIJEDNOSTAJNA
POZNAN UNIVE RSITY OF TE CHNOLOGY ACADE MIC JOURNALS No 73 Electrcal Engneerng 213 Jan PURCZYŃSKI* APROKSYMACJA QUASIJEDNOSTAJNA W pracy wykorzystano metodę aproksymacj średnokwadratowej welomanowej, przy
Bardziej szczegółowoEgzamin ze statystyki/ Studia Licencjackie Stacjonarne/ Termin I /czerwiec 2010
Egzamn ze statystyk/ Studa Lcencjacke Stacjonarne/ Termn /czerwec 2010 Uwaga: Przy rozwązywanu zadań, jeśl to koneczne, naleŝy przyjąć pozom stotnośc 0,01 współczynnk ufnośc 0,99 Zadane 1 PonŜsze zestawene
Bardziej szczegółowoSTATECZNOŚĆ SKARP. α - kąt nachylenia skarpy [ o ], φ - kąt tarcia wewnętrznego gruntu [ o ],
STATECZNOŚĆ SKARP W przypadku obektu wykonanego z gruntów nespostych zaprojektowane bezpecznego nachylena skarp sprowadza sę do przekształcena wzoru na współczynnk statecznośc do postac: tgφ tgα = n gdze:
Bardziej szczegółowoOPTYMALIZACJA WARTOŚCI POLA MAGNETYCZNEGO W POBLIŻU LINII NAPOWIETRZNEJ Z WYKORZYSTANIEM ALGORYTMU GENETYCZNEGO
POZNAN UNIVE RSITY OF TE CHNOLOGY ACADE MIC JOURNALS No 81 Electrcal Engneerng 015 Mkołaj KSIĄŻKIEWICZ* OPTYMALIZACJA WARTOŚCI POLA MAGNETYCZNEGO W POLIŻU LINII NAPOWIETRZNEJ Z WYKORZYSTANIEM ALGORYTMU
Bardziej szczegółowoRozkład dwupunktowy. Rozkład dwupunktowy. Rozkład dwupunktowy x i p i 0 1-p 1 p suma 1
Rozkład dwupunktowy Zmenna losowa przyjmuje tylko dwe wartośc: wartość 1 z prawdopodobeństwem p wartość 0 z prawdopodobeństwem 1- p x p 0 1-p 1 p suma 1 Rozkład dwupunktowy Funkcja rozkładu prawdopodobeństwa
Bardziej szczegółowo