Graficzne modele probabilistyczne zmieniajace się w czasie na przykładzie cyklu miesięcznego kobiety

Wielkość: px
Rozpocząć pokaz od strony:

Download "Graficzne modele probabilistyczne zmieniajace się w czasie na przykładzie cyklu miesięcznego kobiety"

Transkrypt

1 Autoreferat rozprawy doktorskiej Graficzne modele probabilistyczne zmieniajace się w czasie na przykładzie cyklu miesięcznego kobiety Anna Łupińska Dubicka Rozprawa doktorska została przygotowana pod kierunkiem Mareka J. DRUŻDŻELA Wydział Informatyki, Politechnika Białostocka, Białystok Białystok 2014

2 Wprowadzenie Kontekst i motywacja pracy Cytując Benjamina Franklina "... na tym świecie pewne są tylko śmierć i podatki", możemy pokusić się o stwierdzenie, że niepewność jest nieodłącznym składnikiem naszej wiedzy o otaczającym świecie. Tą wiedzę możemy modelować przy użyciu łącznego rozkładu prawdopodobieństwa zmiennych losowych opisujących zjawiska nas otaczające. Jednakże, z reguły takie podejście jest niewykonalne. Jako, że łączny rozkłąd prawdopodobieństwa specyfikuje prawdopodobieństwa wszystkich możliwych kombinacji stanów każdej zmiennej, wyznaczenie tych wartości stanowi problem zarówno obliczeniowy, jak i praktyczny. Liczba wartości, które musimy obliczyć rośnie wykładniczo wraz ze wzrostem liczby zmiennych. Probabilistyczne modele graficzne takie jak sieci Bayesowskie (zwane również sieciami przekonań lub sieciami przyczynowo skutkowymi) [20] pozwalają na zwartą reprezentację łącznego rozkładu prawdopodobieństwa, a co za tym idzie na spójną oraz przejrzystą reprezentację wiedzy niepewnej. Ich budowa opiera się na skierowanych grafach acyklicznych, w których wierzchołki odpowiadają modelowanym zmiennym losowym, a krawędzie bezpośrednim zależnościom przyczynowym między nimi. Interakcje pomiędzy sąsiadującymi zmiennymi są wyrażone poprzez rozkłady prawdopodobieństwa warunkowego. Zaletą sieci Bayesowskich jest możliwość reprezentowania zależności przyczynowych, a także łatwość szacowania poszczególnych rozkładów warunkowych. Sieci Bayesowskie są potężnym i efektywnym narzędziem modelowania systemu w stanie równowagi. Jednakże otaczający na świat jest dynamiczny a modelowane zjawiska często przedstawiane są w postaci szeregu czasowego. Użycie sieci Bayesowskich skutkowałoby utratą informacji o zależnościach pomiędzy kolejnymi krokami eksperymentu. Rozwiązanie stanowią dynamiczne sieci Bayesowskie [5]. Są one rozszerzeniem sieci Bayesowskich o aspekt czasowy. W grafie pojawiają się kolejne krawędzie pomiędzy zmiennymi reprezentujące stan tych zmiennych w poszczególnych krokach czasowym. W najczęściej stosowanym podejściu do modeli dynamicznych bierze się pod uwagę tylko zależności między dwoma sąsiednimi krokami czasowymi. Spowodowane jest to najprawdopodobniej brakiem odpowiednich narzędzi, zdolnych radzić sobie z zależnościami wyższych rzędów. W większości przypadków uwzględnienie zależności jedynie pierwszego rzędu jest zapewne wystarczające. Jednakże istnieje możliwość, że część zjawisk mogłaby 1

3 być modelowana z wyższą skutecznością, gdyby wziąć również pod uwagę wpływ stanów wcześniejszych niż tylko bezpośrednio poprzedzający na bieżący stan modelu. Prawdopodobne jest, iż upraszczanie modeli systemów dynamicznych do zależności jedynie pierwszego rzędu prowadzi do uzyskania niepełnych a nawet błędnych wyników. Przykładem lepszej efektywności modeli dynamicznych wyższego rzędu może być wykorzystanie łańcuchów Markowa do generowania tekstu w języku angielskim. Im wyższy rząd, tym bardziej wytworzony tekst przypomina język naturalny [2]. śaade ve mw hc n entt da k eethetocusosselalwo gx fgrsnoh,tvettaf aetnlbilo fc lhd okleutsndyeosthtbogo eet ib nheaoopefni ngent" W powyższym tekście kolejne litery były generowane w sposób zupełnie losowy. Zachowano jedynie założenie, że rozmaite litery występują w języku z różnym prawdopodobieństwem. Jednakże, jeżeli przyjrzymy się poszczególnym wyrazom dowolnego języka, to zauważymy, że poszczególne litery bardzo często występują w pewnym kontekście. W przypadku języka angielskiego, po literze Q, z wszelkim prawdopodobieństwem następną będzie litera U. Przykładowy tekst wygenerowany przy użyciu łańcucha pierwszego rzędu, w którym wybór każdej litery jest losową funkcją jej poprzednika: "t I amy, vin. id wht omanly heay atuss n macon aresethe hired boutwhe t, tl, ad torurest t plur I wit hengamind tarer-plarody thishand" Idąc krok dalej zauważamy, że po digramie TH w języku angielskim często występują samogłoski A, E, I, O lub U, nieco rzadziej spółgłoski R lub W i dość rzadko pozostałe litery. W poniższym fragmencie tekstu użyto łańcucha Markowa drugiego rzędu: "Ther I the heingoind of-pleat, blur it dwere wing waske hat throos. Yout lar on wassing, an sit". "Yould,I that vide was nots ther." A tak może wygląć przykładowy tekst, jeżeli użyjemy modelu czwartego rzędu. Jak widzimy, większość wygenerowanych słów to istniejące słowa angielskie: "His heard.» «Exactly he very glad trouble, and by Hopkins! That it on of the who difficentralia. He rushed likely?» «Blood night that." Jak widaäğ, podobieństwo tego ostatniego zdania do zwykłego angielskiego tekstu, nieformalnej miary dokładności modelu, wzrosło znacznie między modelami pierwszego a czwartego rzędu. 2

4 Teza Głównym celem niniejszej rozprawy doktorskiej jest zastosowanie modeli opartych na dynamicznych sieciach Bayesowskich do problemu monitorowania cyklu miesięcznego. Wyznaczenie dnia owulacji, a co za tym idzie dni płodnych cyklu, jest zadaniem skomplikowanym, głównie z uwagi na długość cyklu miesięcznego, która jest cechą typowo osobniczą, zależną od kobiety i, w większości przypadków, nie ma stałej wartości. Analogicznie, w każdym cyklu liczba dni przypadających na każdą fazę może być inna. Postawiona w rozprawie teza mówi, że: rozszerzenie modeli dynamicznych o wpływy czasowe wyższych rzędów może znaczaco poprawić ich dokładność. Zadania 1. Zaproponowanie i implementacja zbioru modeli opartych na dynamicznych sieciach Bayesowskich modelujących cykl miesięczny kobiety oraz zbadanie wpływu rzędu modelu na jakość prognozowania. 2. Rozwiązanie problemu danych brakujących przy uczeniu parametrów numerycznych modelu oraz porównanie metod. 3. Analiza zagadnienia uczenia ze zbiorów danych, gdzie liczba rekordów jest niewielka. 4. Empiryczne porównanie zaproponowanych modeli do 11 istniejących metod wyznaczania okresu płodnego podczas cyklu miesięcznego. Struktura pracy Rozprawa doktorska może być podzielona na dwie części. Część pierwsza dostarcza teoretycznych podstaw używanych w całej pracy. Zawiera teoretyczny opis graficznych modeli probabilistycznych ze szczególnych uwzględnieniem sieci Bayesowskich, a następnie opisuje szereg metod służących do modelowania systemów zmieniających się w czasie koncentrując się na dynamicznych sieciach Bayesowskich. Stanowi również wprowadzenie do zagadnienia cyklu miesięcznego kobiety. Część druga rozprawy przestawia wyniki zastosowania modeli opartych na dynamicznych sieciach Bayesowskich do problemu modelowania cyklu miesięcznego. Rozdział czwarty przestawia proponowane modele oraz wyniki wprowadzenia zależności czasowych wyższych rzędów. Rozdział a także opisuje zastosowane techniki radzenia z danymi brakującymi. Rozdział szósty koncentruje się na budowaniu części numerycznej sieci Bayesowskich. Rozdział 3

5 siódmy przedstawia rezultaty zastosowania jednego z interakcyjnych modeli kanonicznych, bramek SL. Rozdział ósmy pokazuje wyniki empirycznego porównania proponowaych modeli opartych na dynamicznych sieciach Bayesowkich do istniejących metod wyznaczania okresu płodnego w trakcie trwania cyklu miesięcznego. Całość rozprawy zamyka rozdział zawierający podsumowanie, wnioski oraz możliwe kierunki dalszych badań. Systemy zmieniajace się w czasie Więszość procesów fizjologicznych występujących w organizmie człowieka, podobnie jak wiele zjawisk w przyrodzie czy też procesów technologicznych ma charakater dynamiczny. Wartości poszczególnych zmiennych obserwowane są w kolejnych momentach czasu. Co za tym idzie, modelowane zjawisko przedstawione jest w postaci szeregu czasowego. Dodatkowo, na analizowane zjawisko mają wpływ nie tylko bieżące obserwacje, ale również obserwacje pochodzące z poprzednich okresów. W takim przypadku stosowanie modeli statycznych jest niewystarczające i z pewnością prowadzić będzie do uzyskania nieprawidłowych wyników. Do przedstawiania i analizowania zjawisk zmieniających się w czasie używamy modeli dynamicznych, które pozwalają na uwzględnienie zależności pomiędzy wartościami zamiennych modelu w poszczególnych momentach czasu. Modele dynamiczne znalazły szerokie zastosowanie w wielu dziedzinach nauki. Już w roku 1969 Ragnar Anton Kittil Frisch wraz z Janem Tinbergenem otrzymali Nagrodę Nobla za opracowanie i zastosowanie modeli dynamicznych do analizy procesów gospodarczych. Dynamiczne sieci Bayesowskie Sieci bayesowskie (ang. Bayesian networks, BNs) [20], zwane również probabilistycznymi modelami graficznymi, sieciami przekonań lub sieciami przyczynowo skutkowymi, są popularnym narzędziem do reprezentacji wiedzy w warunkach niepewności. Dynamiczne sieci Bayesowskie (ang. dynamic Bayesian networks, DBNs) [5] są ich rozszerzeniem służącym do reprezentacji probabilistycznych modeli dla procesów stochastycznych. Podczas gdy sieć Bayesowska przedstawia łączny rozkład prawdopodobieństwa dla zestawu zmiennych losowych systemu w stanie równowagi, dynamiczna sieć Bayesowska może być postrzegana jako wielowymiarowa reprezentacja tego systemu. DBN umożliwia interpretację teraźniejszości, rekonstrukcję przeszłości oraz przewidywanie przyszłości. Zjawiska umiejscowione są w 4

6 czasie w posób uporządkowany relacją "wcześniej i później". Głównie ze względu na złożoność obliczeniową algorytmów wnioskowania, czas jest traktowany jako zmienna dyskretna. Należy zauważyć, że określenie "dynamiczneóznacza, że modelujemy rozwój systemu w czasie, a nie, że struktura modelu lub jego parametry zmieniają się w czasie, nawet jeśli to ostatnie jest teoretycznie możliwe. Dynamiczna sieć Bayesowska jest skierowanym, acyklicznym modelem procesu stochastycznego. Sieć podzielna jest na segmenty, z których każdy posiada własne węzły, krawędzie i rozkłady prawdopodobieństw. Pojedyńczy segment możemy traktować jako zrzut stanu procesu w danym momencie czasu, a dynamiczną sieć Bayesowską jako sekwencję podmodeli reprezentujących stan systemu w konkretnych punktach czasu. Segmenty połączone są ze sobą krawędziami przedstawiającymi zależność czasową pomiędzy zmiennymi systemu z różnych punktach czasu. Zazwyczaj zakłada się, że DBN spełnia własność Markowa, tzn., że stan systemu w następnym kroku czasowym zależyt tylko od jego bieżącego stanu niezależnie od przeszlości. Taka sieć nazywana jest siecią pierwszego rzędu. Z matematycznego punktu widzenia stan systemu w czasie t jest reprezentowany przez zbiór zmiennych losowych Z t = (U t, X t, Y t ), gdzie U oznacza zmienne wejściowe modelu, X zmienne ukryte a Y zmienne wyjściowe. Rozkład przejścia pomiędzy poszczególnymi krokami czasowymi wyrażony jest wzorem [5]: P (Z t Z t 1 ) = n P (Zi t P a(zi t )), i=1 where Zi t is the i th node at time t. P a(zi t ) are the parents of Zi t from the same or from the previous time slice. Łączny rozkład prawdopodobieństwa sieci o T segmentach możemy uzyskać poprzez proces zwany rozwinięciem sieci: P (Z 1:T ) = T n P (Zi t P a(zi t )). t=1 i=1 Jak wspomniano wcześniej, zazwyczaj zakłada się, że stan systemu w czasie t zależy jest tylko od poprzednich k = 1 stanów. Jednakże z teoretycznego punktu widzenia nic nie stoi na przeszkodzie, by k przyjmowało dowolną wartość z przedziału 1, t k. W większości przypadków, uwzględnianie tylko stanu systemu bezpośrednio poprzedzającego stan bieżący jest wystarczające. Jednakże, możliwe jest, że istnieją zjawiska, które moglibyśmy modelować z większą dokładnością jeśli tylko uwzględnilibyśmy stan systemu w odleglejszych momentach 5

7 czasu. Takie podejście jest rzadkie w literaturze, głównie z powodu braku zarówno algorytmów jak i narzędzi praktycznych. Dla procesu o rzędzie k rozkład przejścia pomiędzy poszczególnymi krokami czasowymi wyrażony jest wzorem [5]: n P (Z t Z t 1, Z t 2,..., Z t k ) = P (Zi t P a(zi t )). W tym przypadku zbiór rodziców P a(zi t ) zawiera węzły pochodzące nie tylko z bezpośrednio poprzedzającego segmentu, ale również węzły z segmentów wcześniejszych. Łączny rozkład prawdopodobieństwa sieci rzędu k o T segmentach wyrażony jest wzorem: i=1 P (Z 1:T ) = T n P (Zi t P a(zi t )). t=1 i=1 Fizjologia Cyklu Miesięcznego Kobiety Podobnie jak wiele zjawisk w przyrodzie, powtarzających się cyklicznie w określonym czasie, również większość procesów fizjologicznych występujących w organizmie ludzkim ma charakter okresowy. Do takich procesów zaliczamy m.in. procesy związane z płodnością kobiety. Przez cały okres rozrodczy w organizmie kobiety zachodzą powtarzające się regulowane przez układ hormonalny procesy związane z dojrzewaniem komórki jajowej, owulacją oraz czynnością ciałka żółtego. Z punktu widzenia zmian zachodzących w ciele kobiety cykl miesiączkowy możemy podzielić na cztery fazy: menstruację, fazę folikularną, owulację oraz fazę lutealną. Czas trwania cyklu miesiączkowego jest cechą wybitnie indywidualną każdej kobiety i waha się zwykle od 24 do 31 dni [25]. Jednakże cykle trwające od 21 do 36 dni należy również traktować jako prawidłowe. Nieregularności cyklu często występują u kobiet zdrowych, a długość cykli prawie nigdy nie jest idealnie równa. Hormonalna charakterystyka i podział cyklu miesięcznego Cykl miesiączkowy kobiety sterowany jest poprzez wzajemne interakcje hormonów produkowanych w większości przez trzy organy w jej ciele: podwzgórze, przysadkę mózgową oraz jajniki. Najważniejsze hormony regulujące proces cyklu miesięcznego to: gonadoliberyna (GnRH), lutropina (hormon luteinizujący, LH), folitropina (hormon, folikulotropowyfsh), estrogeny oraz progesteron ([25]). 6

8 Rysunek 1. Poziom hormonów w organizmie kobiety w trakcie trwania cyklu miesięcznego [1]. Biorąc pod uwagę poziom hormonów w organizmie kobiety możemy wyodrębnić cztery fazy cyklu miesięcznego: menstruację, fazę folikularną (pęcherzykową), owulację oraz fazę lutealną (ciałka żółtego) (Rysunek 1). Przyjmuje sę, że pierwszym dniem cyklu jest pierwszy dzień krwawienia menstruacyjnego. Krwawienie jest spodowowane złuszczaniem błony śluzowej macicy, rozrośniętej w ostatniej fazie poprzednego cyklu. Menstruacja trwa zwykle od 3 do 5 dni, choć krwawienia trwające od 2 do 7 dni są traktowane jako normalne. Po ustaniu krwawienia w fazie folikularnej pod wpływem hormonów gonadotropowych w jajniku dochodzi do dojrzewania pęcherzyka zawierającegoh komórką jajową. Macica wchodzi w tak zwaną fazę wzrostu, w której jej błona śluzowa ulega regeneracji. Za tą odbudowę odpowiedzialne są estrogeny wydzielane przez dojrzewający pęcherzyk jajowy. W długich cyklach jest ona wydłużona, a w zdarzających się cyklach krótkich ulega skróceniu. Pod koniec fazy folikularnej dochodzi do gwałtownego wyrzutu LH do krwi przez przysadkę mózgową. Wzost poziomu tego hormonu jest bezpośrednią przyczyną pęknięcia pęcherzyka i uwolnienia komórki jajowej, czyli owulacji. Komórka jajowa żyje od 15 do 24 godzin [14] i tylko w tym czasie w trakcie danego cyklu może dojść do zapłodnienia. Podczas jednego, nawet bardzo długiego cyklu, ma miejsce tylko jedna owulacja. Może się zdarzyć, że równocześnie dojrzewają i wydostają się z jajnika dwie lub więcej komórki jajowe, co może być przyczyną ciąży mnogiej, ale następuje to zawsze w ciągu jednej doby, gdyż jest uwarunkowane działaniem hormonu LH. Dodatkowemu jajeczkowaniu w późniejszym czasie przeciwdziała wytwarzany po owulacji progesteron. Przyczyną trudności z poczęciem 7

9 dziecka może też być zbyt skąpe lub krótkotrwałe wytwarzanie śluzu w szyjce macicy, pomimo prawidłowego jajeczkowania. Faza lutealna, zwana także fazą ciałka żółtego rozpoczyna się tuż po owulacji i trwa do ostatniego dnia przed wystąpieniem następnego krwawienia. W literaturze nie ma zgodności co do średniej długości fazy lutealnej, według Wójcika trwa ona przeciętnie dni[27], podczas gdy Kippley w [14] podaje dni. Jej długość jest determinowana przez czas życia ciałka żółtego, które, o ile nie dojdzie do zapłodnienia, obumiera po około 13 dniach [25]. Na skutek jego obumarcia dochodzi do gwałtownego spadku progesteronu w krwi kobiety, a w konsekwencji do oddzielenia powierzchniowej warstwy śluzówki macicy i pojawienia kolejnego krwawienia miesięcznego. Samoobserwacja objawów cyklu miesięcznego Przez cały cykl miesięczny na skutek działania hormonów w organizmie kobiety zachodzi szereg zmian. Mogą one dostarczyć kobiecie przesłanek pozwalających przypuszczać, że w danym cyklu wystąpiła owulacja. Rzetelna i systematyczna samoobserwacja cykli miesięcznych przez kobietę jest tanim i wartościowym sposobem rozpoznawania prawidłowego ich przebiegu oraz ewentualnych zaburzeń. Z punktu widzenia występowania tych objawów w trakcie cyklu, możemy je podzielić na dwie grupy: główne objawy płodności oraz dodatkowe objawy płodności. Główne objawy płodności występują we wszystkich cyklach owulacyjnych. Należą do nich krwawienie miesięczne, pomiar podstawowej temperatury ciała, obserwacja śluzu szyjki macicy oraz zmiany w położeniu i charakterystyce szyjki macicy. Objawy dodatkowe są obserwowane tylko przez niektóre kobiety i tylko w części ich cykli. Możemy do nich zaliczyć tzw. ból owulacyjny, krwawienie owulacyjne, obrzmienie piersi, powiększenie węzła chłonnego w pachwinie. Menstruacja Menstruacja jest najbardziej widocznym objawem, który kobieta może zaobserwować w trakcie całego cyklu miesięcznego. Pojawienie się pierwszej miesączki (menarche) kończy proces pokwitania i jest oznaką dojrzałości płciowej. Występuje po około 14 miesiącach od szczytu skoku pokwitaniowego, czyli intensywnego wzrostu ciała oraz dynamicznego rozwoju narządów wewnętrznych i zewnętrznych. Normalny wiek wystąpienia pierwszej miesiączki waha się między 10. a 17. rokiem życia, przy czym średnio menarche występuje w 12. roku 8

10 życia. Okres rozrodczy kobiety kończy się wraz z ostatnią menstruacją, zwaną menopauzą. Przeciętnie ostatnia miesiączka pojawia się pomiędzy 45. a 55. rokiem życia. Krwawienie miesięczne jest pierwszym etapem cyklu miesiączkowego. Jest spodowowane zanikiem w ostatniej fazie poprzednego cyklu błony śluzowej macicy, której pozostałości są wydalane wraz z krwią. Menstruacja trwa zwykle od 3 do 5 dni, choć krwawienia trwające od 2 do 7 dni są traktowane jako normalne. Kobieta traci w tym czasie do 80 ml krwi. Podstawowa temperatura ciała Postawowa temperatura ciała (ang. Basal Body Temperature, BBT) to temperatura ciała znajdującego się w stanie spoczynku, bez wplywu pokarmu czy uprzednio wykonywanych czynności. Temperatura ciała podlega dobowym wahaniam, przy czym w godzinach rannych osiąga najniższy poziom. W normalnych warunkach wzrasta o oko ło 0.1 C na każdą godzinę dziennej aktywności. Zmiany podstawowej temperatury ciała następują w rezultacie zmian stężenia progesteronu we krwi. W fazie przedowulacyjnej, na skutek niskiego poziomu progesteronu w stosunku do wysokiego poziomu estrogenów BBT utrzymuje się na niższym poziomie [18]. Faza niższych temperatur (hipotermiczna) obejmuje czas menstruacji i trwa do momentu uwolnienia komórki jajowej. Po owulacji, na skutek działania progesteronu wytwarzanego przez ciało żółte podstawowa temperatura ciała kobiety podnosi się mniej więcej o 0.2 C i obniża dopiero tuż przed wystąpieniem następnej menstruacji a czasem dopiero w jej trakcie. Jest to tak zwana faza wyższych temperatur (hipertermiczna). Podwyższanie BBT przez progesteron jest wyjaśnione jako skutek zwiększenie podstawowej przemiany materii. Przejście z fazy hipotermicznej do fazy hipermicznej nosi nazę skoku temperatury lub zmiany (ang. shift). Skok uznawany jest za istotny, jeżeli wzrost temperatury dokonał się w czasie nie dłuższym niż 48 godzin i przez następne trzy dni BBT jest wyższa o co najmniej 0.2 C w porównaniu z najwyższą temperaturą w ostatnich sześciu dniach poprzedzających skok. Badania WHO wykazały, że średnia długość fazy hipotermicznej wynosi 17.6 dnia ±4.1 dnia, a fazy hipertermicznej 12.7 dnia ±1.7 dnia [18]. O ile długość fazy hipotermicznej wpływa jedynie na długość całego cyklu, to zbyt krótka faza hipertermiczna ma znaczący wplyw na płodność kobiety. Za prawidłwową długość fazy hipertermicznej uzwaje się przedział od 10 do 16 dni. Faza wyższych temperatur krótsza niż 10 dni może wskazywać na niewydolność ciałka żółtego, co uniemożliwia zagnieżdżenie zapłpdnionej koórki jajowej w 9

11 macicy i utrzymacie wczesnej ciąży. Cykl o dwufazowym przebiegu uznawany jest za cykl owulacyjny, natomiast brak skoku temperatury najczęściej oznacza, że w tym cyklu nie doszło do jajeczkowania. BBT utrzymująca się na poziomie wyższych temperatur przez dłużej niż dni może świadczyć o poczęciu dziecka [25], [18], [27]. Śluz szyjki macicy Śluz szyjkowy, wytwarzany pod wpływem estrogenów odgrywa bardzo ważną rolę w procesie zapłodnienia. Jego obecność jest niezbędna do utrzymania żywotności plemników. W dniach, kiedy śluzu nie ma, czyli zwykle kilka dni po menstruacji, plemini giną w kwaśnym środowisku pochwy w ciągu około 30 minut ([27]). Występuje wtedy również uczucie śuchości". W ciągu następnych dni pojawia się śluz gęsty, lepki oraz nierozciągliwy i wraz z nim odczucie "wilgotności"(tzw. śluz gorszej jakości, śluz o cechach mniejszej płodności). U niewielkiego odsetka kobiet już. bezpośrednio po menstruacji występuje niezmieniająca się wydzielina z uczuciem "wilgotności"[25]. Rysunek 2. Charakterystyka śluzu szyjki macicy w trakcie cyklu miesięcznego kobiety. Po kilku dniach, na skutek wzrostu poziomu estrogenów wydzielanych przez dojrzewający pęcherzyk jajowy, zwiększa się ilość wydzielanego śluzu. Zmienia się również jego postać. Im bliżej owulacji, tym bardziej śluz staje się rozciągliwy, przejrzysty, podobny do białka jaja kurzego (tzw. śluz dobrej jakości, śluz bardzo płodny.). Ostatni dzień, w którym śluz posiada cechy płodności nosi nazwę dnia szczytu śluzu. Śluz szyjki macicy ma odczyn zasadowy i uzdalnia plemniki do zapłodnienia. W jego obecności plemniki mogą żyć nawet do 6 dni [26]. Wytwarzanie śluzu ustaje po owulacji na skutek działania progesteronu. U większości kobiet nie ma w tym czasie żadnej wydzieliny i przeważa odczucie śuchości"przedsionka 10

12 Rysunek 3. Charakterystyka szyjki macicy w trakcie cyklu miesięcznego kobiety. pochwy. U nielicznych kobiet występuje stale wydzielina w niewielkiej ilości, która jest łatwa do odróżnienia od śluzu szyjkowego [27]. Położenie szyjki śluzowej macicy Hormony jajnikowe powodują również zmiany szyjki macicy, wpływają na jej warstwę mięśniową. Przez kilka dni po menstruacji szyjka jest zazwyczaj zamknięta, twarda oraz nisko położona. W miarę zbliżającej się owulacji, szyjka macicy przemieszcza się lekko od strony kości krzyżowej ku spojeniu łonowemu, przez co wydaje się, że znajduje się wyżej. Jest bardziej miękka i otwarta, a z jej ujścia wydziela się śluz. Pod wpływem zwiększonego poziomu progesteronu po owulacji szyjka wraca do punktu wyjścia, szybko się zamyka, twardnieje i ponownie opuszcza się niżej. Metody oparte na samoobserwacji cyklu Metody naturalnego planowania rodziny (ang. Fertility Awareness Methods, metody FA) są kolekcją metod opartych na znajomości i wykorzystywaniu naturalnego cyklicznego rytmu płodności kobiety. Metody te wyznaczają czas, w kórym może dojść do zapłodninia na podstawie śledzenia długości cyklu i/lub obserwacji głównych objawów płodności, takich jak podstawowa temperatura ciała, zmiany śluzu szyjki macicy oraz zmiany w położeniu i charakterystyce szyjki macicy. Wiedzę o czasie występowania okresów płodnych można wykorzystać zarówno w celu zwiększenia prawdopodobieństwa zajścia w ciążę, jak też dla jej uniknięcia. 11

13 Z punktu widzenia wykorzystywanych informacji metody FA można podzielić na trzy kategorie: (1) metody kalendarzowe, bazujące na długotrwałym i systematycznym zapisie długości cyklów miesiączkowych kobiety(np. metoda Ogino Knausa [25]), (2) metody objawowe, polegające na obserwacji jednego wskaźnika płodności temperatury lub śluzu szyjki macicy (np. metoda temperaturowa [24], system Döringa [1], metoda owulacyjna Billingsów [16], model Creightona [12]) oraz (3) metody objawowo termiczne, wykorzystujące więcej niż jeden wskaźnik płodności kobiety (np. metoda Rötzera [23], metoda Kippleyów [14], metoda podwójnego sprawdzenia [25], Sensiplan [22] metoda T. Kramarek [25]). Modelowanie zależności wyższych rzędów Niniejszy rozdział prezentuje kolekcję modeli opartych na dynamicznych sieciach Bayesowskich o różnych stopniach zależności czasowych oraz przedstawia wyniki eksperymentu porównującego zachowanie takich modeli w zastosowaniu do rzeczywistego problemu. Zgodnie z moją wiedzą, pomimo iż dynamiczne sieci Bayesowskie są popularnym narzędziem modelowania procesów stochastycznych, ich zastosowanie skupia się głównie na zależnościach pierwszego i drugiego rzędu [4, 15, 17, 21]. Problem, który analizuję w tej rozprawie to modelowanie cyklu miesięcznego kobiety, problem ściśle związany z ludzką płodnością. Właściwa estymacja dnia owulacji, a w konsekwencji okresu płodnego w trakcie trwania cyklu miesięcznego z uwagi na zmienną długość cyklu jest problemem skomplikowanym. Długość cyklu, a wraz z tym długość jego poszczególnych faz jest cechą indywidualną każdej kobiety [9]. Wahania dotyczą również zdrowych kobiet, a długości ich cykli prawie nigdy nie są sobie idealnie równe. Co jeszcze uważam za istotne w analizowanym problemie, to fakt, że cykl miesięczny kobiety jest systemem z pamięcią sięgającą nawet całej długości cyklu. Dane, których używam w tej rozprawie pochodzą z europejskiego badania nad płodnością [3]. W trakcie badania 881 kobiet z siedmiu europejskich ośrodków oraz z ośrodka w Nowej Zelandii zgromadziło 7017 cykli. Jednakże w eksperymentach uwzględniłam tylko 3432 cykli 236. kobiet. Z analizy wykluczyłam kobiety, które zgromadziły mniej niż siedem cykli z uwagi na wytyczne metod FA, kóre zalecają obserwację minimum sześciu cykli w celu zapoznania się z metodą. Pominęłam również cykle z niejednoznacznie określonym skokiem temperatury lub dniem szczytu śluzu szyjki macicy. Dodatkowo, z analizy wykluczyłam kobiety z cyklami, których długość uznawana jest za anormalną [25]. 12

14 Opis modelu Proponowany model cyklu miesięcznego kobiety (Rysunek 4) zawiera zmienną Phase opisującą fazę cyklu, w której kobieta aktualnie się znajduje. W modelu umieściłam sześć zmiennych opisujących obserwacje, jakie kobieta może zebrać w czasie trwania cyklu. Zawierają one główne wskaźniki płodności, czyli informacje o krwawieniu (Bleeding), podstawową temperaturę ciała (BBT) i obserwacje śluzu szyjki macicy (Mucus observation) oraz obserwacje dotyczące zmianm w położeniu i charakterystyce szyjki macicy (Cervix position, Crevix firmness, Cervix openness). Wszystkie modele stworzyłam, rozwijałam oraz testowałam przy użyciu biblioteki SMILE służącej do tworzenia i wnioskowania w graficznych modelach probabilistycznych [6]. SMILE powstał w Laboratorium Systemów Decyzyjnych (Decision Systems Laboratory) Uniwersytetu w Pittsburgh u i jest dostepny na stronie Rysunek 4. Przykład modelu ósmego rzędu cyklu miesięcznego kobiety. Opis eksperymentu Do porównania wyników generowanych przez poszczególne modele zdecydowałam się użyć trzech następujących miar: procentowa ilość przypadków fałszywie negatywnych, czyli dni płodnych błędnie zaklasyfikowanych jako niepłodne, i przypadków fałszywie pozytywnych, czyli dni niepłodnych błędnie zaklasyfikowanych jako płodne oraz miary wyprowadzonej z 13

15 metod naturalnego planowania rodziny procentowej długości okresu płodnego i niepłodnego w czasie cyklu miesięcznego. Jako, że moją intencją była symulacja użycia poszczególnych modeli przez kobietę podczas uczenia i weryfikacji modeli zastosowałam następującą procedurę. Dla każdej kobiety stworzyłam kolekcję modeli, których struktura i parametry początkowe oparte były na jej pierwszych sześciu cyklach. Po każdym cyklu sprawdzałam, czy nie zaszła potrzeba aktualizacji struktury oraz wyznaczałam numeryczne parametry modeli używając nie więcej niż ostatnie dwanaście cykli danej kobiety. Powodem takiego postępowania jest fakt, że organizm kobiety zmienia się w czasie a wraz z tym zmianom ulega charakterystyka jej cykli. Model powinien na bieżąco dostosowywać się do stopniowych zmian zachodzących w ciele kobiety. Dla każdej kobiety stworzyłam dziewięć dynamicznych sieci Bayesowskich w rzędami temporalnymi od pierwszego do dziewiątego. Dodatkowo, dla każdej kobiety stworzyłam model, krótego struktura mogła zmieniać się po każdym cyklu. Zmiana struktury polegała na dodawaniu lub usuwaniu krawędzi reprezentujących zależności temporalne, przy czym krawędź pierwszego rzędu nigdy nie mogła zostać usunięta. Proces zmiany struktury wyglądał następująco. Po każdym cyklu na podstawie danych z poprzednich cykli (co najmniej sześciu i nie więcej niż dwunastu) wyznaczałam najwcześniejszy i najczęściej występujący dzień owulacji. Dzieląc te dwie wartości przez dwa otrzymywałam rzędy zależności temporalnych, które powinny pojawić się w modelu. W każdym kroku czasowym (tzn. dniu cyklu) każdy model wyznaczał dzień z najwyższym prawdopodobieństwem owulacji. Jeżeli przedział między wyznaczonym dniem a dniem bieżącym był równy co najmniej sześć dni, oznaczałam dzień bieżący jako początek okresu płodnego w danym cyklu. Do wyznaczenia końca okresu płodnego modele używały skoku podstawowej temperatury ciała. Wyniki Rysunek 5 pokazuje średni procent dni sklasyfikowanych jako płodne i niepłodne podczas cyklu. W przypadku modeli zawierających wszystkie kolejne rzędy zależności temporalnych długość okresu płodnego zmniejsza się wraz ze zwrostem wysokości rzędu, by w przypadku modelu rzędu dziewiątego osiągnąć poziom 40% długości całego cyklu. Długość okresu płodnego wyznaczona przez model ze zmnieniającą się strukturą (oznaczona jako ŚEL orders") jest bliska wartościom uzyskanym przez modele ósmego i dziewiątego rzędu. Takie rezultaty 14

16 Rysunek 5. Średni procent dni sklasyfikowanych przez porównywane modele jako płodne i niepłodne w trakcie cyklu miesięcznego kobiety. pokrywają się z naszą intuicją, że im wyższy rząd modelu tym bliższa prognozowana długość okresu płodnego do rzeczywistej długości. Rysunek 6. Średni procent dni fałszywie negatywnych i fałszywie pozytywnych wykazanych przez porównywane modele. Z rysunku 6 możemy zaobserwować, że liczba dni fałszywie negatywnych jest najwyższa w przypadku modelu pierwszego rzędu. Począwszy od rzędu drugiego liczba dni płodnych niepoprawnie sklasyfikowanych jako niepłodne maleje wraz z rosnącym rzędem modelu. Jednakże, dla modelu siódmego rzędu i wyższych obserwujemy trend odwrotny. W tym samym czasie model ze zmienną strukturą wykazuje liczbę dni fałszywie negatywnych porównywalną z modelem rzędu ósmego. Liczba dni niepłodnych niewłaściwie sklasyfikowanych jako płodne (tzn. dni fałszywie pozytywnych) jest niższa dla modeli zawierającyh zależności temporalne wyższych rzędów. 15

17 Różnica pomiędzy modelem pierwszego rzędu a modelem dziewiątego rzędu wynosi około 18%. Podsumowanie Uzyskane wyniki pokazują, że cykl miesięczny kobiety jest procesem z pamięcią sięgającą długości całego cyklu. Znaczy to, że na stan procesu w dniu bieżącym wpływają nie tylko obserwacje z dnia poprzedniego, ale również z dni wcześniejszych. W związku z tym uwzględnienie w modelu zależności zcasowych wyższych rzędów wpływa korzystnie na jakość prognostyczną modelu. Jednocześnie wyniki pokazały również, że w przypadku analizowanych danych mamy do czynienia z nadmiernym dopasowaniem modelu, co w przypadku zbyt wysokiego rzędu modelu prowadzi co spadku jakości. Odpowiedź na pytanie, jaki jest właściwy rząd modelu jest kluczowa przy modelowaniu procesów stochastycznych. Parametry numeryczne modelu Poprzedni rozdział pokazał, że modele dynamiczne uwzględniające zależności wyższych rzędów mogą z większą dokładnością modelować stan procesu stochastycznego niż modele pierwszego rzędu. Przeprowadzony eskperyment wykazał, że wraz ze wzrostem rzędu modelu długość prognozowanego okresu płodnego jest krótsza, co pozwala nam rozważać taki model za bardziej precyzyjny. Również liczba dni fałszywie pozytywnych malała przy modelach wyższych rzędów. Jednakże rosnąca liczba dni fałszywie niegatywnych sugeruje, że mamy do czynienia z nadmiernym dopasowaniem modelu do danych, przez co nowe przypadki, óżniące się od dotychczasowych są błędnie klasyfikowane. Jednym z powodów takiego zachowania modeli jest mała liczebność zbiorów danych wykorzystanych do uczenia. Uczenie sieci Bayesowskich z danych poparte jest solidnymi podstawami teoretycznymi. Dysponując wystarczająco dużym zbiorem danych jesteśmy w stanie nauczyć zarówno część jakościową modelu, jak i jego część ilościową. Jednakże, w praktyce liczba rekordów dostępnych do uczenia jest zawsze ograniczona. Wyznaczanie parametrów sieci bayesowskiej sprowadza się głównie do zliczania liczby rekordów dla różnych warunków (kombinacji stanów parametryzowanego węzła i jego rodziców). Liczba estymowanych parametrów rośnie wykładniczo wraz ze wzrostem liczby rodziców. Co za tym idzie modele wyższych rzędów stają coraz bardziej złożone i potrzebujemy większej liczby rekordów w celu wyznaczenia 16

18 rozkładów. Przykładowo, dla sieci piątego rzędu w przypadku węzła Phase tabele rozkłądów warunkowych zawiera 1, 024 wartości. Nawet jeśli wezmiemy pod uwagę, że ze względu na specyfikę modelowanego problemu wiele kolumn w tabeli prawdopodobieństw reprezentuje wysoko nieprawdopodobne przypadki, ciągle zmagamy się z problemem niewystarczającej liczby rekordów. Warto zauważyć, że stosując metody naturalnego planowania rodziny zarówno początkowa struktura modelu jak i jego parametry wyznaczamy z reguły w oparciu o sześć cykli kobiety. W przypadku zbiorów z tak niewielką liczbą rekordów, niejednokrotnie dana kombinacja wartości jest reprezentowana przez zaledwie kilka rekordów lub nawet przez zerową liczbę rekordów, co uniemożliwia wyznaczenie wiarygodnych parametrów. Częstym założeniem odnośnie rozkładów początkowych modelu są rozkłady jednostajne. Jednakże takie podejście w przypadku cyklu miesięcznego kobiety nie niesie żadnej informacji, a wręcz prowadzić może do błędnych rezutlatów. Wytrenowanie skomplikowanego modelu wymaga dużej liczby obserwacji. Niestety, zbieranie danych opisujących cykl miesięczny kobiety nigdy nie będzie skutkować wystarczająco dużym zbiorem danych. Zakładając, że kobieta jest płodna przez mniej więcej 40 lat swojego życia, średnio z trzynastoma cyklami w ciągu roku, jest w stanie zebrać około 520 rekordów. W momencie, gdy ta liczba zostanie osiągnięta, obserwacje stają się bezużyteczne jako, że kobieta wchodzi w okres przekwitania. W rzeczywistości kobieta w optymistycznym przypadku dysponuje nie więcej niż kilkudziesięcioma zaobserwowanymi cyklami. W tym rozdziale koncentruję się na ustaleniu parametrów a priori modeli o ustalonej strukturze przy użyciu dostępnych danych. Zaproponowałam dwa podejścia do rozwiązania problemu małych zbiorów danych w kontekście cyklu miesięcznego kobiety. Pierwsze z nich opiera się na wykorzystaniu rekordów całej populacji kobiet. Drugie podejście bazuje wyłącznie na danych kobiety na podstawie których wyznaczane są początkowe parametry. W obydwu przypadkach dla każdej kobiety utworzyłam siedem sieci dynamicznych o rzędach od pierwszego do siódmego. Uczenie z populacji W tym podejściu wykorzystałam dane z populacji (3432 rekordów) do wyznaczenia parametrów. Procedura uczenia i walidacji modeli wyglądała następująco. Losowo podzieliłam dostępne dane na pięć równych podzbiorów. Zbiór uczący modeli każdej kobiety był sumą czterech pozdbiorów, wyłączając ten, do którego kobieta została przyporządkowana. W tym kroku dla każdej kobiety uzyskałam model oparty na populacji. Następnie, użyłam tych modeli 17

19 jako modeli a priori w celu wyznaczenia modeli specyficznych dla kobiety. W tym celu użyłam tylko cykli danej kobiety. W tym kroku zarówno dla uczenia jak i walidacji użyłam procedury opartej na wcześniejszych cyklach kobiety, opisanej w poprzednim rozdziale. Interesującym wynikiem jest to, że średnia liczba dni sklasyfikowanych przez modele o rzędzie niższym niż siódmy jako płodne kształtuje się na porównywalnym poziomie (około 44%). Model siódmego rzędu poprawia swoją dokładność o około 5%. Podobnie zachowuje się liczba dni fałszywie pozytywnych. W przypadku modeli o rzędach niższych niż siódmy wynosi ona około 19%, podczas gdy dla modelu rzędu siódmego około 16%. Jednakże, liczba dni płodnych sklasyfikowanych błednie jako niepłodne różni się pomiędzy modelami. Najniższą wartość dni fałszywie pozytywnych wykazały modele rzędu trzeciego, czwartego oraz piątego, trzykrotnie niższą niż model rzędu siódmego. Uczenie na podstawie charakterystyki kobiety Wyniki zaprezentowane w poprzedniej sekcji pokazują, że modele oparte na populacji nie dają satysfakcjonujących rezultatów. Przyczyną takiego zachowania modeli mogą być znaczące różnice pomiędzy poszczególnymi kobietami. Drugi eksperyment zakładał wyestymowanie parametrów a priori w oparciu o indywidualną charakterystykę każdej kobiety. Jednym z podejść jest pozyskanie tych wartości od eksperta. Jednakże jak pokazuje doświadczenie, o ile eksperci są w stanie łatwo i wiarygodnie określić graficzną strukturę modelu, to wyznaczenie parametrów numerycznych sprawia im spore problemy [7]. W przypadku modeli cyklu miesięcznego kobiety, parametry powinny być określone indywidualnie dla każdej kobiety. Takie zadanie byłoby jednak czasochłonne i skomplikowane. Drugie podejście opiera się na nauczeniu parametrów z danych. Biorąc pod uwagę, że dostępna liczba rekordów jest niewystarczająca (kilka dla każdej kobiety) postanowiłam wygenerować dane o cyklach każdej kobiety bazując na charakterystykach jej pierwszych sześciu cykli. W celu ustalenia indywidualnych parametrów modeli zastosowałam następującą procedurę. Dla każdej kobiety wygenerowałam zbiór cykli o liczności 500 elementów. Taka liczność wydaje się być wystarczająca, biorąc pod uwagę, że wiele kolumn w tabelach prawdopodobieństw w przypadku problemu modelowania cyklu miesięcznego kobiety reprezentuje wysoce nieprawdopodobne przypadki. Przykładowo dla sieci szóstego rzędu rozmiar tabeli prawdopodobieństw warunkowych wynosi 4, 096 jednak tylko około 30 odpowiada za rzeczywiste 18

20 kombinacje. Bazując na regułach metod naturalnego planowania rodziny, które zalecają zebranie przynajmniej sześciu cykli przed pełnym stosowaniem metody, wykorzystałam te cykle do wyznaczenia podstawowej charakterystyki każdej kobiety. Pod uwagę brałam minimum, maksimum, wartość oczekiwaną oraz odchylenie standardowe długości cyklu oraz długości każdej fazy. Następnie wygenerowałam dane zakładając rozkład normalny długości cyklu, a co za tym idzie długości poszczególnych faz. Dodatkowo ustaliłam wzorzec występowania obserwacji w zależności od fazy cyklu, co było szczególnie istotne w przypadku zmiennej opisującej śluz szyjki macicy. Podobnie jak w poprzednich eksperymentach, zarówno długość okresu płodnego jak i liczba dni niepłodnych błędnie sklasyfikowanych jako płodne zmniejszała się w przypadku modeli wyższych rzędów. Znaczącą różnicą jest fakt, że liczba dni fałszywie negatywnych w przypadku większości modeli wynosiła zero lub była bliska zeru. Podsumowanie Głównym problemem uczenia parametrów początkowych modeli cyklu miesięcznego kobiety jest niewystarczająca liczba danych. Ponieważ uczenie prawdopodobieństw warunkowych sprowadza się głównie do zliczania liczby rekordów dla różnych kombinacji stanów parametryzowanego węzła i jego rodziców, mała liczba danych prowadzi do sytuacji, w której część kombinacji będzie reprezentowana w danych przez niewielką lub nawet zerową liczbę rekordów. W takiej sytuacji zakładany z reguły jako a priori rozkład jednostajny nie niesie żadnej informacji, a wręcz może prowadzić do błędnych wyników. Dlatego też kwestią wielkiej wagi jest właściwe ustalenie parametrów początkowych modelu. W tym rozdziale testowałam dwa podejścia pozyskania parametrów a priori, obydwa oparte na uczeniu z danych. W pierwszym podejściu estymowałam parametry na podstawie dostępnej populacji kobiet, podczas gdy drugie podejście zakładało wyznaczanie parametrów początkowych indywidualnie dla każdej kobiety. Wyniki pokazują, że modele oparte na populacji zachowują się gorzej niż modele, których parametry były estymowane w oparciu o indywidualną charakterystykę kobiety. Moim zdaniem, jednym z wyzwań w modelowaniu cyklu miesięcznego kobiety jest znacząca różnorodność pomiędzy kobietami. 19

21 Zastosowanie modeli kanonicznych Założenie o warunkowej niezależności zmiennych w sieciach Bayesowskich skutkuje w bardziej kompaktowej reprezentacji łącznego rozkładu prawdopodobieństwa i znacząco redukuje liczbę estymowanych parametrów. Jednakże w dalszym ciągu liczba paramaterów rośnie wykładniczo wraz ze wzrostem liczby rodziców, co w przypadku uczenia parametrów z małych zbiorów danych prowadzi do do niskiej jakości modeli. Niektóre rozkłady prawdopodobieństw warunkowych mogą być aproksymowane przez interakcyjne modele kanoniczne, które wymagają mniejszej liczby parametrów. Modele kanoniczne są zazwyczaj stosowane w sytuacji związanej z opisem oddziaływań pomiędzy n przyczynami X 1, X 2,..., X n oraz ich wspólnym efektem Y. Zakłada się, że każda z przyczyn jest w stanie prowadzić do efektu Y, w sytuacji, gdy pozostałe przyczyny są nieobecne oraz gdy ich zdolność do wywoływania efektu Y jest niezależna od występowania pozostałych przyczyn. Najbardziej popularne spośród modeli kanonicznych są bramki noisy OR [20] wraz z ich uogólnieniem bramkami noisy MAX model [10, 11]. W niniejszym rozdziale testowałam zastosowanie jednego z rodziny modeli kanonicznych, modelu Simple Ladder, SL( [28]), do problemu cyklu miesięcznego kobiety z dwóch punktów widzenia. Pierwszy eksperyment koncetrował się na aspekcie obliczeniowym, to znaczy na porównaniu czasu uczenia oraz czasu wnioskowania modeli kanonicznego do modeli tradycyjnych (będę określać je jako modele CPT). Drugi eksperyment testował jakość takich modeli. Dla każdej kobiety utworzyłam siedem par sieci dynamicznych o rzędach od pierwszego do siódmego. Rysunek 7 przedstawia przykład takiej pary dla modelu rzędu czwartego. Dodatkowo, aby porównać zachowanie się modeli w przypadku wybranych rzędów, strowrzyłam pięć par modeli z rzędami 1,6,10; 1,6,10,15; 1,3,7,10,12; oraz 1,7-12. Eksperyment pokazał, że średni czas wnioskowania znacząco skraca się w przypadku modeli SL wraz ze zwiększającym się rzędem modelu. Czas wnioskowania dla modeli SL wzrasta liniowo wraz ze wzrostem liczby rodziców, podczas gdy dla modeli CPT wykłdniczo. Średni czas uczenia modeli CPT jest krótszy w przypadku niższych rzędów (do rzędu szóstego). Dłuższy czas uczenia modeli SL może być wytłumaczony wprowadzonymi przez te modele zmiennymi ukrytymi (węzły A oraz B na Rysynku 7). Jednakże biorąc pod uwagę praktyczne zastosowanie tych modeli, czas uczenia ma mniejsze znaczenie niż czas wnioskowania. Parametry modelu uaktualniane są z reguły tylko raz, po zakończeniu cyklu, podczas gdy prognozowanie wykonywane jest znacznie częściej (przynajmniej raz dziennie). 20

22 Rysunek 7. Przykładowa sieć czwartego rzędu modelu CPT (a) oraz odpowiadający mu model SL (b). Modele SL wykazują zazwyczaj wyższy procent dni fałszywie pozytywnych. Z drugiej strony, liczba dni płodnych błędnie sklasyfikowanych jako niepłodne, jest mniejsza w porównaniu z odpowiadającymi modelami CPT. Oznacza to, że modele SL są bardziej dopasowane do oczekiwań użytkownika. Podsumowanie Przeprowadzone eksperymenty pokazały, że róźica między modelami opartymi na modelach kanonicznych oraz na modelach tradyjnych nie są duże. Jednym z możliwych wytłumaczeń jest to, z uwagi na specyfikę problemu nawet modele oparte na tradycyjnym podejściu nie zmagają się z dużą liczbą parametrów do wyestymowania. Jednakże, z uwagi na krótszy czas wnioskowania zastosowanie modeli kanonicznych do modelowania procesów stochastycznych wydaje się być obiecującym kierunkiem badań. Empiryczne porównanie modeli opartych na dynamicznych sieciach Bayesowskich do metod naturalnego planowania rodziny Metody naturalnego planowania rodziny (ang. Fertility Awareness Methods, metody FA) są kolekcją metod opartych na znajomości i wykorzystywaniu naturalnego cyklicznego rytmu płodności kobiety. Dzięki nim kobieta może określić fazy płodności i świadomie planować bądź odłożyć moment poczęcia dziecka. Każdy cykl miesięczny rozpoczyna się okresem 21

23 niepłodności względnej (tzw. niepłodność przedowulacyjna). Następnie, na kilka dni przez owulacją rozpoczyna się okres płodny, a po nim następuje okres niepłodności bezwzględnej (tzw. niepłodność poowulacyjna). Metody FA wyznaczają czas, w którym może dojść do zapłodnienia w oparciu o obserwację długości cyklu oraz/lub obserwację głównych objawów płodności, takich jak podstawowa temperatura ciała, zmiany śluzu szyjki macicy i szyjki macicy. Skuteczność metod FA została zweryfikowana mi.in. przez światową Organizację Zdrowia [19]. Z punktu widzenia wykorzystywanych informacji metody FA można podzielić na trzy kategorie: (1) metody kalendarzowe, bazujące na długotrwałym i systematycznym zapisie długości cyklów miesiączkowych kobiety: Rhythm [25], (2) metody objawowe, polegające na obserwacji jednego wskaźnika płodności temperatury lub śluzu szyjki macicy: metoda temperaturowa (BBT) [24], system Döringa (DS) [1], metoda owulacyjna Billingsów (BO) [16], model Creightona (CM) [12], algorytm Two Days (TDA) [8, 13], oraz (3) metody objawowo termiczne, wykorzystujące więcej niż jeden wskaźnik płodności kobiety: metoda Rötzera (RM) [23], metoda Kippleyów (CCL) [14], metoda podwójnego sprawdzenia (EM) [25], metoda zaproponowana przez Sensiplan (GM) [22] metoda Teresy Kramarek (PL) [25]. W tym rodziale przedstawiam wyniki porównania modeli opartych na dynamicznych sieciach Bayesowskich do istniejących jedenastu metod FA. Modele oparte na sieciach dynamicznych mogą stanowić trzon systemu ekspertowego służącego do określania czasu płodnego w trakcie cyklu miesięcznego. Opis eksperymentu W tym eksperymencie chciałam zasymulować wykorzystanie zaimplementowanych metod przez kobiety, które chcą zajść w ciążę lub chcą uniknąć ciąży, koncentrując się na skuteczności poszczególnych metod w identyfikacji okresu płodnego i niepłodnego. Zaimpelentowałam każdą z wymienionych wyżej metod FA oraz jeden z modeli oparty na dynamicznych sieciach Bayesowskich w postaci programu komputerowego ściśle przestrzegając reguł danej metody. Spośród zaproponowanych w tej rozprawie modeli do tego eksperymentu wybrałam model o zmiennej strukturze. Jak pokazały wcześniejsze wyniki, efektywność takiego modelu jest porównywalna z modelami zawierającymi wszystkie kolejne wpływy temporalne, a jednocześnie posiada on mniej skomplikowaną strukturę przez co czas uczenia i wnioskowania jest krótszy. 22

24 Rysunek 8. Średnią procentową długość okresu płodnego i niepłodnego w trakcie cyklu miesięcznego wynzaczone przez każdą z zaimplementowanych metod. Dla każdej z zaimplementowanych metod, zgodnie z jej regułami, wyznaczyłam średnią długość okresu płodnego i niepłodnego. Dodatkowo obliczyłam średnią liczbę dni fałszywie pozytywnych i fałszywie negatywnych. W przypadku modelu odpartego na dynamicznych sieciach Bayesowskich okres płodny był wyznaczany według następującej procedury. W każdym kroku czasowym (tzn. dniu cyklu) każdy model wyznaczał dzień z najwyższym prawdopodobieństwem owulacji. Jeżeli przedział między wyznaczonym dniem a dniem bieżącym był równy co najmniej sześć dni, oznaczałam dzień bieżący jako początek okresu płodnego w danym cyklu. Do wyznaczenia końca okresu płodnego model używał skoku podstawowej temperatury ciała. Wyniki Rysunek 8 przedstawia średnią procentową długość okresu płodnego i niepłodnego w trakcie cyklu miesięcznego. Liczba dni, w których kobieta powinna powstrzymać się od współżycia by uniknąć nieplanowanej ciąż jest dłuższa w przypadku metod bazujących dwóch lub więcej wskaźnikach płodności. Najkrótszą długość okresu płodnego wykazały metody oparte na obserwacji wyłącznie śluzu szyjki macicy, tzn. metoda owulacyjna Billingsa i model Creightona. Metoda temperaturowa w swoich zasadach rozróżnia tylko dwie fazy cyklu: płodną oraz fazę niepłodności bezwględnej, dlatego też wykazuje najdłuższy okres płodny w trakcie cyklu. Możemy zauważyć, że prognozowana przez model oparty na dynamicznych sieciach Bayesowskich długość okresu płodnego jest porównywalna do tej wykazanej przez metody oparte na obserwacji śluzu. 23

25 Rysunek 9. Średnią liczba dni fałszywie negatywnych oraz dni fałszywie pozytywnych wykazanych przez kaźdą z zaimplementowanych metod (posortowanych wg dni fałszywie negetywnych). Rysunek 9 przedstawia średnią wartość dni fałszywie negatywnych oraz dni fałszywie pozytywnych. Spośród wszystkich zaimplementowanych metod FA jedynie metoda temperaturowa osiągnęła wartość dni płodnych błędnie sklasifikowanych jako niepłodne równą zeru. Metody objawowo termiczne wykazały mniejszą liczbę dni fałszywie negatywnych niż metody oparte na kalendarzu i metody objawowe. Metody oparte na obserwacjach jedynie śluzu szyjki macicy wykazały najwszyższą wartość błędnie sklasyfikowanych dni. W tym samym czasie, model oparty na dynamicznych sieciach Bayesowskich osiągnął zerową wartość dni fałszywie negatywnych. Podsumowanie Jak pokazują wyniki porównania z istniejącymi metodami FA, zaproponowany model cyklu miesięcznego kobiety oparty na dynamicznych sieciach Bayesowskich osiąga wyniki porównywalne z metodami FA zarówno w przypadku prognozowanej długości okresu płodnego jak i w liczbie dni fałszywie negatywnych. Dodatkową zaletą takiego modelu jest to, że w przeciwieństwie do istniejących metod, może on przewidzieć dzień owulacji, co może przynieść wymierne korzyści dla par starających się o dziecko. Podsumowanie i kierunki dalszych badań Głównym celem tej rozprawy było zaimplementowanie modelu opartego na dynamicznych sieciach Bayesowkich wyższych rzędów w problemie obserwacji cyklu miesięcznego kobiety. 24

mokro ślisko naoliwienie przejrzysty rozciągliwy płynny podobny do surowego białka jaja kurzego czasem podbarwiony krwią mokro, ślisko wilgotno mokro

mokro ślisko naoliwienie przejrzysty rozciągliwy płynny podobny do surowego białka jaja kurzego czasem podbarwiony krwią mokro, ślisko wilgotno mokro Metoda wielowskaźnikowa podwójnego sprawdzenia Metoda podwójnego sprawdzenia jest metodą objawowo-termiczną. Stosowanie jej umożliwia rozpoznanie płodności na podstawie objawów w cyklu miesiączkowym kobiety.

Bardziej szczegółowo

SCENARIUSZ ZAJĘĆ Z WYCHOWANIADO ŻYCIAW RODZINIE UCZNIÓW SZKOŁY PONADGIMNAZJALNEJ. Temat: FIZJOLOGIA PŁODNOŚCI

SCENARIUSZ ZAJĘĆ Z WYCHOWANIADO ŻYCIAW RODZINIE UCZNIÓW SZKOŁY PONADGIMNAZJALNEJ. Temat: FIZJOLOGIA PŁODNOŚCI SCENARIUSZ ZAJĘĆ Z WYCHOWANIADO ŻYCIAW RODZINIE DLA UCZNIÓW SZKOŁY PONADGIMNAZJALNEJ Treści: fizjologia układu płciowego człowieka, fazy cyklu miesiączkowego kobiety, owulacja, fazy płodności i niepłodności

Bardziej szczegółowo

Jak ustalić datę poczęcia?

Jak ustalić datę poczęcia? Jak ustalić datę poczęcia? Ciąża rozpoczyna się w chwili zapłodnienia komórki jajowej. Czy jest możliwe dokładne wyznaczenie dnia w którym do tego doszło? Istnieją kalkulatory, które obliczają prawdopodobną

Bardziej szczegółowo

NOWE TECHNOLOGIE. wspomagające NATURALNE PLANOWANIE RODZINY. Agnieszka Stasieńko

NOWE TECHNOLOGIE. wspomagające NATURALNE PLANOWANIE RODZINY. Agnieszka Stasieńko NOWE TECHNOLOGIE wspomagające NATURALNE PLANOWANIE RODZINY Agnieszka Stasieńko Dlaczego szukamy nowych rozwiązań w NPR? Problemy z prowadzeniem samoobserwacji i interpretacją objawów płodności Zaufanie

Bardziej szczegółowo

Wykaz obowiązków rodzicielskich. Wykaz obowiązków rodzicielskich. Wykaz obowiązków rodzicielskich. Wykaz obowiązków rodzicielskich

Wykaz obowiązków rodzicielskich. Wykaz obowiązków rodzicielskich. Wykaz obowiązków rodzicielskich. Wykaz obowiązków rodzicielskich Wypisz skojarzenia dotyczące macierzyństwa i ojcostwa. macierzyństwo Wykaz obowiązków rodzicielskich ojcostwo Wypisz skojarzenia dotyczące macierzyństwa i ojcostwa. macierzyństwo Wykaz obowiązków rodzicielskich

Bardziej szczegółowo

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego

Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Budowa sztucznych sieci neuronowych do prognozowania. Przykład jednostek uczestnictwa otwartego funduszu inwestycyjnego Dorota Witkowska Szkoła Główna Gospodarstwa Wiejskiego w Warszawie Wprowadzenie Sztuczne

Bardziej szczegółowo

Projekt Sieci neuronowe

Projekt Sieci neuronowe Projekt Sieci neuronowe Chmielecka Katarzyna Gr. 9 IiE 1. Problem i dane Sieć neuronowa miała za zadanie nauczyć się klasyfikować wnioski kredytowe. W projekcie wykorzystano dane pochodzące z 110 wniosków

Bardziej szczegółowo

Spacery losowe generowanie realizacji procesu losowego

Spacery losowe generowanie realizacji procesu losowego Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z

Bardziej szczegółowo

Zmienne zależne i niezależne

Zmienne zależne i niezależne Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }

Bardziej szczegółowo

Porównywanie populacji

Porównywanie populacji 3 Porównywanie populacji 2 Porównywanie populacji Tendencja centralna Jednostki (w grupie) według pewnej zmiennej porównuje się w ten sposób, że dokonuje się komparacji ich wartości, osiągniętych w tej

Bardziej szczegółowo

Czy w poprzednim cyklu wystąpił wzrost temperatury?

Czy w poprzednim cyklu wystąpił wzrost temperatury? W TYPOWYM* CYKLU MIESIĄCZKOWYM DLA KOBIETY, KTÓRA NIE ZNA DŁUGOŚCI CYKLI Z OSTATNIEGO ROKU OD 1. DO 3. kolejno obserwowane NASTĘPNE w poprzednim cyklu wystąpił wzrost temperatury? cykle 7. i następne cykle

Bardziej szczegółowo

Inteligentna analiza danych

Inteligentna analiza danych Numer indeksu 150946 Michał Moroz Imię i nazwisko Numer indeksu 150875 Grzegorz Graczyk Imię i nazwisko kierunek: Informatyka rok akademicki: 2010/2011 Inteligentna analiza danych Ćwiczenie I Wskaźniki

Bardziej szczegółowo

Układ rozrodczy samicy

Układ rozrodczy samicy Układ rozrodczy samicy ESPZiWP układ rozrodczy samicy jajniki, jajowody, macica, pochwa, srom 1 Jajniki Jajniki pełnią funkcje wewnątrzwydzielniczą (hormonalną) i rozrodczą, które są ze sobą ściśle powiązane.

Bardziej szczegółowo

Ustalamy dzień cyklu. Obserwujemy śluz szyjkowy

Ustalamy dzień cyklu. Obserwujemy śluz szyjkowy Ustalamy dzień cyklu Przypomnij sobie, kiedy zaczął się trwający właśnie cykl. W kolumnie, która oznacza pierwszy dzień cyklu wpisz datę, kiedy zaczęła się ostatnia miesiączka. Teraz oblicz dni od początku

Bardziej szczegółowo

Sterowanie wielkością zamówienia w Excelu - cz. 3

Sterowanie wielkością zamówienia w Excelu - cz. 3 Sterowanie wielkością zamówienia w Excelu - cz. 3 21.06.2005 r. 4. Planowanie eksperymentów symulacyjnych Podczas tego etapu ważne jest określenie typu rozkładu badanej charakterystyki. Dzięki tej informacji

Bardziej szczegółowo

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd.

Statystyki: miary opisujące rozkład! np. : średnia, frakcja (procent), odchylenie standardowe, wariancja, mediana itd. Wnioskowanie statystyczne obejmujące metody pozwalające na uogólnianie wyników z próby na nieznane wartości parametrów oraz szacowanie błędów tego uogólnienia. Przewidujemy nieznaną wartości parametru

Bardziej szczegółowo

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania

Prognozowanie i Symulacje. Wykład I. Matematyczne metody prognozowania Prognozowanie i Symulacje. Wykład I. e-mail:e.kozlovski@pollub.pl Spis treści Szeregi czasowe 1 Szeregi czasowe 2 3 Szeregi czasowe Definicja 1 Szereg czasowy jest to proces stochastyczny z czasem dyskretnym

Bardziej szczegółowo

EGZAMIN GIMNAZJALNY 2012 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM. sesja wiosenna

EGZAMIN GIMNAZJALNY 2012 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM. sesja wiosenna EGZAMIN GIMNAZJALNY 2012 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM sesja wiosenna Jaworzno 2012 SPIS TREŚCI 1. WPROWADZENIE... 3 2. WYNIKI SŁUCHACZY GIMNAZJÓW DLA DOROSŁYCH DOTYCZĄCE STANDARDOWYCH

Bardziej szczegółowo

Wykład z Technologii Informacyjnych. Piotr Mika

Wykład z Technologii Informacyjnych. Piotr Mika Wykład z Technologii Informacyjnych Piotr Mika Uniwersalna forma graficznego zapisu algorytmów Schemat blokowy zbiór bloków, powiązanych ze sobą liniami zorientowanymi. Jest to rodzaj grafu, którego węzły

Bardziej szczegółowo

Dlaczego należy uwzględniać zarówno wynik maturalny jak i wskaźnik EWD?

Dlaczego należy uwzględniać zarówno wynik maturalny jak i wskaźnik EWD? EWD co to jest? Metoda EWD to zestaw technik statystycznych pozwalających oszacować wkład szkoły w końcowe wyniki egzaminacyjne. Wkład ten nazywamy właśnie edukacyjną wartością dodaną. EWD jest egzaminacyjnym

Bardziej szczegółowo

Wnioskowanie bayesowskie

Wnioskowanie bayesowskie Wnioskowanie bayesowskie W podejściu klasycznym wnioskowanie statystyczne oparte jest wyłącznie na podstawie pobranej próby losowej. Możemy np. estymować punktowo lub przedziałowo nieznane parametry rozkładów,

Bardziej szczegółowo

Aproksymacja funkcji a regresja symboliczna

Aproksymacja funkcji a regresja symboliczna Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą

Bardziej szczegółowo

Planowanie rodziny zawsze powinno być poddane Bogu. Jest to współpraca z Panem Bogiem w poczęciu dziecka.

Planowanie rodziny zawsze powinno być poddane Bogu. Jest to współpraca z Panem Bogiem w poczęciu dziecka. Odpowiedzialne rodzicielstwo odnosi się do sfer przekazywania życia. Planowanie rodziny zawsze powinno być poddane Bogu. Jest to współpraca z Panem Bogiem w poczęciu dziecka. W Humane Vitae Paweł VI pisze

Bardziej szczegółowo

166 Wstęp do statystyki matematycznej

166 Wstęp do statystyki matematycznej 166 Wstęp do statystyki matematycznej Etap trzeci realizacji procesu analizy danych statystycznych w zasadzie powinien rozwiązać nasz zasadniczy problem związany z identyfikacją cechy populacji generalnej

Bardziej szczegółowo

AiSD zadanie trzecie

AiSD zadanie trzecie AiSD zadanie trzecie Gliwiński Jarosław Marek Kruczyński Konrad Marek Grupa dziekańska I5 5 czerwca 2008 1 Wstęp Celem postawionym przez zadanie trzecie było tzw. sortowanie topologiczne. Jest to typ sortowania

Bardziej szczegółowo

Jakie są objawy zespołu policystycznych jajników?

Jakie są objawy zespołu policystycznych jajników? 3 Jakie są objawy zespołu policystycznych jajników? Najważniejsze punkty zu kobiet występuje różne nasilenie objawów; u niektórych objawy mogą być ciężkie, u innych nieznaczne. zobjawami zespołu PCOS mogą

Bardziej szczegółowo

Rekomendacje dotyczące diagnostyki i leczenia niepłodności

Rekomendacje dotyczące diagnostyki i leczenia niepłodności Rekomendacje dotyczące diagnostyki i leczenia niepłodności Polskie Towarzystwo Ginekologiczne Polskie Towarzystwo Medycyny Rozrodu 2012 Polskie Towarzystwo Ginekologiczne i Polskie Towarzystwo Medycyny

Bardziej szczegółowo

Testy nieparametryczne

Testy nieparametryczne Testy nieparametryczne Testy nieparametryczne możemy stosować, gdy nie są spełnione założenia wymagane dla testów parametrycznych. Stosujemy je również, gdy dane można uporządkować według określonych kryteriów

Bardziej szczegółowo

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka Modelowanie jako sposób opisu rzeczywistości Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka 2015 Wprowadzenie: Modelowanie i symulacja PROBLEM: Podstawowy problem z opisem otaczającej

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

Analiza współzależności zjawisk

Analiza współzależności zjawisk Analiza współzależności zjawisk Informacje ogólne Jednostki tworzące zbiorowość statystyczną charakteryzowane są zazwyczaj za pomocą wielu cech zmiennych, które nierzadko pozostają ze sobą w pewnym związku.

Bardziej szczegółowo

STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne.

STRESZCZENIE. rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne. STRESZCZENIE rozprawy doktorskiej pt. Zmienne jakościowe w procesie wyceny wartości rynkowej nieruchomości. Ujęcie statystyczne. Zasadniczym czynnikiem stanowiącym motywację dla podjętych w pracy rozważań

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change

Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change Raport 4/2015 Optymalizacja parametrów w strategiach inwestycyjnych dla event-driven tradingu dla odczytu Australia Employment Change autor: Michał Osmoła INIME Instytut nauk informatycznych i matematycznych

Bardziej szczegółowo

Etapy modelowania ekonometrycznego

Etapy modelowania ekonometrycznego Etapy modelowania ekonometrycznego jest podstawowym narzędziem badawczym, jakim posługuje się ekonometria. Stanowi on matematyczno-statystyczną formę zapisu prawidłowości statystycznej w zakresie rozkładu,

Bardziej szczegółowo

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.

w analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych. Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą

Bardziej szczegółowo

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć)

Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) Szczegółowy program kursu Statystyka z programem Excel (30 godzin lekcyjnych zajęć) 1. Populacja generalna a losowa próba, parametr rozkładu cechy a jego ocena z losowej próby, miary opisu statystycznego

Bardziej szczegółowo

OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) Algorytmy i Struktury Danych PIŁA

OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) Algorytmy i Struktury Danych PIŁA OSTASZEWSKI Paweł (55566) PAWLICKI Piotr (55567) 16.01.2003 Algorytmy i Struktury Danych PIŁA ALGORYTMY ZACHŁANNE czas [ms] Porównanie Algorytmów Rozwiązyjących problem TSP 100 000 000 000,000 10 000 000

Bardziej szczegółowo

Po co w ogóle prognozujemy?

Po co w ogóle prognozujemy? Po co w ogóle prognozujemy? Pojęcie prognozy: racjonalne, naukowe przewidywanie przyszłych zdarzeń stwierdzenie odnoszącym się do określonej przyszłości formułowanym z wykorzystaniem metod naukowym, weryfikowalnym

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Wykład 5: Statystyki opisowe (część 2)

Wykład 5: Statystyki opisowe (część 2) Wykład 5: Statystyki opisowe (część 2) Wprowadzenie Na poprzednim wykładzie wprowadzone zostały statystyki opisowe nazywane miarami położenia (średnia, mediana, kwartyle, minimum i maksimum, modalna oraz

Bardziej szczegółowo

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów:

W kolejnym kroku należy ustalić liczbę przedziałów k. W tym celu należy wykorzystać jeden ze wzorów: Na dzisiejszym wykładzie omówimy najważniejsze charakterystyki liczbowe występujące w statystyce opisowej. Poszczególne wzory będziemy podawać w miarę potrzeby w trzech postaciach: dla szeregu szczegółowego,

Bardziej szczegółowo

Recenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność biznesu a dokonania przedsiębiorstwa

Recenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność biznesu a dokonania przedsiębiorstwa Prof. dr hab. Edward Nowak Uniwersytet Ekonomiczny we Wrocławiu Katedra Rachunku Kosztów, Rachunkowości Zarządczej i Controllingu Recenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność

Bardziej szczegółowo

PRZEDMIOTOWY SYSTEM OCENIANIA GEOGRAFIA 2017/2018

PRZEDMIOTOWY SYSTEM OCENIANIA GEOGRAFIA 2017/2018 PRZEDMIOTOWY SYSTEM OCENIANIA GEOGRAFIA 2017/2018 Wiesława Polanin Przedmiotowy System Oceniania /geografia / PSO polega na rozpoznaniu przez nauczyciela poziomu postępów w opanowywaniu przez ucznia wiadomości

Bardziej szczegółowo

OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI

OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI Autoreferat do rozprawy doktorskiej OPTYMALIZACJA HARMONOGRAMOWANIA MONTAŻU SAMOCHODÓW Z ZASTOSOWANIEM PROGRAMOWANIA W LOGICE Z OGRANICZENIAMI Michał Mazur Gliwice 2016 1 2 Montaż samochodów na linii w

Bardziej szczegółowo

Dopasowywanie modelu do danych

Dopasowywanie modelu do danych Tematyka wykładu dopasowanie modelu trendu do danych; wybrane rodzaje modeli trendu i ich właściwości; dopasowanie modeli do danych za pomocą narzędzi wykresów liniowych (wykresów rozrzutu) programu STATISTICA;

Bardziej szczegółowo

Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny

Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny Analiza sezonowości Wiele zjawisk charakteryzuje się nie tylko trendem i wahaniami przypadkowymi, lecz także pewną sezonowością. Występowanie wahań sezonowych może mieć charakter kwartalny, miesięczny,

Bardziej szczegółowo

Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY.

Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY. Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY. 1. Cel ćwiczenia Celem ćwiczenia jest zapoznanie się z przykładowym systemem ekspertowym napisanym w JESS. Studenci poznają strukturę systemu ekspertowego,

Bardziej szczegółowo

ROC Rate of Charge. gdzie ROC wskaźnik szybkości zmiany w okresie n, x n - cena akcji na n-tej sesji,

ROC Rate of Charge. gdzie ROC wskaźnik szybkości zmiany w okresie n, x n - cena akcji na n-tej sesji, ROC Rate of Charge Analityk techniczny, który w swej analizie opierałby się wyłącznie na wykresach uzyskiwałby obraz możliwości inwestycyjnych obarczony sporym ryzykiem. Wnioskowanie z wykresów bazuje

Bardziej szczegółowo

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji

Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki

Bardziej szczegółowo

Przykładowe sprawozdanie. Jan Pustelnik

Przykładowe sprawozdanie. Jan Pustelnik Przykładowe sprawozdanie Jan Pustelnik 30 marca 2007 Rozdział 1 Sformułowanie problemu Tematem pracy jest porównanie wydajności trzech tradycyjnych metod sortowania: InsertionSort, SelectionSort i BubbleSort.

Bardziej szczegółowo

Podstawy Sztucznej Inteligencji (PSZT)

Podstawy Sztucznej Inteligencji (PSZT) Podstawy Sztucznej Inteligencji (PSZT) Paweł Wawrzyński Uczenie maszynowe Sztuczne sieci neuronowe Plan na dziś Uczenie maszynowe Problem aproksymacji funkcji Sieci neuronowe PSZT, zima 2013, wykład 12

Bardziej szczegółowo

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie

Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie Teoretyczne podstawy analizy indeksowej klasyfikacja indeksów, konstrukcja, zastosowanie Szkolenie dla pracowników Urzędu Statystycznego nt. Wybrane metody statystyczne w analizach makroekonomicznych dr

Bardziej szczegółowo

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com

PDF created with FinePrint pdffactory Pro trial version http://www.fineprint.com Analiza korelacji i regresji KORELACJA zależność liniowa Obserwujemy parę cech ilościowych (X,Y). Doświadczenie jest tak pomyślane, aby obserwowane pary cech X i Y (tzn i ta para x i i y i dla różnych

Bardziej szczegółowo

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań

Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Algorytm indukcji klasyfikatora za pomocą EA z automatycznym przełączaniem ukierunkowań Anna Manerowska, Michal Kozakiewicz 2.12.2009 1 Wstęp Jako projekt na przedmiot MEUM (Metody Ewolucyjne Uczenia Maszyn)

Bardziej szczegółowo

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych:

W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: W rachunku prawdopodobieństwa wyróżniamy dwie zasadnicze grupy rozkładów zmiennych losowych: Zmienne losowe skokowe (dyskretne) przyjmujące co najwyżej przeliczalnie wiele wartości Zmienne losowe ciągłe

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory

Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Statystyka i opracowanie danych Podstawy wnioskowania statystycznego. Prawo wielkich liczb. Centralne twierdzenie graniczne. Estymacja i estymatory Dr Anna ADRIAN Paw B5, pok 407 adrian@tempus.metal.agh.edu.pl

Bardziej szczegółowo

Systemy uczące się Lab 4

Systemy uczące się Lab 4 Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego

Bardziej szczegółowo

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno WSTĘP DO REGRESJI LOGISTYCZNEJ Dr Wioleta Drobik-Czwarno REGRESJA LOGISTYCZNA Zmienna zależna jest zmienną dychotomiczną (dwustanową) przyjmuje dwie wartości, najczęściej 0 i 1 Zmienną zależną może być:

Bardziej szczegółowo

Zastosowanie rozmytych map kognitywnych do badania scenariuszy rozwoju jednostek naukowo-dydaktycznych

Zastosowanie rozmytych map kognitywnych do badania scenariuszy rozwoju jednostek naukowo-dydaktycznych Konferencja Systemy Czasu Rzeczywistego 2012 Kraków, 10-12 września 2012 Zastosowanie rozmytych map kognitywnych do badania scenariuszy rozwoju jednostek naukowo-dydaktycznych Piotr Szwed AGH University

Bardziej szczegółowo

MODELOWANIE STANÓW CZYNNOŚCIOWYCH W JĘZYKU SIECI BAYESOWSKICH

MODELOWANIE STANÓW CZYNNOŚCIOWYCH W JĘZYKU SIECI BAYESOWSKICH Inżynieria Rolnicza 7(105)/2008 MODELOWANIE STANÓW CZYNNOŚCIOWYCH W JĘZYKU SIECI BAYESOWSKICH Katedra Podstaw Techniki, Uniwersytet Przyrodniczy w Lublinie Streszczenie. Zastosowanie sieci bayesowskiej

Bardziej szczegółowo

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 12. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 12 Mikołaj Czajkowski Wiktor Budziński Dane panelowe Co jeśli mamy do dyspozycji dane panelowe? Kilka obserwacji od tych samych respondentów, w różnych punktach czasu (np. ankieta realizowana

Bardziej szczegółowo

RAPORT EDUKACYJNA WARTOŚĆ DODANA

RAPORT EDUKACYJNA WARTOŚĆ DODANA RAPORT EDUKACYJNA WARTOŚĆ DODANA rok 2013 w Gimnazjum Katolickim Zespół Szkół Świętego Jana Bosko Opracowały: Marlena Kowalska, Katarzyna Harlejczyk Wykresy wygenerowano w programie Kalkulator EWD 100

Bardziej szczegółowo

Wstęp do Techniki Cyfrowej... Teoria automatów

Wstęp do Techniki Cyfrowej... Teoria automatów Wstęp do Techniki Cyfrowej... Teoria automatów Alfabety i litery Układ logiczny opisywany jest przez wektory, których wartości reprezentowane są przez ciągi kombinacji zerojedynkowych. Zwiększenie stopnia

Bardziej szczegółowo

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński

Mikroekonometria 5. Mikołaj Czajkowski Wiktor Budziński Mikroekonometria 5 Mikołaj Czajkowski Wiktor Budziński Zadanie 1. Wykorzystując dane me.medexp3.dta przygotuj model regresji kwantylowej 1. Przygotuj model regresji kwantylowej w którym logarytm wydatków

Bardziej szczegółowo

1 Proces zapłodnienia 15 Kobiecy cykl miesiączkowy 15 Spermatogeneza 20 Zapłodnienie 22. Kiedy należy zwrócić się o pomoc do lekarza?

1 Proces zapłodnienia 15 Kobiecy cykl miesiączkowy 15 Spermatogeneza 20 Zapłodnienie 22. Kiedy należy zwrócić się o pomoc do lekarza? SPIS TREŚCI Wstęp 10 1 Proces zapłodnienia 15 Kobiecy cykl miesiączkowy 15 Spermatogeneza 20 Zapłodnienie 22 Zagnieżdżenie 23 Prawdopodobieństwo zajścia w ciążę 23 Kiedy należy zwrócić się o pomoc do lekarza?

Bardziej szczegółowo

Regresja linearyzowalna

Regresja linearyzowalna 1 z 5 2007-05-09 23:22 Medycyna Praktyczna - portal dla lekarzy Regresja linearyzowalna mgr Andrzej Stanisz z Zakładu Biostatystyki i Informatyki Medycznej Collegium Medicum UJ w Krakowie Data utworzenia:

Bardziej szczegółowo

Statystyka. Wykład 13. Magdalena Alama-Bućko. 12 czerwca Magdalena Alama-Bućko Statystyka 12 czerwca / 30

Statystyka. Wykład 13. Magdalena Alama-Bućko. 12 czerwca Magdalena Alama-Bućko Statystyka 12 czerwca / 30 Statystyka Wykład 13 Magdalena Alama-Bućko 12 czerwca 2017 Magdalena Alama-Bućko Statystyka 12 czerwca 2017 1 / 30 Co wpływa na zmiany wartości danej cechy w czasie? W najbardziej ogólnym przypadku, na

Bardziej szczegółowo

Zastosowanie symulacji Monte Carlo do zarządzania ryzykiem przedsięwzięcia z wykorzystaniem metod sieciowych PERT i CPM

Zastosowanie symulacji Monte Carlo do zarządzania ryzykiem przedsięwzięcia z wykorzystaniem metod sieciowych PERT i CPM SZKOŁA GŁÓWNA HANDLOWA w Warszawie STUDIUM MAGISTERSKIE Kierunek: Metody ilościowe w ekonomii i systemy informacyjne Karol Walędzik Nr albumu: 26353 Zastosowanie symulacji Monte Carlo do zarządzania ryzykiem

Bardziej szczegółowo

Wprowadzenie do analizy korelacji i regresji

Wprowadzenie do analizy korelacji i regresji Statystyka dla jakości produktów i usług Six sigma i inne strategie Wprowadzenie do analizy korelacji i regresji StatSoft Polska Wybrane zagadnienia analizy korelacji Przy analizie zjawisk i procesów stanowiących

Bardziej szczegółowo

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1.

Zadania ze statystyki cz. 8 I rok socjologii. Zadanie 1. Zadania ze statystyki cz. 8 I rok socjologii Zadanie 1. W potocznej opinii pokutuje przekonanie, że lepsi z matematyki są chłopcy niż dziewczęta. Chcąc zweryfikować tę opinię, przeprowadzono badanie w

Bardziej szczegółowo

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16

Spis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16 Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego

Bardziej szczegółowo

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO

SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO SCHEMAT ROZWIĄZANIA ZADANIA OPTYMALIZACJI PRZY POMOCY ALGORYTMU GENETYCZNEGO. Rzeczywistość (istniejąca lub projektowana).. Model fizyczny. 3. Model matematyczny (optymalizacyjny): a. Zmienne projektowania

Bardziej szczegółowo

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Paweł Szołtysek 12 czerwca 2008 Streszczenie Planowanie produkcji jest jednym z problemów optymalizacji dyskretnej,

Bardziej szczegółowo

Sieci neuronowe - dokumentacja projektu

Sieci neuronowe - dokumentacja projektu Sieci neuronowe - dokumentacja projektu Predykcja finansowa, modelowanie wskaźnika kursu spółki KGHM. Piotr Jakubas Artur Kosztyła Marcin Krzych Kraków 2009 1. Sieci neuronowe - dokumentacja projektu...

Bardziej szczegółowo

Porównanie opłacalności kredytu w PLN i kredytu denominowanego w EUR Przykładowa analiza

Porównanie opłacalności kredytu w PLN i kredytu denominowanego w EUR Przykładowa analiza Porównanie opłacalności kredytu w PLN i kredytu denominowanego w EUR Przykładowa analiza Opracowanie: kwiecień 2016r. www.strattek.pl strona 1 Spis 1. Parametry kredytu w PLN 2 2. Parametry kredytu denominowanego

Bardziej szczegółowo

Maciej Piotr Jankowski

Maciej Piotr Jankowski Reduced Adder Graph Implementacja algorytmu RAG Maciej Piotr Jankowski 2005.12.22 Maciej Piotr Jankowski 1 Plan prezentacji 1. Wstęp 2. Implementacja 3. Usprawnienia optymalizacyjne 3.1. Tablica ekspansji

Bardziej szczegółowo

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska. SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia

Bardziej szczegółowo

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów

Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów Eksploracja danych Piotr Lipiński Informacje ogólne Informacje i materiały dotyczące wykładu będą publikowane na stronie internetowej wykładowcy, m.in. prezentacje z wykładów UWAGA: prezentacja to nie

Bardziej szczegółowo

EGZAMIN GIMNAZJALNY 2011 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM. sesja wiosenna

EGZAMIN GIMNAZJALNY 2011 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM. sesja wiosenna EGZAMIN GIMNAZJALNY 2011 W SZKOŁACH DLA DOROSŁYCH W WOJEWÓDZTWIE ŚLĄSKIM sesja wiosenna Jaworzno 2011 SPIS TREŚCI 1. WPROWADZENIE... 3 2. OGÓLNE WYNIKI UZYSKANE PRZEZ SŁUCHACZY GIMNAZJÓW DLA DOROSŁYCH

Bardziej szczegółowo

Wykład 4: Statystyki opisowe (część 1)

Wykład 4: Statystyki opisowe (część 1) Wykład 4: Statystyki opisowe (część 1) Wprowadzenie W przypadku danych mających charakter liczbowy do ich charakterystyki można wykorzystać tak zwane STATYSTYKI OPISOWE. Za pomocą statystyk opisowych można

Bardziej szczegółowo

Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami

Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami Równoległy algorytm wyznaczania bloków dla cyklicznego problemu przepływowego z przezbrojeniami dr inż. Mariusz Uchroński Wrocławskie Centrum Sieciowo-Superkomputerowe Agenda Cykliczny problem przepływowy

Bardziej szczegółowo

Grupa SuperTaniaApteka.pl Utworzono : 17 wrzesień 2016

Grupa SuperTaniaApteka.pl Utworzono : 17 wrzesień 2016 TESTY CIĄŻOWE I DIAGNOSTYCZNE > Model : 9042596 Producent : HYDREX PRZED.TECH.HANDL. Owulacja (jajeczkowanie) jest to proces, w którym dochodzi do uwolnienia z jajnika kobiety dojrzałej komórki jajowej

Bardziej szczegółowo

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012 ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2012 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.

Bardziej szczegółowo

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013

ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013 ANALIZA WYNIKÓW NAUCZANIA W GIMNAZJUM NR 3 Z ZASTOSOWANIEM KALKULATORA EWD 100 ROK 2013 OPRACOWAŁY: ANNA ANWAJLER MARZENA KACZOR DOROTA LIS 1 WSTĘP W analizie wykorzystywany będzie model szacowania EWD.

Bardziej szczegółowo

Optymalizacja ciągła

Optymalizacja ciągła Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej

Bardziej szczegółowo

Na poprzednim wykładzie omówiliśmy podstawowe zagadnienia. związane z badaniem dynami zjawisk. Dzisiaj dokładniej zagłębimy

Na poprzednim wykładzie omówiliśmy podstawowe zagadnienia. związane z badaniem dynami zjawisk. Dzisiaj dokładniej zagłębimy Analiza dynami zjawisk Na poprzednim wykładzie omówiliśmy podstawowe zagadnienia związane z badaniem dynami zjawisk. Dzisiaj dokładniej zagłębimy się w tej tematyce. Indywidualne indeksy dynamiki Indywidualne

Bardziej szczegółowo

mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych.

mgr inż. Magdalena Deckert Poznań, r. Metody przyrostowego uczenia się ze strumieni danych. mgr inż. Magdalena Deckert Poznań, 30.11.2010r. Metody przyrostowego uczenia się ze strumieni danych. Plan prezentacji Wstęp Concept drift i typy zmian Algorytmy przyrostowego uczenia się ze strumieni

Bardziej szczegółowo

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,

Klasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L, Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której

Bardziej szczegółowo

Prognozowanie popytu. mgr inż. Michał Adamczak

Prognozowanie popytu. mgr inż. Michał Adamczak Prognozowanie popytu mgr inż. Michał Adamczak Plan prezentacji 1. Definicja prognozy 2. Klasyfikacja prognoz 3. Szereg czasowy 4. Metody prognozowania 4.1. Model naiwny 4.2. Modele średniej arytmetycznej

Bardziej szczegółowo

Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006

Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006 Modele dynamiczne Paweł Cibis pcibis@o2.pl 27 kwietnia 2006 1 Wyodrębnianie tendencji rozwojowej 2 Etap I Wyodrębnienie tendencji rozwojowej Etap II Uwolnienie wyrazów szeregu empirycznego od trendu Etap

Bardziej szczegółowo

ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY

ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY ANALIZA JAKOŚCIOWA I ILOŚCIOWA TESTÓW SZKOLNYCH MATERIAŁ SZKOLENIOWY Instrukcja przeprowadzania analiz badań edukacyjnych i sporządzania raportów po badaniach. Cele prowadzenia analiz jakościowych i ilościowych

Bardziej szczegółowo

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Summary in Polish Fatimah Mohammed Furaiji Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Zastosowanie symulacji wieloagentowej w modelowaniu zachowania konsumentów Streszczenie

Bardziej szczegółowo

Elementy modelowania matematycznego

Elementy modelowania matematycznego Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski

Bardziej szczegółowo

Algorytmy stochastyczne, wykład 08 Sieci bayesowskie

Algorytmy stochastyczne, wykład 08 Sieci bayesowskie Algorytmy stochastyczne, wykład 08 Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2014-04-10 Prawdopodobieństwo Prawdopodobieństwo Prawdopodobieństwo warunkowe Zmienne

Bardziej szczegółowo

Oscylator Stochastyczny (Stochastic)

Oscylator Stochastyczny (Stochastic) Oscylator Stochastyczny (Stochastic) Wielu traderów stosuje strategie gry z trendem, jesteśmy przekonani, że można poprawić regularność, z jaką nasz system będzie przynosił zyski, stosując wskaźniki sprawdzające

Bardziej szczegółowo

RozmnaŜanie się i rozwój człowieka

RozmnaŜanie się i rozwój człowieka RozmnaŜanie się i rozwój człowieka 1. Zaznacz definicję rozwoju osobniczego. A. Proces prowadzący do uzyskania przez organizm energii. B. Usuwanie z organizmu zbędnych produktów przemiany materii. C. Zmiany

Bardziej szczegółowo

Budowa. Metoda wytwarzania

Budowa. Metoda wytwarzania Budowa Tranzystor JFET (zwany też PNFET) zbudowany jest z płytki z jednego typu półprzewodnika (p lub n), która stanowi tzw. kanał. Na jego końcach znajdują się styki źródła (ang. source - S) i drenu (ang.

Bardziej szczegółowo

3. Modele tendencji czasowej w prognozowaniu

3. Modele tendencji czasowej w prognozowaniu II Modele tendencji czasowej w prognozowaniu 1 Składniki szeregu czasowego W teorii szeregów czasowych wyróżnia się zwykle następujące składowe szeregu czasowego: a) składowa systematyczna; b) składowa

Bardziej szczegółowo