Autoreferat rozprawy doktorskiej Graficzne modele probabilistyczne zmieniajace się w czasie na przykładzie cyklu miesięcznego kobiety Anna Łupińska Dubicka Rozprawa doktorska została przygotowana pod kierunkiem Mareka J. DRUŻDŻELA Wydział Informatyki, Politechnika Białostocka, Białystok Białystok 2014
Wprowadzenie Kontekst i motywacja pracy Cytując Benjamina Franklina "... na tym świecie pewne są tylko śmierć i podatki", możemy pokusić się o stwierdzenie, że niepewność jest nieodłącznym składnikiem naszej wiedzy o otaczającym świecie. Tą wiedzę możemy modelować przy użyciu łącznego rozkładu prawdopodobieństwa zmiennych losowych opisujących zjawiska nas otaczające. Jednakże, z reguły takie podejście jest niewykonalne. Jako, że łączny rozkłąd prawdopodobieństwa specyfikuje prawdopodobieństwa wszystkich możliwych kombinacji stanów każdej zmiennej, wyznaczenie tych wartości stanowi problem zarówno obliczeniowy, jak i praktyczny. Liczba wartości, które musimy obliczyć rośnie wykładniczo wraz ze wzrostem liczby zmiennych. Probabilistyczne modele graficzne takie jak sieci Bayesowskie (zwane również sieciami przekonań lub sieciami przyczynowo skutkowymi) [20] pozwalają na zwartą reprezentację łącznego rozkładu prawdopodobieństwa, a co za tym idzie na spójną oraz przejrzystą reprezentację wiedzy niepewnej. Ich budowa opiera się na skierowanych grafach acyklicznych, w których wierzchołki odpowiadają modelowanym zmiennym losowym, a krawędzie bezpośrednim zależnościom przyczynowym między nimi. Interakcje pomiędzy sąsiadującymi zmiennymi są wyrażone poprzez rozkłady prawdopodobieństwa warunkowego. Zaletą sieci Bayesowskich jest możliwość reprezentowania zależności przyczynowych, a także łatwość szacowania poszczególnych rozkładów warunkowych. Sieci Bayesowskie są potężnym i efektywnym narzędziem modelowania systemu w stanie równowagi. Jednakże otaczający na świat jest dynamiczny a modelowane zjawiska często przedstawiane są w postaci szeregu czasowego. Użycie sieci Bayesowskich skutkowałoby utratą informacji o zależnościach pomiędzy kolejnymi krokami eksperymentu. Rozwiązanie stanowią dynamiczne sieci Bayesowskie [5]. Są one rozszerzeniem sieci Bayesowskich o aspekt czasowy. W grafie pojawiają się kolejne krawędzie pomiędzy zmiennymi reprezentujące stan tych zmiennych w poszczególnych krokach czasowym. W najczęściej stosowanym podejściu do modeli dynamicznych bierze się pod uwagę tylko zależności między dwoma sąsiednimi krokami czasowymi. Spowodowane jest to najprawdopodobniej brakiem odpowiednich narzędzi, zdolnych radzić sobie z zależnościami wyższych rzędów. W większości przypadków uwzględnienie zależności jedynie pierwszego rzędu jest zapewne wystarczające. Jednakże istnieje możliwość, że część zjawisk mogłaby 1
być modelowana z wyższą skutecznością, gdyby wziąć również pod uwagę wpływ stanów wcześniejszych niż tylko bezpośrednio poprzedzający na bieżący stan modelu. Prawdopodobne jest, iż upraszczanie modeli systemów dynamicznych do zależności jedynie pierwszego rzędu prowadzi do uzyskania niepełnych a nawet błędnych wyników. Przykładem lepszej efektywności modeli dynamicznych wyższego rzędu może być wykorzystanie łańcuchów Markowa do generowania tekstu w języku angielskim. Im wyższy rząd, tym bardziej wytworzony tekst przypomina język naturalny [2]. śaade ve mw hc n entt da k eethetocusosselalwo gx fgrsnoh,tvettaf aetnlbilo fc lhd okleutsndyeosthtbogo eet ib nheaoopefni ngent" W powyższym tekście kolejne litery były generowane w sposób zupełnie losowy. Zachowano jedynie założenie, że rozmaite litery występują w języku z różnym prawdopodobieństwem. Jednakże, jeżeli przyjrzymy się poszczególnym wyrazom dowolnego języka, to zauważymy, że poszczególne litery bardzo często występują w pewnym kontekście. W przypadku języka angielskiego, po literze Q, z wszelkim prawdopodobieństwem następną będzie litera U. Przykładowy tekst wygenerowany przy użyciu łańcucha pierwszego rzędu, w którym wybór każdej litery jest losową funkcją jej poprzednika: "t I amy, vin. id wht omanly heay atuss n macon aresethe hired boutwhe t, tl, ad torurest t plur I wit hengamind tarer-plarody thishand" Idąc krok dalej zauważamy, że po digramie TH w języku angielskim często występują samogłoski A, E, I, O lub U, nieco rzadziej spółgłoski R lub W i dość rzadko pozostałe litery. W poniższym fragmencie tekstu użyto łańcucha Markowa drugiego rzędu: "Ther I the heingoind of-pleat, blur it dwere wing waske hat throos. Yout lar on wassing, an sit". "Yould,I that vide was nots ther." A tak może wygląć przykładowy tekst, jeżeli użyjemy modelu czwartego rzędu. Jak widzimy, większość wygenerowanych słów to istniejące słowa angielskie: "His heard.» «Exactly he very glad trouble, and by Hopkins! That it on of the who difficentralia. He rushed likely?» «Blood night that." Jak widaäğ, podobieństwo tego ostatniego zdania do zwykłego angielskiego tekstu, nieformalnej miary dokładności modelu, wzrosło znacznie między modelami pierwszego a czwartego rzędu. 2
Teza Głównym celem niniejszej rozprawy doktorskiej jest zastosowanie modeli opartych na dynamicznych sieciach Bayesowskich do problemu monitorowania cyklu miesięcznego. Wyznaczenie dnia owulacji, a co za tym idzie dni płodnych cyklu, jest zadaniem skomplikowanym, głównie z uwagi na długość cyklu miesięcznego, która jest cechą typowo osobniczą, zależną od kobiety i, w większości przypadków, nie ma stałej wartości. Analogicznie, w każdym cyklu liczba dni przypadających na każdą fazę może być inna. Postawiona w rozprawie teza mówi, że: rozszerzenie modeli dynamicznych o wpływy czasowe wyższych rzędów może znaczaco poprawić ich dokładność. Zadania 1. Zaproponowanie i implementacja zbioru modeli opartych na dynamicznych sieciach Bayesowskich modelujących cykl miesięczny kobiety oraz zbadanie wpływu rzędu modelu na jakość prognozowania. 2. Rozwiązanie problemu danych brakujących przy uczeniu parametrów numerycznych modelu oraz porównanie metod. 3. Analiza zagadnienia uczenia ze zbiorów danych, gdzie liczba rekordów jest niewielka. 4. Empiryczne porównanie zaproponowanych modeli do 11 istniejących metod wyznaczania okresu płodnego podczas cyklu miesięcznego. Struktura pracy Rozprawa doktorska może być podzielona na dwie części. Część pierwsza dostarcza teoretycznych podstaw używanych w całej pracy. Zawiera teoretyczny opis graficznych modeli probabilistycznych ze szczególnych uwzględnieniem sieci Bayesowskich, a następnie opisuje szereg metod służących do modelowania systemów zmieniających się w czasie koncentrując się na dynamicznych sieciach Bayesowskich. Stanowi również wprowadzenie do zagadnienia cyklu miesięcznego kobiety. Część druga rozprawy przestawia wyniki zastosowania modeli opartych na dynamicznych sieciach Bayesowskich do problemu modelowania cyklu miesięcznego. Rozdział czwarty przestawia proponowane modele oraz wyniki wprowadzenia zależności czasowych wyższych rzędów. Rozdział a także opisuje zastosowane techniki radzenia z danymi brakującymi. Rozdział szósty koncentruje się na budowaniu części numerycznej sieci Bayesowskich. Rozdział 3
siódmy przedstawia rezultaty zastosowania jednego z interakcyjnych modeli kanonicznych, bramek SL. Rozdział ósmy pokazuje wyniki empirycznego porównania proponowaych modeli opartych na dynamicznych sieciach Bayesowkich do istniejących metod wyznaczania okresu płodnego w trakcie trwania cyklu miesięcznego. Całość rozprawy zamyka rozdział zawierający podsumowanie, wnioski oraz możliwe kierunki dalszych badań. Systemy zmieniajace się w czasie Więszość procesów fizjologicznych występujących w organizmie człowieka, podobnie jak wiele zjawisk w przyrodzie czy też procesów technologicznych ma charakater dynamiczny. Wartości poszczególnych zmiennych obserwowane są w kolejnych momentach czasu. Co za tym idzie, modelowane zjawisko przedstawione jest w postaci szeregu czasowego. Dodatkowo, na analizowane zjawisko mają wpływ nie tylko bieżące obserwacje, ale również obserwacje pochodzące z poprzednich okresów. W takim przypadku stosowanie modeli statycznych jest niewystarczające i z pewnością prowadzić będzie do uzyskania nieprawidłowych wyników. Do przedstawiania i analizowania zjawisk zmieniających się w czasie używamy modeli dynamicznych, które pozwalają na uwzględnienie zależności pomiędzy wartościami zamiennych modelu w poszczególnych momentach czasu. Modele dynamiczne znalazły szerokie zastosowanie w wielu dziedzinach nauki. Już w roku 1969 Ragnar Anton Kittil Frisch wraz z Janem Tinbergenem otrzymali Nagrodę Nobla za opracowanie i zastosowanie modeli dynamicznych do analizy procesów gospodarczych. Dynamiczne sieci Bayesowskie Sieci bayesowskie (ang. Bayesian networks, BNs) [20], zwane również probabilistycznymi modelami graficznymi, sieciami przekonań lub sieciami przyczynowo skutkowymi, są popularnym narzędziem do reprezentacji wiedzy w warunkach niepewności. Dynamiczne sieci Bayesowskie (ang. dynamic Bayesian networks, DBNs) [5] są ich rozszerzeniem służącym do reprezentacji probabilistycznych modeli dla procesów stochastycznych. Podczas gdy sieć Bayesowska przedstawia łączny rozkład prawdopodobieństwa dla zestawu zmiennych losowych systemu w stanie równowagi, dynamiczna sieć Bayesowska może być postrzegana jako wielowymiarowa reprezentacja tego systemu. DBN umożliwia interpretację teraźniejszości, rekonstrukcję przeszłości oraz przewidywanie przyszłości. Zjawiska umiejscowione są w 4
czasie w posób uporządkowany relacją "wcześniej i później". Głównie ze względu na złożoność obliczeniową algorytmów wnioskowania, czas jest traktowany jako zmienna dyskretna. Należy zauważyć, że określenie "dynamiczneóznacza, że modelujemy rozwój systemu w czasie, a nie, że struktura modelu lub jego parametry zmieniają się w czasie, nawet jeśli to ostatnie jest teoretycznie możliwe. Dynamiczna sieć Bayesowska jest skierowanym, acyklicznym modelem procesu stochastycznego. Sieć podzielna jest na segmenty, z których każdy posiada własne węzły, krawędzie i rozkłady prawdopodobieństw. Pojedyńczy segment możemy traktować jako zrzut stanu procesu w danym momencie czasu, a dynamiczną sieć Bayesowską jako sekwencję podmodeli reprezentujących stan systemu w konkretnych punktach czasu. Segmenty połączone są ze sobą krawędziami przedstawiającymi zależność czasową pomiędzy zmiennymi systemu z różnych punktach czasu. Zazwyczaj zakłada się, że DBN spełnia własność Markowa, tzn., że stan systemu w następnym kroku czasowym zależyt tylko od jego bieżącego stanu niezależnie od przeszlości. Taka sieć nazywana jest siecią pierwszego rzędu. Z matematycznego punktu widzenia stan systemu w czasie t jest reprezentowany przez zbiór zmiennych losowych Z t = (U t, X t, Y t ), gdzie U oznacza zmienne wejściowe modelu, X zmienne ukryte a Y zmienne wyjściowe. Rozkład przejścia pomiędzy poszczególnymi krokami czasowymi wyrażony jest wzorem [5]: P (Z t Z t 1 ) = n P (Zi t P a(zi t )), i=1 where Zi t is the i th node at time t. P a(zi t ) are the parents of Zi t from the same or from the previous time slice. Łączny rozkład prawdopodobieństwa sieci o T segmentach możemy uzyskać poprzez proces zwany rozwinięciem sieci: P (Z 1:T ) = T n P (Zi t P a(zi t )). t=1 i=1 Jak wspomniano wcześniej, zazwyczaj zakłada się, że stan systemu w czasie t zależy jest tylko od poprzednich k = 1 stanów. Jednakże z teoretycznego punktu widzenia nic nie stoi na przeszkodzie, by k przyjmowało dowolną wartość z przedziału 1, t k. W większości przypadków, uwzględnianie tylko stanu systemu bezpośrednio poprzedzającego stan bieżący jest wystarczające. Jednakże, możliwe jest, że istnieją zjawiska, które moglibyśmy modelować z większą dokładnością jeśli tylko uwzględnilibyśmy stan systemu w odleglejszych momentach 5
czasu. Takie podejście jest rzadkie w literaturze, głównie z powodu braku zarówno algorytmów jak i narzędzi praktycznych. Dla procesu o rzędzie k rozkład przejścia pomiędzy poszczególnymi krokami czasowymi wyrażony jest wzorem [5]: n P (Z t Z t 1, Z t 2,..., Z t k ) = P (Zi t P a(zi t )). W tym przypadku zbiór rodziców P a(zi t ) zawiera węzły pochodzące nie tylko z bezpośrednio poprzedzającego segmentu, ale również węzły z segmentów wcześniejszych. Łączny rozkład prawdopodobieństwa sieci rzędu k o T segmentach wyrażony jest wzorem: i=1 P (Z 1:T ) = T n P (Zi t P a(zi t )). t=1 i=1 Fizjologia Cyklu Miesięcznego Kobiety Podobnie jak wiele zjawisk w przyrodzie, powtarzających się cyklicznie w określonym czasie, również większość procesów fizjologicznych występujących w organizmie ludzkim ma charakter okresowy. Do takich procesów zaliczamy m.in. procesy związane z płodnością kobiety. Przez cały okres rozrodczy w organizmie kobiety zachodzą powtarzające się regulowane przez układ hormonalny procesy związane z dojrzewaniem komórki jajowej, owulacją oraz czynnością ciałka żółtego. Z punktu widzenia zmian zachodzących w ciele kobiety cykl miesiączkowy możemy podzielić na cztery fazy: menstruację, fazę folikularną, owulację oraz fazę lutealną. Czas trwania cyklu miesiączkowego jest cechą wybitnie indywidualną każdej kobiety i waha się zwykle od 24 do 31 dni [25]. Jednakże cykle trwające od 21 do 36 dni należy również traktować jako prawidłowe. Nieregularności cyklu często występują u kobiet zdrowych, a długość cykli prawie nigdy nie jest idealnie równa. Hormonalna charakterystyka i podział cyklu miesięcznego Cykl miesiączkowy kobiety sterowany jest poprzez wzajemne interakcje hormonów produkowanych w większości przez trzy organy w jej ciele: podwzgórze, przysadkę mózgową oraz jajniki. Najważniejsze hormony regulujące proces cyklu miesięcznego to: gonadoliberyna (GnRH), lutropina (hormon luteinizujący, LH), folitropina (hormon, folikulotropowyfsh), estrogeny oraz progesteron ([25]). 6
Rysunek 1. Poziom hormonów w organizmie kobiety w trakcie trwania cyklu miesięcznego [1]. Biorąc pod uwagę poziom hormonów w organizmie kobiety możemy wyodrębnić cztery fazy cyklu miesięcznego: menstruację, fazę folikularną (pęcherzykową), owulację oraz fazę lutealną (ciałka żółtego) (Rysunek 1). Przyjmuje sę, że pierwszym dniem cyklu jest pierwszy dzień krwawienia menstruacyjnego. Krwawienie jest spodowowane złuszczaniem błony śluzowej macicy, rozrośniętej w ostatniej fazie poprzednego cyklu. Menstruacja trwa zwykle od 3 do 5 dni, choć krwawienia trwające od 2 do 7 dni są traktowane jako normalne. Po ustaniu krwawienia w fazie folikularnej pod wpływem hormonów gonadotropowych w jajniku dochodzi do dojrzewania pęcherzyka zawierającegoh komórką jajową. Macica wchodzi w tak zwaną fazę wzrostu, w której jej błona śluzowa ulega regeneracji. Za tą odbudowę odpowiedzialne są estrogeny wydzielane przez dojrzewający pęcherzyk jajowy. W długich cyklach jest ona wydłużona, a w zdarzających się cyklach krótkich ulega skróceniu. Pod koniec fazy folikularnej dochodzi do gwałtownego wyrzutu LH do krwi przez przysadkę mózgową. Wzost poziomu tego hormonu jest bezpośrednią przyczyną pęknięcia pęcherzyka i uwolnienia komórki jajowej, czyli owulacji. Komórka jajowa żyje od 15 do 24 godzin [14] i tylko w tym czasie w trakcie danego cyklu może dojść do zapłodnienia. Podczas jednego, nawet bardzo długiego cyklu, ma miejsce tylko jedna owulacja. Może się zdarzyć, że równocześnie dojrzewają i wydostają się z jajnika dwie lub więcej komórki jajowe, co może być przyczyną ciąży mnogiej, ale następuje to zawsze w ciągu jednej doby, gdyż jest uwarunkowane działaniem hormonu LH. Dodatkowemu jajeczkowaniu w późniejszym czasie przeciwdziała wytwarzany po owulacji progesteron. Przyczyną trudności z poczęciem 7
dziecka może też być zbyt skąpe lub krótkotrwałe wytwarzanie śluzu w szyjce macicy, pomimo prawidłowego jajeczkowania. Faza lutealna, zwana także fazą ciałka żółtego rozpoczyna się tuż po owulacji i trwa do ostatniego dnia przed wystąpieniem następnego krwawienia. W literaturze nie ma zgodności co do średniej długości fazy lutealnej, według Wójcika trwa ona przeciętnie 12 16 dni[27], podczas gdy Kippley w [14] podaje 10 16 dni. Jej długość jest determinowana przez czas życia ciałka żółtego, które, o ile nie dojdzie do zapłodnienia, obumiera po około 13 dniach [25]. Na skutek jego obumarcia dochodzi do gwałtownego spadku progesteronu w krwi kobiety, a w konsekwencji do oddzielenia powierzchniowej warstwy śluzówki macicy i pojawienia kolejnego krwawienia miesięcznego. Samoobserwacja objawów cyklu miesięcznego Przez cały cykl miesięczny na skutek działania hormonów w organizmie kobiety zachodzi szereg zmian. Mogą one dostarczyć kobiecie przesłanek pozwalających przypuszczać, że w danym cyklu wystąpiła owulacja. Rzetelna i systematyczna samoobserwacja cykli miesięcznych przez kobietę jest tanim i wartościowym sposobem rozpoznawania prawidłowego ich przebiegu oraz ewentualnych zaburzeń. Z punktu widzenia występowania tych objawów w trakcie cyklu, możemy je podzielić na dwie grupy: główne objawy płodności oraz dodatkowe objawy płodności. Główne objawy płodności występują we wszystkich cyklach owulacyjnych. Należą do nich krwawienie miesięczne, pomiar podstawowej temperatury ciała, obserwacja śluzu szyjki macicy oraz zmiany w położeniu i charakterystyce szyjki macicy. Objawy dodatkowe są obserwowane tylko przez niektóre kobiety i tylko w części ich cykli. Możemy do nich zaliczyć tzw. ból owulacyjny, krwawienie owulacyjne, obrzmienie piersi, powiększenie węzła chłonnego w pachwinie. Menstruacja Menstruacja jest najbardziej widocznym objawem, który kobieta może zaobserwować w trakcie całego cyklu miesięcznego. Pojawienie się pierwszej miesączki (menarche) kończy proces pokwitania i jest oznaką dojrzałości płciowej. Występuje po około 14 miesiącach od szczytu skoku pokwitaniowego, czyli intensywnego wzrostu ciała oraz dynamicznego rozwoju narządów wewnętrznych i zewnętrznych. Normalny wiek wystąpienia pierwszej miesiączki waha się między 10. a 17. rokiem życia, przy czym średnio menarche występuje w 12. roku 8
życia. Okres rozrodczy kobiety kończy się wraz z ostatnią menstruacją, zwaną menopauzą. Przeciętnie ostatnia miesiączka pojawia się pomiędzy 45. a 55. rokiem życia. Krwawienie miesięczne jest pierwszym etapem cyklu miesiączkowego. Jest spodowowane zanikiem w ostatniej fazie poprzednego cyklu błony śluzowej macicy, której pozostałości są wydalane wraz z krwią. Menstruacja trwa zwykle od 3 do 5 dni, choć krwawienia trwające od 2 do 7 dni są traktowane jako normalne. Kobieta traci w tym czasie do 80 ml krwi. Podstawowa temperatura ciała Postawowa temperatura ciała (ang. Basal Body Temperature, BBT) to temperatura ciała znajdującego się w stanie spoczynku, bez wplywu pokarmu czy uprzednio wykonywanych czynności. Temperatura ciała podlega dobowym wahaniam, przy czym w godzinach rannych osiąga najniższy poziom. W normalnych warunkach wzrasta o oko ło 0.1 C na każdą godzinę dziennej aktywności. Zmiany podstawowej temperatury ciała następują w rezultacie zmian stężenia progesteronu we krwi. W fazie przedowulacyjnej, na skutek niskiego poziomu progesteronu w stosunku do wysokiego poziomu estrogenów BBT utrzymuje się na niższym poziomie [18]. Faza niższych temperatur (hipotermiczna) obejmuje czas menstruacji i trwa do momentu uwolnienia komórki jajowej. Po owulacji, na skutek działania progesteronu wytwarzanego przez ciało żółte podstawowa temperatura ciała kobiety podnosi się mniej więcej o 0.2 C i obniża dopiero tuż przed wystąpieniem następnej menstruacji a czasem dopiero w jej trakcie. Jest to tak zwana faza wyższych temperatur (hipertermiczna). Podwyższanie BBT przez progesteron jest wyjaśnione jako skutek zwiększenie podstawowej przemiany materii. Przejście z fazy hipotermicznej do fazy hipermicznej nosi nazę skoku temperatury lub zmiany (ang. shift). Skok uznawany jest za istotny, jeżeli wzrost temperatury dokonał się w czasie nie dłuższym niż 48 godzin i przez następne trzy dni BBT jest wyższa o co najmniej 0.2 C w porównaniu z najwyższą temperaturą w ostatnich sześciu dniach poprzedzających skok. Badania WHO wykazały, że średnia długość fazy hipotermicznej wynosi 17.6 dnia ±4.1 dnia, a fazy hipertermicznej 12.7 dnia ±1.7 dnia [18]. O ile długość fazy hipotermicznej wpływa jedynie na długość całego cyklu, to zbyt krótka faza hipertermiczna ma znaczący wplyw na płodność kobiety. Za prawidłwową długość fazy hipertermicznej uzwaje się przedział od 10 do 16 dni. Faza wyższych temperatur krótsza niż 10 dni może wskazywać na niewydolność ciałka żółtego, co uniemożliwia zagnieżdżenie zapłpdnionej koórki jajowej w 9
macicy i utrzymacie wczesnej ciąży. Cykl o dwufazowym przebiegu uznawany jest za cykl owulacyjny, natomiast brak skoku temperatury najczęściej oznacza, że w tym cyklu nie doszło do jajeczkowania. BBT utrzymująca się na poziomie wyższych temperatur przez dłużej niż 16-18 dni może świadczyć o poczęciu dziecka [25], [18], [27]. Śluz szyjki macicy Śluz szyjkowy, wytwarzany pod wpływem estrogenów odgrywa bardzo ważną rolę w procesie zapłodnienia. Jego obecność jest niezbędna do utrzymania żywotności plemników. W dniach, kiedy śluzu nie ma, czyli zwykle kilka dni po menstruacji, plemini giną w kwaśnym środowisku pochwy w ciągu około 30 minut ([27]). Występuje wtedy również uczucie śuchości". W ciągu następnych dni pojawia się śluz gęsty, lepki oraz nierozciągliwy i wraz z nim odczucie "wilgotności"(tzw. śluz gorszej jakości, śluz o cechach mniejszej płodności). U niewielkiego odsetka kobiet już. bezpośrednio po menstruacji występuje niezmieniająca się wydzielina z uczuciem "wilgotności"[25]. Rysunek 2. Charakterystyka śluzu szyjki macicy w trakcie cyklu miesięcznego kobiety. Po kilku dniach, na skutek wzrostu poziomu estrogenów wydzielanych przez dojrzewający pęcherzyk jajowy, zwiększa się ilość wydzielanego śluzu. Zmienia się również jego postać. Im bliżej owulacji, tym bardziej śluz staje się rozciągliwy, przejrzysty, podobny do białka jaja kurzego (tzw. śluz dobrej jakości, śluz bardzo płodny.). Ostatni dzień, w którym śluz posiada cechy płodności nosi nazwę dnia szczytu śluzu. Śluz szyjki macicy ma odczyn zasadowy i uzdalnia plemniki do zapłodnienia. W jego obecności plemniki mogą żyć nawet do 6 dni [26]. Wytwarzanie śluzu ustaje po owulacji na skutek działania progesteronu. U większości kobiet nie ma w tym czasie żadnej wydzieliny i przeważa odczucie śuchości"przedsionka 10
Rysunek 3. Charakterystyka szyjki macicy w trakcie cyklu miesięcznego kobiety. pochwy. U nielicznych kobiet występuje stale wydzielina w niewielkiej ilości, która jest łatwa do odróżnienia od śluzu szyjkowego [27]. Położenie szyjki śluzowej macicy Hormony jajnikowe powodują również zmiany szyjki macicy, wpływają na jej warstwę mięśniową. Przez kilka dni po menstruacji szyjka jest zazwyczaj zamknięta, twarda oraz nisko położona. W miarę zbliżającej się owulacji, szyjka macicy przemieszcza się lekko od strony kości krzyżowej ku spojeniu łonowemu, przez co wydaje się, że znajduje się wyżej. Jest bardziej miękka i otwarta, a z jej ujścia wydziela się śluz. Pod wpływem zwiększonego poziomu progesteronu po owulacji szyjka wraca do punktu wyjścia, szybko się zamyka, twardnieje i ponownie opuszcza się niżej. Metody oparte na samoobserwacji cyklu Metody naturalnego planowania rodziny (ang. Fertility Awareness Methods, metody FA) są kolekcją metod opartych na znajomości i wykorzystywaniu naturalnego cyklicznego rytmu płodności kobiety. Metody te wyznaczają czas, w kórym może dojść do zapłodninia na podstawie śledzenia długości cyklu i/lub obserwacji głównych objawów płodności, takich jak podstawowa temperatura ciała, zmiany śluzu szyjki macicy oraz zmiany w położeniu i charakterystyce szyjki macicy. Wiedzę o czasie występowania okresów płodnych można wykorzystać zarówno w celu zwiększenia prawdopodobieństwa zajścia w ciążę, jak też dla jej uniknięcia. 11
Z punktu widzenia wykorzystywanych informacji metody FA można podzielić na trzy kategorie: (1) metody kalendarzowe, bazujące na długotrwałym i systematycznym zapisie długości cyklów miesiączkowych kobiety(np. metoda Ogino Knausa [25]), (2) metody objawowe, polegające na obserwacji jednego wskaźnika płodności temperatury lub śluzu szyjki macicy (np. metoda temperaturowa [24], system Döringa [1], metoda owulacyjna Billingsów [16], model Creightona [12]) oraz (3) metody objawowo termiczne, wykorzystujące więcej niż jeden wskaźnik płodności kobiety (np. metoda Rötzera [23], metoda Kippleyów [14], metoda podwójnego sprawdzenia [25], Sensiplan [22] metoda T. Kramarek [25]). Modelowanie zależności wyższych rzędów Niniejszy rozdział prezentuje kolekcję modeli opartych na dynamicznych sieciach Bayesowskich o różnych stopniach zależności czasowych oraz przedstawia wyniki eksperymentu porównującego zachowanie takich modeli w zastosowaniu do rzeczywistego problemu. Zgodnie z moją wiedzą, pomimo iż dynamiczne sieci Bayesowskie są popularnym narzędziem modelowania procesów stochastycznych, ich zastosowanie skupia się głównie na zależnościach pierwszego i drugiego rzędu [4, 15, 17, 21]. Problem, który analizuję w tej rozprawie to modelowanie cyklu miesięcznego kobiety, problem ściśle związany z ludzką płodnością. Właściwa estymacja dnia owulacji, a w konsekwencji okresu płodnego w trakcie trwania cyklu miesięcznego z uwagi na zmienną długość cyklu jest problemem skomplikowanym. Długość cyklu, a wraz z tym długość jego poszczególnych faz jest cechą indywidualną każdej kobiety [9]. Wahania dotyczą również zdrowych kobiet, a długości ich cykli prawie nigdy nie są sobie idealnie równe. Co jeszcze uważam za istotne w analizowanym problemie, to fakt, że cykl miesięczny kobiety jest systemem z pamięcią sięgającą nawet całej długości cyklu. Dane, których używam w tej rozprawie pochodzą z europejskiego badania nad płodnością [3]. W trakcie badania 881 kobiet z siedmiu europejskich ośrodków oraz z ośrodka w Nowej Zelandii zgromadziło 7017 cykli. Jednakże w eksperymentach uwzględniłam tylko 3432 cykli 236. kobiet. Z analizy wykluczyłam kobiety, które zgromadziły mniej niż siedem cykli z uwagi na wytyczne metod FA, kóre zalecają obserwację minimum sześciu cykli w celu zapoznania się z metodą. Pominęłam również cykle z niejednoznacznie określonym skokiem temperatury lub dniem szczytu śluzu szyjki macicy. Dodatkowo, z analizy wykluczyłam kobiety z cyklami, których długość uznawana jest za anormalną [25]. 12
Opis modelu Proponowany model cyklu miesięcznego kobiety (Rysunek 4) zawiera zmienną Phase opisującą fazę cyklu, w której kobieta aktualnie się znajduje. W modelu umieściłam sześć zmiennych opisujących obserwacje, jakie kobieta może zebrać w czasie trwania cyklu. Zawierają one główne wskaźniki płodności, czyli informacje o krwawieniu (Bleeding), podstawową temperaturę ciała (BBT) i obserwacje śluzu szyjki macicy (Mucus observation) oraz obserwacje dotyczące zmianm w położeniu i charakterystyce szyjki macicy (Cervix position, Crevix firmness, Cervix openness). Wszystkie modele stworzyłam, rozwijałam oraz testowałam przy użyciu biblioteki SMILE służącej do tworzenia i wnioskowania w graficznych modelach probabilistycznych [6]. SMILE powstał w Laboratorium Systemów Decyzyjnych (Decision Systems Laboratory) Uniwersytetu w Pittsburgh u i jest dostepny na stronie http://genie.sis.pitt.edu. Rysunek 4. Przykład modelu ósmego rzędu cyklu miesięcznego kobiety. Opis eksperymentu Do porównania wyników generowanych przez poszczególne modele zdecydowałam się użyć trzech następujących miar: procentowa ilość przypadków fałszywie negatywnych, czyli dni płodnych błędnie zaklasyfikowanych jako niepłodne, i przypadków fałszywie pozytywnych, czyli dni niepłodnych błędnie zaklasyfikowanych jako płodne oraz miary wyprowadzonej z 13
metod naturalnego planowania rodziny procentowej długości okresu płodnego i niepłodnego w czasie cyklu miesięcznego. Jako, że moją intencją była symulacja użycia poszczególnych modeli przez kobietę podczas uczenia i weryfikacji modeli zastosowałam następującą procedurę. Dla każdej kobiety stworzyłam kolekcję modeli, których struktura i parametry początkowe oparte były na jej pierwszych sześciu cyklach. Po każdym cyklu sprawdzałam, czy nie zaszła potrzeba aktualizacji struktury oraz wyznaczałam numeryczne parametry modeli używając nie więcej niż ostatnie dwanaście cykli danej kobiety. Powodem takiego postępowania jest fakt, że organizm kobiety zmienia się w czasie a wraz z tym zmianom ulega charakterystyka jej cykli. Model powinien na bieżąco dostosowywać się do stopniowych zmian zachodzących w ciele kobiety. Dla każdej kobiety stworzyłam dziewięć dynamicznych sieci Bayesowskich w rzędami temporalnymi od pierwszego do dziewiątego. Dodatkowo, dla każdej kobiety stworzyłam model, krótego struktura mogła zmieniać się po każdym cyklu. Zmiana struktury polegała na dodawaniu lub usuwaniu krawędzi reprezentujących zależności temporalne, przy czym krawędź pierwszego rzędu nigdy nie mogła zostać usunięta. Proces zmiany struktury wyglądał następująco. Po każdym cyklu na podstawie danych z poprzednich cykli (co najmniej sześciu i nie więcej niż dwunastu) wyznaczałam najwcześniejszy i najczęściej występujący dzień owulacji. Dzieląc te dwie wartości przez dwa otrzymywałam rzędy zależności temporalnych, które powinny pojawić się w modelu. W każdym kroku czasowym (tzn. dniu cyklu) każdy model wyznaczał dzień z najwyższym prawdopodobieństwem owulacji. Jeżeli przedział między wyznaczonym dniem a dniem bieżącym był równy co najmniej sześć dni, oznaczałam dzień bieżący jako początek okresu płodnego w danym cyklu. Do wyznaczenia końca okresu płodnego modele używały skoku podstawowej temperatury ciała. Wyniki Rysunek 5 pokazuje średni procent dni sklasyfikowanych jako płodne i niepłodne podczas cyklu. W przypadku modeli zawierających wszystkie kolejne rzędy zależności temporalnych długość okresu płodnego zmniejsza się wraz ze zwrostem wysokości rzędu, by w przypadku modelu rzędu dziewiątego osiągnąć poziom 40% długości całego cyklu. Długość okresu płodnego wyznaczona przez model ze zmnieniającą się strukturą (oznaczona jako ŚEL orders") jest bliska wartościom uzyskanym przez modele ósmego i dziewiątego rzędu. Takie rezultaty 14
Rysunek 5. Średni procent dni sklasyfikowanych przez porównywane modele jako płodne i niepłodne w trakcie cyklu miesięcznego kobiety. pokrywają się z naszą intuicją, że im wyższy rząd modelu tym bliższa prognozowana długość okresu płodnego do rzeczywistej długości. Rysunek 6. Średni procent dni fałszywie negatywnych i fałszywie pozytywnych wykazanych przez porównywane modele. Z rysunku 6 możemy zaobserwować, że liczba dni fałszywie negatywnych jest najwyższa w przypadku modelu pierwszego rzędu. Począwszy od rzędu drugiego liczba dni płodnych niepoprawnie sklasyfikowanych jako niepłodne maleje wraz z rosnącym rzędem modelu. Jednakże, dla modelu siódmego rzędu i wyższych obserwujemy trend odwrotny. W tym samym czasie model ze zmienną strukturą wykazuje liczbę dni fałszywie negatywnych porównywalną z modelem rzędu ósmego. Liczba dni niepłodnych niewłaściwie sklasyfikowanych jako płodne (tzn. dni fałszywie pozytywnych) jest niższa dla modeli zawierającyh zależności temporalne wyższych rzędów. 15
Różnica pomiędzy modelem pierwszego rzędu a modelem dziewiątego rzędu wynosi około 18%. Podsumowanie Uzyskane wyniki pokazują, że cykl miesięczny kobiety jest procesem z pamięcią sięgającą długości całego cyklu. Znaczy to, że na stan procesu w dniu bieżącym wpływają nie tylko obserwacje z dnia poprzedniego, ale również z dni wcześniejszych. W związku z tym uwzględnienie w modelu zależności zcasowych wyższych rzędów wpływa korzystnie na jakość prognostyczną modelu. Jednocześnie wyniki pokazały również, że w przypadku analizowanych danych mamy do czynienia z nadmiernym dopasowaniem modelu, co w przypadku zbyt wysokiego rzędu modelu prowadzi co spadku jakości. Odpowiedź na pytanie, jaki jest właściwy rząd modelu jest kluczowa przy modelowaniu procesów stochastycznych. Parametry numeryczne modelu Poprzedni rozdział pokazał, że modele dynamiczne uwzględniające zależności wyższych rzędów mogą z większą dokładnością modelować stan procesu stochastycznego niż modele pierwszego rzędu. Przeprowadzony eskperyment wykazał, że wraz ze wzrostem rzędu modelu długość prognozowanego okresu płodnego jest krótsza, co pozwala nam rozważać taki model za bardziej precyzyjny. Również liczba dni fałszywie pozytywnych malała przy modelach wyższych rzędów. Jednakże rosnąca liczba dni fałszywie niegatywnych sugeruje, że mamy do czynienia z nadmiernym dopasowaniem modelu do danych, przez co nowe przypadki, óżniące się od dotychczasowych są błędnie klasyfikowane. Jednym z powodów takiego zachowania modeli jest mała liczebność zbiorów danych wykorzystanych do uczenia. Uczenie sieci Bayesowskich z danych poparte jest solidnymi podstawami teoretycznymi. Dysponując wystarczająco dużym zbiorem danych jesteśmy w stanie nauczyć zarówno część jakościową modelu, jak i jego część ilościową. Jednakże, w praktyce liczba rekordów dostępnych do uczenia jest zawsze ograniczona. Wyznaczanie parametrów sieci bayesowskiej sprowadza się głównie do zliczania liczby rekordów dla różnych warunków (kombinacji stanów parametryzowanego węzła i jego rodziców). Liczba estymowanych parametrów rośnie wykładniczo wraz ze wzrostem liczby rodziców. Co za tym idzie modele wyższych rzędów stają coraz bardziej złożone i potrzebujemy większej liczby rekordów w celu wyznaczenia 16
rozkładów. Przykładowo, dla sieci piątego rzędu w przypadku węzła Phase tabele rozkłądów warunkowych zawiera 1, 024 wartości. Nawet jeśli wezmiemy pod uwagę, że ze względu na specyfikę modelowanego problemu wiele kolumn w tabeli prawdopodobieństw reprezentuje wysoko nieprawdopodobne przypadki, ciągle zmagamy się z problemem niewystarczającej liczby rekordów. Warto zauważyć, że stosując metody naturalnego planowania rodziny zarówno początkowa struktura modelu jak i jego parametry wyznaczamy z reguły w oparciu o sześć cykli kobiety. W przypadku zbiorów z tak niewielką liczbą rekordów, niejednokrotnie dana kombinacja wartości jest reprezentowana przez zaledwie kilka rekordów lub nawet przez zerową liczbę rekordów, co uniemożliwia wyznaczenie wiarygodnych parametrów. Częstym założeniem odnośnie rozkładów początkowych modelu są rozkłady jednostajne. Jednakże takie podejście w przypadku cyklu miesięcznego kobiety nie niesie żadnej informacji, a wręcz prowadzić może do błędnych rezutlatów. Wytrenowanie skomplikowanego modelu wymaga dużej liczby obserwacji. Niestety, zbieranie danych opisujących cykl miesięczny kobiety nigdy nie będzie skutkować wystarczająco dużym zbiorem danych. Zakładając, że kobieta jest płodna przez mniej więcej 40 lat swojego życia, średnio z trzynastoma cyklami w ciągu roku, jest w stanie zebrać około 520 rekordów. W momencie, gdy ta liczba zostanie osiągnięta, obserwacje stają się bezużyteczne jako, że kobieta wchodzi w okres przekwitania. W rzeczywistości kobieta w optymistycznym przypadku dysponuje nie więcej niż kilkudziesięcioma zaobserwowanymi cyklami. W tym rozdziale koncentruję się na ustaleniu parametrów a priori modeli o ustalonej strukturze przy użyciu dostępnych danych. Zaproponowałam dwa podejścia do rozwiązania problemu małych zbiorów danych w kontekście cyklu miesięcznego kobiety. Pierwsze z nich opiera się na wykorzystaniu rekordów całej populacji kobiet. Drugie podejście bazuje wyłącznie na danych kobiety na podstawie których wyznaczane są początkowe parametry. W obydwu przypadkach dla każdej kobiety utworzyłam siedem sieci dynamicznych o rzędach od pierwszego do siódmego. Uczenie z populacji W tym podejściu wykorzystałam dane z populacji (3432 rekordów) do wyznaczenia parametrów. Procedura uczenia i walidacji modeli wyglądała następująco. Losowo podzieliłam dostępne dane na pięć równych podzbiorów. Zbiór uczący modeli każdej kobiety był sumą czterech pozdbiorów, wyłączając ten, do którego kobieta została przyporządkowana. W tym kroku dla każdej kobiety uzyskałam model oparty na populacji. Następnie, użyłam tych modeli 17
jako modeli a priori w celu wyznaczenia modeli specyficznych dla kobiety. W tym celu użyłam tylko cykli danej kobiety. W tym kroku zarówno dla uczenia jak i walidacji użyłam procedury opartej na wcześniejszych cyklach kobiety, opisanej w poprzednim rozdziale. Interesującym wynikiem jest to, że średnia liczba dni sklasyfikowanych przez modele o rzędzie niższym niż siódmy jako płodne kształtuje się na porównywalnym poziomie (około 44%). Model siódmego rzędu poprawia swoją dokładność o około 5%. Podobnie zachowuje się liczba dni fałszywie pozytywnych. W przypadku modeli o rzędach niższych niż siódmy wynosi ona około 19%, podczas gdy dla modelu rzędu siódmego około 16%. Jednakże, liczba dni płodnych sklasyfikowanych błednie jako niepłodne różni się pomiędzy modelami. Najniższą wartość dni fałszywie pozytywnych wykazały modele rzędu trzeciego, czwartego oraz piątego, trzykrotnie niższą niż model rzędu siódmego. Uczenie na podstawie charakterystyki kobiety Wyniki zaprezentowane w poprzedniej sekcji pokazują, że modele oparte na populacji nie dają satysfakcjonujących rezultatów. Przyczyną takiego zachowania modeli mogą być znaczące różnice pomiędzy poszczególnymi kobietami. Drugi eksperyment zakładał wyestymowanie parametrów a priori w oparciu o indywidualną charakterystykę każdej kobiety. Jednym z podejść jest pozyskanie tych wartości od eksperta. Jednakże jak pokazuje doświadczenie, o ile eksperci są w stanie łatwo i wiarygodnie określić graficzną strukturę modelu, to wyznaczenie parametrów numerycznych sprawia im spore problemy [7]. W przypadku modeli cyklu miesięcznego kobiety, parametry powinny być określone indywidualnie dla każdej kobiety. Takie zadanie byłoby jednak czasochłonne i skomplikowane. Drugie podejście opiera się na nauczeniu parametrów z danych. Biorąc pod uwagę, że dostępna liczba rekordów jest niewystarczająca (kilka dla każdej kobiety) postanowiłam wygenerować dane o cyklach każdej kobiety bazując na charakterystykach jej pierwszych sześciu cykli. W celu ustalenia indywidualnych parametrów modeli zastosowałam następującą procedurę. Dla każdej kobiety wygenerowałam zbiór cykli o liczności 500 elementów. Taka liczność wydaje się być wystarczająca, biorąc pod uwagę, że wiele kolumn w tabelach prawdopodobieństw w przypadku problemu modelowania cyklu miesięcznego kobiety reprezentuje wysoce nieprawdopodobne przypadki. Przykładowo dla sieci szóstego rzędu rozmiar tabeli prawdopodobieństw warunkowych wynosi 4, 096 jednak tylko około 30 odpowiada za rzeczywiste 18
kombinacje. Bazując na regułach metod naturalnego planowania rodziny, które zalecają zebranie przynajmniej sześciu cykli przed pełnym stosowaniem metody, wykorzystałam te cykle do wyznaczenia podstawowej charakterystyki każdej kobiety. Pod uwagę brałam minimum, maksimum, wartość oczekiwaną oraz odchylenie standardowe długości cyklu oraz długości każdej fazy. Następnie wygenerowałam dane zakładając rozkład normalny długości cyklu, a co za tym idzie długości poszczególnych faz. Dodatkowo ustaliłam wzorzec występowania obserwacji w zależności od fazy cyklu, co było szczególnie istotne w przypadku zmiennej opisującej śluz szyjki macicy. Podobnie jak w poprzednich eksperymentach, zarówno długość okresu płodnego jak i liczba dni niepłodnych błędnie sklasyfikowanych jako płodne zmniejszała się w przypadku modeli wyższych rzędów. Znaczącą różnicą jest fakt, że liczba dni fałszywie negatywnych w przypadku większości modeli wynosiła zero lub była bliska zeru. Podsumowanie Głównym problemem uczenia parametrów początkowych modeli cyklu miesięcznego kobiety jest niewystarczająca liczba danych. Ponieważ uczenie prawdopodobieństw warunkowych sprowadza się głównie do zliczania liczby rekordów dla różnych kombinacji stanów parametryzowanego węzła i jego rodziców, mała liczba danych prowadzi do sytuacji, w której część kombinacji będzie reprezentowana w danych przez niewielką lub nawet zerową liczbę rekordów. W takiej sytuacji zakładany z reguły jako a priori rozkład jednostajny nie niesie żadnej informacji, a wręcz może prowadzić do błędnych wyników. Dlatego też kwestią wielkiej wagi jest właściwe ustalenie parametrów początkowych modelu. W tym rozdziale testowałam dwa podejścia pozyskania parametrów a priori, obydwa oparte na uczeniu z danych. W pierwszym podejściu estymowałam parametry na podstawie dostępnej populacji kobiet, podczas gdy drugie podejście zakładało wyznaczanie parametrów początkowych indywidualnie dla każdej kobiety. Wyniki pokazują, że modele oparte na populacji zachowują się gorzej niż modele, których parametry były estymowane w oparciu o indywidualną charakterystykę kobiety. Moim zdaniem, jednym z wyzwań w modelowaniu cyklu miesięcznego kobiety jest znacząca różnorodność pomiędzy kobietami. 19
Zastosowanie modeli kanonicznych Założenie o warunkowej niezależności zmiennych w sieciach Bayesowskich skutkuje w bardziej kompaktowej reprezentacji łącznego rozkładu prawdopodobieństwa i znacząco redukuje liczbę estymowanych parametrów. Jednakże w dalszym ciągu liczba paramaterów rośnie wykładniczo wraz ze wzrostem liczby rodziców, co w przypadku uczenia parametrów z małych zbiorów danych prowadzi do do niskiej jakości modeli. Niektóre rozkłady prawdopodobieństw warunkowych mogą być aproksymowane przez interakcyjne modele kanoniczne, które wymagają mniejszej liczby parametrów. Modele kanoniczne są zazwyczaj stosowane w sytuacji związanej z opisem oddziaływań pomiędzy n przyczynami X 1, X 2,..., X n oraz ich wspólnym efektem Y. Zakłada się, że każda z przyczyn jest w stanie prowadzić do efektu Y, w sytuacji, gdy pozostałe przyczyny są nieobecne oraz gdy ich zdolność do wywoływania efektu Y jest niezależna od występowania pozostałych przyczyn. Najbardziej popularne spośród modeli kanonicznych są bramki noisy OR [20] wraz z ich uogólnieniem bramkami noisy MAX model [10, 11]. W niniejszym rozdziale testowałam zastosowanie jednego z rodziny modeli kanonicznych, modelu Simple Ladder, SL( [28]), do problemu cyklu miesięcznego kobiety z dwóch punktów widzenia. Pierwszy eksperyment koncetrował się na aspekcie obliczeniowym, to znaczy na porównaniu czasu uczenia oraz czasu wnioskowania modeli kanonicznego do modeli tradycyjnych (będę określać je jako modele CPT). Drugi eksperyment testował jakość takich modeli. Dla każdej kobiety utworzyłam siedem par sieci dynamicznych o rzędach od pierwszego do siódmego. Rysunek 7 przedstawia przykład takiej pary dla modelu rzędu czwartego. Dodatkowo, aby porównać zachowanie się modeli w przypadku wybranych rzędów, strowrzyłam pięć par modeli z rzędami 1,6,10; 1,6,10,15; 1,3,7,10,12; oraz 1,7-12. Eksperyment pokazał, że średni czas wnioskowania znacząco skraca się w przypadku modeli SL wraz ze zwiększającym się rzędem modelu. Czas wnioskowania dla modeli SL wzrasta liniowo wraz ze wzrostem liczby rodziców, podczas gdy dla modeli CPT wykłdniczo. Średni czas uczenia modeli CPT jest krótszy w przypadku niższych rzędów (do rzędu szóstego). Dłuższy czas uczenia modeli SL może być wytłumaczony wprowadzonymi przez te modele zmiennymi ukrytymi (węzły A oraz B na Rysynku 7). Jednakże biorąc pod uwagę praktyczne zastosowanie tych modeli, czas uczenia ma mniejsze znaczenie niż czas wnioskowania. Parametry modelu uaktualniane są z reguły tylko raz, po zakończeniu cyklu, podczas gdy prognozowanie wykonywane jest znacznie częściej (przynajmniej raz dziennie). 20
Rysunek 7. Przykładowa sieć czwartego rzędu modelu CPT (a) oraz odpowiadający mu model SL (b). Modele SL wykazują zazwyczaj wyższy procent dni fałszywie pozytywnych. Z drugiej strony, liczba dni płodnych błędnie sklasyfikowanych jako niepłodne, jest mniejsza w porównaniu z odpowiadającymi modelami CPT. Oznacza to, że modele SL są bardziej dopasowane do oczekiwań użytkownika. Podsumowanie Przeprowadzone eksperymenty pokazały, że róźica między modelami opartymi na modelach kanonicznych oraz na modelach tradyjnych nie są duże. Jednym z możliwych wytłumaczeń jest to, z uwagi na specyfikę problemu nawet modele oparte na tradycyjnym podejściu nie zmagają się z dużą liczbą parametrów do wyestymowania. Jednakże, z uwagi na krótszy czas wnioskowania zastosowanie modeli kanonicznych do modelowania procesów stochastycznych wydaje się być obiecującym kierunkiem badań. Empiryczne porównanie modeli opartych na dynamicznych sieciach Bayesowskich do metod naturalnego planowania rodziny Metody naturalnego planowania rodziny (ang. Fertility Awareness Methods, metody FA) są kolekcją metod opartych na znajomości i wykorzystywaniu naturalnego cyklicznego rytmu płodności kobiety. Dzięki nim kobieta może określić fazy płodności i świadomie planować bądź odłożyć moment poczęcia dziecka. Każdy cykl miesięczny rozpoczyna się okresem 21
niepłodności względnej (tzw. niepłodność przedowulacyjna). Następnie, na kilka dni przez owulacją rozpoczyna się okres płodny, a po nim następuje okres niepłodności bezwzględnej (tzw. niepłodność poowulacyjna). Metody FA wyznaczają czas, w którym może dojść do zapłodnienia w oparciu o obserwację długości cyklu oraz/lub obserwację głównych objawów płodności, takich jak podstawowa temperatura ciała, zmiany śluzu szyjki macicy i szyjki macicy. Skuteczność metod FA została zweryfikowana mi.in. przez światową Organizację Zdrowia [19]. Z punktu widzenia wykorzystywanych informacji metody FA można podzielić na trzy kategorie: (1) metody kalendarzowe, bazujące na długotrwałym i systematycznym zapisie długości cyklów miesiączkowych kobiety: Rhythm [25], (2) metody objawowe, polegające na obserwacji jednego wskaźnika płodności temperatury lub śluzu szyjki macicy: metoda temperaturowa (BBT) [24], system Döringa (DS) [1], metoda owulacyjna Billingsów (BO) [16], model Creightona (CM) [12], algorytm Two Days (TDA) [8, 13], oraz (3) metody objawowo termiczne, wykorzystujące więcej niż jeden wskaźnik płodności kobiety: metoda Rötzera (RM) [23], metoda Kippleyów (CCL) [14], metoda podwójnego sprawdzenia (EM) [25], metoda zaproponowana przez Sensiplan (GM) [22] metoda Teresy Kramarek (PL) [25]. W tym rodziale przedstawiam wyniki porównania modeli opartych na dynamicznych sieciach Bayesowskich do istniejących jedenastu metod FA. Modele oparte na sieciach dynamicznych mogą stanowić trzon systemu ekspertowego służącego do określania czasu płodnego w trakcie cyklu miesięcznego. Opis eksperymentu W tym eksperymencie chciałam zasymulować wykorzystanie zaimplementowanych metod przez kobiety, które chcą zajść w ciążę lub chcą uniknąć ciąży, koncentrując się na skuteczności poszczególnych metod w identyfikacji okresu płodnego i niepłodnego. Zaimpelentowałam każdą z wymienionych wyżej metod FA oraz jeden z modeli oparty na dynamicznych sieciach Bayesowskich w postaci programu komputerowego ściśle przestrzegając reguł danej metody. Spośród zaproponowanych w tej rozprawie modeli do tego eksperymentu wybrałam model o zmiennej strukturze. Jak pokazały wcześniejsze wyniki, efektywność takiego modelu jest porównywalna z modelami zawierającymi wszystkie kolejne wpływy temporalne, a jednocześnie posiada on mniej skomplikowaną strukturę przez co czas uczenia i wnioskowania jest krótszy. 22
Rysunek 8. Średnią procentową długość okresu płodnego i niepłodnego w trakcie cyklu miesięcznego wynzaczone przez każdą z zaimplementowanych metod. Dla każdej z zaimplementowanych metod, zgodnie z jej regułami, wyznaczyłam średnią długość okresu płodnego i niepłodnego. Dodatkowo obliczyłam średnią liczbę dni fałszywie pozytywnych i fałszywie negatywnych. W przypadku modelu odpartego na dynamicznych sieciach Bayesowskich okres płodny był wyznaczany według następującej procedury. W każdym kroku czasowym (tzn. dniu cyklu) każdy model wyznaczał dzień z najwyższym prawdopodobieństwem owulacji. Jeżeli przedział między wyznaczonym dniem a dniem bieżącym był równy co najmniej sześć dni, oznaczałam dzień bieżący jako początek okresu płodnego w danym cyklu. Do wyznaczenia końca okresu płodnego model używał skoku podstawowej temperatury ciała. Wyniki Rysunek 8 przedstawia średnią procentową długość okresu płodnego i niepłodnego w trakcie cyklu miesięcznego. Liczba dni, w których kobieta powinna powstrzymać się od współżycia by uniknąć nieplanowanej ciąż jest dłuższa w przypadku metod bazujących dwóch lub więcej wskaźnikach płodności. Najkrótszą długość okresu płodnego wykazały metody oparte na obserwacji wyłącznie śluzu szyjki macicy, tzn. metoda owulacyjna Billingsa i model Creightona. Metoda temperaturowa w swoich zasadach rozróżnia tylko dwie fazy cyklu: płodną oraz fazę niepłodności bezwględnej, dlatego też wykazuje najdłuższy okres płodny w trakcie cyklu. Możemy zauważyć, że prognozowana przez model oparty na dynamicznych sieciach Bayesowskich długość okresu płodnego jest porównywalna do tej wykazanej przez metody oparte na obserwacji śluzu. 23
Rysunek 9. Średnią liczba dni fałszywie negatywnych oraz dni fałszywie pozytywnych wykazanych przez kaźdą z zaimplementowanych metod (posortowanych wg dni fałszywie negetywnych). Rysunek 9 przedstawia średnią wartość dni fałszywie negatywnych oraz dni fałszywie pozytywnych. Spośród wszystkich zaimplementowanych metod FA jedynie metoda temperaturowa osiągnęła wartość dni płodnych błędnie sklasifikowanych jako niepłodne równą zeru. Metody objawowo termiczne wykazały mniejszą liczbę dni fałszywie negatywnych niż metody oparte na kalendarzu i metody objawowe. Metody oparte na obserwacjach jedynie śluzu szyjki macicy wykazały najwszyższą wartość błędnie sklasyfikowanych dni. W tym samym czasie, model oparty na dynamicznych sieciach Bayesowskich osiągnął zerową wartość dni fałszywie negatywnych. Podsumowanie Jak pokazują wyniki porównania z istniejącymi metodami FA, zaproponowany model cyklu miesięcznego kobiety oparty na dynamicznych sieciach Bayesowskich osiąga wyniki porównywalne z metodami FA zarówno w przypadku prognozowanej długości okresu płodnego jak i w liczbie dni fałszywie negatywnych. Dodatkową zaletą takiego modelu jest to, że w przeciwieństwie do istniejących metod, może on przewidzieć dzień owulacji, co może przynieść wymierne korzyści dla par starających się o dziecko. Podsumowanie i kierunki dalszych badań Głównym celem tej rozprawy było zaimplementowanie modelu opartego na dynamicznych sieciach Bayesowkich wyższych rzędów w problemie obserwacji cyklu miesięcznego kobiety. 24