Detekcja motywów w złożonych strukturach sieciowych perspektywy zastosowań Krzysztof Juszczyszyn Instytut Informatyki Technicznej PWr
MOTYWY SIECIOWE -NETWORK MOTIFS 1. Co to jest? 2. Jak mierzyć? 3. Gdzie i jak (szybko) szukać? 4. Interpretacje? 5. Software? 6. Perspektywy, kontrowersje...
Motyw sieciowy (network motif): wzorzec połączeń między węzłami ( podgraf), występujący znacznie częściej niż w grafie losowym o tych samych parametrach ( liczba węzłów, połączeń, rozkład stopni węzłów,...). R Milo, S Shen-Orr, S Itzkovitz, N Kashtan, D Chklovskii & U Alon, Network Motifs: Simple Building Blocks of Complex Networks Science, 298:824-827 (2002).
Początek: dlaczego bioinformatyka? - nieporównywalne z innymi dziedzinami repozytoria danych (ilość). - wieloletnie badania struktur sieciowych (sieci metaboliczne, regulacji genów, katalityczne, komórkowe... - szczegółowość). - powyższe w odniesieniu do wielu organizmów (różnorodność) Pojawienie się / poszukiwania standardowych metod klasyfikacji, badania, modelowania ewolucyjnego struktur sieciowych. Computer science - inspiracje...? Jeśli TAK jakie będą różnice w porównaniu z podejściem do sieci informacyjnych/społecznych/informatycznych...?
Systemy sieciowe - analogie...
Typowe rozmiary motywów 3-7 węzłów. Miary obecności motywów w sieciach: Z-score najpopularniejsza miara statystyczna. Koncentracja C w porównaniu z innymi motywami.
Real sieci regulacji genów w prostych organizmach. Motyw: feed forward loop :
Występowanie: Wszędzie: Sieci informacyjne, społeczne, biologiczne, ewolucyjne, biochemiczne,... praktycznie każda nielosowa (czyt: rzeczywista) struktura sieciowa (pod warunkiem odpowiedniej skali). wszędzie nie znaczy te same ani też w takich samych proporcjach... (bakteria E.coli sieć regulacji genów)
Network fingerprint Skala! TSP: Networks fingerprints
W bioinformatyce: - Profile TSP dla kilku typów sieci (genom, metabolizm, synteza białek) oraz kilkudziesięciu organizmów na różnych stadiach rozwoju ewolucyjnego. - Pierwsze (2006-2007) propozycje klasyfikacji ewolucyjnej, szybkiego ustalania pokrewieństwa organizmów na podstawie profili TSP.
Wykrywanie motywów: 1. Przegląd zupełny grafu sieci. Złożone obliczenia, dla motywów 5-7 węzłowych oraz sieci k*mln węzłów - nie praktykuje się. 2. Próbkowanie sieci (network sampling) Tanio - maksymalnie O(n 2 )
Network sampling motywy n-węzłowe
Network sampling:
Network sampling wyniki WWW; 325tys. węzłów, 1.46mln połączeń (Barabasi & Albert, 1999) NETWORK MOTIFS
Network sampling wyniki NETWORK MOTIFS Dla porównania: przegląd zupełny: ~1.4mln motywów.
Network sampling wyniki NETWORK MOTIFS
Co dalej? Kolorowanie motywów wagi krawędzi. Symulacje wskazują korelację między topologią sieci (np. lokalność połączeń) a stężeniem motywów. Artificial Intelligence in Medicine (2007) 41, 117 127
Motywy a funkcje elementów sieci (obecnie znane interpretacje/zastosowania: biochemia).
Software: NETWORK MOTIFS http://www.minet.uni-jena.de/~wernicke/motifs/index.html http://mavisto.ipk-gatersleben.de/ http://www.weizmann.ac.il/mcb/urialon/
Open questions & challenges : Możliwości reinterpretacji dla systemów informacyjnych/ społecznych/informatycznych: Motywy z wagami/etykietami...-? Motywy w klasyfikacji sieci danego typu -?? Motywy szczególne w danej klasie sieci (a są? Interpretacja?) -??? Motywy jako takie: Geografia motywów w sieci (wpływ na własności i ewolucję?) -?? Wymiar czasowy ewolucja systemów: Szansa na zdjęcia poklatkowe szybkozmiennych struktur sieci-? Motywy a ewolucja sieci -?? Motywy a zjawiska krytyczne w sieciach -??? Motywy jako czynnik sterujący systemu sieciowego -??
DZIĘKUJĘ ZA UWAGĘ