Sieci komputerowe. Wykład 8: Wyszukiwarki internetowe. Marcin Bieńkowski. Instytut Informatyki Uniwersytet Wrocławski

Wielkość: px
Rozpocząć pokaz od strony:

Download "Sieci komputerowe. Wykład 8: Wyszukiwarki internetowe. Marcin Bieńkowski. Instytut Informatyki Uniwersytet Wrocławski"

Transkrypt

1 Sieci komputerowe Wykład 8: Wyszukiwarki internetowe Marcin Bieńkowski Instytut Informatyki Uniwersytet Wrocławski Sieci komputerowe (II UWr) Wykład 8 1 / 37

2 czyli jak znaleźć igłę w sieci Sieci komputerowe (II UWr) Wykład 8 2 / 37

3 Historia Wstęp Dawno, dawno temu... Sieć bez wyszukiwarek Statyczne zbiory zasobów (katalogi stron, nadal istnieja) Polskie Zasoby Sieciowe wydawane na CD! Obecnie: Cała gama wyszukiwarek: Google, Live Search, Yahoo! Search, A wyszukiwarki treści specjalistycznych Sieci komputerowe (II UWr) Wykład 8 3 / 37

4 Historia Wstęp Dawno, dawno temu... Sieć bez wyszukiwarek Statyczne zbiory zasobów (katalogi stron, nadal istnieja) Polskie Zasoby Sieciowe wydawane na CD! Obecnie: Cała gama wyszukiwarek: Google, Live Search, Yahoo! Search, A wyszukiwarki treści specjalistycznych Sieci komputerowe (II UWr) Wykład 8 3 / 37

5 Historia Wstęp Dawno, dawno temu... Sieć bez wyszukiwarek Statyczne zbiory zasobów (katalogi stron, nadal istnieja) Polskie Zasoby Sieciowe wydawane na CD! Obecnie: Cała gama wyszukiwarek: Google, Live Search, Yahoo! Search, A wyszukiwarki treści specjalistycznych Sieci komputerowe (II UWr) Wykład 8 3 / 37

6 Wyszukiwarki Wstęp Trzy etapy działania Przeszukiwanie sieci Indeksowanie treści Wyszukiwanie informacji Sieci komputerowe (II UWr) Wykład 8 4 / 37

7 Wyszukiwarki Wstęp Trzy etapy działania Przeszukiwanie sieci Indeksowanie treści Wyszukiwanie informacji Sieci komputerowe (II UWr) Wykład 8 4 / 37

8 Web crawling Przeszukiwanie sieci Web crawler działa jak przegladarka WWW podażaj aca za wszystkimi odnośnikami, które widzi. Sieci komputerowe (II UWr) Wykład 8 5 / 37

9 Problem Przeszukiwanie sieci Graf sieci WWW wyglada tak (stan na rok 2000, ok. 200 mln stron) Ok. 10% stron nie jest podłaczonych do głównej sieci WWW. Teraz jeszcze gorzej: 100mld stron (około 45mld zaindeksowane) Obrazek ze pracy Graph structure of the Web, Broder et al. Sieci komputerowe (II UWr) Wykład 8 6 / 37

10 Problem Przeszukiwanie sieci Graf sieci WWW wyglada tak (stan na rok 2000, ok. 200 mln stron) Ok. 10% stron nie jest podłaczonych do głównej sieci WWW. Teraz jeszcze gorzej: 100mld stron (około 45mld zaindeksowane) Obrazek ze pracy Graph structure of the Web, Broder et al. Sieci komputerowe (II UWr) Wykład 8 6 / 37

11 Problem Przeszukiwanie sieci Graf sieci WWW wyglada tak (stan na rok 2000, ok. 200 mln stron) Ok. 10% stron nie jest podłaczonych do głównej sieci WWW. Teraz jeszcze gorzej: 100mld stron (około 45mld zaindeksowane) Obrazek ze pracy Graph structure of the Web, Broder et al. Sieci komputerowe (II UWr) Wykład 8 6 / 37

12 Przeszukiwanie sieci Na które strony nie wchodzimy Webcrawlery (zazwyczaj) respektuja tzw. pliki robots.txt Przykładowy robots.txt User-agent: * Disallow: /cgi-bin/ Disallow: /images/ Disallow: /tmp/ Disallow: /private/ Sieci komputerowe (II UWr) Wykład 8 7 / 37

13 Przeszukiwanie sieci Dalsze problemy z przechodzeniem grafu sieci Strony generowane dynamicznie (wypełnianie formularzy) Obiekty nietekstowe (obrazki, filmy, strony we Flashu, programy w Javie,...) Często uaktualniane strony Sieci komputerowe (II UWr) Wykład 8 8 / 37

14 Wyszukiwarki Indeksowanie Trzy etapy działania Przeszukiwanie sieci Indeksowanie treści Wyszukiwanie informacji Sieci komputerowe (II UWr) Wykład 8 9 / 37

15 Indeksowanie Indeksowanie znalezionych stron Problemy: Liczba stron Ponad 100 różnych języków (różne alfabety!) 30% stron to kopie innych stron Sieci komputerowe (II UWr) Wykład 8 10 / 37

16 Indeksowanie Po czym możemy indeksować? Po zawartości (słowa w tekście) Po znacznikach meta Po tytule Czy to wystarcza? Sieci komputerowe (II UWr) Wykład 8 11 / 37

17 Indeksowanie Po czym możemy indeksować? Po zawartości (słowa w tekście) Po znacznikach meta Po tytule Czy to wystarcza? Sieci komputerowe (II UWr) Wykład 8 11 / 37

18 Indeksowanie Problemy z indeksowaniem po zawartości strony Na stronie nie występuje słowo car ani auto. Na stronie nie występuje słowo wyszukiwarka. Strona wortschatz.uni-leipzig.de/papers/top10000en.txt zawiera 10 tysięcy najpopularniejszych słów angielskich. Niektóre słowa, np. WWW, Web występuja na prawie każdej stronie. Sieci komputerowe (II UWr) Wykład 8 12 / 37

19 Indeksowanie Problemy z indeksowaniem po zawartości strony Na stronie nie występuje słowo car ani auto. Na stronie nie występuje słowo wyszukiwarka. Strona wortschatz.uni-leipzig.de/papers/top10000en.txt zawiera 10 tysięcy najpopularniejszych słów angielskich. Niektóre słowa, np. WWW, Web występuja na prawie każdej stronie. Sieci komputerowe (II UWr) Wykład 8 12 / 37

20 Pomysł Indeksowanie Możemy indeksować również po nazwach odnośników prowadzacych do danej strony. Istotniejsze jest to co o naszej stronie myśla inni niż my sami. Sieci komputerowe (II UWr) Wykład 8 13 / 37

21 Pomysł Indeksowanie Możemy indeksować również po nazwach odnośników prowadzacych do danej strony. Istotniejsze jest to co o naszej stronie myśla inni niż my sami. Sieci komputerowe (II UWr) Wykład 8 13 / 37

22 Wyszukiwarki Wyszukiwanie informacji Trzy etapy działania Przeszukiwanie sieci Indeksowanie treści Wyszukiwanie informacji Sieci komputerowe (II UWr) Wykład 8 14 / 37

23 Wyszukiwanie informacji Główny problem (dla jęz. angielskiego) 95% stron da się zbudować używajac tych samych słów. Wniosek: Wyszukanie niektórych słów, a nawet ich kombinacji, zwraca kilkadziesiat milionów trafień. Które trafienia zwrócić użytkownikowi jako pierwsze? Sieci komputerowe (II UWr) Wykład 8 15 / 37

24 Wyszukiwanie informacji Główny problem (dla jęz. angielskiego) 95% stron da się zbudować używajac tych samych słów. Wniosek: Wyszukanie niektórych słów, a nawet ich kombinacji, zwraca kilkadziesiat milionów trafień. Które trafienia zwrócić użytkownikowi jako pierwsze? Sieci komputerowe (II UWr) Wykład 8 15 / 37

25 Wyszukiwanie informacji Główny problem (dla jęz. angielskiego) 95% stron da się zbudować używajac tych samych słów. Wniosek: Wyszukanie niektórych słów, a nawet ich kombinacji, zwraca kilkadziesiat milionów trafień. Które trafienia zwrócić użytkownikowi jako pierwsze? Sieci komputerowe (II UWr) Wykład 8 15 / 37

26 Sortowanie wyników Oczywiste: najpierw wyświetlamy strony sponsorowane. Ale żeby nam płacono, musimy zwracać też dobre wyniki dla niesponsorowanych stron. Sieci komputerowe (II UWr) Wykład 8 16 / 37

27 Sortowanie wyników Oczywiste: najpierw wyświetlamy strony sponsorowane. Ale żeby nam płacono, musimy zwracać też dobre wyniki dla niesponsorowanych stron. Sieci komputerowe (II UWr) Wykład 8 16 / 37

28 Sortowanie wyników, cd. Stara strategia (do ok. roku 1998): Jeśli użytkownik szuka słowa X zwracamy stronę, która zawiera jak najwięcej X Patologie: Mnóstwo słów (często niezwiazanych z treścia) w znacznikach meta. Niewyświetlane napisy (np. w kolorze tła). Sieci komputerowe (II UWr) Wykład 8 17 / 37

29 Sortowanie wyników, cd. Stara strategia (do ok. roku 1998): Jeśli użytkownik szuka słowa X zwracamy stronę, która zawiera jak najwięcej X Patologie: Mnóstwo słów (często niezwiazanych z treścia) w znacznikach meta. Niewyświetlane napisy (np. w kolorze tła). Sieci komputerowe (II UWr) Wykład 8 17 / 37

30 Które strony sa ważne? Brin, Page 98 - Algorytm Algorytm przypisujacy ważność poszczególnym stronom (jedna wartość dla każdej strony). Sieci komputerowe (II UWr) Wykład 8 18 / 37

31 Wyszukiwanie informacji Główna idea: Ważne strony wskazuja (maja odnośniki) na inne ważne strony. Każdej stronie P i przypisujemy rangę R(P i ) [0, 1]. Jeśli strona P i ma l i sasiadów, to każdemu przekazuje 1/l i swojej rangi: R(P i ) = R(P j ), l j P j B i gdzie B i jest zbiorem stron, z których prowadzi krawędź do P i. Sieci komputerowe (II UWr) Wykład 8 19 / 37

32 Żeby zrozumieć rekurencję, trzeba zrozumieć rekurencję Mamy rekurencyjna zależność: Uproszczony algorytm : R(P i ) = P j B i R(P j ) l j Żeby policzyć rangę (ważność) danej strony trzeba policzyć rangi stron do niej prowadzacych A zatem rangi stron do nich prowadzacych... itd. Oczywiście można też obliczyć R(P i ) rozwiazuj ac układ równań (dużo stron niepraktyczne) Sieci komputerowe (II UWr) Wykład 8 20 / 37

33 Żeby zrozumieć rekurencję, trzeba zrozumieć rekurencję Mamy rekurencyjna zależność: Uproszczony algorytm : R(P i ) = P j B i R(P j ) l j Żeby policzyć rangę (ważność) danej strony trzeba policzyć rangi stron do niej prowadzacych A zatem rangi stron do nich prowadzacych... itd. Oczywiście można też obliczyć R(P i ) rozwiazuj ac układ równań (dużo stron niepraktyczne) Sieci komputerowe (II UWr) Wykład 8 20 / 37

34 Żeby zrozumieć rekurencję, trzeba zrozumieć rekurencję Mamy rekurencyjna zależność: Uproszczony algorytm : R(P i ) = P j B i R(P j ) l j Żeby policzyć rangę (ważność) danej strony trzeba policzyć rangi stron do niej prowadzacych A zatem rangi stron do nich prowadzacych... itd. Oczywiście można też obliczyć R(P i ) rozwiazuj ac układ równań (dużo stron niepraktyczne) Sieci komputerowe (II UWr) Wykład 8 20 / 37

35 Żeby zrozumieć rekurencję, trzeba zrozumieć rekurencję Mamy rekurencyjna zależność: Uproszczony algorytm : R(P i ) = P j B i R(P j ) l j Żeby policzyć rangę (ważność) danej strony trzeba policzyć rangi stron do niej prowadzacych A zatem rangi stron do nich prowadzacych... itd. Oczywiście można też obliczyć R(P i ) rozwiazuj ac układ równań (dużo stron niepraktyczne) Sieci komputerowe (II UWr) Wykład 8 20 / 37

36 Żeby zrozumieć rekurencję, trzeba zrozumieć rekurencję Mamy rekurencyjna zależność: Uproszczony algorytm : R(P i ) = P j B i R(P j ) l j Żeby policzyć rangę (ważność) danej strony trzeba policzyć rangi stron do niej prowadzacych A zatem rangi stron do nich prowadzacych... itd. Oczywiście można też obliczyć R(P i ) rozwiazuj ac układ równań (dużo stron niepraktyczne) Sieci komputerowe (II UWr) Wykład 8 20 / 37

37 Rozwiazanie Zacznijmy od dowolnych rang R i obliczajmy kolejne wartości ze wzoru R(P i ) P j B i R(P j ) l j, Sieci komputerowe (II UWr) Wykład 8 21 / 37

38 Przykład Wyszukiwanie informacji R(P i ) P j B i R(P j ) l j, Obrazki ze strony Sieci komputerowe (II UWr) Wykład 8 22 / 37

39 Przykład, cd. Wyszukiwanie informacji R(P i ) P j B i R(P j ) l j Dochodzimy do stanu stacjonarnego: R(a) = 1.2, R(b) = 1.2, R(c) = 0.6 Możemy go przeskalować: Jeśli zaczniemy od R(a) = R(b) = R(c) = 1/3, to dojdziemy do R(a) = 0.4, R(b) = 0.4, R(c) = 0.2. Sieci komputerowe (II UWr) Wykład 8 23 / 37

40 Czy to zawsze działa? W szczególności, czy: 1 wektor rang zawsze zbiega do stanu stacjonarnego? 2 ostateczna wartość zależy od stanu poczatkowego? 3 rangi faktycznie odpowiadaja ważności stron? Rangi a ważność strony ranga pojedynczy wskaźnik (co ze słowami o wielu znaczeniach?) możliwość nadużywania systemu przez tworzenie zbiorów stron, które wskazuja na nasza (ćwiczenie) Sieci komputerowe (II UWr) Wykład 8 24 / 37

41 Czy to zawsze działa? W szczególności, czy: 1 wektor rang zawsze zbiega do stanu stacjonarnego? Nie 2 ostateczna wartość zależy od stanu poczatkowego? 3 rangi faktycznie odpowiadaja ważności stron? Rangi a ważność strony ranga pojedynczy wskaźnik (co ze słowami o wielu znaczeniach?) możliwość nadużywania systemu przez tworzenie zbiorów stron, które wskazuja na nasza (ćwiczenie) Sieci komputerowe (II UWr) Wykład 8 24 / 37

42 Czy to zawsze działa? W szczególności, czy: 1 wektor rang zawsze zbiega do stanu stacjonarnego? Nie 2 ostateczna wartość zależy od stanu poczatkowego? Nie 3 rangi faktycznie odpowiadaja ważności stron? Rangi a ważność strony ranga pojedynczy wskaźnik (co ze słowami o wielu znaczeniach?) możliwość nadużywania systemu przez tworzenie zbiorów stron, które wskazuja na nasza (ćwiczenie) Sieci komputerowe (II UWr) Wykład 8 24 / 37

43 Czy to zawsze działa? W szczególności, czy: 1 wektor rang zawsze zbiega do stanu stacjonarnego? Nie 2 ostateczna wartość zależy od stanu poczatkowego? Nie 3 rangi faktycznie odpowiadaja ważności stron? Nie Rangi a ważność strony ranga pojedynczy wskaźnik (co ze słowami o wielu znaczeniach?) możliwość nadużywania systemu przez tworzenie zbiorów stron, które wskazuja na nasza (ćwiczenie) Sieci komputerowe (II UWr) Wykład 8 24 / 37

44 Czy to zawsze działa? W szczególności, czy: 1 wektor rang zawsze zbiega do stanu stacjonarnego? Nie 2 ostateczna wartość zależy od stanu poczatkowego? Nie 3 rangi faktycznie odpowiadaja ważności stron? Nie Rangi a ważność strony ranga pojedynczy wskaźnik (co ze słowami o wielu znaczeniach?) możliwość nadużywania systemu przez tworzenie zbiorów stron, które wskazuja na nasza (ćwiczenie) Sieci komputerowe (II UWr) Wykład 8 24 / 37

45 Problem nr 1: strony bez odnośników Kolejne wartości rang: R(1) R(2) Strony bez odnośników wysysaja cała wagę przeznaczona na rangi. Tymczasowe rozwiazanie: dodajmy pętle do stron bez odnośników. Obrazki ze strony Sieci komputerowe (II UWr) Wykład 8 25 / 37

46 Problem nr 1: strony bez odnośników Kolejne wartości rang: R(1) R(2) Strony bez odnośników wysysaja cała wagę przeznaczona na rangi. Tymczasowe rozwiazanie: dodajmy pętle do stron bez odnośników. Obrazki ze strony Sieci komputerowe (II UWr) Wykład 8 25 / 37

47 Problem nr 1: strony bez odnośników Kolejne wartości rang: R(1) R(2) Strony bez odnośników wysysaja cała wagę przeznaczona na rangi. Tymczasowe rozwiazanie: dodajmy pętle do stron bez odnośników. Obrazki ze strony Sieci komputerowe (II UWr) Wykład 8 25 / 37

48 Problem nr 2 (nawet pętle nie pomagaja) Kolejne wartości rang: R(1) R(2) R(3) Wynik (stan stacjonarny) zależy od wartości poczatkowej! Sieci komputerowe (II UWr) Wykład 8 26 / 37

49 Problem nr 2 (nawet pętle nie pomagaja) Kolejne wartości rang: R(1) R(2) R(3) Ale jeśli zaczniemy od innych: R(1) R(2) R(3) Wynik (stan stacjonarny) zależy od wartości poczatkowej! Sieci komputerowe (II UWr) Wykład 8 26 / 37

50 Problem nr 2, cd. Wyszukiwanie informacji Dlaczego? Problem zbiegania do różnych stanów stacjonarnych pojawia się, bo graf nie jest silnie spójny Gdyby nie był spójny, byłoby jeszcze gorzej Czy silna spójność wystarcza? Sieci komputerowe (II UWr) Wykład 8 27 / 37

51 Problem nr 2, cd. Wyszukiwanie informacji Dlaczego? Problem zbiegania do różnych stanów stacjonarnych pojawia się, bo graf nie jest silnie spójny Gdyby nie był spójny, byłoby jeszcze gorzej Czy silna spójność wystarcza? Sieci komputerowe (II UWr) Wykład 8 27 / 37

52 Problem nr 2, cd. Wyszukiwanie informacji Dlaczego? Problem zbiegania do różnych stanów stacjonarnych pojawia się, bo graf nie jest silnie spójny Gdyby nie był spójny, byłoby jeszcze gorzej Czy silna spójność wystarcza? Nie! Sieci komputerowe (II UWr) Wykład 8 27 / 37

53 Problem nr 3: okresowość Kolejne wartości rang: R(1) R(2) R(3) R(4) R(5) Ale jeśli zaczniemy od innych: R(1) R(2) R(3) R(4) R(5) Obrazki ze strony Sieci komputerowe (II UWr) Wykład 8 28 / 37

54 Problem nr 3: okresowość Kolejne wartości rang: R(1) R(2) R(3) R(4) R(5) Ale jeśli zaczniemy od innych: R(1) R(2) R(3) R(4) R(5) Obrazki ze strony Sieci komputerowe (II UWr) Wykład 8 28 / 37

55 Problem 3, cd. Wyszukiwanie informacji Okresowość wierzchołka Okres wierzchołka s = GCD długości wszystkich cykli zawierajacych s Okresowość grafu Graf jest okresowy jeśli wszystkie wierzchołki maja okres > 1. Sieci komputerowe (II UWr) Wykład 8 29 / 37

56 Problem 3, cd. Wyszukiwanie informacji Okresowość wierzchołka Okres wierzchołka s = GCD długości wszystkich cykli zawierajacych s Okresowość grafu Graf jest okresowy jeśli wszystkie wierzchołki maja okres > 1. Sieci komputerowe (II UWr) Wykład 8 29 / 37

57 Co nam daje silna spójność i nieokresowość? Uogólnijmy nasz graf: dodajemy do krawędzi wagi; wymagamy, żeby suma wag krawędzi w ij wychodzacych ze strony P i była równa 1. Obliczamy R(P i ) P j w ij R(P j ) własności silna spójność i okresowość dotycza grafu, w którym patrzymy na krawędzie o niezerowych wagach Twierdzenie Jeśli graf jest silnie spójny i nieokresowy, to istnieje tylko jeden stan stacjonarny i uproszczony algorytm do niego zbiega. Sieci komputerowe (II UWr) Wykład 8 30 / 37

58 Co nam daje silna spójność i nieokresowość? Uogólnijmy nasz graf: dodajemy do krawędzi wagi; wymagamy, żeby suma wag krawędzi w ij wychodzacych ze strony P i była równa 1. Obliczamy R(P i ) P j w ij R(P j ) własności silna spójność i okresowość dotycza grafu, w którym patrzymy na krawędzie o niezerowych wagach Twierdzenie Jeśli graf jest silnie spójny i nieokresowy, to istnieje tylko jeden stan stacjonarny i uproszczony algorytm do niego zbiega. Sieci komputerowe (II UWr) Wykład 8 30 / 37

59 Co nam daje silna spójność i nieokresowość? Uogólnijmy nasz graf: dodajemy do krawędzi wagi; wymagamy, żeby suma wag krawędzi w ij wychodzacych ze strony P i była równa 1. Obliczamy R(P i ) P j w ij R(P j ) własności silna spójność i okresowość dotycza grafu, w którym patrzymy na krawędzie o niezerowych wagach Twierdzenie Jeśli graf jest silnie spójny i nieokresowy, to istnieje tylko jeden stan stacjonarny i uproszczony algorytm do niego zbiega. Sieci komputerowe (II UWr) Wykład 8 30 / 37

60 Modyfikacja algorytmu Nie modyfikujemy samego algorytmu, tylko uruchamiamy go na lekko zmodyfikowanym grafie. Chcemy, żeby graf po modyfikacji był silnie spójny był nieokresowy możliwie najmniej różnił się od oryginalnego Sieci komputerowe (II UWr) Wykład 8 31 / 37

61 Interpretacja probabilistyczna Inne spojrzenie na proces obliczania stanu stacjonarnego ranga = prawdopodobieństwo, że jesteśmy w danym wierzchołku na poczatku losujemy sobie dowolna stronę potem klikamy losowo w odnośniki po wielu kliknięciach prawdpodobieństwo jest dyktowane przez coś podobnego do stanu stacjonarnego w ważnych stronach jesteśmy z większym prawdopodobieństwem Pomysł: niech nasz losowy klikacz jeśli nie ma wyjścia z danej strony, zaczyna od nowa nawet jeśli wyjście jest to zaczyna od nowa z prawdopodobieństwem 1 α. Jak to przełożyć na modyfikację grafu? Sieci komputerowe (II UWr) Wykład 8 32 / 37

62 Interpretacja probabilistyczna Inne spojrzenie na proces obliczania stanu stacjonarnego ranga = prawdopodobieństwo, że jesteśmy w danym wierzchołku na poczatku losujemy sobie dowolna stronę potem klikamy losowo w odnośniki po wielu kliknięciach prawdpodobieństwo jest dyktowane przez coś podobnego do stanu stacjonarnego w ważnych stronach jesteśmy z większym prawdopodobieństwem Pomysł: niech nasz losowy klikacz jeśli nie ma wyjścia z danej strony, zaczyna od nowa nawet jeśli wyjście jest to zaczyna od nowa z prawdopodobieństwem 1 α. Jak to przełożyć na modyfikację grafu? Sieci komputerowe (II UWr) Wykład 8 32 / 37

63 Interpretacja probabilistyczna Inne spojrzenie na proces obliczania stanu stacjonarnego ranga = prawdopodobieństwo, że jesteśmy w danym wierzchołku na poczatku losujemy sobie dowolna stronę potem klikamy losowo w odnośniki po wielu kliknięciach prawdpodobieństwo jest dyktowane przez coś podobnego do stanu stacjonarnego w ważnych stronach jesteśmy z większym prawdopodobieństwem Pomysł: niech nasz losowy klikacz jeśli nie ma wyjścia z danej strony, zaczyna od nowa nawet jeśli wyjście jest to zaczyna od nowa z prawdopodobieństwem 1 α. Jak to przełożyć na modyfikację grafu? Sieci komputerowe (II UWr) Wykład 8 32 / 37

64 Interpretacja probabilistyczna Inne spojrzenie na proces obliczania stanu stacjonarnego ranga = prawdopodobieństwo, że jesteśmy w danym wierzchołku na poczatku losujemy sobie dowolna stronę potem klikamy losowo w odnośniki po wielu kliknięciach prawdpodobieństwo jest dyktowane przez coś podobnego do stanu stacjonarnego w ważnych stronach jesteśmy z większym prawdopodobieństwem Pomysł: niech nasz losowy klikacz jeśli nie ma wyjścia z danej strony, zaczyna od nowa nawet jeśli wyjście jest to zaczyna od nowa z prawdopodobieństwem 1 α. Jak to przełożyć na modyfikację grafu? Sieci komputerowe (II UWr) Wykład 8 32 / 37

65 Rozwiazanie Wyszukiwanie informacji Jak radzić sobie z okresowościa i brakiem silnej spójności? Mnożymy wagi istniejacych krawędzi przez α Z wierzchołków z których wychodza krawędzie dodajemy sztuczne krawędzie (z wagami 1 α n ) od każdego innego wierzchołka (w tym także pętle). Z wierzchołków z których nie wychodza krawędzie dodajemy sztuczne krawędzie (z wagami 1 n ) od każdego innego wierzchołka. Sieci komputerowe (II UWr) Wykład 8 33 / 37

66 Przykładowa modyfikacja Przed: Po: 1 α α + 1 α 2 Sieci komputerowe (II UWr) Wykład 8 34 / 37

67 Własności Wyszukiwanie informacji Twierdzenie Po powyższej modyfikacji otrzymujemy graf silnie spójny i nieokresowy. Dowód Po pominięciu wag, otrzymany graf jest grafem pełnym. Sieci komputerowe (II UWr) Wykład 8 35 / 37

68 Algorytm Wyszukiwanie informacji Algorytm Zaczynamy od R(u) = 1 n. W każdym kroku obliczamy R(P i ) = P j w ij R(P j ) = 1 α n + α P j nie ma odnosnikow R(P j) n + R(P j ) l j P j B i Sieci komputerowe (II UWr) Wykład 8 36 / 37

69 Uwagi końcowe Wyszukiwanie informacji Google używa(ł) z α = Im większa wartość α, tym graf jest bliższy oryginalnemu: dla α = 0 otrzymujemy graf pełny (z ppb. 1/n na wszystkich krawędziach). Im mniejsza wartość α, tym szybsza zbieżność do stanu stacjonarnego Sieci komputerowe (II UWr) Wykład 8 37 / 37

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova

Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova Wstęp do sieci neuronowych, wykład 11 Łańcuchy Markova M. Czoków, J. Piersa 2010-12-21 1 Definicja Własności Losowanie z rozkładu dyskretnego 2 3 Łańcuch Markova Definicja Własności Losowanie z rozkładu

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa

Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa Wstęp do sieci neuronowych, wykład 12 Łańcuchy Markowa M. Czoków, J. Piersa 2012-01-10 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego 3 1 Łańcucha Markowa 2 Istnienie Szukanie stanu stacjonarnego

Bardziej szczegółowo

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH

ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH 1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Dane w postaci grafów Przykład: social network 3 Przykład: media network 4 Przykład: information network

Bardziej szczegółowo

Spacery losowe generowanie realizacji procesu losowego

Spacery losowe generowanie realizacji procesu losowego Spacery losowe generowanie realizacji procesu losowego Michał Krzemiński Streszczenie Omówimy metodę generowania trajektorii spacerów losowych (błądzenia losowego), tj. szczególnych procesów Markowa z

Bardziej szczegółowo

Badanie struktury sieci WWW

Badanie struktury sieci WWW Eksploracja zasobów internetowych Wykład 1 Badanie struktury sieci WWW mgr inż. Maciej Kopczyński Białystok 214 Rys historyczny Idea sieci Web stworzona została w 1989 przez Tima BernersaLee z CERN jako

Bardziej szczegółowo

Porównanie algorytmów wyszukiwania najkrótszych ścieżek międz. grafu. Daniel Golubiewski. 22 listopada Instytut Informatyki

Porównanie algorytmów wyszukiwania najkrótszych ścieżek międz. grafu. Daniel Golubiewski. 22 listopada Instytut Informatyki Porównanie algorytmów wyszukiwania najkrótszych ścieżek między wierzchołkami grafu. Instytut Informatyki 22 listopada 2015 Algorytm DFS w głąb Algorytm przejścia/przeszukiwania w głąb (ang. Depth First

Bardziej szczegółowo

Zastosowanie wartości własnych macierzy

Zastosowanie wartości własnych macierzy Uniwersytet Warszawski 15 maja 2008 Agenda Postawienie problemu 1 Postawienie problemu Motywacja Jak zbudować wyszukiwarkę? Dlaczego to nie jest takie trywialne? Możliwe rozwiazania Model 2 3 4 Motywacja

Bardziej szczegółowo

Instytut Informatyki Uniwersytet Wrocławski. Dane w sieciach. (i inne historie) Marcin Bieńkowski

Instytut Informatyki Uniwersytet Wrocławski. Dane w sieciach. (i inne historie) Marcin Bieńkowski Dane w sieciach (i inne historie) Marcin Bieńkowski Jak przechowywać dane w sieciach (strony WWW, bazy danych, ) tak, żeby dowolne ciągi odwołań do (części) tych obiektów mogły być obsłużone małym kosztem?

Bardziej szczegółowo

Reprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów

Reprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów Wykład 2. Reprezentacja komputerowa grafów 1 / 69 Macierz incydencji Niech graf G będzie grafem nieskierowanym bez pętli o n wierzchołkach (x 1, x 2,..., x n) i m krawędziach (e 1, e 2,..., e m). 2 / 69

Bardziej szczegółowo

Algorytmy metaheurystyczne Wykład 6. Piotr Syga

Algorytmy metaheurystyczne Wykład 6. Piotr Syga Algorytmy metaheurystyczne Wykład 6 Piotr Syga 10.04.2017 Wprowadzenie Inspiracje Wprowadzenie ACS idea 1 Zaczynamy z pustym rozwiązaniem początkowym 2 Dzielimy problem na komponenty (przedmiot do zabrania,

Bardziej szczegółowo

Algorytm Dijkstry znajdowania najkrótszej ścieżki w grafie

Algorytm Dijkstry znajdowania najkrótszej ścieżki w grafie Algorytm Dijkstry znajdowania najkrótszej ścieżki w grafie Używane struktury danych: V - zbiór wierzchołków grafu, V = {1,2,3...,n} E - zbiór krawędzi grafu, E = {(i,j),...}, gdzie i, j Î V i istnieje

Bardziej szczegółowo

Edytor Edit+ - dodawanie zdjęć i. załączników. Instrukcja użytkownika

Edytor Edit+ - dodawanie zdjęć i. załączników. Instrukcja użytkownika Edytor Edit+ - dodawanie zdjęć i załączników Instrukcja użytkownika Maj 2015 SPIS TREŚCI SPIS TREŚCI... 2 Tworzenie zdjęć... 3 Tworzenie załączników... 6 Strona 2 z 10 Tworzenie zdjęć Aby dodać do strony

Bardziej szczegółowo

Elementy modelowania matematycznego

Elementy modelowania matematycznego Elementy modelowania matematycznego Łańcuchy Markowa: zagadnienia graniczne. Ukryte modele Markowa. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ KLASYFIKACJA STANÓW Stan i jest osiągalny

Bardziej szczegółowo

Sposoby wyszukiwania multimedialnych zasobów w Internecie

Sposoby wyszukiwania multimedialnych zasobów w Internecie Sposoby wyszukiwania multimedialnych zasobów w Internecie Lidia Derfert-Wolf Biblioteka Główna Uniwersytetu Technologiczno-Przyrodniczego w Bydgoszczy e-mail: lidka@utp.edu.pl III seminarium z cyklu INFOBROKER:

Bardziej szczegółowo

Teoria grafów dla małolatów. Andrzej Przemysław Urbański Instytut Informatyki Politechnika Poznańska

Teoria grafów dla małolatów. Andrzej Przemysław Urbański Instytut Informatyki Politechnika Poznańska Teoria grafów dla małolatów Andrzej Przemysław Urbański Instytut Informatyki Politechnika Poznańska Wstęp Matematyka to wiele różnych dyscyplin Bowiem świat jest bardzo skomplikowany wymaga rozważenia

Bardziej szczegółowo

Spis treúci. Księgarnia PWN: Paweł Kobis - Marketing z Google. Podziękowania O Autorze Wstęp... 13

Spis treúci. Księgarnia PWN: Paweł Kobis - Marketing z Google. Podziękowania O Autorze Wstęp... 13 Spis treúci Księgarnia PWN: Paweł Kobis - Marketing z Google Podziękowania... 9 O Autorze... 11 Wstęp... 13 1. Pozycjonowanie stron... 15 1.1. Dlaczego warto pozycjonować strony?... 16 1.2. Dlaczego pozycjonowanie,

Bardziej szczegółowo

Digraf. 13 maja 2017

Digraf. 13 maja 2017 Digraf 13 maja 2017 Graf skierowany, digraf, digraf prosty Definicja 1 Digraf prosty G to (V, E), gdzie V jest zbiorem wierzchołków, E jest rodziną zorientowanych krawędzi, między różnymi wierzchołkami,

Bardziej szczegółowo

Matematyczne Podstawy Informatyki

Matematyczne Podstawy Informatyki Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 03/0 Przeszukiwanie w głąb i wszerz I Przeszukiwanie metodą

Bardziej szczegółowo

Zad. 1 Zad. 2 Zad. 3 Zad. 4 Zad. 5 SUMA

Zad. 1 Zad. 2 Zad. 3 Zad. 4 Zad. 5 SUMA Zad. 1 Zad. 2 Zad. 3 Zad. 4 Zad. 5 SUMA Zad. 1 (12p.)Niech n 3k > 0. Zbadać jaka jest najmniejsza możliwa liczba krawędzi w grafie, który ma dokładnie n wierzchołków oraz dokładnie k składowych, z których

Bardziej szczegółowo

Minimalne drzewa rozpinające

Minimalne drzewa rozpinające KNM UŚ 26-28 listopada 2010 Ostrzeżenie Wprowadzenie Motywacja Definicje Niektóre pojęcia pojawiające się podczas tego referatu są naszymi autorskimi tłumaczeniami z języka angielskiego. Nie udało nam

Bardziej szczegółowo

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite

Tomasz Boiński: 1. Pozycjonowanie stron i zastosowanie mod_rewrite Tomasz Boiński: 1 Pozycjonowanie stron i zastosowanie mod_rewrite Pozycjonowanie stron Promocja strony odbywa się poprzez umiejscowienie jej jak najwyżej w wynikach wyszukiwania Wyszukiwarki indeksują

Bardziej szczegółowo

Ogłoszenia parafialne nie tylko z ambony

Ogłoszenia parafialne nie tylko z ambony Ogłoszenia parafialne nie tylko z ambony Nota Materiał powstał w ramach realizacji projektu e-kompetencje bez barier dofinansowanego z Programu Operacyjnego Polska Cyfrowa działanie 3.1 Działania szkoleniowe

Bardziej szczegółowo

Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można

Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można Wyszukiwarki stosują różne metody oceny stron i algorytmy oceniające za indeksowane strony różnią się w poszczególnych wyszukiwarkach, ale można jednak wyróżnić 3 główne elementy, które brane są pod uwagę:

Bardziej szczegółowo

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2

Metody teorii gier. ALP520 - Wykład z Algorytmów Probabilistycznych p.2 Metody teorii gier ALP520 - Wykład z Algorytmów Probabilistycznych p.2 Metody teorii gier Cel: Wyprowadzenie oszacowania dolnego na oczekiwany czas działania dowolnego algorytmu losowego dla danego problemu.

Bardziej szczegółowo

Drzewa spinające MST dla grafów ważonych Maksymalne drzewo spinające Drzewo Steinera. Wykład 6. Drzewa cz. II

Drzewa spinające MST dla grafów ważonych Maksymalne drzewo spinające Drzewo Steinera. Wykład 6. Drzewa cz. II Wykład 6. Drzewa cz. II 1 / 65 drzewa spinające Drzewa spinające Zliczanie drzew spinających Drzewo T nazywamy drzewem rozpinającym (spinającym) (lub dendrytem) spójnego grafu G, jeżeli jest podgrafem

Bardziej szczegółowo

Nierówność Krafta-McMillana, Kodowanie Huffmana

Nierówność Krafta-McMillana, Kodowanie Huffmana Nierówność Krafta-McMillana, Kodowanie Huffmana Kodowanie i kompresja informacji - Wykład 2 1 marca 2010 Test na jednoznaczna dekodowalność Kod a jest prefiksem kodu b jeśli b jest postaci ax. x nazywamy

Bardziej szczegółowo

Internet, jako ocean informacji. Technologia Informacyjna Lekcja 2

Internet, jako ocean informacji. Technologia Informacyjna Lekcja 2 Internet, jako ocean informacji Technologia Informacyjna Lekcja 2 Internet INTERNET jest rozległą siecią połączeń, między ogromną liczbą mniejszych sieci komputerowych na całym świecie. Jest wszechstronnym

Bardziej szczegółowo

Kompresja danych Streszczenie Studia Dzienne Wykład 10,

Kompresja danych Streszczenie Studia Dzienne Wykład 10, 1 Kwantyzacja wektorowa Kompresja danych Streszczenie Studia Dzienne Wykład 10, 28.04.2006 Kwantyzacja wektorowa: dane dzielone na bloki (wektory), każdy blok kwantyzowany jako jeden element danych. Ogólny

Bardziej szczegółowo

Kompresja bezstratna. Entropia. Kod Huffmana

Kompresja bezstratna. Entropia. Kod Huffmana Kompresja bezstratna. Entropia. Kod Huffmana Kodowanie i bezpieczeństwo informacji - Wykład 10 29 kwietnia 2013 Teoria informacji Jeśli P(A) jest prawdopodobieństwem wystapienia informacji A to niech i(a)

Bardziej szczegółowo

Grafy Alberta-Barabasiego

Grafy Alberta-Barabasiego Spis treści 2010-01-18 Spis treści 1 Spis treści 2 Wielkości charakterystyczne 3 Cechy 4 5 6 7 Wielkości charakterystyczne Wielkości charakterystyczne Rozkład stopnie wierzchołków P(deg(x) = k) Graf jest

Bardziej szczegółowo

Internetowa strategia marketingowa

Internetowa strategia marketingowa Strategie Marketingowe Marketing Internetowy dr Grzegorz Szymański Internetowa strategia marketingowa Pozycjonowanie Jest to jedna z najskuteczniejszych i najtańszych metod reklamy w Internecie. Skuteczne

Bardziej szczegółowo

Internet wyszukiwarki internetowe

Internet wyszukiwarki internetowe Internet wyszukiwarki internetowe 1. WYSZUKIWARKI INTERNETOWE to doskonały sposób na znalezienie potrzebnych informacji w Internecie. Najpopularniejsze wyszukiwarki to: http://www.google.pl/ http://www.netsprint.pl/

Bardziej szczegółowo

Sprzedaż online. Piotr Sankowski Uniwersytet Warszawski Warszawa p. 1/40

Sprzedaż online. Piotr Sankowski Uniwersytet Warszawski Warszawa p. 1/40 Sprzedaż online Piotr Sankowski Uniwersytet Warszawski Warszawa 18.04.2013 - p. 1/40 Plan wykładu Problem skojarzeń online Algorytm zachłanny Algorytm losowo rankujacy Dolne ograniczenie Problem aukcji

Bardziej szczegółowo

Algorytmy mrówkowe (optymalizacja kolonii mrówek, Ant Colony optimisation)

Algorytmy mrówkowe (optymalizacja kolonii mrówek, Ant Colony optimisation) Algorytmy mrówkowe (optymalizacja kolonii mrówek, Ant Colony optimisation) Jest to technika probabilistyczna rozwiązywania problemów obliczeniowych, które mogą zostać sprowadzone do problemu znalezienie

Bardziej szczegółowo

Programowanie liniowe metoda sympleks

Programowanie liniowe metoda sympleks Programowanie liniowe metoda sympleks Mirosław Sobolewski Wydział Matematyki, Informatyki i Mechaniki UW 13. wykład z algebry liniowej Warszawa, styczeń 2018 Mirosław Sobolewski (UW) Warszawa, 2018 1 /

Bardziej szczegółowo

Wykład 8. Drzewo rozpinające (minimum spanning tree)

Wykład 8. Drzewo rozpinające (minimum spanning tree) Wykład 8 Drzewo rozpinające (minimum spanning tree) 1 Minimalne drzewo rozpinające - przegląd Definicja problemu Własności minimalnych drzew rozpinających Algorytm Kruskala Algorytm Prima Literatura Cormen,

Bardziej szczegółowo

Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I

Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I Techniki Optymalizacji: Stochastyczny spadek wzdłuż gradientu I Wojciech Kotłowski Instytut Informatyki Politechniki Poznańskiej email: imię.nazwisko@cs.put.poznan.pl pok. 2 (CW) tel. (61)665-2936 konsultacje:

Bardziej szczegółowo

Matematyka dyskretna - 7.Drzewa

Matematyka dyskretna - 7.Drzewa Matematyka dyskretna - 7.Drzewa W tym rozdziale zajmiemy się drzewami: specjalnym przypadkiem grafów. Są one szczególnie przydatne do przechowywania informacji, umożliwiającego szybki dostęp do nich. Definicja

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 12 Wykorzystanie sieci rekurencyjnych w optymalizacji grafowej

Wstęp do sieci neuronowych, wykład 12 Wykorzystanie sieci rekurencyjnych w optymalizacji grafowej Wstęp do sieci neuronowych, wykład 12 Wykorzystanie sieci rekurencyjnych w optymalizacji grafowej Maja Czoków, Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2013-01-09

Bardziej szczegółowo

Graf. Definicja marca / 1

Graf. Definicja marca / 1 Graf 25 marca 2018 Graf Definicja 1 Graf ogólny to para G = (V, E), gdzie V jest zbiorem wierzchołków (węzłów, punktów grafu), E jest rodziną krawędzi, które mogą być wielokrotne, dokładniej jednoelementowych

Bardziej szczegółowo

Wyszukiwanie informacji

Wyszukiwanie informacji Wyszukiwanie informacji Informatyka Temat 1 Krotoszyn, wrzesień 2015 r. 1 Informatyka 1 Przeszukiwanie zasobów internetowych Krotoszyn, 2015 r. Spis treści prezentacji 1. Wprowadzenie 2. Gdzie szukać informacji?

Bardziej szczegółowo

Pozycjonowanie stron w wyszukiwarkach internetowych. Szansa dla małych i średnich firm na konkurowanie z największymi

Pozycjonowanie stron w wyszukiwarkach internetowych. Szansa dla małych i średnich firm na konkurowanie z największymi Pozycjonowanie stron w wyszukiwarkach internetowych Szansa dla małych i średnich firm na konkurowanie z największymi Podstawowe informacje na temat pozycjonowania Według badań Search Engine Watch 81% internautów

Bardziej szczegółowo

Programowanie dynamiczne i algorytmy zachłanne

Programowanie dynamiczne i algorytmy zachłanne Programowanie dynamiczne i algorytmy zachłanne Tomasz Głowacki tglowacki@cs.put.poznan.pl Zajęcia finansowane z projektu "Rozwój i doskonalenie kształcenia na Politechnice Poznańskiej w zakresie technologii

Bardziej szczegółowo

Inteligentne systemy informacyjne

Inteligentne systemy informacyjne Filip Graliński Inteligentne systemy informacyjne Między stronami Wewnętrzna Ocena strony Zewnętrzna adversarial information retrieval = wyszukiwanie informacji we wrogim środowisku (spamerzy!) Unigram

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 9 Sieci rekurencyjne. Autoasocjator Hopfielda

Wstęp do sieci neuronowych, wykład 9 Sieci rekurencyjne. Autoasocjator Hopfielda Wstęp do sieci neuronowych, wykład 9. M. Czoków, J. Piersa 2010-12-07 1 Sieci skierowane 2 Modele sieci rekurencyjnej Energia sieci 3 Sieci skierowane Sieci skierowane Sieci skierowane graf połączeń synaptycznych

Bardziej szczegółowo

Podstawowe własności grafów. Wykład 3. Własności grafów

Podstawowe własności grafów. Wykład 3. Własności grafów Wykład 3. Własności grafów 1 / 87 Suma grafów Niech będą dane grafy proste G 1 = (V 1, E 1) oraz G 2 = (V 2, E 2). 2 / 87 Suma grafów Niech będą dane grafy proste G 1 = (V 1, E 1) oraz G 2 = (V 2, E 2).

Bardziej szczegółowo

Grafy co o ich rysowaniu wiedzą przedszkolaki i co z tego wynika dla matematyków

Grafy co o ich rysowaniu wiedzą przedszkolaki i co z tego wynika dla matematyków Wykłady popularne z matematyki Grafy co o ich rysowaniu wiedzą przedszkolaki i co z tego wynika dla matematyków Joanna Jaszuńska Politechnika Warszawska, 6 maja 2010 Grafy Wykłady popularne z matematyki,

Bardziej szczegółowo

1. Promocja sklepu. 1.1. Wysokość pozycjonowania.

1. Promocja sklepu. 1.1. Wysokość pozycjonowania. 1. Promocja sklepu Według Forrester Research ponad 80 proc. użytkowników sieci wykorzystuje wyszukiwarki internetowe do dotarcia do informacji dotyczących produktów i usług. Przeciętny internauta częściej

Bardziej szczegółowo

Algorytmy wyznaczania centralności w sieci Szymon Szylko

Algorytmy wyznaczania centralności w sieci Szymon Szylko Algorytmy wyznaczania centralności w sieci Szymon Szylko Zakład systemów Informacyjnych Wrocław 10.01.2008 Agenda prezentacji Cechy sieci Algorytmy grafowe Badanie centralności Algorytmy wyznaczania centralności

Bardziej szczegółowo

Algorytmy mrówkowe w dynamicznych problemach transportowych

Algorytmy mrówkowe w dynamicznych problemach transportowych y w dynamicznych problemach transportowych prof. dr hab Jacek Mandziuk MiNI, PW 3 czerwca 2013 Cel pracy Zbadanie zachowania algorytmu go zwykłego oraz z zaimplementowanymi optymalizacjami dla problemów

Bardziej szczegółowo

Księgarnia internetowa Lubię to!» Nasza społeczność

Księgarnia internetowa Lubię to!» Nasza społeczność Kup książkę Poleć książkę Oceń książkę Księgarnia internetowa Lubię to!» Nasza społeczność SPIS TREŚCI Drodzy Uczniowie!........................................... 5 Rozdział 1. Bezpieczne posługiwanie

Bardziej szczegółowo

MATEMATYKA DYSKRETNA - MATERIAŁY DO WYKŁADU GRAFY

MATEMATYKA DYSKRETNA - MATERIAŁY DO WYKŁADU GRAFY ERIAŁY DO WYKŁADU GRAFY Graf nieskierowany Grafem nieskierowanym nazywamy parę G = (V, E), gdzie V jest pewnym zbiorem skończonym (zwanym zbiorem wierzchołków grafu G), natomiast E jest zbiorem nieuporządkowanych

Bardziej szczegółowo

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne

E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne Przypominajka: 152 drzewo filogenetyczne to drzewo, którego liśćmi są istniejące gatunki, a węzły wewnętrzne mają stopień większy niż jeden i reprezentują

Bardziej szczegółowo

Wokół wyszukiwarek internetowych

Wokół wyszukiwarek internetowych Wokół wyszukiwarek internetowych Bartosz Makuracki 23 stycznia 2014 Przypomnienie Wzór x 1 = 1 d N x 2 = 1 d N + d N i=1 p 1,i x i + d N i=1 p 2,i x i. x N = 1 d N + d N i=1 p N,i x i Oznaczenia Gdzie:

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa. Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa. Maja Czoków, Jarosław Piersa, Andrzej Rutkowski Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2018-10-15 Projekt

Bardziej szczegółowo

Drzewa. Jeżeli graf G jest lasem, który ma n wierzchołków i k składowych, to G ma n k krawędzi. Własności drzew

Drzewa. Jeżeli graf G jest lasem, który ma n wierzchołków i k składowych, to G ma n k krawędzi. Własności drzew Drzewa Las - graf, który nie zawiera cykli Drzewo - las spójny Jeżeli graf G jest lasem, który ma n wierzchołków i k składowych, to G ma n k krawędzi. Własności drzew Niech T graf o n wierzchołkach będący

Bardziej szczegółowo

Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu

Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu XXVIII Letnia Szkoła Naukowa Metodologii Nauk Empirycznych Zakopane, 12-14.05.2014 Jak pisać publikacje naukowe? Nie o naukowej, a technicznej stronie pisania artykułu Maciej Zaborowicz Instytut Inżynierii

Bardziej szczegółowo

Wykład z Technologii Informacyjnych. Piotr Mika

Wykład z Technologii Informacyjnych. Piotr Mika Wykład z Technologii Informacyjnych Piotr Mika Uniwersalna forma graficznego zapisu algorytmów Schemat blokowy zbiór bloków, powiązanych ze sobą liniami zorientowanymi. Jest to rodzaj grafu, którego węzły

Bardziej szczegółowo

Materiały do projektów dostępne w Internecie

Materiały do projektów dostępne w Internecie Internet pełen jest treści, których użycie może znacznie uatrakcyjnić lekcje. Podpowiadamy, jak je znaleźć i nie narazić się przy tym na zarzuty o łamanie prawa. Często przygotowując się do lekcji czy

Bardziej szczegółowo

Matematyka dyskretna

Matematyka dyskretna Matematyka dyskretna Wykład 13: Teoria Grafów Gniewomir Sarbicki Literatura R.J. Wilson Wprowadzenie do teorii grafów Definicja: Grafem (skończonym, nieskierowanym) G nazywamy parę zbiorów (V (G), E(G)),

Bardziej szczegółowo

ROZDZIAŁ 2. INTERNET. Lekcja 5. Temat: Przeglądanie stron internetowych

ROZDZIAŁ 2. INTERNET. Lekcja 5. Temat: Przeglądanie stron internetowych ROZDZIAŁ 2. INTERNET Lekcja 5. Przeglądanie stron internetowych.................21 Lekcja 6. Wyszukiwanie informacji w internecie...............24 Lekcja 7. Gry w internecie...........................26

Bardziej szczegółowo

Matematyczne Podstawy Informatyki

Matematyczne Podstawy Informatyki Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 2013/2014 Informacje podstawowe 1. Konsultacje: pokój

Bardziej szczegółowo

Programowanie liniowe metoda sympleks

Programowanie liniowe metoda sympleks Programowanie liniowe metoda sympleks Mirosław Sobolewski Wydział Matematyki, Informatyki i Mechaniki UW wykład z algebry liniowej Warszawa, styczeń 2009 Mirosław Sobolewski (UW) Warszawa, 2009 1 / 13

Bardziej szczegółowo

INTERNET - NOWOCZESNY MARKETING

INTERNET - NOWOCZESNY MARKETING STRONA INTERNETOWA TO JUŻ ZBYT MAŁO! INTERNET ROZWIJA SIĘ Z KAŻDYM DNIEM MÓWIMY JUŻ O: SEM Search Engine Marketing, czyli wszystko co wiąże się z marketingiem internetowym w wyszukiwarkach. SEM jest słowem

Bardziej szczegółowo

Odwrotna Notacja Polska

Odwrotna Notacja Polska Odwrotna Notacja Polska Odwrotna Notacja Polska w skrócie ONP) jest sposobem zapisu wyrażeń arytmetycznych. Znak wykonywanej operacji umieszczany jest po operandach, argumentach tzw. zapis postfiksowy).

Bardziej szczegółowo

Działanie algorytmu oparte jest na minimalizacji funkcji celu jako suma funkcji kosztu ( ) oraz funkcji heurystycznej ( ).

Działanie algorytmu oparte jest na minimalizacji funkcji celu jako suma funkcji kosztu ( ) oraz funkcji heurystycznej ( ). Algorytm A* Opracowanie: Joanna Raczyńska 1.Wstęp Algorytm A* jest heurystycznym algorytmem służącym do znajdowania najkrótszej ścieżki w grafie. Jest to algorytm zupełny i optymalny, co oznacza, że zawsze

Bardziej szczegółowo

5c. Sieci i przepływy

5c. Sieci i przepływy 5c. Sieci i przepływy Grzegorz Kosiorowski Uniwersytet Ekonomiczny w Krakowie zima 2016/2017 rzegorz Kosiorowski (Uniwersytet Ekonomiczny w Krakowie) 5c. Sieci i przepływy zima 2016/2017 1 / 40 1 Definicje

Bardziej szczegółowo

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak Wyszukiwanie boolowskie i strukturalne Adam Srebniak Wyszukiwanie boolowskie W wyszukiwaniu boolowskim zapytanie traktowane jest jako zdanie logiczne. Zwracane są dokumenty, dla których to zdanie jest

Bardziej szczegółowo

TEORETYCZNE PODSTAWY INFORMATYKI

TEORETYCZNE PODSTAWY INFORMATYKI 1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Wykład 14c 2 Definicje indukcyjne Twierdzenia dowodzone przez indukcje Definicje indukcyjne Definicja drzewa

Bardziej szczegółowo

Poradnik SEO. Ilu z nich szuka Twojego produktu? Jak skutecznie to wykorzystać?

Poradnik SEO. Ilu z nich szuka Twojego produktu? Jak skutecznie to wykorzystać? Poradnik SEO Poradnik SEO Internet to najszybciej rozwijające się medium. W Polsce jest już 15 mln użytkowników, ponad 90% z nich używa wyszukiwarki Google. Dziennie użytkownicy zadają ponad 130 milionów

Bardziej szczegółowo

Metody Programowania

Metody Programowania POLITECHNIKA KRAKOWSKA - WIEiK KATEDRA AUTOMATYKI i TECHNIK INFORMACYJNYCH Metody Programowania www.pk.edu.pl/~zk/mp_hp.html Wykładowca: dr inż. Zbigniew Kokosiński zk@pk.edu.pl Wykład 8: Wyszukiwanie

Bardziej szczegółowo

Wstęp do programowania

Wstęp do programowania Wstęp do programowania Algorytmy zachłanne, algoritme Dijkstry Paweł Daniluk Wydział Fizyki Jesień 2013 P. Daniluk(Wydział Fizyki) WP w. XI Jesień 2013 1 / 25 Algorytmy zachłanne Strategia polegająca na

Bardziej szczegółowo

Spis treści. Rozdział 1. Wprowadzenie, czyli kilka słów o komputerze / 11

Spis treści. Rozdział 1. Wprowadzenie, czyli kilka słów o komputerze / 11 Spis treści Rozdział 1. Wprowadzenie, czyli kilka słów o komputerze / 11 Spis treści 1.1. Czym zajmuje się informatyka? / 12 1.1.1. Bezpieczna praca z komputerem / 13 Pytania i zadania / 15 1.2. Komputer

Bardziej szczegółowo

PageRank i HITS. Mikołajczyk Grzegorz

PageRank i HITS. Mikołajczyk Grzegorz PageRank i HITS Mikołajczyk Grzegorz PageRank Metoda nadawania indeksowanym stronom internetowym określonej wartości liczbowej, oznaczającej jej jakość. Algorytm PageRank jest wykorzystywany przez popularną

Bardziej szczegółowo

Drzewa rozpinajace, zbiory rozłaczne, czas zamortyzowany

Drzewa rozpinajace, zbiory rozłaczne, czas zamortyzowany , 1 2 3, czas zamortyzowany zajęcia 3. Wojciech Śmietanka, Tomasz Kulczyński, Błażej Osiński rozpinajace, 1 2 3 rozpinajace Mamy graf nieskierowany, ważony, wagi większe od 0. Chcemy wybrać taki podzbiór

Bardziej szczegółowo

Algorytmy grafowe. Wykład 1 Podstawy teorii grafów Reprezentacje grafów. Tomasz Tyksiński CDV

Algorytmy grafowe. Wykład 1 Podstawy teorii grafów Reprezentacje grafów. Tomasz Tyksiński CDV Algorytmy grafowe Wykład 1 Podstawy teorii grafów Reprezentacje grafów Tomasz Tyksiński CDV Rozkład materiału 1. Podstawowe pojęcia teorii grafów, reprezentacje komputerowe grafów 2. Przeszukiwanie grafów

Bardziej szczegółowo

Algorytmiczna teoria grafów

Algorytmiczna teoria grafów Przedmiot fakultatywny 20h wykładu + 20h ćwiczeń 21 lutego 2014 Zasady zaliczenia 1 ćwiczenia (ocena): kolokwium, zadania programistyczne (implementacje algorytmów), praca na ćwiczeniach. 2 Wykład (egzamin)

Bardziej szczegółowo

8. Neuron z ciągłą funkcją aktywacji.

8. Neuron z ciągłą funkcją aktywacji. 8. Neuron z ciągłą funkcją aktywacji. W tym ćwiczeniu zapoznamy się z modelem sztucznego neuronu oraz przykładem jego wykorzystania do rozwiązywanie prostego zadania klasyfikacji. Neuron biologiczny i

Bardziej szczegółowo

METODY INŻYNIERII WIEDZY

METODY INŻYNIERII WIEDZY METODY INŻYNIERII WIEDZY Metoda K Najbliższych Sąsiadów K-Nearest Neighbours (KNN) ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej

Bardziej szczegółowo

METODY INŻYNIERII WIEDZY

METODY INŻYNIERII WIEDZY METODY INŻYNIERII WIEDZY Metoda K Najbliższych Sąsiadów K-Nearest Neighbours (KNN) ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej

Bardziej szczegółowo

1. Algorytmy przeszukiwania. Przeszukiwanie wszerz i w głąb.

1. Algorytmy przeszukiwania. Przeszukiwanie wszerz i w głąb. 1. Algorytmy przeszukiwania. Przeszukiwanie wszerz i w głąb. Algorytmy przeszukiwania w głąb i wszerz są najczęściej stosowanymi algorytmami przeszukiwania. Wykorzystuje się je do zbadania istnienia połączenie

Bardziej szczegółowo

Sieci komputerowe. Wykład 0: O czym jest ten przedmiot. Marcin Bieńkowski. Instytut Informatyki Uniwersytet Wrocławski

Sieci komputerowe. Wykład 0: O czym jest ten przedmiot. Marcin Bieńkowski. Instytut Informatyki Uniwersytet Wrocławski Sieci komputerowe Wykład 0: O czym jest ten przedmiot Marcin Bieńkowski Instytut Informatyki Uniwersytet Wrocławski Sieci komputerowe (II UWr) Wykład 0 1 / 17 Wprowadzenie Co o sieci wie sama sieć Sieć

Bardziej szczegółowo

Procesy Markowa zawdzięczają swoją nazwę ich twórcy Andriejowi Markowowi, który po raz pierwszy opisał problem w 1906 roku.

Procesy Markowa zawdzięczają swoją nazwę ich twórcy Andriejowi Markowowi, który po raz pierwszy opisał problem w 1906 roku. Procesy Markowa zawdzięczają swoją nazwę ich twórcy Andriejowi Markowowi, który po raz pierwszy opisał problem w 1906 roku. Uogólnienie na przeliczalnie nieskończone przestrzenie stanów zostało opracowane

Bardziej szczegółowo

Algorytm dyskretnego PSO z przeszukiwaniem lokalnym w problemie dynamicznej wersji TSP

Algorytm dyskretnego PSO z przeszukiwaniem lokalnym w problemie dynamicznej wersji TSP Algorytm dyskretnego PSO z przeszukiwaniem lokalnym w problemie dynamicznej wersji TSP Łukasz Strąk lukasz.strak@gmail.com Uniwersytet Śląski, Instytut Informatyki, Będzińska 39, 41-205 Sosnowiec 9 grudnia

Bardziej szczegółowo

Grafy dla każdego. dr Krzysztof Bryś. Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska.

Grafy dla każdego. dr Krzysztof Bryś. Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska. Grafy dla każdego dr Krzysztof Bryś brys@mini.pw.edu.pl Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska www.mini.pw.edu.pl Warszawa, 28 marca 2015 Graf składa się z elementów pewnego zbioru

Bardziej szczegółowo

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot

Bardziej szczegółowo

Najprostsze modele sieci z rekurencją. sieci Hopfielda; sieci uczone regułą Hebba; sieć Hamminga;

Najprostsze modele sieci z rekurencją. sieci Hopfielda; sieci uczone regułą Hebba; sieć Hamminga; Sieci Hopfielda Najprostsze modele sieci z rekurencją sieci Hopfielda; sieci uczone regułą Hebba; sieć Hamminga; Modele bardziej złoŝone: RTRN (Real Time Recurrent Network), przetwarzająca sygnały w czasie

Bardziej szczegółowo

Mapa witryny - Poradnik od A do Z

Mapa witryny - Poradnik od A do Z Mapa witryny - Poradnik od A do Z Submit URL czy mapa Google? Istnieje specjalny formularz Google do zgłaszania nowych podstron w serwisie, który potrafi błyskawicznie dodać adres URL do indeksu wyszukiwarki:

Bardziej szczegółowo

Elementy inteligencji obliczeniowej

Elementy inteligencji obliczeniowej Elementy inteligencji obliczeniowej Paweł Liskowski Institute of Computing Science, Poznań University of Technology 9 October 2018 1 / 19 Perceptron Perceptron (Rosenblatt, 1957) to najprostsza forma sztucznego

Bardziej szczegółowo

Podstawy Sztucznej Inteligencji (PSZT)

Podstawy Sztucznej Inteligencji (PSZT) Podstawy Sztucznej Inteligencji (PSZT) Paweł Wawrzyński Uczenie maszynowe Sztuczne sieci neuronowe Plan na dziś Uczenie maszynowe Problem aproksymacji funkcji Sieci neuronowe PSZT, zima 2013, wykład 12

Bardziej szczegółowo

Algorytmika Internetu

Algorytmika Internetu Algorytmika Internetu Krzysztof Diks Instytut Informatyki Uniwersytet Warszawski informatyka + 2 Czym jest algorytmika? Przepisy określiliśmy mianem algorytmów, obszar zaś ludzkich dociekań, wiedzy i doświadczeń

Bardziej szczegółowo

Edytor materiału nauczania

Edytor materiału nauczania Edytor materiału nauczania I. Uruchomienie modułu zarządzania rozkładami planów nauczania... 2 II. Opuszczanie elektronicznej biblioteki rozkładów... 5 III. Wyszukiwanie rozkładu materiałów... 6 IV. Modyfikowanie

Bardziej szczegółowo

Struktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott

Struktury danych i złożoność obliczeniowa Wykład 7. Prof. dr hab. inż. Jan Magott Struktury danych i złożoność obliczeniowa Wykład 7 Prof. dr hab. inż. Jan Magott Problemy NP-zupełne Transformacją wielomianową problemu π 2 do problemu π 1 (π 2 π 1 ) jest funkcja f: D π2 D π1 spełniająca

Bardziej szczegółowo

Podręcznik użytkownika Platformy Edukacyjnej Zdobywcy Wiedzy (zdobywcywiedzy.pl)

Podręcznik użytkownika Platformy Edukacyjnej Zdobywcy Wiedzy (zdobywcywiedzy.pl) Podręcznik użytkownika Platformy Edukacyjnej Zdobywcy Wiedzy (zdobywcywiedzy.pl) Spis treści Wstęp... 4 Strona główna platformy... 4 Logowanie do aplikacji... 5 Logowanie poprzez formularz logowania...

Bardziej szczegółowo

Optymalizacja ciągła

Optymalizacja ciągła Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej

Bardziej szczegółowo

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa.

Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa. Wstęp do sieci neuronowych, wykład 02 Perceptrony c.d. Maszyna liniowa. Maja Czoków, Jarosław Piersa Wydział Matematyki i Informatyki, Uniwersytet Mikołaja Kopernika 2011-10-11 1 Modelowanie funkcji logicznych

Bardziej szczegółowo

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor

S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.

Bardziej szczegółowo

ALHE. prof. Jarosław Arabas semestr 15Z

ALHE. prof. Jarosław Arabas semestr 15Z ALHE prof. Jarosław Arabas semestr 15Z Wykład 5 Błądzenie przypadkowe, Algorytm wspinaczkowy, Przeszukiwanie ze zmiennym sąsiedztwem, Tabu, Symulowane wyżarzanie 1. Błądzenie przypadkowe: Pierwszym krokiem

Bardziej szczegółowo

Liczby losowe i pętla while w języku Python

Liczby losowe i pętla while w języku Python Liczby losowe i pętla while w języku Python Mateusz Miotk 17 stycznia 2017 Instytut Informatyki UG 1 Generowanie liczb losowych Na ogół programy są spójne i prowadzą do przewidywanych wyników. Czasem jednak

Bardziej szczegółowo