SYSTEMY WYSZUKIWANIA INFORMACJI
|
|
- Milena Lis
- 9 lat temu
- Przeglądów:
Transkrypt
1 SYSTEMY WYSZUKIWANIA INFORMACJI Agnieszka Nowak- Brzezińska Zbiór zadań z rozwiązaniami
2 Systemy Wyszukiwania Informacji by Agnieszka Nowak Brzezińska by Instytut Informatyki Uniwersytetu Śląskiego Wersja z dnia r. str. 1
3 Zbio r zadan z rozwiązaniami Spis treści Metoda list prostych... 3 Metoda list inwersyjnych Metoda list łańcuchowych Metoda Saltona Metoda składowych atomowych Zadania ogólne str. 2
4 Systemy Wyszukiwania Informacji Metoda list prostych Zadanie 1 Podaj parametry, które musi określić użytkownik, aby wyszukiwanie zgodne z modyfikacją, zwaną odcedzaniem statycznym i dynamicznym, miało sens. Dane są odpowiedzi na pytania zadane do systemu: σ(t1) ={x2, x4, x7, x10} σ(t5) ={x2, x3, x5, x8} σ(t2) ={x4, x6, x7, x9} σ(t6) ={x2, x5, x7, x9} σ(t3) ={x3, x5, x7, x10} σ(t7) ={x4, x6, x8, x10} σ(t4) ={x2, x4, x6, x9} σ(t8) ={x2, x4, x7, x9} Przeprowadź proces odcedzania statycznego, a następnie oblicz zysk czasowy dla różnych parametrów związanych z tą techniką w stosunku do metody klasycznej metody list prostych. W systemie informacyjnym jest 10 obiektów. Rozwiązanie Odcedzanie statyczne - polega na tym, że, po ustaleniu grupy pytań typowych, czyli najczęściej zadawanych do systemu, obiekty w kartotece porządkujemy w taki sposób, że te, które najczęściej stanowiły odpowiedź na pytanie umieszczamy na początku, zaś te, które najrzadziej są odpowiedzią na pytanie odpowiednio na końcu kartoteki. W tym celu po serii zadanych pytań określamy dla każdego dokumentu częstość występowania w odpowiedziach na pytania i na podstawie tej częstości zmieniamy dotychczasowy porządek dokumentów w kartotece. Odcedzanie dynamiczne - różni się tym od statycznego, że system automatycznie po zadaniu pytania zmienia kolejność dokumentów w kartotece tak, że jeśli obiekt stanowił odpowiedź na dane pytanie przesuwamy go o jedno miejsce w górę kosztem tych obiektów które nie były odpowiedzią i te przesuwamy odpowiednio w dół. Ta modyfikacja pozwala oszczędzać na zajętości pamięci, gdyż zmiana uporządkowania obiektów w kartotece jest dokonywana na bieżąco bez konieczności tworzenia dodatkowych struktur (jak w przypadku odcedzania statycznego, dla którego najczęściej tworzona jest macierz zerojedynkowa, w której zaznaczamy odpowiednio fakt, czy dany dokument był odpowiedzią czy nie). Ewentualną wadą tej modyfikacji jest to, że przy zmianie kolejności zadawanych pytań uporządkowanie dokumentów możemy być za każdym razem inne. Przy odcedzaniu statycznym kolejność pytań nie ma żadnego wpływu na to jaka będzie ostatecznie kolejność uporządkowania dokumentów. Idea wyszukiwania przy wykorzystaniu tych modyfikacji polega na tych, iż po zmianie uporządkowania dokumentów na podstawie częstości występowania w odpowiedziach na pytania zadawane do systemu dodatkowym parametrem wartym określenia jest jeden z następujących: str. 3
5 Zbio r zadan z rozwiązaniami Wielkość obszaru do przeszukania, Liczba obiektów relewantnych, Kompletność. Przykładowo wykorzystując dodatkowo wielkość obszaru do przeszukania, możemy ograniczyć się do przeszukania jedynie 50% systemu, co spowoduje zysk czasowy. O efektywność takiego wyszukiwania zadbała wcześniejsza zmiana uporządkowania dokumentów. Jest ogromna szansa, że skoro po zmianie porządku dokumentów te wg częstości są na samej górze, to nawet gdy przeszukamy tylko 50% znajdziemy większość obiektów będących odpowiedzią na zadane pytanie. Wykorzystując metodę odcedzania statycznego, w pierwszej kolejności należy przedstawić obiekty wraz z częstością występowania w odpowiedziach na zadane pytania w tabeli: MACIERZ DOKUMENTÓW I PYTAŃ ZADANYCH DO SYSTEMU WRAZ Z CZĘSTOŚCIĄ WYSTĘPOWANIA DOKUMENTÓW W ODPOWIEDZIACH NA PYTANIA X t1 t2 t3 t4 t5 t6 t7 t8 częstość x1 x2 x3 x4 x5 x6 x7 x8 x9 x gdzie: x1,,xn dokumenty zaś t1 tn pytania zadawane do systemu. Gdy wyznaczymy już częstość występowania dokumentów w pytaniach zadawanych do systemu możemy dokonać zmiany ich wcześniejszego uporządkowania w kartotece. Dokumenty o najwyższej częstości występowania w odpowiedziach na pytania umieszczamy na samej górze kartoteki, zaś te najrzadziej stanowiące odpowiedź odpowiednio na samym dole. Struktura kartoteki wyszukiwawczej przyjmuje zatem następujący format: str. 4
6 Systemy Wyszukiwania Informacji KARTOTEKA WYSZUKIWAWCZA X Opis obiektu x2 x 4 x7 x9 x5 x6 x10 x3 x8 x1. str. 5
7 Zbio r zadan z rozwiązaniami Zadanie 2 Do przedszkola zakupiono kilka rodzajów klocków. Klocki podzielono na zestawy zależnie od: materiału, wieku dziecka, które będzie się nimi bawić i według odporności na zniszczenie klocka. Typ klocka Materiał Wiek (lata) Sposób łączenia Odporność na zniszczenia LEGO Plastik 5-99 Wpust Średnia DUPLO Plastik 1-6 Wpust Duża LIDIO Metal 5-99 Śruba Mała SOHO Plastik 6-99 Wpust Średnia MIMI Drewno 1-5 Brak Duża CHILDE Drewno 5-10 Brak Średnia ABC Drewno 3-10 Brak Średnia TECH Metal 3-10 Śruba Mała Utwórz kartotekę wyszukiwawczą zgodnie z założeniami metody podziału połówkowego wykorzystując odpowiedni porządek. Następnie napisz algorytm słowny podziału połówkowego (przeszukiwania binarnego). Rozwiązanie Założenia metody podziału połówkowego mówią o uporządkowaniu obiektów rosnąco bądź malejąco (dla cech numerycznie zakodowanych) lub wykorzystując porządek leksykograficzny (dla cech zakodowanych alfanumerycznie). W naszym przypadku porządek ten ma w pierwszej kolejności wykorzystać atrybuty: materiał, wiek dziecka oraz odporność na zniszczenia. Atrybuty te powinny się znaleźć na pierwszych miejscach w opisie obiektów. Kartoteka wyszukiwawcza po zmianie uporządkowania (tylko dla atrybutu Materiał) będzie wyglądać następująco: TMIMI=(Materiał, Drewno)(Wiek dziecka, 1 do 5)(Odporność, duża)(sposób łączenia, Brak) TABC=(Materiał, Drewno)(Wiek dziecka, 3 do 10)(Odporność, średnia)(sposób łączenia, Brak) TCHILDE=(Materiał, Drewno)(Wiek dziecka, 5 do 10)(Odporność, duża)(sposób łączenia, Brak) TTECH=(Materiał, Metal)(Wiek dziecka, 3 do 10)(Odporność, mała)(sposób łączenia, śruba) TLIDIO=(Materiał, Metal)(Wiek dziecka, 5 do 99)(Odporność, mała)(sposób łączenia, śruba) TDUPLO=(Materiał, Plastik)(Wiek dziecka, 1 do 6)(Odporność, duża)(sposób łączenia, wpust) TLEGO=(Materiał, Plastik)(Wiek dziecka, 5 do 99)(Odporność, średnia)(sposób łączenia, wpust) TSOHO=(Materiał, Plastik)(Wiek dziecka, 6 do 99)(Odporność, średnia)(sposób łączenia, wpust) str. 6
8 Systemy Wyszukiwania Informacji Algorytm wyszukiwania metodą podziału połówkowego działa efektywnie tylko wtedy, gdy w pytaniu zawarto deskryptor (parę (atrybut, wartość)) wg którego kartotekę porządkowano. Porządek ten bazuje na relacji porządku ostrego z użyciem symboli poprzedzania i następowania. Zapis a 1 a 2 czytamy następująco: wartość a1 pewnego atrybutu a poprzedza wartość a2 tego samego atrybutu. Algorytm wyszukiwania przebiega zgodnie z następującym schematem. Jeśli pytanie zawiera deskryptor związany z atrybutem, który porządkował obiekty (atrybut ten jest na pierwszym miejscu w opisie obiektów) wówczas dokonujemy porównania wartości tego atrybutu w pytaniu z wartością (tego atrybutu) przy obiekcie leżącym dokładnie w połowie kartoteki a więc obiekcie na pozycji [ n ], gdzie n oznacza liczbę obiektów w systemie. Porównanie to można zapisać następująco:t x 2 [ n ]. 2 Jeśli t x n [ wówczas do dalszego przeszukiwania wybrana zostanie pierwsza połowa kartoteki a więc ]+1 2 obiekty na pozycjach: x 1,, x n [ ]. W przeciwnym przypadku przeszukana będzie druga połowa kartoteki 2 a więc obiekty na pozycjach: x [ n 2 ]+1,, x n. Jeśli pytanie nie zawiera deskryptora, który porządkował kartotekę wówczas zmuszeni jesteśmy dokonać przeglądu zupełnego jak w metodzie klasycznej. Warto zaznaczyć, że podziału połówkowego możemy dokonywać wiele razy, tak długo dopóki istnieje wyraźny zysk z wykorzystania tej modyfikacji. str. 7
9 Zbio r zadan z rozwiązaniami Zadanie 3 Ze względu na silnie wzrastający stopień przestępczości w jednej z komend policji założono system, do którego wpisane zostały dane o różnego rodzaju przestępstwach. Przykładowa kartoteka wtórna wygląda następująco: X Rodzaj Użyte Wygląd zewnętrzny Data Godz. przestępstwa narzędzie Płeć Wzrost Wiek Waga Włosy x1 włamanie wytrych M ciemne x2 włamanie wytrych K jasne x3 włamanie wytrych M ciemne x4 napad gaz-rurka M ciemne x5 napad tulipan M ciemne x6 kradzież nóż M jasne x7 morderstwo gaz-rurka M ciemne x8 pobicie tulipan M jasne x9 rabunek nóż K ciemne x10 rabunek nóż K ciemne x11 włamanie łom M ciemne x12 kradzież pilnik K jasne x13 morderstwo nóż K jasne x14 pobicie gaz-rurka M ciemne x15 rabunek wytrych M jasne x16 włamanie wytrych M ciemne x17 włamanie łom M jasne x18 włamanie pilnik K jasne x19 włamanie wytrych M ciemne X20 kradzież łom M ciemne x21 morderstwo nóż K ciemne x22 rabunek nóż M jasne x23 rabunek nóż K jasne Do tabeli podanej powyżej zastosuj metodę grupowania (modyfikacja metody list prostych) uwzględniając rodzaj przestępstwa, czas wykonania przestępstwa, jak również stosowane narzędzie. Następnie podaj odpowiedź na pytanie o przestępstwo dokonane o godz Należy wykorzystać tablicę adresową dla tak utworzonych grup. Rozwiązanie Kartoteka wtórna zostaje pogrupowana leksykograficznie i chronologicznie wg rodzaju przestępstwa, godziny wykonania przestępstwa oraz zastosowanego narzędzia. Nowe uporządkowanie dokumentów wymusza wprowadzenie dodatkowej kolumny w kartotece wtórnej (NU). str. 8
10 Systemy Wyszukiwania Informacji N Rodzaj Użyte Wygląd zewnętrzny X Data Godz. U przestępstwa narzędzie Płeć Wzrost Wiek Waga Włosy 1 x20 kradzież łom M ciemne 2 x12 kradzież pilnik K jasne 3 x6 kradzież nóż M jasne 4 x7 morderstwo gaz-rurka M ciemne 5 x21 morderstwo nóż K ciemne 6 x13 morderstwo nóż K jasne 7 x5 napad tulipan M ciemne 8 x4 napad gaz-rurka M ciemne 9 x8 pobicie tulipan M jasne 10 x14 pobicie gaz-rurka M ciemne 11 x15 rabunek wytrych M jasne 12 x22 rabunek nóż M jasne 13 x23 rabunek nóż K jasne 14 x9 rabunek nóż K ciemne 15 x10 rabunek nóż K ciemne 16 x17 włamanie łom M jasne 17 x16 włamanie wytrych M ciemne 18 x18 włamanie pilnik K jasne 19 x3 włamanie wytrych M ciemne 20 x19 włamanie wytrych M ciemne 21 x11 włamanie łom M ciemne 22 x1 włamanie wytrych M ciemne 23 x2 włamanie wytrych K jasne Można utworzyć tablicę adresową (TA) z trzema deskryptorami: rodzaj przestępstwa, podziałem na grupy wg rodzaju przestępstwa, godziny przestępstwa oraz użytego narzędzia. Jednak byłaby ona zbyt obszerna. Skoro szukana jest odpowiedź na pytanie ogólne t=(godzina, 10) to dla uproszczenia zbudujemy tablicę adresową tylko dla atrybutu Godzina (zakodowanego w kartotece jako Godz. ). str. 9
11 Zbio r zadan z rozwiązaniami N Rodzaj Użyte Wygląd zewnętrzny X Godz. Data U przestępstwa narzędzie Płeć Wzrost Wiek Waga Włosy 1 x17 08 włamanie łom M jasne 2 x16 09 włamanie wytrych M ciemne 3 x7 10 morderstwo gaz-rurka M ciemne 4 x5 10 napad tulipan M ciemne 5 x15 10 rabunek wytrych M jasne 6 x21 11 morderstwo nóż K ciemne 7 x8 11 pobicie tulipan M jasne 8 x14 11 pobicie gaz-rurka M ciemne 9 x18 11 włamanie pilnik K jasne 10 x20 12 kradzież łom M ciemne 11 x13 12 morderstwo nóż K jasne 12 x4 12 napad gaz-rurka M ciemne 13 x12 13 kradzież pilnik K jasne 14 x3 13 włamanie wytrych M ciemne 15 x19 13 włamanie wytrych M ciemne 16 x22 14 rabunek nóż M jasne 17 x11 14 włamanie łom M ciemne 18 x6 15 kradzież nóż M jasne 19 x23 15 rabunek nóż K jasne 20 x1 15 włamanie wytrych M ciemne 21 x2 16 włamanie wytrych K jasne 22 x9 17 rabunek nóż K ciemne 23 x10 18 rabunek nóż K ciemne Jedną z metod pozwalających na sprawne wyszukanie odpowiedzi na zadawane pytania będzie stworzenie tablicy adresowej (TA) z podziałem na grupy wg czasu przestępstwa deskryptor Adres początku Adres końca (Godz., 08) 1 1 (Godz., 09) 2 2 (Godz., 10) 3 5 (Godz., 11) 6 9 (Godz., 12) (Godz., 13) (Godz., 14) (Godz., 15) (Godz., 16) (Godz., 17) (Godz., 17) Szukana jest odpowiedź na pytanie ogólne t=(godz., 10). W tablicy adresowej odnajdujemy wiersz, w którym występuje deskryptor pytania a więc (Godz., 10). Jest to 3 wiersz tej tabeli. Pobieramy z wiersza z kolumny drugiej (Adres początku) oraz trzeciej (Adres końca) informację o tym jaki jest początek i koniec bloku obiektów stanowiących odpowiedź na pytanie t. Są to odpowiednio 3 (początek) oraz 5 (koniec). Z kartoteki wtórnej nowouporządkowanej pobieramy prawdziwe nazwy obiektów na pozycjach od 3 do 5. σ(t) = TA3-5 = {x7, x5,x 15} str. 10
12 Systemy Wyszukiwania Informacji Zadanie 4 Dla następującej macierzy T-x (macierz ta określa częstość występowania obiektów w zbiorze odpowiedzi na pytania T) zastosuj modyfikację list prostych - organizację zwartą. Zdefiniuj własność zwartości; następnie przedstaw kartotekę wyszukiwawczą dla ww. modyfikacji i omów proces wyszukiwania (dla dowolnej postaci pytania) w tak zorganizowanej strukturze bazy danych. Rozwiązanie X t1 t2 t3 t4 t5 x x x x x Organizacja zwarta wymaga takiego uporządkowania obiektów aby te, które stanowiły odpowiedź na dane pytanie, były uporządkowane obok siebie w kartotece. Uporządkowanie musi być spójne dla wszystkich pytań. Może ono wyglądać następująco: NU X t1 t2 t3 t4 t5 1 x x x x x Uwaga: NU oznacza pozycję obiektu w kartotece po zmianie uporządkowania. Kartoteka wyszukiwawcza składać się powinna z kartoteki wtórnej nowo uporządkowanej na podstawie wartości NU oraz tablicy adresowej z informacją o pytaniu oraz adresach początku i końca bloku stanowiącego odpowiedź na to dane pytanie. str. 11
13 Zbio r zadan z rozwiązaniami Kartoteka wtórna nowo uporządkowana powinna mieć następującą strukturę: NU X Opis obiektu 1 x3 2 x1 3 x4 4 x2 5 x5 Tablica adresowa zawierająca informację, o adresie początku i końca obszaru spójnego w kartotece wtórnej wygląda następująco: T AP AK t1 3 4 t2 4 5 t3 2 4 t4 3 5 t5 1 3 Uwaga: AP oznacza adres początku, zaś AK odpowiednio adres końca bloku obiektów będących odpowiedzią na jedno z pytań t1,,t5. Jeśli pytanie nie jest standardowe (tzn. nie było ujęte w zbiorze pytań dla których zmienialiśmy uporządkowanie kartoteki), dokonujemy przeglądu zupełnego. W przeciwnym przypadku używamy tablicy adresowej w pierwszej fazie wyszukiwania. Wówczas pobieramy dla danego pytania standardowego adres początku (AP) oraz adres końca (AK) obszaru spójnego, następnie korzystając z kartoteki wtórej nowo uporządkowanej pobieramy właściwe nazwy obiektów stanowiących odpowiedzi na zadane pytania. str. 12
14 Systemy Wyszukiwania Informacji Zadanie 5 Wiedząc, że system informacyjny S dotyczący charakterystyk wybranych pojazdów zadany jest tabelą: Model Producent Typ Napęd Chłodzenie Moc Przełożenie DR Suzuki motocykl tylni powietrze duża duże SENDA Kawasaki motocykl tylni woda duża duże MATIZ Daewoo samochód przedni woda mała średnie CARISMA Mitsubishi samochód przedni powietrze średnia średnie 126P Fiat samochód tylni woda mała średnie MEGANE Renault samochód przedni woda średnia średnie 307 Peugeot samochód przedni woda mała średnie S40 Volvo samochód przedni woda średnia średnie LAGUNA Renault samochód przedni woda średnia średnie TX Suzuki motocykl tylni powietrze duża duże a) Zdefiniuj formalnie system oraz zbuduj kartotekę wyszukiwawczą dla metody list prostych z grupowaniem obiektów wg wybranego przez siebie atrybutu. Uzasadnij jakie warunki powinien spełniać wybrany atrybut przy zastosowaniu tej modyfikacji? b) Czy przedstawiony system jest selektywny i/lub kompletny? Odpowiedź uzasadnij. Rozwiązanie Definicja formalna systemu: S = < X, A, V, ρ> X = {DR, SENDA, MATIZ, CARISMA, 126P, MEGANE, 307, S40, LAGUNA, TX} A = {Producent, Typ, Napęd, Chłodzenie, Moc, Przełożenia} VProducent = {Suzuki, Kawasaki, Daewoo, Mitsubishi, Fiat, Renault, Peugeot, Volvo, Renault} VTyp = {motocykl, samochód} VNapęd = {tylni, przedni} VChłodzenie = {powietrze, woda} VMoc = {mała, średnia, duża} VPrzełożenie = {średnie, duże} ρ: X A V str. 13
15 Zbio r zadan z rozwiązaniami Atrybut, według którego następuje grupowanie powinien: występować często w pytaniach do systemu, być wielowartościowy, w miarę równomiernie dzielić kartotekę. W przypadku powyższego systemu najlepszym atrybutem spełniającym te kryteria jest "Moc". Wobec tego kartoteka wyszukiwawcza wygląda następująco: NU Model Moc Producent Typ Napęd Chłodzenie Przełożenie 1 126P mała Fiat samochód tylni woda średnie mała Peugeot samochód przedni woda średnie 3 MATIZ mała Daewoo samochód przedni woda średnie 4 CARISMA średnia Mitsubishi samochód przedni powietrze średnie 5 S40 średnia Volvo samochód przedni woda średnie 6 MEGANE średnia Renault samochód przedni woda średnie 7 LAGUNA średnia Renault samochód przedni woda średnie 8 SENDA duża Kawasaki motocykl tylni woda duże 9 TX duża Suzuki motocykl tylni powietrze duże 10 DR duża Suzuki motocykl tylni powietrze duże Gdzie NU nowe uporządkowanie. Dla przyspieszenia wyszukiwania możemy utworzyć także tablicę adresową: adres początku adres końca (Moc, mała) 1 3 (Moc, średnia) 4 7 (Moc, duża) 8 10 System jest selektywny wtedy i tylko wtedy, gdy każdej informacji odpowiada co najwyżej jeden obiekt. Przedstawiony system nie jest selektywny, gdyż obiekty TX oraz DR mają taki sam opis (odpowiada im taka sama informacja). σ[(moc, duża)(producent, Suzuki)(Typ, motocykl)(napęd, tylni)(chłodzenie, powietrze)(przełożenie, duże)] = {TX, DR} System jest kompletny wtedy i tylko wtedy, gdy każdej informacji odpowiada co najmniej jeden obiekt. System nie jest też kompletny, ponieważ istnieje przynajmniej jedna informacja pusta: str. 14
16 Systemy Wyszukiwania Informacji σ[(moc, duża)(producent, Renault)(Typ, motocykl)(napęd, tylni)(chłodzenie, powietrze)(przełożenie, duże)] = { } Zresztą liczba różnych informacji możliwych do zapisania w tym systemie wynosi 480 (iloczyn liczności wartości atrybutów) a w zadanym systemie istnieje tylko 10 obiektów, co powoduje, że 470 informacji jest pustych. Liczba wszystkich możliwych informacji: card(v a ) a A = = 480. str. 15
17 Zbio r zadan z rozwiązaniami Zadanie 6 Dla systemu informacyjnego S przedstawionego w formie tabeli: RODZAJ WIEK PRZEZNA MATERIAŁ WIELKOŚĆ KLOCKÓW DZIECKA CZENIE WYTRZYMAŁOŚĆ LEGO PLASTIK 5-9 MAŁA ZABAWA ŚREDNIA DUPLO PLASTIK 1-6 DUŻA ZABAWA DUŻA LIDO METAL 5-9 DUŻA EDUKACJA MAŁA SOHO PLASTIK 6-9 MAŁA EDUKACJA ŚREDNIA MIMI DREWNO 1-5 DUŻA ZABAWA DUŻA CHILDE DREWNO 5-10 DUŻA EDUKACJA ŚREDNIA ABC DREWNO 3 10 MA ŁA EDUKACJA ŚREDNIA TECH METAL 3-10 MAŁA ZABAWA MAŁA wiedząc, że najczęściej zadawanymi pytaniami do systemu S są: a. (Materiał, plastik)+(materiał, Drewno) b. (Przeznaczenie, zabawa) c. (Wytrzymałość, duża) (Materiał, metal) d. (Materiał, plastik) e. (Wytrzymałość, średnia) (Przeznaczenie, edukacja) f. (Wielkość, mała) (Wiek, 5-9)+(Materiał, drewno) (Przeznaczenie, zabawa) Zaproponuj modyfikacje i określ jak będzie wyglądać kartoteka wyszukiwawcza po jej zastosowaniu. Określ też zyski i straty spowodowane jej zastosowaniem. Omów algorytm wyszukiwania informacji po zastosowaniu takiej modyfikacji. Rozwiązanie Jeśli znamy zestaw pytań zadawanych do systemu można na podstawie odpowiedzi na te pytania zmienić uporządkowanie obiektów tak by te najczęściej występujące jako odpowiedzi znalazły się na początku kartoteki wyszukiwawczej. Musielibyśmy w tym celu zastosować bądź to odcedzanie bądź organizację zwartą. a. ((Materiał, plastik)+(materiał, Drewno)) = {LEGO,DUPLO,SOHO, MIMI, CHILDE, ABC} b. (Przeznaczenie, zabawa)={lego, DUPLO, MIMI, TECH} c. (Wytrzymałość, duża) (Materiał, metal)={ } d. (Materiał, plastik)={lego, DUPLO, SOHO} e. (Wytrzymałość, średnia) (Przeznaczenie, edukacja)={soho, CHILDE, ABC} f. ((Wielkość, mała) (Wiek, 5-9)+(Materiał, drewno) (Przeznaczenie, zabawa)) = {LEGO,MIMI} str. 16
18 Systemy Wyszukiwania Informacji Zastosujemy technikę odcedzania statycznego. W tym celu sprawdzimy, jaka była częstość występowania danego obiektu w odpowiedziach na pytania zadawane do systemu zapiszemy ją za pomocą funkcji f. f(lego) =4 f(duplo)= 3 f(lido)=0 f(soho)=3 f(mimi)=3 f(childe)=2 f(abc)=2 f(tech)=1 Widać, że najczęściej odpowiedzią na pytania zadawane do systemu były klocki LEGO bo aż 4 razy, potem odpowiednio klocki: DUPLO, SOHO oraz MIMI (bo 3 razy), i potem CHILDE i ABC (tylko 2 razy). Klocki TECH były odpowiedzią tylko raz, zaś LIDO nigdy nie były odpowiedzią na pytanie. Teraz zmieniamy uporządkowanie obiektów w kartotece zgodnie z tą częstością. RODZAJ WIEK PRZEZNA MATERIAŁ WIELKOŚĆ KLOCKÓW DZIECKA CZENIE WYTRZYMAŁOŚĆ LEGO PLASTIK 5-9 MAŁA ZABAWA ŚREDNIA DUPLO PLASTIK 1-6 DUŻA ZABAWA DUŻA SOHO PLASTIK 6-9 MAŁA EDUKACJA ŚREDNIA MIMI DREWNO 1-5 DUŻA ZABAWA DUŻA CHILDE DREWNO 5-10 DUŻA EDUKACJA ŚREDNIA ABC DREWNO 3 10 MA ŁA EDUKACJA ŚREDNIA TECH METAL 3-10 MAŁA ZABAWA MAŁA LIDO METAL 5-9 DUŻA EDUKACJA MAŁA Zysk: gdy do systemu będą zadawane pytania z puli pytań na podstawie których dokonana była modyfikacja jest szansa, że wyszukiwanie będzie znacznie krótsze. Modyfikacja nie wprowadza zwiększonej zajętości pamięci jeśli idzie o kartotekę wyszukiwawczą, zaś konieczne jest wyznaczenie częstości występowania w odpowiedziach na pytanie systemu. Wyszukiwanie wygląda następująco: Zakłada się, że pytanie zadawane do systemu ma dodatkowo informację o tym jaki obszar kartoteki wyszukiwawczej należy przeszukać. Może t obyć % kartoteki (np. 50%) albo po prostu liczba dokumentów relewantnych która usatysfakcjonuje użytkownika. Wówczas pilnując parametru o którym mowa, dokonywany jest przegląd opisu obiektów i porównywany jest ów przegląd z pytaniem. Jest szansa, że przeglądając tylko fragment kartoteki znaleziona będzie jak największa liczba dokumentów relewantnych. Przykładowo (przeglądając tylko 50% kartoteki) T = (Wielkość, mała) (Wiek, 5-9)+(Materiał, drewno) (Przeznaczenie, zabawa) str. 17
19 Zbio r zadan z rozwiązaniami Przy przeglądaniu tylko 50% kartoteki a więc 4 dokumentów w kartotece, docieramy do obu relewantnych dokumentów, a więc zarówno dokumentów LEGO jak i MIMI. Przeglądając tylko połowę kartoteki znajdujemy kompletną odpowiedź systemu. ((Wielkość, mała) (Wiek, 5-9)+(Materiał, drewno) (Przeznaczenie, zabawa)) = { LEGO,MIMI} str. 18
20 Systemy Wyszukiwania Informacji Zadanie 7 Dany jest system informacyjny S przedstawiający w formie tabelarycznej charakterystyki wybranych samochodów: X Skrzynia biegów Kolor Typ nadwozia Napęd x 1 Mechaniczna Srebrny Sedan Wszystkie koła x 2 Mechaniczna Czerwony Kombi Przedni x 3 Automatyczna Srebrny Sedan Tylni x 4 Automatyczna Srebrny Kombi Przedni x 5 Mechaniczna Inny Kabriolet Wszystkie koła x 6 Automatyczna Czarny Kabriolet Tylni x 7 Automatyczna Srebrny Sedan Wszystkie koła x 8 Automatyczna Czerwony Kabriolet Przedni x 9 Automatyczna Czarny Kombi Tylni x 10 Mechaniczna Czerwony Kombi Tylni Po pewnym czasie działania systemu wyodrębniono zbiór najczęściej zadawanych pytań t1 = (Typ nadwozia, Sedan)(Kolor, Srebrny) t2 = (Napęd, Przedni) + (Skrzynia biegów, Mechaniczna) t3 = (Napęd, Wszystkie koła) A odpowiedzi na pytania były następujące σ(t1)={x1, x3, x7} σ(t2)={x1, x2, x4, x5, x8, x10} σ(t1)={x1, x5, x7} Zbuduj kartotekę wyszukiwawczą z wykorzystaniem modyfikacji metody list prostych - odcedzania hiperdynamicznego. Opisz proces udzielenia odpowiedzi na pytanie t = (Kolor, Czerwony)(Typ nadwozia, Kombi) w tak zmodyfikowanym systemie zakładając, że przeszukiwana będzie tylko połowa kartoteki. Rozwiązanie: Kartoteka wyszukiwawcza przedstawiona w postaci iloczynów deskryptorów po wszystkich atrybutach systemu ma postać następującą: tx1=(skrzynia biegów, Mechaniczna)(Kolor, Srebrny)(Typ nadwozia, Sedan)(Napęd, Wszystkie koła) tx2=(skrzynia biegów, Mechaniczna)(Kolor, Czerwony)(Typ nadwozia, Kombi)(Napęd, Przedni) tx3=(skrzynia biegów, Automatyczna)(Kolor, Srebrny)(Typ nadwozia, Sedan)(Napęd, Tylni) tx4=(skrzynia biegów, Automatyczna)(Kolor, Srebrny)(Typ nadwozia, Kombi)(Napęd, Przedni) tx5=(skrzynia biegów, Mechaniczna)(Kolor, Inny)(Typ nadwozia, Kabriolet)(Napęd, Wszystkie koła) tx6=(skrzynia biegów, Automatyczna)(Kolor, Czarny)(Typ nadwozia, Kabriolet)(Napęd, Tylni) tx7=(skrzynia biegów, Automatyczna)(Kolor, Srebrny)(Typ nadwozia, Sedan)(Napęd, Wszystkie koła) tx8=(skrzynia biegów, Automatyczna)(Kolor, Czerwony)(Typ nadwozia, Kabriolet)(Napęd, Przedni) tx9=(skrzynia biegów, Automatyczna)(Kolor, Czarny)(Typ nadwozia, Kombi)(Napęd, Tylni) tx10=(skrzynia biegów, Mechaniczna)(Kolor, Czerwony)(Typ nadwozia, Kombi)(Napęd, Tylni) str. 19
21 Zbio r zadan z rozwiązaniami 1. Procedura odcedzania (obiekty, które są odpowiedzią na pytanie przechodzą na początek kartoteki) X x1 Wyjściowe uporządkowanie: x2 x3 x4 x5 x6 x7 x8 x9 x10 X x1 x3 x7 x2 x4 x5 x6 x8 x9 x10 X x1 x3 x7 Wyjściowe uporządkowanie po pytaniu t 1 X x1 x2 Uporządkowanie po pytaniu t 2 Uporządkowanie po pytaniu t 1 X x1 x2 x4 x5 x8 Wyjściowe uporządkowanie po pytaniu t 2 X x1 x2 x4 x5 x6 x8 x9 x10 x4 x5 x8 x10 x3 x7 x6 x9 x10 x5 x3 x7 x7 x6 x9 x2 x4 x8 x10 Uporządkowanie po ostatnim pytaniu t 3 x3 x6 x9 Postać kartoteki wyszukiwawczej po odcedzaniu tx1=(skrzynia biegów, Mechaniczna)(Kolor, Srebrny)(Typ nadwozia, Sedan)(Napęd, Wszystkie koła) tx5=(skrzynia biegów, Mechaniczna)(Kolor, Inny)(Typ nadwozia, Kabriolet)(Napęd, Wszystkie koła) tx7=(skrzynia biegów, Automatyczna)(Kolor, Srebrny)(Typ nadwozia, Sedan)(Napęd, Wszystkie koła) tx2=(skrzynia biegów, Mechaniczna)(Kolor, Czerwony)(Typ nadwozia, Kombi)(Napęd, Przedni) tx4=(skrzynia biegów, Automatyczna)(Kolor, Srebrny)(Typ nadwozia, Kombi)(Napęd, Przedni) tx8=(skrzynia biegów, Automatyczna)(Kolor, Czerwony)(Typ nadwozia, Kabriolet)(Napęd, Przedni) tx10=(skrzynia biegów, Mechaniczna)(Kolor, Czerwony)(Typ nadwozia, Kombi)(Napęd, Tylni) tx3=(skrzynia biegów, Automatyczna)(Kolor, Srebrny)(Typ nadwozia, Sedan)(Napęd, Tylni) tx6=(skrzynia biegów, Automatyczna)(Kolor, Czarny)(Typ nadwozia, Kabriolet)(Napęd, Tylni) tx9=(skrzynia biegów, Automatyczna)(Kolor, Czarny)(Typ nadwozia, Kombi)(Napęd, Tylni) str. 20
22 Systemy Wyszukiwania Informacji 2. Wyszukiwanie Do systemu zadano pytanie: t=(kolor, Czerwony)(Typ nadwozia, Kombi) Skoro przeszukana ma być tylko połowa kartoteki, wyszukiwanie polegające na porównywaniu całego pytania (pytanie jest iloczynem deskryptorów) z opisami obiektów wg nowego uporządkowania kartoteki będzie obejmowało jedynie opisy obiektów: x1,x5,x7,x2 i x4. Zapis t tx1 będziemy interpretować jako potwierdzenie, że pytanie t zawiera się w opisie obiektu x1 (zgodnie z definicją zawierania się termów podaną na stronie 29 w pracy 1 ). Odpowiednio zapis t tx1 będzie oznaczał, że pytanie t nie zawiera się w opisie obiektu x1. t tx1 t tx5 t tx7 t tx2 t tx4 Odpowiedź na pytanie t: σ(t)={x2} Na zadane pytanie odpowiedzią był także obiekt x10 jednak ograniczając przeszukiwanie do połowy kartoteki nie zostanie on przeszukany. Kompletność odpowiedzi wynosi zatem 50% przy jednoczesnym skróceniu czasu wyszukiwania o połowę. 1 Wakulicz-Deja Alicja, Podstawy systemów wyszukiwania informacji. Analiza metod, Akademicka Oficyna Wydawnicza, Warszawa str. 21
23 Zbio r zadan z rozwiązaniami Zadanie 8 Dla systemu SI przedstawionego w postaci tabeli stwórz kartotekę wyszukiwawczą w metodzie list prostych z grupowaniem wg atrybutu kategoria. Następnie przedstaw sposób wyszukiwania odpowiedzi na pytanie: t = (kategoria, historia) (cena, wysoka) X cena Popularność autora Kategoria x1 wysoka nieznany informatyka x2 niska przeciętnie języki obce x3 wysoka duża historia x4 niska nieznany języki obce x5 średnia nieznany informatyka x6 średnia przeciętnie języki obce x7 wysoka duża historia x8 niska przeciętnie języki obce x9 niska nieznany informatyka x10 niska przeciętnie języki obce Rozwiązanie: I) Tworzenie kartoteki wyszukiwawczej Atrybut kategoria przestawiamy na początek opisu obiektów w kartotece. Tak zmienione co do kolejności deskryptorów, opisy obiektów porządkujemy leksykograficznie względem wybranego atrybutu, a więc najpierw wszystkie obiekty z wartością informatyka, następnie języki obce i na końcu historia. Kartoteka nowo uporządkowana wygląda następująco: X Kategoria cena Popularność autora x1 informatyka wysoka nieznany x5 informatyka średnia nieznany x9 informatyka niska nieznany x2 języki obce niska przeciętnie x4 języki obce niska nieznany x6 języki obce średnia przeciętnie x8 języki obce niska przeciętnie x10 języki obce niska przeciętnie x3 historia wysoka duża x7 historia wysoka duża Widzimy, iż uporządkowanie obiektów w kartotece uległo zmianie. By zbudować tablicę adresową z informacjami o początku i końcu bloku obiektów zawierających w swoim opisie dany deskryptor musimy zapamiętać to nowe uporządkowanie. Najczęściej po prostu przy nazwie obiektu podajemy numer nowego str. 22
SYSTEMY WYSZUKIWANIA INFORMACJI
SYSTEMY WYSZUKIWANIA INFORMACJI Agnieszka Nowak- Brzezińska Zbiór zadań z rozwiązaniami Systemy Wyszukiwania Informacji by Agnieszka Nowak Brzezińska by Instytut Informatyki Uniwersytetu Śląskiego str.
Metoda list prostych Wykład II. Agnieszka Nowak - Brzezińska
Metoda list prostych Wykład II Agnieszka Nowak - Brzezińska Wprowadzenie Przykładowa KW Inna wersja KW Wyszukiwanie informacji Metoda I 1. Przeglądamy kolejne opisy obiektów i wybieramy te, które zawierają
Metoda list inwersyjnych. Wykład III
Metoda list inwersyjnych Wykład III Plan wykładu Cele metody Tworzenie kartoteki wyszukiwawczej Redundancja i zajętość pamięci Wyszukiwanie informacji Czasy wyszukiwania Ocena metody: wady i zalety Modyfikacje
Metoda List Prostych mgr Tomasz Xięski, Instytut Informatyki, Uniwersytet Śląski Sosnowiec, 2012
Metoda List Prostych mgr Tomasz Xięski, Instytut Informatyki, Uniwersytet Śląski Sosnowiec, 2012 Najprostsza metoda wyszukiwania informacji. Nazywana również Metodą Przeglądu Zupełnego (bo w procesie wyszukiwania
Metoda List Łańcuchowych
Metoda List Łańcuchowych mgr Tomasz Xięski, Instytut Informatyki, Uniwersytet Śląski Sosnowiec, 2010 Celem metody jest utrzymanie zalet MLI (dobre czasy wyszukiwania), ale wyeliminowanie jej wad (wysoka
Metoda List Inwersyjnych
Metoda List Inwersyjnych Celem metody jest poprawienie (skrócenie) czasów wyszukiwania względem MLP (i tak się faktycznie dzieje dla pewnej klasy pytań). Założenie: Dany jest system informacyjny S =
Metoda list inwersyjnych
Metoda list inwersyjnych Zakładam, że materiał ten zastępuje nam zajęcia, które się niestety nie odbyły w dniach 10 i 17 kwiecień. Bardzo proszę przejrzeć cały materiał i na kolejne zajęcia przyjść przygotowanym.
METODA LIST PROSTYCH. Marcin Jaskuła
METODA LIST PROSTYCH Marcin Jaskuła DEFINIOWANIE SYSTEMU S= Gdzie: X- zbiór obiektów systemu A- zbiór atrybutów systemu V- zbiór wartości atrybutów Q- funkcja informacji Zdefiniowany system
Metoda Składowych atomowych
Metoda Składowych atomowych 26 stycznia 2011 Konspekt do zajęć z przedmiotu: Systemy Wyszukiwania Informacji Literatura źródłowa: 1. Wakulicz-Deja A.: Podstawy systemów wyszukiwania informacji. Analiza
Systemy Wyszukiwania Informacji
Systemy Wyszukiwania Informacji METODA LIST INWERSYJNYCH OPRACOWALI: Filip Kuliński Adam Pokoleńczuk Sprawozdanie zawiera: Przedstawienie kartoteki wtórnej Przedstawienie kartoteki wyszukiwawczej (inwersyjne)
Terminarz na sezon 2014/2015 (zaznaczono główny termin sobotni) 1 kolejka 19 lipca
Terminarz na sezon 2014/2015 (zaznaczono główny termin sobotni) 1 kolejka 19 lipca Lech Poznań - Piast Gliwice Legia Warszawa - GKS Bełchatów Górnik Zabrze Cracovia Jagiellonia Białystok - Lechia Gdańsk
Pozycjonowanie oficjalnych stron internetowych polskich klubów piłkarskich
FOOTBALL BUSINESS GROUP przy współpracy z SPORT & BUSINESS FOUNDATION Sierpień 2007 Pozycjonowanie oficjalnych stron internetowych polskich klubów piłkarskich Spis treści 1. Wstęp... 3 2. Pozycjonowanie
Dekompozycja w systemach wyszukiwania informacji
METODY DEKOMPOZYCJI: Dekompozycja w systemach wyszukiwania informacji ATRYBUTOWA OBIEKTOWA HIERARCHICZNA (zależna i wymuszona) Dekompozycje mają cel wtedy kiedy zachodzi któryś z poniższych warunków: Duża
Zadanie 1. Suma silni (11 pkt)
2 Egzamin maturalny z informatyki Zadanie 1. Suma silni (11 pkt) Pojęcie silni dla liczb naturalnych większych od zera definiuje się następująco: 1 dla n = 1 n! = ( n 1! ) n dla n> 1 Rozpatrzmy funkcję
ALFA ROMEO... 2 AUDI... 2 BMW... 2 CHRYSLER... 3 CITROEN... 4 FIAT... 4 FORD... 5 HONDA... 6 HYUNDAI... 7 LEXUS... 7 MITSUBISHI... 8 OPEL...
SPIS TREŚCI ALFA ROMEO... 2 AUDI... 2 BMW... 2 CHRYSLER... 3 CITROEN... 4 FIAT... 4 FORD... 5 HONDA... 6 HYUNDAI... 7 LEXUS... 7 MITSUBISHI... 8 OPEL... 8 PEUGEOT... 9 RENAULT... 10 TOYOTA... 10 VOLKSWAGEN...
Wojewódzki Konkurs Matematyczny dla uczniów gimnazjów 19 luty 2012 Czas 90 minut
kod ucznia Wojewódzki Konkurs Matematyczny dla uczniów gimnazjów 19 luty 2012 Czas 90 minut 1. Otrzymujesz do rozwiązania 10 zadań zamkniętych oraz 5 zadań otwartych. 2. Obok każdego zadania podana jest
Wojewódzki Konkurs Matematyczny dla uczniów gimnazjów 19 luty 2013 Czas 90 minut
Wojewódzki Konkurs Matematyczny dla uczniów gimnazjów 19 luty 01 Czas 90 minut ZADANIA ZAMKNIĘTE Rozwiązania zadań W zadaniach od 1. do 10. właściwe odpowiedzi zostały zaznaczone Zadanie 1. (1 punkt) Ile
Instrukcje dla zawodników
Płock, 17 marca 2018 r. Instrukcje dla zawodników Arkusze otwieramy na wyraźne polecenie komisji. Wszystkie poniższe instrukcje zostaną odczytane i wyjaśnione. 1. Arkusz składa się z 3 zadań. 2. Każde
Algorytmy i struktury danych. Wykład 4 Tablice nieporządkowane i uporządkowane
Algorytmy i struktury danych Wykład 4 Tablice nieporządkowane i uporządkowane Tablice uporządkowane Szukanie binarne Szukanie interpolacyjne Tablice uporządkowane Szukanie binarne O(log N) Szukanie interpolacyjne
5.5. Wybieranie informacji z bazy
5.5. Wybieranie informacji z bazy Baza danych to ogromny zbiór informacji, szczególnie jeśli jest odpowiedzialna za przechowywanie danych ogromnych firm lub korporacji. Posiadając tysiące rekordów trudno
1 Układy równań liniowych
II Metoda Gaussa-Jordana Na wykładzie zajmujemy się układami równań liniowych, pojawi się też po raz pierwszy macierz Formalną (i porządną) teorią macierzy zajmiemy się na kolejnych wykładach Na razie
Wprowadzenie i pojęcia wstępne.
Wprowadzenie i pojęcia wstępne. X\A a b c x 1 a 1 b 1 c 1 x 2 a 1 b 1 c 2 x 3 a 1 b 2 c 3 x 4 a 2 b 1 c 4 x 5 a 1 b 2 c 1 x 6 a 1 b 2 c 2 x 7 a 1 b 1 c 1 S = X = {x 1,,x 8 } A = {a, b, c}
Jednym z najprostszych sposobów porządkowania jest technika stosowana przy sortowaniu listów:
Jednym z najprostszych sposobów porządkowania jest technika stosowana przy sortowaniu listów: Listy rozkładane są do różnych przegródek. O tym, do której z nich trafi koperta, decydują różne fragmenty
operacje porównania, a jeśli jest to konieczne ze względu na złe uporządkowanie porównywanych liczb zmieniamy ich kolejność, czyli przestawiamy je.
Problem porządkowania zwanego również sortowaniem jest jednym z najważniejszych i najpopularniejszych zagadnień informatycznych. Dane: Liczba naturalna n i ciąg n liczb x 1, x 2,, x n. Wynik: Uporządkowanie
Elementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Przekladnie kierownicze
SPIS TRESC I Alfa Romeo 4 Audi 7 BMW 11 Citroen 13 Dacia 15 Daewoo 16 Fiat 17 Ford 36 Honda 40 Hyundai 41 Iveco 42 Lancia 44 Land Rover 45 Mercedes 46 Mitsubishi 48 Nissan 49 Opel 50 Peugeot 52 Renault
Algorytmy sortujące i wyszukujące
Algorytmy sortujące i wyszukujące Zadaniem algorytmów sortujących jest ułożenie elementów danego zbioru w ściśle określonej kolejności. Najczęściej wykorzystywany jest porządek numeryczny lub leksykograficzny.
Programowanie w VB Proste algorytmy sortowania
Programowanie w VB Proste algorytmy sortowania Sortowanie bąbelkowe Algorytm sortowania bąbelkowego polega na porównywaniu par elementów leżących obok siebie i, jeśli jest to potrzebne, zmienianiu ich
FUNKCJA KWADRATOWA. Zad 1 Przedstaw funkcję kwadratową w postaci ogólnej. Postać ogólna funkcji kwadratowej to: y = ax + bx + c;(
Zad Przedstaw funkcję kwadratową w postaci ogólnej Przykład y = ( x ) + 5 (postać kanoniczna) FUNKCJA KWADRATOWA Postać ogólna funkcji kwadratowej to: y = ax + bx + c;( a 0) Aby ją uzyskać pozbywamy się
Metody indeksowania dokumentów tekstowych
Metody indeksowania dokumentów tekstowych Paweł Szołtysek 21maja2009 Metody indeksowania dokumentów tekstowych 1/ 19 Metody indeksowania dokumentów tekstowych 2/ 19 Czym jest wyszukiwanie informacji? Wyszukiwanie
Algorytmy i struktury danych
Algorytmy i struktury danych ĆWICZENIE 2 - WYBRANE ZŁOŻONE STRUKTURY DANYCH - (12.3.212) Prowadząca: dr hab. inż. Małgorzata Sterna Informatyka i3, poniedziałek godz. 11:45 Adam Matuszewski, nr 1655 Oliver
QUERY język zapytań do tworzenia raportów w AS/400
QUERY język zapytań do tworzenia raportów w AS/400 Dariusz Bober Katedra Informatyki Politechniki Lubelskiej Streszczenie: W artykule przedstawiony został język QUERY, standardowe narzędzie pracy administratora
Systemy Wyszukiwania Informacji: Metoda list inwersyjnych
Systemy Wyszukiwania Informacji: Metoda list inwersyjnych dr agnieszka Nowak - Brzezi«ska Instytut Informatyki, Zakªad Systemów Informatycznych ul. Badzi«ska 39, Sosnowiec, Tel (+48 32) 368 97 65 e-mail:agnieszka.nowak@us.edu.al
Informatyka Ćwiczenie 10. Bazy danych. Strukturę bazy danych można określić w formie jak na rysunku 1. atrybuty
Informatyka Ćwiczenie 10 Bazy danych Baza danych jest zbiór informacji (zbiór danych). Strukturę bazy danych można określić w formie jak na rysunku 1. Pracownik(ID pracownika, imie, nazwisko, pensja) Klient(ID
Oferta Najmu Krótkoterminowego
Oferta Najmu Krótkoterminowego Dlaczego MasterRent24? Właścicielem marki MasterRent24 jest Grupa Masterlease, która działa w Polsce od 1995 roku. Grupa Masterlease jest jednym z liderów polskiego rynku
ZAMÓWIENIA GIS BY CTI
ZAMÓWIENIA GIS BY CTI Instrukcja obsługi DATA 05.03.2013 PRODUCENT Centrum Technologii Informatycznej Zygmunt Wilder WERSJA 1.0 AUTOR Dariusz Skórniewski 1. Wstęp. Program ten stworzony został z myślą
Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski
: idea Indeksowanie: Drzewo decyzyjne, przeszukiwania binarnego: F = {5, 7, 10, 12, 13, 15, 17, 30, 34, 35, 37, 40, 45, 50, 60} 30 12 40 7 15 35 50 Tadeusz Pankowski www.put.poznan.pl/~tadeusz.pankowski
Instrukcje dla zawodników
Instrukcje dla zawodników Nie otwieraj arkusza z zadaniami dopóki nie zostaniesz o to poproszony. Instrukcje poniżej zostaną ci odczytane i wyjaśnione. 1. Arkusz składa się z 3 zadań. 2. Każde zadanie
Wyszukiwanie i zamawianie artykułów za pośrednictwem strony internetowej
Wyszukiwanie i zamawianie artykułów za pośrednictwem strony internetowej OBSŁUGA SYSTEMU E-ZAMÓWIENIA W celu skorzystania z systemu e-zamówienia należy zalogować się na stronie internetowej www.motohurt.pl
Arkusz kalkulacyjny Excel
Arkusz kalkulacyjny Excel Ćwiczenie 1. Sumy pośrednie (częściowe). POMOC DO ĆWICZENIA Dzięki funkcji sum pośrednich (częściowych) nie jest konieczne ręczne wprowadzanie odpowiednich formuł. Dzięki nim
Bazy danych TERMINOLOGIA
Bazy danych TERMINOLOGIA Dane Dane są wartościami przechowywanymi w bazie danych. Dane są statyczne w tym sensie, że zachowują swój stan aż do zmodyfikowania ich ręcznie lub przez jakiś automatyczny proces.
Wyszukiwanie i zamawianie artykułów za pośrednictwem strony internetowej
Wyszukiwanie i zamawianie artykułów za pośrednictwem strony internetowej OBSŁUGA SYSTEMU E-ZAMÓWIENIA W celu skorzystania z systemu e-zamówienia należy zalogować się na stronie internetowej www.motohurt.pl
Krzysztof Leszczyński Adam Sosnowski Michał Winiarski. Projekt UCYF
Krzysztof Leszczyński Adam Sosnowski Michał Winiarski Projekt UCYF Temat: Dekodowanie kodów 2D. 1. Opis zagadnienia Kody dwuwymiarowe nazywane często kodami 2D stanowią uporządkowany zbiór jasnych i ciemnych
Hierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Pracownia Informatyczna Instytut Technologii Mechanicznej Wydział Inżynierii Mechanicznej i Mechatroniki. Podstawy Informatyki i algorytmizacji
Pracownia Informatyczna Instytut Technologii Mechanicznej Wydział Inżynierii Mechanicznej i Mechatroniki Podstawy Informatyki i algorytmizacji wykład 6 dr inż. Maria Lachowicz Zagadnienia poruszane w ramach
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Rekurencja. Przykład. Rozważmy ciąg
Rekurencja Definicje rekurencyjne Definicja: Mówimy, iż ciąg jest zdefiniowany rekurencyjnie, jeżeli: (P) Określony jest pewien skończony zbiór wyrazów tego ciągu, zwykle jest to pierwszy wyraz tego ciągu
opisuje nazwy kolumn, wyrażenia arytmetyczne, funkcje nazwy tabel lub widoków warunek (wybieranie wierszy)
Zapytania SQL. Polecenie SELECT jest używane do pobierania danych z bazy danych (z tabel lub widoków). Struktura polecenia SELECT SELECT FROM WHERE opisuje nazwy kolumn, wyrażenia arytmetyczne, funkcje
NADKOLA 20-01-2015. Możliwe są dodatkowe rabaty w zależności od zamawianej ilości. AUDI Nr artykułu Numer OE
NADKOLA 20-01-2015 Możliwe są dodatkowe rabaty w zależności od zamawianej ilości AUDI Nr artykułu Numer OE Audi A3 1996-2005, lewy przód 110101 8L0821171C Audi A3 1996-2005, prawy przód 110102 8L0821172B
Złożoność obliczeniowa zadania, zestaw 2
Złożoność obliczeniowa zadania, zestaw 2 Określanie złożoności obliczeniowej algorytmów, obliczanie pesymistycznej i oczekiwanej złożoności obliczeniowej 1. Dana jest tablica jednowymiarowa A o rozmiarze
Temat: Algorytm kompresji plików metodą Huffmana
Temat: Algorytm kompresji plików metodą Huffmana. Wymagania dotyczące kompresji danych Przez M oznaczmy zbiór wszystkich możliwych symboli występujących w pliku (alfabet pliku). Przykład M = 2, gdy plik
Oprogramowanie diagnostyczne Delphi 2012 Wydanie 3 do samochodów osobowych i lekkich pojazdów dostawczych
DI001-13 (DM1012) DO WSZYSTKICH KONTRAHENTÓW Oprogramowanie diagnostyczne Delphi 2012 Wydanie 3 do samochodów osobowych i lekkich pojazdów dostawczych Najnowsze uaktualnienie do oprogramowania diagnostycznego
Ustalanie dostępu do plików - Windows XP Home/Professional
Ustalanie dostępu do plików - Windows XP Home/Professional Aby edytować atrybuty dostępu do plikow/ katalogow w systemie plików NTFS wpierw sprawdź czy jest Wyłączone proste udostępnianie czyli przejdź
Metoda Karnaugh. B A BC A
Metoda Karnaugh. Powszechnie uważa się, iż układ o mniejszej liczbie elementów jest tańszy i bardziej niezawodny, a spośród dwóch układów o takiej samej liczbie elementów logicznych lepszy jest ten, który
Funkcje wymierne. Jerzy Rutkowski. Działania dodawania i mnożenia funkcji wymiernych określa się wzorami: g h + k l g h k.
Funkcje wymierne Jerzy Rutkowski Teoria Przypomnijmy, że przez R[x] oznaczamy zbiór wszystkich wielomianów zmiennej x i o współczynnikach rzeczywistych Definicja Funkcją wymierną jednej zmiennej nazywamy
Pologne :02 00:00 03:00 01:01 00:02 02:03 03:00 01:01 01:03 01:01 02:00 04:02 01:02 00:00 00:02 00:01 01:01 01:02 03:01 00:00 01:01 01:00
Pologne 1975 76 430323 434343 01 Pol Śląsk Wrocław ROW Rybnik 02:02 430321 01 Pol Stal Rzeszów Szombierki Bytom 00:00 0,11214 102343 01 Pol Ruch Chorzów Górnik Zabrze 03:00 252341 123234 01 Pol GKS Tychy
Redakcja Radia TOK FM Olga Chojnacka
Peugeot 308 Renault Megane 1.4 benzyna 98KM 1.6 diesel 90KM 1.6 benzyna 100KM 1.5 diesel 85 KM Po jakim czasie pierwszy przegląd 30 tys km / 2 lata 30 tys km / 2 lata 30 tys. Km lub 2 lata 31 tys. Km lub
METODY INŻYNIERII WIEDZY
METODY INŻYNIERII WIEDZY Metoda K Najbliższych Sąsiadów K-Nearest Neighbours (KNN) ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Na polskiej piłce da się zarabiać Ekstraklasa piłkarskiego biznesu września 2011 r.
Na polskiej piłce da się zarabiać Ekstraklasa piłkarskiego biznesu 2011 20 września 2011 r. Wpływy do klubowych kas w 2010 roku 383,6 mln zł łączne przychody klubów Ekstraklasy w 2010 roku 22% - stopa
TP1 - TABELE PRZESTAWNE od A do Z
TP1 - TABELE PRZESTAWNE od A do Z Program szkolenia 1. Tabele programu Excel 1.1. Wstawianie tabeli 1.2. Style tabeli 1.3. Właściwości tabeli 1.4. Narzędzia tabel 1.4.1. Usuń duplikaty 1.4.2. Konwertuj
Instrukcja wprowadzania graficznych harmonogramów pracy w SZOI Wg stanu na 21.06.2010 r.
Instrukcja wprowadzania graficznych harmonogramów pracy w SZOI Wg stanu na 21.06.2010 r. W systemie SZOI została wprowadzona nowa funkcjonalność umożliwiająca tworzenie graficznych harmonogramów pracy.
Materiały dla finalistów
Materiały dla finalistów Malachoviacus Informaticus 2016 11 kwietnia 2016 Wprowadzenie Poniższy dokument zawiera opisy zagadnień, które będą niezbędne do rozwiązania zadań w drugim etapie konkursu. Polecamy
Nabór Bursy/CKU. Do korzystania ze strony elektronicznej rekrutacji zalecamy następujące wersje przeglądarek internetowych:
Nabór Bursy/CKU Przeglądanie oferty i rejestracja kandydata Informacje ogólne Do korzystania ze strony elektronicznej rekrutacji zalecamy następujące wersje przeglądarek internetowych: Internet Explorer
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Polski rynek pojazdów używanych
1 Polski rynek pojazdów używanych Przegląd informacji RAPORT maj 2019 r. 2 typy pojazdów samochody osobowe 87,16% samochody ciężarowe 6,90% motocykle 1,96% motorowery 1,05% ciągniki rolnicze 0,65% właściciele
2 Arytmetyka. d r 2 r + d r 1 2 r 1...d d 0 2 0,
2 Arytmetyka Niech b = d r d r 1 d 1 d 0 będzie zapisem liczby w systemie dwójkowym Zamiana zapisu liczby b na system dziesiętny odbywa się poprzez wykonanie dodawania d r 2 r + d r 1 2 r 1 d 1 2 1 + d
Klasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Kolorowanie płaszczyzny, prostych i okręgów
Kolorowanie płaszczyzny, prostych i okręgów Jadwiga Czyżewska Pisane pod kierunkiem W.Guzickiego W 2013 roku na II etapie VIII edycji Olimpiady Matematycznej Gimnazjalistów pojawiło się zadanie o następującej
6. Zagadnienie parkowania ciężarówki.
6. Zagadnienie parkowania ciężarówki. Sterowniki rozmyte Aby móc sterować przebiegiem pewnych procesów lub też pracą urządzeń niezbędne jest stworzenie odpowiedniego modelu, na podstawie którego można
Zależności funkcyjne
Zależności funkcyjne Plan wykładu Pojęcie zależności funkcyjnej Dopełnienie zbioru zależności funkcyjnych Postać minimalna zbioru zależności funkcyjnych Domknięcie atrybutu relacji względem zależności
Programowanie 3 - Funkcje, pliki i klasy
Instytut Informatyki Uniwersytetu Śląskiego Laborki funkcja; parametry funkcji; typ zwracany; typ void; funkcje bez parametrów; napis.length() - jako przykład funkcji. Zadania funkcja dodająca dwie liczby;
Materiały: kartki papieru (5 x 5 kolorów), piłeczki pingpongowe (5 x 5 kolorów), worek (nieprzeźroczysty).
Pudełkowy komputer Materiały: kartki papieru (5 x 5 kolorów), piłeczki pingpongowe (5 x 5 kolorów), worek (nieprzeźroczysty). Budowa komputera: każdy uczeń składa proste pudełko metodą orgiami Zobacz:
POMOC / INSTRUKCJA OBSŁUGI
POMOC / INSTRUKCJA OBSŁUGI 1. Powiększanie mapy 2. Plakat 3. Schemat lekcji 4. Broszura informacyjna 5. Instrukcja obsługi Pasek narzędzi i menu wyboru Zmiana skali mapy Mini mapa - podgląd na położenie
wykład Organizacja plików Opracował: dr inż. Janusz DUDCZYK
wykład Organizacja plików Opracował: dr inż. Janusz DUDCZYK 1 2 3 Pamięć zewnętrzna Pamięć zewnętrzna organizacja plikowa. Pamięć operacyjna organizacja blokowa. 4 Bufory bazy danych. STRUKTURA PROSTA
Górnicki Mateusz 17681
Streszczenie referatu pt.: Obróbka i montaż wideo w programie Sony Vegas -ścieżki audio/wideo, przejścia, filtry, rendering i inne Tytuł streszczenia: Maskowanie i animacja w programie Sony Vegas Pro Data
Agnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Rok prod.: Alfa Romeo 33 90 95 Alfa Romeo 147 01-- Alfa Romeo 159 Sedan 05--
Wykaz aut, do których pasuje bagażnik bazowy Dromader D1 plus. Bagażnik do samochodów bezrynienkowych: składa się z belek nośnych oraz uchwytów. Natomiast uchwyt składa się z łapy, poduszki i łapki chwytającej
Luty 2001 Algorytmy (7) 2000/2001 s-rg@siwy.il.pw.edu.pl
System dziesiętny 7 * 10 4 + 3 * 10 3 + 0 * 10 2 + 5 *10 1 + 1 * 10 0 = 73051 Liczba 10 w tym zapisie nazywa się podstawą systemu liczenia. Jeśli liczba 73051 byłaby zapisana w systemie ósemkowym, co powinniśmy
Języki formalne i automaty Ćwiczenia 4
Języki formalne i automaty Ćwiczenia 4 Autor: Marcin Orchel Spis treści Spis treści... 1 Wstęp teoretyczny... 2 Sposób tworzenia deterministycznego automatu skończonego... 4 Intuicyjne rozumienie konstrukcji
Przewidywana do zakupu ilość filtrów (w zalezności od potrzeb warsztatowych Zamawiającego) przykładowy numer katalogowy*
Zalącznik nr 1 Lp. Rodzaj filtru (powietrza, oleju, przeciwpyłkowy itp.) Marka i model pojazdu do którego jest filtr przykładowy numer katalogowy* Przewidywana do zakupu ilość filtrów (w zalezności od
Wydział Matematyki I Informatyki ul. Słoneczna Olsztyn
Klucz Napisać program sprawdzający czy dany klucz pasuje do danego zamka. Dziurka w zamku reprezentowana jest w postaci tablicy zero-jedynkowej i jest spójna. Klucz zakodowany jest jako ciąg par liczb
Jeśli czas działania algorytmu zależy nie tylko od rozmiaru danych wejściowych i przyjmuje różne wartości dla różnych danych o tym samym rozmiarze,
Oznaczenia: Jeśli czas działania algorytmu zależy nie tylko od rozmiaru danych wejściowych i przyjmuje różne wartości dla różnych danych o tym samym rozmiarze, to interesuje nas złożoność obliczeniowa
Drzewa BST i AVL. Drzewa poszukiwań binarnych (BST)
Drzewa ST i VL Drzewa poszukiwań binarnych (ST) Drzewo ST to dynamiczna struktura danych (w formie drzewa binarnego), która ma tą właściwość, że dla każdego elementu wszystkie elementy w jego prawym poddrzewie
Zagadnienie klasyfikacji (dyskryminacji)
Zagadnienie klasyfikacji (dyskryminacji) Przykład Bank chce klasyfikować klientów starających się o pożyczkę do jednej z dwóch grup: niskiego ryzyka (spłacających pożyczki terminowo) lub wysokiego ryzyka
030 PROJEKTOWANIE BAZ DANYCH. Prof. dr hab. Marek Wisła
030 PROJEKTOWANIE BAZ DANYCH Prof. dr hab. Marek Wisła Elementy procesu projektowania bazy danych Badanie zależności funkcyjnych Normalizacja Projektowanie bazy danych Model ER, diagramy ERD Encje, atrybuty,
Samochody w Polsce posiadanie, plany zakupu
IMAS International Wrocław Samochody w Polsce posiadanie, plany zakupu Wrocław, październik 2008 IMAS International Polska, 53-238 Wrocław, ul. Ostrowskiego 30, tel.: 071 339 04 31 imas@imas.pl, www.imas.pl
Podstawowe zapytania SELECT (na jednej tabeli)
Podstawowe zapytania SELECT (na jednej tabeli) Struktura polecenia SELECT SELECT opisuje nazwy kolumn, wyrażenia arytmetyczne, funkcje FROM nazwy tabel lub widoków WHERE warunek (wybieranie wierszy) GROUP
Algorytmy i złożoności. Wykład 3. Listy jednokierunkowe
Algorytmy i złożoności Wykład 3. Listy jednokierunkowe Wstęp. Lista jednokierunkowa jest strukturą pozwalającą na pamiętanie danych w postaci uporzadkowanej, a także na bardzo szybkie wstawianie i usuwanie
Terminarz rozgrywek Ekstraklasy w sezonie 2016/2017
1 2016-07-16 Wisła Kraków Pogoń Szczecin 1 2016-07-16 Legia Warszawa Jagiellonia Białystok 1 2016-07-16 Ruch Chorzów Górnik Łęczna 1 2016-07-16 Śląsk Wrocław Lech Poznań 1 2016-07-16 Bruk-Bet Termalica
PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE
D: PROBLEM: SORTOWANIE PRZEZ ODWRÓCENIA METODA: ALGORYTMY ZACHŁANNE I. Strategia zachłanna II. Problem przetasowań w genomie III. Sortowanie przez odwrócenia IV. Algorytmy przybliżone V. Algorytm zachłanny
Uszczelnienia, zestawy uszczelnień i części serwisowe o jakości wyposażenia oryginalnego. Przegląd produktów. Elring-Service
Uszczelnienia, zestawy uszczelnień i części serwisowe o jakości wyposażenia oryginalnego D O B R A P R A K T Y K A Przegląd produktów Elring-Service Bezpieczeństwo w każdym calu: czy to uszczelki podgłowicowe
Zadanie Wstaw wykres i dokonaj jego edycji dla poniższych danych. 8a 3,54 8b 5,25 8c 4,21 8d 4,85
Zadanie Wstaw wykres i dokonaj jego edycji dla poniższych danych Klasa Średnia 8a 3,54 8b 5,25 8c 4,21 8d 4,85 Do wstawienia wykresu w edytorze tekstu nie potrzebujemy mieć wykonanej tabeli jest ona tylko
TEORETYCZNE PODSTAWY INFORMATYKI
1 TEORETYCZNE PODSTAWY INFORMATYKI 16/01/2017 WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Repetytorium złożoność obliczeniowa 2 Złożoność obliczeniowa Notacja wielkie 0 Notacja Ω i Θ Rozwiązywanie
DLA SERWISÓW SAMOCHODOWYCH
Reklama w wyszukiwarce DLA SERWISÓW SAMOCHODOWYCH Czego użytkownicy szukają częściej? Kiedy najlepiej reklamować wymianę oleju, a kiedy rozrządu? Czy przepłacasz za kliknięcia w reklamę w Twoim mieście?
MS Excel 2007 Kurs zaawansowany Obsługa baz danych. prowadzi: Dr inż. Tomasz Bartuś. Kraków: 2008 04 25
MS Excel 2007 Kurs zaawansowany Obsługa baz danych prowadzi: Dr inż. Tomasz Bartuś Kraków: 2008 04 25 Bazy danych Microsoft Excel 2007 udostępnia szereg funkcji i mechanizmów obsługi baz danych (zwanych
Algorytmy przeszukiwania
Algorytmy przeszukiwania Przeszukiwanie liniowe Algorytm stosowany do poszukiwania elementu w zbiorze, o którym nic nie wiemy. Aby mieć pewność, że nie pominęliśmy żadnego elementu zbioru przeszukujemy
EGZAMIN MATURALNY Z INFORMATYKI
Miejsce na naklejkę z kodem szkoły dysleksja MIN-R1A1P-062 EGZAMIN MATURALNY Z INFORMATYKI POZIOM ROZSZERZONY Czas pracy 90 minut ARKUSZ I MAJ ROK 2006 Instrukcja dla zdającego 1. Sprawdź, czy arkusz egzaminacyjny
Metoda eliminacji Gaussa
Metoda eliminacji Gaussa Rysunek 3. Rysunek 4. Rozpoczynamy od pierwszego wiersza macierzy opisującej nasz układ równań (patrz Rys.3). Zakładając, że element a 11 jest niezerowy (jeśli jest, to niezbędny
Raport aktywności kibiców ekstraklasy na Facebooku maj 2011
Raport aktywności kibiców ekstraklasy na Facebooku maj 2011 Warszawa 13 czerwca 2011 1 7 Raport aktywności kibiców ekstraklasy na Facebooku Lech Poznań mistrzem Polski! Kolejorz jest bezkonkurencyjny w
Temat: Przedstawianie i odczytywanie informacji przedstawionych za pomocą wykresów. rysowanie i analizowanie wykresów zależności funkcyjnych.
Scenariusz lekcji matematyki dla klasy I Gimnazjum Temat: Przedstawianie i odczytywanie informacji przedstawionych za pomocą wykresów Cel ogólny : rysowanie i analizowanie wykresów zależności funkcyjnych.