1. Dane punkty na płaszczyźnie. Trzeba narysować dendrogram centroidu
|
|
- Władysław Kozłowski
- 8 lat temu
- Przeglądów:
Transkrypt
1 1. Dane punkty na płaszczyźnie. Trzeba narysować dendrogram centroidu Dendrogram obrazuje powiązania między klastrami. Liście obiekty Korzeń wynik grupowania Linia odcinająca pokazuje, w którym momencie dzielone są grupy. Centroid środek klastra. Wyznaczany jako średnia arytmetyczna odległości. Patrząc na dendrogram od dołu: Punkty B i C są najbliżej, więc są połączone na dendrogramie najniżej. Potem łączone są punkty D i E oraz F i G. Kolejną parą do połączenia jest punkt A i istniejący już klaster (BC). W tym momencie dochodzimy do przerywanej linii, która oznacza tutaj tylko pewien podział na klastry - na tym poziomie są one trzy (bo trzy pionowe linie przecina pozioma kreskowana): (ABC), (DE) i (FG). Dalej jak będziemy złączać to najbliższe są klastry (FG) i (DE), które są dalej łączone i na końcu pozostałe klastry (ABC) i (DEFG) są łączone w jeden zbiór. 2. Omów jak zaimplementować rozumienie znaczenia pojęć na komputerze np: Dodanie metadanych do danych Wymień sposoby redukcji wymiarów (3) i opisz jeden wybrany. (w02.ppt - slajd 24) selekcja o wybór podzbioru cech o filtrowanie oryginalnego zbioru cech funkcja częstości występuje w największej liczbie dokumentów
2 pozostawienie tylko częstych termów, występujących w określonej liczbie dokumentów ocena zysku informacyjnego - promowanie termów, których rozkład znacząco wyróżnia klasę ekstrakcja cech z tekstu o eliminacja synonimów, wieloznaczności o synonimy - zastępowanie zbliżonych termnów sztucznymi cechami - transformacja tezaurusowa o polisemia o klasteryzacja - grupowanie termów na podstawie przyjętej miary podobieństwa o PCA, SVD LSI - automatyczne wyrażanie oryginalnych danych w postaci nowych, zredukowanych cech stemming i Stop listy pozwalają zredukować nawet do 40% oryginalną reprezentacją danych. używane mogą być również do określenia języka 4. Budowa wyszukiwarki internetowej (w06.ppt - slajd 25-29) moduł crawler o Crawler, BOT, pełzacz, pająk o Sieć www to nie tylko strony html: grafika, dokumenty tekstowe, bazy, aplikacje o Przeszukiwanie zasobów sieci w celu pozyskania nowych stron i uaktualnienia już pozyskanych. Częstość aktualizacji zależy od typu strony np.: wiadomości co godzinę, typowo raz na miesiąc o W zależności od typu pająka do bazy trafiają różne cechy dokumentów: tekst, słowa kluczowe, linki, tytuł o Pijawki leech pozyskujące dane z bazy danych o Zbliżony wykładniczemu rozrost linków uzyskanych z pobranych stron o Wydajność dobra gdy ~ 25 stron / sekundę o Normalizacja URL Małe / wielkie litery Usuwanie odnośników, kotwic, ~,.., portów o Google BOT Dodane strony poprzez google.com/addurl.html Focused crawl, po linkach Fresh crawl częsty, Deep Crawl ilościowy o Istniejące pająki do własnego użycia moduł baza/ indexer - Wspomaga działanie procesu wyszukiwania o Indeks dokumentów pozyskanych przez clawrer o Wymagania na szybkość przeszukiwania ogromnej kolekcji zmieniających się dokumentów o Analiza dokumentu: Identyfikacja języka Lematyzacja, stemming Usunięcie stopwords Utworzenie indeksu słów występujących w dokumencie Utworzenie miar częstotliwości słów, wag Ewentualne rozszerzenia: zastąpienia synonimów, wyrazów ogólnych o Analiza dokumentów: Utworzenie słownika Indeksu odwróconego wyrażenia - dokumenty kompresja
3 moduł analizator zapytań / o Odpowiedzialny za komunikację między zapytaniem użytkownika a zbiorem dokumentów o Działanie: Rozbija zapytanie na tokeny Parsowanie rozróżnienie termów i operatorów Usunięcie stop words Analiza słów : częstotliwościowa, synonimy, stemming, ustalenie wagi Utworzenie zapytania wewnątrz systemowa reprezentacja Dopasowanie wyrażeń z dokumentów moduł wyszukiwania o Dopasowywanie dokumentów do zapytania i prezentacja wyników Analizator rozkłada pytanie Z użyciem algorytmu dopasowującego i indeksera wyznaczony zostaje podzbiór stron spełniających zapytanie Utworzenie rankingu stron Prezentacja wyników o W rzeczywistych zastosowaniach dopasowanie odbywa się do odwróconego indeksu, a nie samych stron o Dopasowanie zależy od przyjętego algorytmu opartego o miarę podobieństwa 5. Opisać algorytm PCA, jego zasadę działania i do czego służy. (w03.ppt - slajd 9-15) sposób identyfikacji wzorców w danych i wyrażenia danych w sposób uwidaczniający ich różnice i podobieństwa transformacja z n-wymiarowego do innej przestrzeni tak by obcięcie danych wejściowych w nowym systemie współrzędnych powodowało najmniejszy błąd kwadratowy - najmniejszą stratę informacji. PCA znajduje liniową transformację, która w optymalny sposób rzutuje punkty na mniej wymiarową przestrzeń tak, że błąd projekcji (suma kwadratów odległości) jest najmniejsza zastosowania
4 o kompresja o określenie czynników rozróżniających za pomocą liniowych kombinacji oryginalnych danych celem jest zwykle redukcja wymiarów przez odrzucenie współrzędnych odpowiadających mniejszym wartościom lub też poszukiwanie nowych współrzędnych przykład: osoba => [wzrost, wada, wiek, dochód, powierzchnia mieszkania] chcemy przedstawić w 3 wymiarach osoba => [wielkość {wzrost, waga}, zamożność {dochód, powierzchnia mieszkania}, wiek] Algorytm: utworzenie macierzy danych n*n gdzie kolumny są cechami obliczenie macierzy korelacji wyznaczenie wektorów i wartości własnych macierzy korelacji uporządkowanie wektorów włąsnych wg wartości własnych wybranie czynników - wektorów własnych zbudowanie amcierzy transformacji jako iloczyn czynników i macierzy danych 6. Opisać słownik WordNet i jego strukturę. (w05.ppt) Leksykograficzny słownik języka angielskiego obecnie w wersji 3.0 o rzeczowników słów sensów o czasowników o przymiotników o przysłówków Razem słowa pogrupowane są w zbiory synonimów znaczenie pojedynczego słowa jest przez definicje, zbiór słów oraz określone przez jego pozycję w stosunku do innych słów w większej strukturze - graf powiązań słów Przykład koń: o Zwierze horse, Equus caballus -- (solid-hoofed herbivorous quadruped domesticated since prehistoric times) o przyrząd ćwiczenia horse, gymnastic horse -- (a padded gymnastic apparatus on legs) o figura szachowa knight, horse -- (a chessman shaped to resemble the head of a horse; can move two squares horizontally and one vertically (or vice versa) Polisemia wielo znaczenie słów w zależności od kontekstu ranny : zraniony/poranny Synonimy wyrazy równoważne lub zbliżone znaczeniowo Pliki z rozszerzeniem.dat zawierają informacje o relacjach SYSNET Każda linia odpowiada jednej relacji i składa się z aktualnego przesunięcia w bajtach, dwubitowego identyfikatora pliku zawierającego daną relację, ciągu par (kategoria semantyczna jak w plikach.idx, słowo), liczby połączeń tej relacji z innymi. Na końcu linii występuje znak po którym może wystąpić definicja i przykładowe zdania dotyczące relacji. Pliki z rozszerzeniem.exc pozwalają odnaleźć podstawową formę słów, które posiadają nieregularne końcówki Pliki z rozszerzeniem.vrb zawierają zdania ilustrujące przykładowe użycie czasowników Wszystkie pliki są w postaci tekstowej Bardziej po polsku:
5 Wordnet to słownik wyrazów bliskoznacznych, opis relacji semantycznych między wyrazami, źródło definicji znaczeń, hierarchia pojęć - wszystko to składa się na leksykalną bazę wiedzy. Oryginalny WordNet dla języka angielskiego, konstruowany od ponad 20 lat na Uniwersytecie Princeton, użyczył nazwy i struktury wielu takim bazom wiedzy dla innych języków. Bardzo liczne są komercyjne i badawcze zastosowania wordnetów w informatyce i inżynierii oprogramowania, nade wszystko w sztucznej inteligencji i zwłaszcza w przetwarzaniu języków. (Należy odnotować, że są one niemal zawsze swobodnie dostępne dla naukowców i projektantów systemów.) 7. Policzyć odległości cosinusową i euklidesową dla podanych zdań. (w02.ppt - slajd 14) - 8. Opisać implikację/twierdzenia Gödla (w01.ppt - slajd 9) (1931) = twierdzenie o niezupełności + o niedowodliwości niesprzeczności dowolny system formalny jest albo zupełny albo spójny nie posiada tych dwóch cech jednocześnie. Można orzekać o prawdziwości wszystkich zdań takiego systemu, jednak wówczas istnieje w systemie pewne prawdziwe zdanie P, którego zaprzeczenie ~P również jest prawdziwe. Tym samym system albo jest sprzeczny wewnętrznie, albo system nie musi być sprzeczny, lecz wówczas istnieją zdania, których prawdziwości nie da się wywieść z aksjomatów i twierdzeń rozważanego systemu formalnego. Istnieją prawdziwe zdania systemu S które nie są twierdzeniami tego systemu (nie dają się wywieść z aksjomatów). Nie da się dowieść, w ramach systemu formalnego jego niesprzeczności. Trzeba systemu wyższego rzędu i tak w nieskończoność. 9. Precyzja i zwrot (w92.ppt - slajd 37) Są to miary oceny w klasyfikacji tekstów. prezycja 1/3 zwrot 1/2
6 10. VSM vector space model Reprezentacja częstości wystąpień słów Ważenie termów nie wszystkie są jednakowo istotne Algebraiczny model reprezentacji dokumentów tekstowych. Stosowany do filtrowania informacji, wyszukiwania informacji, indeksowania i rankingów. Dokumenty reprezentowane są jako wektory: Każda miara odpowiada oddzielnemu termowi. Jeżeli występuje on w dokumencie, jego wartość jest niezerowa. Wyznaczono kilka sposobów obliczania tych wartości. Jednym z nich jest tf-idf. Określenie czym jest term, zależy od aplikacji. Zazwyczaj to pojedyncze słowa, słowa kluczowe bądź dłuższe frazy. Jeśli słowa zostały oznaczone jako term, wymiarowość wektora to liczba słów w słowniku. Zalety w stosunku do modelu Standard Boolean: prosty model oparty na algebrze liniowej wagi termów nie binarne umożliwia obliczenie stopnia podobieństwa między zapytaniami i dokumentami umożliwia rankingowanie dokumentów według ich znaczenia umożliwia częsciowe dopasowanie 11. Dla dokumentów d1: "Ala ma kota" d2: "tomek ma psa w domu" reprezentowanych poprzez częstości słów wyznacz podobieństwa z użyciem miary cosinusowej dla zapytania Q "kto ma kota w domu" Tutaj nie brakuje cechy kto w słowniku? < Ala, ma, kota, Tomek, psa, w, domu> D1 = < 1, 1, 1, 0, 0, 0, 0> D2 = < 0, 1, 0, 1, 1, 1, 1> Q = < 0, 1, 1, 0, 0, 1, 1>
7 Q*d1 = 2 Q*d2 = 3 Q = sqrt(4) = 2 d1 = sqrt(3) d2 = sqrt(5) sim(d1, q) = 1/sqrt(3) sim(d2, q) = 3/(2*sqrt(5)) 12. Miara kosinusowa dwoch zdan dla czestotliwosci globalnej wystapienia slow: Shipment of silver was in a silver truck, Package of silver was in a plane "Jako wag użyj globalnej częstości wystąpień poszczególnych terminów". Mam rozumieć to tak, że biorę pod uwagę wystąpienia w obu dokumentach? Jak tak to widziałbym to tak. Mamy następujące dokumenty: d1: Delivery of silver arrived in silver truck d2: Shipment of silver arrived in a plane Liczba wszystkich wyrazów: 14 Statystyka globalnych wystąpień słów: Delivery: 1 of: 2 silver: 3 arrived : 2 in: 2 truck: 1 shipment: 1 a: 1 plane: 1 Więc prawdopodobieństwa dla poszczególnych słów mają się nastjępująco: Delivery: 1/14 of: 2/14 silver: 3/14 arrived : 2/14 in: 2/14 truck: 1/14 shipment: 1/14 a: 1/14 plane: 1/14 (Dla uproszczenia rachunków zostawiam 14 w mianowniku) Wektory dla konkretnych dokumentów wyglądają następująco (iloczyn liczby słów w dokumencie * prawdopodobieństwo): d1 = [1 * 1/14,1 * 2/14, 2 * 3/14, 1 * 2/14, 1 * 2/14, 1 * 1/14, 0 * 1/14, 0 * 1/14, 0 * 1/14] = [1/14, 2/14, 6/14, 2/14, 2/14, 1/14, 0, 0, 0]
8 d2 = [0 * 1/14, 1 * 2/14, 1 * 3/14, 1 * 2/14, 1 * 2/14, 0 * 1/14, 1 * 1/14, 1 * 1/14, 1 * 1/14] = [0, 2/14, 3/14, 2/14, 2/14, 0, 1/14, 1/14, 1/14] Odlegość kosinusowa, a tym samym stopień podobieństwa obu dokumentów wyraża się wzorem: sim(d1, d2) = sum(d1 * d2)/[sqrt(sum(d1^2)) * sqrt(sum(d2^2))] sum(d1 * d2) = 0 + 4/14^2 + 18/14^2 + 4/14^2 + 4/14^ = 30/14^2 = 30/14^2 sqrt(sum(d1^2)) = sqrt(1/14^2 + 4/14^2 + 36/14^2 + 4/14^2 + 4/14^2 + 1/14^2) = sqrt(50/14^2) = sqrt(50)/14 sqrt(sum(d2^2) = sqrt(0 + 4/14^2 + 9/14^2 + 4/14^2 + 4/14^ /14^2 + 1/14^2 + 1/14^2) = sqrt(24/14^2) sim(d1, d2) = 30/14^2 : [sqrt(50) * sqrt(24) / 14^2] = 30/sqrt(50*24) = 30/sqrt(25*2*4*6)= 30/[5 * 2 sqrt(3 * 4)] = 30/[20 sqrt(3)]= 3/2sqrt(3) = 3sqrt(3)/6 = sqrt(3)/2 = 87% 13. Oblicz odległość eklidesową/cosunusową zdań: Package of silver arrived in a silver truck. Shipment of silver arrived by plane. "Jako wag użyj lokalnej częstości wystąpień poszczególnych terminów". Mam rozumieć to tak, że biorę pod uwagę wystąpienia per dokument? Jak tak to widziałbym to tak. Mamy następujące dokumenty: d1: Delivery of silver arrived in silver truck d2: Shipment of silver arrived in a plane Liczba wyrazów per dokument: 7 Statystyka lokalnych wystąpień słów dla d1: Delivery: 1/7 of: 1/7 silver: 2/7 arrived : 1/7 in: 1/7 truck: 1/7 shipment: 0 a: 0 plane: 0 Statystyka lokalnych wystąpień słów dla d2: Delivery: 0 of: 1/7 silver: 1/7 arrived : 1/7 in: 1/7 truck: 0 shipment: 1/7 a: 1/7 plane: 1/7
9 Wektory dla konkretnych dokumentów wyglądają następująco (iloczyn liczby słów w dokumencie * prawdopodobieństwo): d1 = [1 * 1/7, 1 * 1/7, 2 * 2/7, 1 * 1/7, 1 * 1/7, 1* 1/7, 0,0,0] = [1/7, 1/7, 4/7, 1/7, 1/7, 1/7, 0,0,0] d2 = [0 * 0, 1 * 1/7, 1 * 1/7, 1 * 1/7, 1 * 1/7, 0, 1 * 1/7,1 * 1/7,1 * 1/7] = [0, 1/7, 1/7, 1/7, 1/7, 0, 1/7,1/7,1/7] Odlegość euklidesowa, a tym samym stopień podobieństwa obu dokumentów wyraża się wzorem: sim(d1, d2) = sqrt([sum(d1 - d2)^2]) = sqrt(1/7^ /7^ /7^2 + 1/7^2 + 1/7^2 + 1/7^2) = sqrt(14)/7 = 53% 14. Wyznacz prawdopodobieństwo dokumentów używając metryki Euklidesowej. Jako wagi użyj lokalnej częstości wystąpień poszczególnych termów: Delivery of silver arrived in silver truck. Shipment of silver arrived in a plane. patrz Do czego wykorzystywane jest ukryte indeksowanie semantyczne. Opisz procedurę jego realizacji. - dopasowanie znaczeń - synonimy (różne słowa odnoszące się do tego samego znaczenia) - polisemia (słowa mające wiele znaczeń) - eliminacja szumu - daje nam dobry model do badania powiązań między dokumentami poprzez termy - pozwala na określenie, które termy są faktycznie istotne dla zapytania - pozwala wyszukiwać koncepcje bardziej niż słowa - pozwala wydobyć dokumenty odpowiadające na pytanie użytkownika nawet jeśli pytanie i dokument nie współdzielą termów Procedura: - utworzenie macierzy reprezentacji dokumentów za pomocą częstotliwości termów - obliczenie SVD - obcięcie SVD do zredukowanej k-wymiarowej przestrzeni LSI, dzięki czemu uzyskujemy reprezentację semantyczną (eliminacja mało istotnych term) - podobieństwa w zredukowanej przestrzeni: - term - term - term - dokument - dokument - dokument 18. Opisz sposób klasyfikacji wykorzystywany w klasyfikatorze Bayesowskim. Dlaczego nazywany jest on naiwnym? Klasyfikacja polega na tym, że mamy zbiór słów w, gdzie każde słowo w_i ma określone prawdopodobieństwo przynależności do każdej klasy C_j. Klasyfikacja Bayesowska określa przynależność tekstu T do każdej klasy C_j. Maksymalna wartość przynależności tekstu T do klasy C kwalifikuje dany tekst do tej właśnie klasy. Czy dobrze rozumuje? Ktoś może to potwierdzić? A jeżeli nie to czy jest ktoś w stanie w bardziej przystępnej formie to przedstawić? Tego typu klasyfikatory są naiwne, ponieważ naiwnie zakładają niezależność słów.
10 19. Opisz algorytm klasteryzacji metodą gestosci. 20. Opisz znane ci metody klasteryzacji dokumentów. Bisecting K-Means, dzielenie początkowo jednego klastra na coraz mniejsze grupy - duże klastry dzielone są na dwa mniejsze. Proces ten iteracyjnie jest powtarzany, aż do uzyskania określonej liczby klastrów. Algorytm: 1. Wybierz klaster do podziału 2. Bisekcja: znajdź dwa klastry przy pomocy K-Means 3. Powtarzaj krok 2 zadaną ilość razy i wybierz podział dając największe podobieństwo 4. GOTO 1 UNTIL zadana iloś klastrów Wybór klastra: najliczniejszy lub posiadający najmniejsze podobieństwo w nim obiektów. Poza tym inne: K-Means, Fuzzy K-Means, Hierarchiczna klasteryzacja (pytanie niżej), metodą gęstości (pytanie wyżej) 21. Opisz znane ci metody klasteryzacji hierarchicznej. W odróżnieniu od algorytmów partycjonujących w wyniku są nie rozłączne grupy, a hierarchia zagnieżdżonych klastrów. Nie wymagają podania a priori liczby grup. Prezentacja dendrogram obrazujący powiązania między klastrami. Liście - obiekty, korzeń - wynik grupowania.
11 Dwa podejścia: Agglomerative skupiające: pojedyncze obiekty są klastrami i w kolejnych krokach łączy się dwie grupy aż do uzyskania jednego klastra. Divisives dzielące: zaczynamy od podziału zakładającego że wszystkie obiekty należą do jednej grupy i dzielimy aż każdy obiekt będzie osobnym klastrem. Np. Algorytm SC Johnson a 22. System informatyczny zawierał 130 dokumentów, spośród których dla pewnego zapytania istotnych było 27. Wyznacz wartość precyzji i zwrot dla danego zapytani wiedząc, że system zwrócił 23 dokumentów z czego 19 było istotnych z punktu użytkownika. Zgodnie z pytaniem 9 wyżej: relevant: 27 found:23 found&relevant:19 precyzja: 19/23 zwrot: 19/27 1.Dane punkty na płaszczyźnie. Trzeba narysować dendrogram centroidu Omów jak zaimplementować rozumienie znaczenia pojęć na komputerze Wymień sposoby redukcji wymiarów (3) i opisz jeden wybrany Budowa wyszukiwarki internetowej Opisać algorytm PCA, jego zasadę działania i do czego służy Opisać słownik WordNet i jego strukturę Policzyć odległości cosinusową i euklidesową dla podanych zdań Opisać implikację/twierdzenia Gödla Precyzja i zwrot VSM vector space model Dla dokumentów d1: "Ala ma kota" d2: "tomek ma psa w domu" reprezentowanych poprzez częstości słów wyznacz podobieństwa z użyciem miary cosinusowej dla zapytania Q "kto ma kota w domu" Miara kosinusowa dwoch zdan dla czestotliwosci globalnej wystapienia slow: Shipment of silver was in a silver truck, Package of silver was in a plane Oblicz odległość eklidesową/cosunusową zdań: Package of silver arrived in a silver truck. Shipment of silver arrived by plane Do czego wykorzystywane jest ukryte indeksowanie semantyczne. Opisz procedurę jego realizacji Opisz sposób klasyfikacji wykorzystywany w klasyfikatorze Bayesowskim. Dlaczego nazywany jest on naiwnym Opisz algorytm klasteryzacji metodą gestosci Opisz znane ci metody klasteryzacji dokumentów Opisz znane ci metody klasteryzacji hierarchicznej System informatyczny zawierał 130 dokumentów, spośród których dla pewnego zapytania istotnych było 27. Wyznacz wartość precyzji i zwrot dla danego zapytani wiedząc, że system zwrócił 23 dokumentów z czego 19 było istotnych z punktu użytkownika -11
Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Bardziej szczegółowoHierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Bardziej szczegółowoWyszukiwanie informacji w internecie. Nguyen Hung Son
Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy
Bardziej szczegółowoWordNet. Leksykograficzny słownik języka angielskiego obecnie w wersji 3.1
Word Net WordNet http://wordnet.princeton.edu/ Leksykograficzny słownik języka angielskiego obecnie w wersji 3.1 rzeczowników 117097 słów 81426 sensów czasowników 11488 13650 przymiotników 22141 18877
Bardziej szczegółowoEksploracja danych. Grupowanie. Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne. Grupowanie wykład 1
Grupowanie Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Grupowanie wykład 1 Sformułowanie problemu Dany jest zbiór obiektów (rekordów). Znajdź naturalne pogrupowanie
Bardziej szczegółowoSYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.
SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW Częstochowa 2014 Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska INFORMACJE WSTĘPNE Hipotezy do uczenia się lub tworzenia
Bardziej szczegółowoAUTOMATYKA INFORMATYKA
AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów
Bardziej szczegółowoSieci Kohonena Grupowanie
Sieci Kohonena Grupowanie http://zajecia.jakubw.pl/nai UCZENIE SIĘ BEZ NADZORU Załóżmy, że mamy za zadanie pogrupować następujące słowa: cup, roulette, unbelievable, cut, put, launderette, loveable Nie
Bardziej szczegółowoWydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych
Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie
Bardziej szczegółowoKlasyfikatory: k-nn oraz naiwny Bayesa. Agnieszka Nowak Brzezińska Wykład IV
Klasyfikatory: k-nn oraz naiwny Bayesa Agnieszka Nowak Brzezińska Wykład IV Naiwny klasyfikator Bayesa Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną
Bardziej szczegółowoAgnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Bardziej szczegółowoAnaliza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania
Analiza skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania Analiza Skupień Elementy składowe procesu grupowania obiekt Ekstrakcja cech Sprzężenie zwrotne Grupowanie klastry Reprezentacja
Bardziej szczegółowoEkstrakcja informacji oraz stylometria na usługach psychologii Część 2
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej
Bardziej szczegółowoIndukcja matematyczna. Zasada minimum. Zastosowania.
Indukcja matematyczna. Zasada minimum. Zastosowania. Arkadiusz Męcel Uwagi początkowe W trakcie zajęć przyjęte zostaną następujące oznaczenia: 1. Zbiory liczb: R - zbiór liczb rzeczywistych; Q - zbiór
Bardziej szczegółowoText mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
Bardziej szczegółowoAlgorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych. Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS
Algorytmy klasteryzacji jako metoda dyskretyzacji w algorytmach eksploracji danych Łukasz Przybyłek, Jakub Niwa Studenckie Koło Naukowe BRAINS Dyskretyzacja - definicja Dyskretyzacja - zamiana atrybutów
Bardziej szczegółowoAgnieszka Nowak Brzezińska
Agnieszka Nowak Brzezińska jeden z algorytmów regresji nieparametrycznej używanych w statystyce do prognozowania wartości pewnej zmiennej losowej. Może również byd używany do klasyfikacji. - Założenia
Bardziej szczegółowoAgnieszka Nowak Brzezińska Wykład III
Agnieszka Nowak Brzezińska Wykład III Naiwny klasyfikator bayesowski jest prostym probabilistycznym klasyfikatorem. Zakłada się wzajemną niezależność zmiennych niezależnych (tu naiwność) Bardziej opisowe
Bardziej szczegółowoGrupowanie Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633
Grupowanie Grupowanie 7 6 5 4 y 3 2 1 0-3 -2-1 0 1 2 3 4 5-1 -2-3 -4 x Witold Andrzejewski, Politechnika Poznańska, Wydział Informatyki 201/633 Wprowadzenie Celem procesu grupowania jest podział zbioru
Bardziej szczegółowoPODSTAWY AUTOMATYKI. MATLAB - komputerowe środowisko obliczeń naukowoinżynierskich - podstawowe operacje na liczbach i macierzach.
WYDZIAŁ ELEKTROTECHNIKI I AUTOMATYKI Katedra Inżynierii Systemów Sterowania PODSTAWY AUTOMATYKI MATLAB - komputerowe środowisko obliczeń naukowoinżynierskich - podstawowe operacje na liczbach i macierzach.
Bardziej szczegółowoSkalowanie wielowymiarowe idea
Skalowanie wielowymiarowe idea Jedną z wad metody PCA jest możliwość używania jedynie zmiennych ilościowych, kolejnym konieczność posiadania pełnych danych z doświadczenia(nie da się użyć PCA jeśli mamy
Bardziej szczegółowo1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie
Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty
Bardziej szczegółowoGrupowanie danych. Wprowadzenie. Przykłady
Grupowanie danych str. 1 Wprowadzenie Celem procesu grupowania jest podział zbioru obiektów, fizycznych lub abstrakcyjnych, na klasy obiektów o podobnych cechach, nazywane klastrami lub skupieniami Klaster
Bardziej szczegółowoElementy modelowania matematycznego
Elementy modelowania matematycznego Modelowanie algorytmów klasyfikujących. Podejście probabilistyczne. Naiwny klasyfikator bayesowski. Modelowanie danych metodą najbliższych sąsiadów. Jakub Wróblewski
Bardziej szczegółowoKlasyfikator. ˆp(k x) = 1 K. I(ρ(x,x i ) ρ(x,x (K) ))I(y i =k),k =1,...,L,
Klasyfikator Jedną z najistotniejszych nieparametrycznych metod klasyfikacji jest metoda K-najbliższych sąsiadów, oznaczana przez K-NN. W metodzie tej zaliczamy rozpoznawany obiekt do tej klasy, do której
Bardziej szczegółowoInteligentne wydobywanie informacji z internetowych serwisów społecznościowych
Inteligentne wydobywanie informacji z internetowych serwisów społecznościowych AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław
Bardziej szczegółowoSemantyczne podobieństwo stron internetowych
Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana
Bardziej szczegółowoEksploracja Danych. wykład 4. Sebastian Zając. 10 maja 2017 WMP.SNŚ UKSW. Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja / 18
Eksploracja Danych wykład 4 Sebastian Zając WMP.SNŚ UKSW 10 maja 2017 Sebastian Zając (WMP.SNŚ UKSW) Eksploracja Danych 10 maja 2017 1 / 18 Klasyfikacja danych Klasyfikacja Najczęściej stosowana (najstarsza)
Bardziej szczegółowoWyszukiwanie tekstów
Wyszukiwanie tekstów Dziedzina zastosowań Elektroniczne encyklopedie Wyszukiwanie aktów prawnych i patentów Automatyzacja bibliotek Szukanie informacji w Internecie Elektroniczne teksy Ksiązki e-book Artykuły
Bardziej szczegółowoInteraktywne wyszukiwanie informacji w repozytoriach danych tekstowych
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury
Bardziej szczegółowoPobieranie i przetwarzanie treści stron WWW
Eksploracja zasobów internetowych Wykład 2 Pobieranie i przetwarzanie treści stron WWW mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Jedną z funkcji silników wyszukiwania danych, a właściwie ich modułów
Bardziej szczegółowoSpis treści. Przedmowa... XI. Rozdział 1. Pomiar: jednostki miar... 1. Rozdział 2. Pomiar: liczby i obliczenia liczbowe... 16
Spis treści Przedmowa.......................... XI Rozdział 1. Pomiar: jednostki miar................. 1 1.1. Wielkości fizyczne i pozafizyczne.................. 1 1.2. Spójne układy miar. Układ SI i jego
Bardziej szczegółowoZaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene
2..22 Zaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene Dominika Puzio Indeks Podstawy: dokument Dokument: jednostka danych, pojedynczy element na liście wyników wyszukiwania,
Bardziej szczegółowoAproksymacja funkcji a regresja symboliczna
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(x), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(x), zwaną funkcją aproksymującą
Bardziej szczegółowoKody blokowe Wykład 2, 10 III 2011
Kody blokowe Wykład 2, 10 III 2011 Literatura 1. R.M. Roth, Introduction to Coding Theory, 2006 2. W.C. Huffman, V. Pless, Fundamentals of Error-Correcting Codes, 2003 3. D.R. Hankerson et al., Coding
Bardziej szczegółowoAlgorytm grupowania danych typu kwantyzacji wektorów
Algorytm grupowania danych typu kwantyzacji wektorów Wstęp Definicja problemu: Typowe, rozważane dotychczas problemy koncentrowały się na nauczeniu na podstawie zbioru treningowego i zbioru etykiet klasyfikacji
Bardziej szczegółowoSPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization
Wrocław University of Technology SPOTKANIE 6: Klasteryzacja: K-Means, Expectation Maximization Jakub M. Tomczak Studenckie Koło Naukowe Estymator jakub.tomczak@pwr.wroc.pl 4.1.213 Klasteryzacja Zmienne
Bardziej szczegółowoAlgorytmy decyzyjne będące alternatywą dla sieci neuronowych
Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny
Bardziej szczegółowoAnaliza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Bardziej szczegółowoMETODY INŻYNIERII WIEDZY ASOCJACYJNA REPREZENTACJA POWIĄZANYCH TABEL I WNIOSKOWANIE IGOR CZAJKOWSKI
METODY INŻYNIERII WIEDZY ASOCJACYJNA REPREZENTACJA POWIĄZANYCH TABEL I WNIOSKOWANIE IGOR CZAJKOWSKI CELE PROJEKTU Transformacja dowolnej bazy danych w min. 3 postaci normalnej do postaci Asocjacyjnej Grafowej
Bardziej szczegółowo4.1. Wprowadzenie...70 4.2. Podstawowe definicje...71 4.3. Algorytm określania wartości parametrów w regresji logistycznej...74
3 Wykaz najważniejszych skrótów...8 Przedmowa... 10 1. Podstawowe pojęcia data mining...11 1.1. Wprowadzenie...12 1.2. Podstawowe zadania eksploracji danych...13 1.3. Główne etapy eksploracji danych...15
Bardziej szczegółowoPrzekształcenia widmowe Transformata Fouriera. Adam Wojciechowski
Przekształcenia widmowe Transformata Fouriera Adam Wojciechowski Przekształcenia widmowe Odmiana przekształceń kontekstowych, w których kontekstem jest w zasadzie cały obraz. Za pomocą transformaty Fouriera
Bardziej szczegółowoRelacje. opracował Maciej Grzesiak. 17 października 2011
Relacje opracował Maciej Grzesiak 17 października 2011 1 Podstawowe definicje Niech dany będzie zbiór X. X n oznacza n-tą potęgę kartezjańską zbioru X, tzn zbiór X X X = {(x 1, x 2,..., x n ) : x k X dla
Bardziej szczegółowoROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ.
ROZKŁAD MATERIAŁU DO II KLASY LICEUM (ZAKRES ROZSZERZONY) A WYMAGANIA PODSTAWY PROGRAMOWEJ. LICZBA TEMAT GODZIN LEKCYJNYCH Potęgi, pierwiastki i logarytmy (8 h) Potęgi 3 Pierwiastki 3 Potęgi o wykładnikach
Bardziej szczegółowoAnaliza składowych głównych. Wprowadzenie
Wprowadzenie jest techniką redukcji wymiaru. Składowe główne zostały po raz pierwszy zaproponowane przez Pearsona(1901), a następnie rozwinięte przez Hotellinga (1933). jest zaliczana do systemów uczących
Bardziej szczegółowoRobert Susmaga. Instytut Informatyki ul. Piotrowo 2 Poznań
... Robert Susmaga Instytut Informatyki ul. Piotrowo 2 Poznań kontakt mail owy Robert.Susmaga@CS.PUT.Poznan.PL kontakt osobisty Centrum Wykładowe, blok informatyki, pok. 7 Wyłączenie odpowiedzialności
Bardziej szczegółowoMetody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Bardziej szczegółowow analizie wyników badań eksperymentalnych, w problemach modelowania zjawisk fizycznych, w analizie obserwacji statystycznych.
Aproksymacja funkcji a regresja symboliczna Problem aproksymacji funkcji polega na tym, że funkcję F(), znaną lub określoną tablicą wartości, należy zastąpić inną funkcją, f(), zwaną funkcją aproksymującą
Bardziej szczegółowoLingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Bardziej szczegółowo5. Rozwiązywanie układów równań liniowych
5. Rozwiązywanie układów równań liniowych Wprowadzenie (5.1) Układ n równań z n niewiadomymi: a 11 +a 12 x 2 +...+a 1n x n =a 10, a 21 +a 22 x 2 +...+a 2n x n =a 20,..., a n1 +a n2 x 2 +...+a nn x n =a
Bardziej szczegółowoE: Rekonstrukcja ewolucji. Algorytmy filogenetyczne
E: Rekonstrukcja ewolucji. Algorytmy filogenetyczne Przypominajka: 152 drzewo filogenetyczne to drzewo, którego liśćmi są istniejące gatunki, a węzły wewnętrzne mają stopień większy niż jeden i reprezentują
Bardziej szczegółowoBazy danych wykład dwunasty. dwunasty Wykonywanie i optymalizacja zapytań SQL 1 / 36
Bazy danych wykład dwunasty Wykonywanie i optymalizacja zapytań SQL Konrad Zdanowski Uniwersytet Kardynała Stefana Wyszyńskiego, Warszawa dwunasty Wykonywanie i optymalizacja zapytań SQL 1 / 36 Model kosztów
Bardziej szczegółowoCo to jest grupowanie
Grupowanie danych Co to jest grupowanie 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Szukanie grup, obszarów stanowiących lokalne gromady punktów Co to jest grupowanie
Bardziej szczegółowoRozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja I
Zespół TI Instytut Informatyki Uniwersytet Wrocławski ti@ii.uni.wroc.pl http://www.wsip.com.pl/serwisy/ti/ Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja I Rozkład zgodny
Bardziej szczegółowoDrzewa spinające MST dla grafów ważonych Maksymalne drzewo spinające Drzewo Steinera. Wykład 6. Drzewa cz. II
Wykład 6. Drzewa cz. II 1 / 65 drzewa spinające Drzewa spinające Zliczanie drzew spinających Drzewo T nazywamy drzewem rozpinającym (spinającym) (lub dendrytem) spójnego grafu G, jeżeli jest podgrafem
Bardziej szczegółowoElementy statystyki wielowymiarowej
Wnioskowanie_Statystyczne_-_wykład Spis treści 1 Elementy statystyki wielowymiarowej 1.1 Kowariancja i współczynnik korelacji 1.2 Macierz kowariancji 1.3 Dwumianowy rozkład normalny 1.4 Analiza składowych
Bardziej szczegółowoOptymalizacja ciągła
Optymalizacja ciągła 5. Metoda stochastycznego spadku wzdłuż gradientu Wojciech Kotłowski Instytut Informatyki PP http://www.cs.put.poznan.pl/wkotlowski/ 04.04.2019 1 / 20 Wprowadzenie Minimalizacja różniczkowalnej
Bardziej szczegółowoAnaliza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
Bardziej szczegółowoWYKŁAD 12. Analiza obrazu Wyznaczanie parametrów ruchu obiektów
WYKŁAD 1 Analiza obrazu Wyznaczanie parametrów ruchu obiektów Cel analizy obrazu: przedstawienie każdego z poszczególnych obiektów danego obrazu w postaci wektora cech dla przeprowadzenia procesu rozpoznania
Bardziej szczegółowoRozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja II
Zespół TI Instytut Informatyki Uniwersytet Wrocławski ti@ii.uni.wroc.pl http://www.wsip.com.pl/serwisy/ti/ Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja II Rozkład wymagający
Bardziej szczegółowoWstęp do przetwarzania języka naturalnego
Wstęp do przetwarzania języka naturalnego Wykład 9 Wektoryzacja dokumentów i podstawowe miary podobieństwa Wojciech Czarnecki 17 grudnia 2013 Section 1 Przypomnienie Bag of words model Podejście Przypomnienie
Bardziej szczegółowo0.1 Pierścienie wielomianów
0.1 Pierścienie wielomianów Zadanie 1. Znaleźć w pierścieniu Z 5 [X] drugi wielomian określający tę samą funkcję, co wielomian X 2 X + 1. (Odp. np. X 5 + X 2 2X + 1). Zadanie 2. Znaleźć sumę i iloczyn
Bardziej szczegółowoAlgorytmy, które estymują wprost rozkłady czy też mapowania z nazywamy algorytmami dyskryminacyjnymi.
Spis treści 1 Wstęp: generatywne algorytmy uczące 2 Gaussowska analiza dyskryminacyjna 2.1 Gaussowska analiza dyskryminacyjna a regresja logistyczna 3 Naiwny Klasyfikator Bayesa 3.1 Wygładzanie Laplace'a
Bardziej szczegółowoProgramowanie dynamiczne
Programowanie dynamiczne Ciąg Fibonacciego fib(0)=1 fib(1)=1 fib(n)=fib(n-1)+fib(n-2), gdzie n 2 Elementy tego ciągu stanowią liczby naturalne tworzące ciąg o takiej własności, że kolejny wyraz (z wyjątkiem
Bardziej szczegółowoRozpoznawanie obrazów
Rozpoznawanie obrazów Laboratorium Python Zadanie nr 1 Regresja liniowa autorzy: A. Gonczarek, J.M. Tomczak, S. Zaręba, M. Zięba, J. Kaczmar Cel zadania Celem zadania jest implementacja liniowego zadania
Bardziej szczegółowoALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Eksploracja danych Algorytmy klastujące Problem 3 Mając daną chmurę punktów chcielibyśmy zrozumieć ich
Bardziej szczegółowoWHILE (wyrażenie) instrukcja;
INSTRUKCJE ITERACYJNE WHILE, DO WHILE, FOR Instrukcje iteracyjne pozwalają powtarzać daną instrukcję programu określoną liczbę razy lub do momentu osiągnięcia określonego skutku. Pętla iteracyjna while
Bardziej szczegółowoTechniki grupowania danych w środowisku Matlab
Techniki grupowania danych w środowisku Matlab 1. Normalizacja danych. Jedne z metod normalizacji: = = ma ( y =, rσ ( = ( ma ( = min = (1 + e, min ( = σ wartość średnia, r współczynnik, σ odchylenie standardowe
Bardziej szczegółowoRozkład materiału nauczania
Dział/l.p. Ilość godz. Typ szkoły: TECHNIKUM Zawód: TECHNIK USŁUG FRYZJERSKICH Rok szkolny 2017/2018 Przedmiot: MATEMATYKA Klasa: III 60 godzin numer programu T5/O/5/12 Rozkład materiału nauczania Temat
Bardziej szczegółowoAnaliza głównych składowych- redukcja wymiaru, wykł. 12
Analiza głównych składowych- redukcja wymiaru, wykł. 12 Joanna Jędrzejowicz Instytut Informatyki Konieczność redukcji wymiaru w eksploracji danych bazy danych spotykane w zadaniach eksploracji danych mają
Bardziej szczegółowoW poszukiwaniu sensu w świecie widzialnym
W poszukiwaniu sensu w świecie widzialnym Andrzej Śluzek Nanyang Technological University Singapore Uniwersytet Mikołaja Kopernika Toruń AGH, Kraków, 28 maja 2010 1 Podziękowania Przedstawione wyniki powstały
Bardziej szczegółowo4.3 Grupowanie według podobieństwa
4.3 Grupowanie według podobieństwa Przykłady obiektów to coś więcej niż wektory wartości atrybutów. Reprezentują one poszczególne rasy psów. Ważnym pytaniem, jakie można sobie zadać, jest to jak dobrymi
Bardziej szczegółowoEGZAMIN MATURALNY W ROKU SZKOLNYM 2017/2018 INFORMATYKA
EGZAMIN MATURALNY W ROKU SZKOLNYM 2017/2018 INFORMATYKA POZIOM ROZSZERZONY FORMUŁA OD 2015 ( NOWA MATURA ) ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ MIN-R1,R2 MAJ 2018 Uwaga: Akceptowane są wszystkie odpowiedzi
Bardziej szczegółowoWYMAGANIA EDUKACYJNE Z MATEMATYKI KLASA I GIMNAZJUM Małgorzata Janik
WYMAGANIA EDUKACYJNE Z MATEMATYKI KLASA I GIMNAZJUM Małgorzata Janik DOPUSZCZAJĄCY DOSTATECZNY DOBRY BARDZO DOBRY LICZBY I DZIAŁANIA zna pojęcie liczby naturalnej, całkowitej, wymiernej. rozumie rozszerzenie
Bardziej szczegółowoMETODY INŻYNIERII WIEDZY
METODY INŻYNIERII WIEDZY Metoda K Najbliższych Sąsiadów K-Nearest Neighbours (KNN) ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Bardziej szczegółowoUCZENIE MASZYNOWE I SZTUCZNA INTELIGENCJA Jako narzędzia wspomagania decyzji w zarządzaniu kapitałem ludzkim organizacji
UCZENIE MASZYNOWE I SZTUCZNA INTELIGENCJA Jako narzędzia wspomagania decyzji w zarządzaniu kapitałem ludzkim organizacji Filip Wójcik Wydział Zarządzania, Informatyki i Finansów Instytut Informatyki Ekonomicznej
Bardziej szczegółowoZadania laboratoryjne i projektowe - wersja β
Zadania laboratoryjne i projektowe - wersja β 1 Laboratorium Dwa problemy do wyboru (jeden do realizacji). 1. Water Jug Problem, 2. Wieże Hanoi. Water Jug Problem Ograniczenia dla każdej z wersji: pojemniki
Bardziej szczegółowoBazy dokumentów tekstowych
Bazy dokumentów tekstowych Bazy dokumentów tekstowych Dziedzina zastosowań Automatyzacja bibliotek Elektroniczne encyklopedie Bazy aktów prawnych i patentów Szukanie informacji w Internecie Dokumenty tekstowe
Bardziej szczegółowoPakiet edukacyjny do nauki przedmiotów ścisłych i kształtowania postaw przedsiębiorczych
ZESPÓŁ SZKÓŁ HANDLOWO-EKONOMICZNYCH IM. MIKOŁAJA KOPERNIKA W BIAŁYMSTOKU Pakiet edukacyjny do nauki przedmiotów ścisłych i kształtowania postaw przedsiębiorczych Mój przedmiot matematyka spis scenariuszy
Bardziej szczegółowoAnaliza obrazów - sprawozdanie nr 2
Analiza obrazów - sprawozdanie nr 2 Filtracja obrazów Filtracja obrazu polega na obliczeniu wartości każdego z punktów obrazu na podstawie punktów z jego otoczenia. Każdy sąsiedni piksel ma wagę, która
Bardziej szczegółowoREPREZENTACJA LICZBY, BŁĘDY, ALGORYTMY W OBLICZENIACH
REPREZENTACJA LICZBY, BŁĘDY, ALGORYTMY W OBLICZENIACH Transport, studia niestacjonarne I stopnia, semestr I Instytut L-5, Wydział Inżynierii Lądowej, Politechnika Krakowska Adam Wosatko Ewa Pabisek Reprezentacja
Bardziej szczegółowoAlgorytmy wyznaczania centralności w sieci Szymon Szylko
Algorytmy wyznaczania centralności w sieci Szymon Szylko Zakład systemów Informacyjnych Wrocław 10.01.2008 Agenda prezentacji Cechy sieci Algorytmy grafowe Badanie centralności Algorytmy wyznaczania centralności
Bardziej szczegółowoMATEMATYKA Z PLUSEM DLA KLASY VII W KONTEKŚCIE WYMAGAŃ PODSTAWY PROGRAMOWEJ. programowej dla klas IV-VI. programowej dla klas IV-VI.
MATEMATYKA Z PLUSEM DLA KLASY VII W KONTEKŚCIE WYMAGAŃ PODSTAWY PROGRAMOWEJ TEMAT LICZBA GODZIN LEKCYJNYCH WYMAGANIA SZCZEGÓŁOWE Z PODSTAWY PROGRAMOWEJ UWAGI. LICZBY I DZIAŁANIA 6 h Liczby. Rozwinięcia
Bardziej szczegółowoSieć przesyłająca żetony CP (counter propagation)
Sieci neuropodobne IX, specyficzne architektury 1 Sieć przesyłająca żetony CP (counter propagation) warstwa Kohonena: wektory wejściowe są unormowane jednostki mają unormowane wektory wag jednostki są
Bardziej szczegółowooperacje porównania, a jeśli jest to konieczne ze względu na złe uporządkowanie porównywanych liczb zmieniamy ich kolejność, czyli przestawiamy je.
Problem porządkowania zwanego również sortowaniem jest jednym z najważniejszych i najpopularniejszych zagadnień informatycznych. Dane: Liczba naturalna n i ciąg n liczb x 1, x 2,, x n. Wynik: Uporządkowanie
Bardziej szczegółowoStosowana Analiza Regresji
Stosowana Analiza Regresji Wykład VIII 30 Listopada 2011 1 / 18 gdzie: X : n p Q : n n R : n p Zał.: n p. X = QR, - macierz eksperymentu, - ortogonalna, - ma zera poniżej głównej diagonali. [ R1 X = Q
Bardziej szczegółowoMETODY INŻYNIERII WIEDZY
METODY INŻYNIERII WIEDZY Metoda K Najbliższych Sąsiadów K-Nearest Neighbours (KNN) ĆWICZENIA Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej
Bardziej szczegółowoMacierze. Rozdział Działania na macierzach
Rozdział 5 Macierze Funkcję, która każdej parze liczb naturalnych (i, j) (i 1,..., n; j 1,..., m) przyporządkowuje dokładnie jedną liczbę a ij F, gdzie F R lub F C, nazywamy macierzą (rzeczywistą, gdy
Bardziej szczegółowoKompresja danych Streszczenie Studia Dzienne Wykład 10,
1 Kwantyzacja wektorowa Kompresja danych Streszczenie Studia Dzienne Wykład 10, 28.04.2006 Kwantyzacja wektorowa: dane dzielone na bloki (wektory), każdy blok kwantyzowany jako jeden element danych. Ogólny
Bardziej szczegółowoALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH
1 ALGORYTMICZNA I STATYSTYCZNA ANALIZA DANYCH WFAiS UJ, Informatyka Stosowana II stopień studiów 2 Eksploracja danych Co to znaczy eksploracja danych Klastrowanie (grupowanie) hierarchiczne Klastrowanie
Bardziej szczegółowoRozdział 5. Macierze. a 11 a a 1m a 21 a a 2m... a n1 a n2... a nm
Rozdział 5 Macierze Funkcję, która każdej parze liczb naturalnych (i,j) (i = 1,,n;j = 1,,m) przyporządkowuje dokładnie jedną liczbę a ij F, gdzie F = R lub F = C, nazywamy macierzą (rzeczywistą, gdy F
Bardziej szczegółowoWstęp do grupowania danych
Eksploracja zasobów internetowych Wykład 5 Wstęp do grupowania danych mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Istnieją dwie podstawowe metody klasyfikowania obiektów: metoda z nauczycielem, metoda
Bardziej szczegółowoZmienne zależne i niezależne
Analiza kanoniczna Motywacja (1) 2 Często w badaniach spotykamy problemy badawcze, w których szukamy zakresu i kierunku zależności pomiędzy zbiorami zmiennych: { X i Jak oceniać takie 1, X 2,..., X p }
Bardziej szczegółowoPrzetwarzanie i analiza danych w języku Python / Marek Gągolewski, Maciej Bartoszuk, Anna Cena. Warszawa, Spis treści
Przetwarzanie i analiza danych w języku Python / Marek Gągolewski, Maciej Bartoszuk, Anna Cena. Warszawa, 2016 Spis treści Przedmowa XI I Podstawy języka Python 1. Wprowadzenie 3 1.1. Język i środowisko
Bardziej szczegółowoAlgorytmy klasyfikacji
Algorytmy klasyfikacji Konrad Miziński Instytut Informatyki Politechnika Warszawska 6 maja 2015 1 Wnioskowanie 2 Klasyfikacja Zastosowania 3 Drzewa decyzyjne Budowa Ocena jakości Przycinanie 4 Lasy losowe
Bardziej szczegółowoSPIS TREŚCI WSTĘP... 8 1. LICZBY RZECZYWISTE 2. WYRAŻENIA ALGEBRAICZNE 3. RÓWNANIA I NIERÓWNOŚCI
SPIS TREŚCI WSTĘP.................................................................. 8 1. LICZBY RZECZYWISTE Teoria............................................................ 11 Rozgrzewka 1.....................................................
Bardziej szczegółowoCLUSTERING. Metody grupowania danych
CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means
Bardziej szczegółowo2. Reprezentacje danych wielowymiarowych sposoby sobie radzenia z nimi. a. Wprowadzenie, aspekt psychologiczny, wady statystyki
1. Wstęp 2. Reprezentacje danych wielowymiarowych sposoby sobie radzenia z nimi a. Wprowadzenie, aspekt psychologiczny, wady statystyki b. Metody graficzne i. Wykres 1.zmiennej ii. Rzut na 2 współrzędne
Bardziej szczegółowoTEORETYCZNE PODSTAWY INFORMATYKI
1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Wykład 16 2 Data Science: Uczenie maszynowe Uczenie maszynowe: co to znaczy? Metody Regresja Klasyfikacja Klastering
Bardziej szczegółowo