Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych
|
|
- Adrian Nowak
- 9 lat temu
- Przeglądów:
Transkrypt
1 Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie teoretyczne: Implementacja demonstracyjnego systemu do wyszukiwania informacji tekstowych w oparciu o tzw. reprezentację wektorową dokumentów (ang. Term-by-Document Matrix) Celem ćwiczenia jest napisanie programu, który implementuje jedną z podstawowych metod tzw. eksploracja tekstu (ang. Test Mining). Samodzielne zapoznanie się z problematyką pewnego wybranego fragmentu bardzo obszernej dziedziny nauki o nazwie eksploracja danych (ang. data exploration, data mining). Należy korzystać z podanego spisu literatury oraz źródeł internetowych. Sposób zaliczenia: Sprawozdanie w formie pisemnej. Pozytywna ocena ćwiczenia przez prowadzącego pod koniec zajęć. [X] [] 1. Uwagi wstępne Zamieszczony w kolejnym punkcie opis zadania jest podany bardzo ogólnie i bez szczegółowego rozwinięcia. Student powinien samodzielnie zapoznać się z opisywanym zagadnieniem korzystając z podanego na końcu instrukcji spisu literatury oraz zasięgając informacji u prowadzącego. 2. Skrótowy opis problemu Celem ćwiczenia jest implementacja jednego z typowych algorytmów stosowanych w eksploracji danych tekstowych. W programie należy zaimplementować tzw. reprezentację macierzową dokumentów (ang. Term-by-Document Matrix; TDM) oraz zapewnić możliwość odpytywania utworzonej (w postaci tejże macierzy) bazy danych. Chodzi tutaj o możliwość wyszukiwania dokumentów (tekstowych) w oparciu o podane przez użytkownika zapytanie (na tej zasadzie działają praktycznie wszystkie wyszukiwarki internetowe). Użytkownik konstruuje zapytanie składające się z pewnej liczby słów kluczowych a wyszukiwarka zwraca dokumenty, które najbardziej pasują do tego zapytania. Obliczany jest również pewien liczbowy wskaźnik podobieństwa, który umożliwia ustawienie (wyświetlenie) dokumentów od tych najbardziej podobnych do najmniej podobnych czyli wg. tzw. rankingu. Wskaźnik ten to tzw. miara kosinusowa, która odzwierciedla podobieństwo pomiędzy dokumentami a zapytaniem opracowali: dr inż. Artur Gramacki, dr inż. Jarosław Gramacki 1
2 wprowadzonym przez użytkownika. Reprezentuje ona kąt pomiędzy dwoma wektorami reprezentującymi dokumenty. Dla przypadku 2-wymiarowego pokazano to na poniższym rysunku (uogólnienie na przypadek wielowymiarowy jest prawie natychmiastowe). Zachodzi oczywiście znana zależność: A B= A B cos θ. (1) Dwa wektory są tym bardziej podobne do siebie, im bardziej kosinus kąta pomiędzy nimi zbliża się do 1. Analogicznie wektory stają się do siebie coraz bardziej niepodobne, gdy kosinus kąta zbliża się do 0. Program powinien umożliwiać tworzenie macierzy TDM 1 na trzy sposoby: reprezentacja boolowska (wagi słów w wektorze dokumentu powinny przyjmować tylko dwie wartości: 0 lub 1), reprezentacja ilościowa (ang. Term Frequency TF; wagi słów w wektorze dokumentu powinny być równe liczbie wystąpień słowa i w dokumencie j), reprezentacja ilościowa wg. schematu TFIDF 2 (ang. Term Frequency Inverse Document Frequency). Człon TF oznacza częstość słowa i w dokumencie j, człon IDF oznacza tzw. odwrotna częstość słów i jest wyliczany jako log 2 (N/n i ), gdzie N łączna liczba dokumentów, n i liczba dokumentów zawierających słowo i. Waga słowa i w dokumencie jest wówczas wyliczana jako iloczyn czynnika TF oraz IDF. Macierz TDM może zostać dodatkowo znormalizowana tak, aby wszystkie wektory (kolumny w macierzy) miały długość jednostkową. Normalizacja upraszcza wyznaczanie miary kosinusowej, gdyż nie trzeba wówczas obliczać długości (normy) wektorów (patrz wzór 1). Każdą element w macierzy TDM należy pomnożyć przez czynnik ( ) 1/ 2 2 l ij (2) i który skaluje poszczególne wektory. l ij oznacza element w i-tym wierszu i j-tej kolumnie. 1 Macierz ma rozmiar i x j, gdzie i oznacza całkowitą ilość słów a j całkowitą ilość dokumentów. 2 Schemat TFIDF (zamiast TF) stosujemy w celu zmniejszenia efektu przeszacowywania wag słów, które znajdują się w dużych dokumentach. Po prostu w dużych dokumentach istnieje większe prawdopodobieństwo wystąpienia danego słowa. I wówczas dokumenty te stają się bardziej podobne do wydanego zapytania, niżby to wynikało z ich rzeczywistego podobieństwa opracowali: dr inż. Artur Gramacki, dr inż. Jarosław Gramacki 2
3 Uwaga: macierz TDM jest zwykle macierzą rzadką (zdecydowana większość elementów będzie miała wartości zerowe). Dlatego też używanie macierzy TDM w czystej postaci nie jest w praktyce stosowane, ze względu na jej wielkość i małą w związku z tym efektywność komputerowego przetwarzania. Niemniej jednak do celów demonstracyjnych można ją z powodzeniem wykorzystać. 3. Przykład 3 Załóżmy, że mamy 4 dokumenty tekstowe, każdy z następującą zawartością: Dokument 1 Dokument 2 Dokument 3 Dokument 4 bazy relacyjne, bazy tekstowe, bazy inne bazy danych: przykłady, zastosowania bazy danych - zalety; bazy danych wady składowanie danych Macierz TDM z reprezentacją boolowską będzie wyglądała następująco (w nawiasach podano wartości znormalizowane): bazy 1 (0.5000) 1 (0.5000) 1 (0.5000) 0 danych 0 1 (0.5000) 1 (0.5000) 1 (0.7071) inne 1 (0.5000) przykłady 0 1 (0.5000) 0 0 relacyjne 1 (0.5000) składowanie (0.7071) tekstowe 1 (0.5000) wady (0.5000) 0 zalety (0.5000) 0 zastosowania 0 1 (0.5000) 0 0 Zwróćmy uwagę, że wszystkie znaki interpunkcyjne zostały pominięte jako nie wnoszące żadnej informacji merytorycznej. Pewne słowa, np. inne, również takiej informacji nie wnoszą 4. Powinny one zostać jakoś usunięte z finalnej macierzy TDM (w przykładzie nie zostały one usunięte). Ponadto, aby system miał bardziej praktyczne zastosowanie powinien w macierzy TDM umieszczać słowa w ich podstawowej formie, czyli np. zamiast słowa składowanie powinno być składować, zamiast bazy powinno być baza itd. Automatyczne zamiana form odmienionych na ich formy podstawowe jest jednak dość trudnym zadaniem nawet dla języka angielskiego, a tym bardziej dla języka polskiego. Ta sama macierz z reprezentacją TF będzie miała postać (w nawiasach podano wartości znormalizowane): bazy 3 (0.8660) 1 (0.5000) 2 (0.6325) 0 danych 0 1 (0.5000) 2 (0.6325) 1 (0.7071) inne 1 (0.2887) przykłady 0 1 (0.5000) 0 0 relacyjne 1 (0.2887) składowanie (0.7071) 3 Na stronie można znaleźć program dla środowiska MATLAB (tzw. toolbox), w którym można sprawdzić/przetestować wykonany program. Umożliwia on m.in. tworzenie macierzy TDM w trzech wymienionych w instrukcji wariantach (oraz jeszcze dodatkowo w kilkunastu innych), jak również kierowanie zapytań do TDM z wykorzystaniem miary kosinusowej. 4 Są to tzw. słowa wyłączone (ang. stop words). opracowali: dr inż. Artur Gramacki, dr inż. Jarosław Gramacki 3
4 tekstowe 1 (0.2887) wady (0.3162) 0 zalety (0.3162) 0 zastosowania 0 1 (0.5000) 0 0 I wreszcie ta sama macierz z reprezentacją TFIDF będzie miała postać (w nawiasach podano wartości znormalizowane): bazy (0.3382) (0.1437) (0.2711) 0 danych (0.1437) (0.2711) (0.2032) inne (0.5433) przykłady (0.6924) 0 0 relacyjne (0.5433) składowanie (0.2032) tekstowe (0.5433) wady (0.6531) 0 zalety (0.6531) 0 zastosowania (0.6924) 0 0 Wydając zapytanie do naszej macierzy TDM np. podając frazę: bazy danych otrzymujemy odpowiednio dla reprezentacji boolowskiej, TF oraz TFTDF następujące wyniki (miary kosinusowe): reprezentacja boolowska Dokument 3 wsp. podobieństwa: Dokument 2 - wsp. podobieństwa: Dokument 4 - wsp. podobieństwa: 0.5 Dokument 1 - wsp. podobieństwa: reprezentacja TF Dokument 3 - wsp. podobieństwa: Dokument 2 - wsp. podobieństwa: Dokument 1 - wsp. podobieństwa: Dokument 4 - wsp. podobieństwa: 0.5 reprezentacja TFIDF Dokument 3 - wsp. podobieństwa: Dokument 1 - wsp. podobieństwa: Dokument 2 - wsp. podobieństwa: Dokument 4 - wsp. podobieństwa: Opis zadania do wykonania W ramach ćwiczenia należy napisać program, który będzie umożliwiał: A. Tworzenie macierzy TDM na podstawie wskazanych plików tekstowych. Z pliku powinny zostać usunięte wszystkie znaki przystankowe. W wersji uproszczonej znaki przystankowe mogą zostać ręcznie usunięte przez użytkownika, jeszcze zanim pliki zostaną wprowadzone do programu. Aby zbytnio nie komplikować obróbki plików wejściowych, pomijamy problem usuwania słów wyłączonych oraz problem odmiany słów. Gdy więc przykładowo w pliku będą słowa komputer, komputerami oraz komputery, to zostaną one potraktowane jako 3 całkowicie różne słowa. Podobnie, gdy będą słowa ale, lub oraz który, to mimo że nie niosą one żadnej treści merytorycznej, zostaną potraktowane przez system jako pełnoprawne słowa. opracowali: dr inż. Artur Gramacki, dr inż. Jarosław Gramacki 4
5 B. Powinna istnieć możliwość tworzenia macierzy TDM w trzech wersjach: boolowska, TF oraz TFIDF. Każda z nich powinna mieć 2 warianty: z normalizacją wartości oraz bez normalizacji. C. Po utworzeniu macierzy TDM musi istnieć możliwość zadawania zapytań. System powinien wyświetlać wyniki (ranking dokumentów pod względem zgodności z podanym zapytaniem) w postaci podobnej do tej pokazanej w punkcie 3. Zwróć uwagę na to, że wektor zapytania musi uwzględniać to, czy macierz TDM jest znormalizowana, czy też nie. 5. Sprawozdanie Sprawozdanie powinno zawierać następujące elementy: szczegółowy opis budowy macierzy TDM (dla reprezentacji boolowskiej, TF oraz TFIDF), ręczne obliczenia przygotowane dla prostych przykładowych dokumentów, 2-3 przykłady demonstrujące różnice pomiędzy różnymi wersjami macierz TDM (boolowska, TF oraz TFIDF). Chodzi tutaj o konstruktywne wychwycenie pewnych wad/zalet wszystkich wersji macierzy TDM. ew. inne uwagi i spostrzeżenia. 6. Literatura 1. Michale W. Berty, Murray Browne, Understanding Search Engines. Mathematical Modeling and Text Retrieval, SIAM, 1999 (książka w Polsce dość trudno dostępna. Można zamówić np. w księgarni internetowej amazon.com koszt około $. Można też pożyczyć ją od prowadzących). 2. Daniel T. Larose, Odkrywanie wiedzy z danych, Wydawnictwo Naukowe PWN, (wykład Eksploracja danych, rozdziały Eksploracja tekstu I oraz Eksploracja tekstu II ) tzw. toolbox dla środowiska MATLAB implementujący tworzenie TDM. opracowali: dr inż. Artur Gramacki, dr inż. Jarosław Gramacki 5
Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych
Eksploracja zasobów internetowych Wykład 3 Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Wyszukiwanie dokumentów za pomocą słów kluczowych bazujące
Eksploracja tekstu. Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu. Eksploracja danych. Eksploracja tekstu wykład 1
Eksploracja tekstu Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu Eksploracja tekstu wykład 1 Tematem wykładu są zagadnienia związane z eksploracją tekstu. Rozpoczniemy od krótkiego wprowadzenia
Wstęp do przetwarzania języka naturalnego
Wstęp do przetwarzania języka naturalnego Wykład 9 Wektoryzacja dokumentów i podstawowe miary podobieństwa Wojciech Czarnecki 17 grudnia 2013 Section 1 Przypomnienie Bag of words model Podejście Przypomnienie
Wyszukiwanie dokumentów/informacji
Wyszukiwanie dokumentów/informacji Wyszukiwanie dokumentów (ang. document retrieval, text retrieval) polega na poszukiwaniu dokumentów tekstowych z pewnego zbioru, które pasują do zapytania. Wyszukiwanie
Wyszukiwanie tekstów
Wyszukiwanie tekstów Dziedzina zastosowań Elektroniczne encyklopedie Wyszukiwanie aktów prawnych i patentów Automatyzacja bibliotek Szukanie informacji w Internecie Elektroniczne teksy Ksiązki e-book Artykuły
Wyszukiwanie informacji w internecie. Nguyen Hung Son
Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy
AKADEMIA MORSKA W SZCZECINIE WI-ET / IIT / ZTT. Instrukcja do zajęc laboratoryjnych nr 1 AUTOMATYZACJA I ROBOTYZACJA PROCESÓW PRODUKCYJNYCH
AKADEMIA MORSKA W SZCZECINIE WI-ET / IIT / ZTT Instrukcja do zajęc laboratoryjnych nr 1 AUTOMATYZACJA I ROBOTYZACJA PROCESÓW PRODUKCYJNYCH II rok Kierunek Logistyka Temat: Zajęcia wprowadzające. BHP stanowisk
Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY.
Ćwiczenie numer 4 JESS PRZYKŁADOWY SYSTEM EKSPERTOWY. 1. Cel ćwiczenia Celem ćwiczenia jest zapoznanie się z przykładowym systemem ekspertowym napisanym w JESS. Studenci poznają strukturę systemu ekspertowego,
Zad. 3: Układ równań liniowych
1 Cel ćwiczenia Zad. 3: Układ równań liniowych Wykształcenie umiejętności modelowania kluczowych dla danego problemu pojęć. Definiowanie właściwego interfejsu klasy. Zwrócenie uwagi na dobór odpowiednich
Matematyczne Podstawy Informatyki
Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 2013/2014 Informacje podstawowe 1. Konsultacje: pokój
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Bazy danych Database Kierunek: Rodzaj przedmiotu: obieralny Rodzaj zajęć: wykład, laboratorium Matematyka Poziom kwalifikacji: I stopnia Liczba godzin/tydzień: 2W, 2L Semestr: III Liczba
Technologie informacyjne Information technologies
Załącznik nr 7 do Zarządzenia Rektora nr 10/12 z dnia 21 lutego 2012r. KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/13
Wprowadzenie do metod numerycznych Wykład 3 Metody algebry liniowej I Wektory i macierze
Wprowadzenie do metod numerycznych Wykład 3 Metody algebry liniowej I Wektory i macierze Polsko-Japońska Wyższa Szkoła Technik Komputerowych Katedra Informatyki Stosowanej Spis treści Spis treści 1 Wektory
AKADEMIA MORSKA W SZCZECINIE WI-ET / IIT / ZTT. Instrukcja do zajęc laboratoryjnych nr 6 AUTOMATYKA
AKADEMIA MORSKA W SZCZECINIE WI-ET / IIT / ZTT Instrukcja do zajęc laboratoryjnych nr 6 AUTOMATYKA II rok Kierunek Transport Temat: Transmitancja operatorowa. Badanie odpowiedzi układów automatyki. Opracował
Pobieranie i przetwarzanie treści stron WWW
Eksploracja zasobów internetowych Wykład 2 Pobieranie i przetwarzanie treści stron WWW mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Jedną z funkcji silników wyszukiwania danych, a właściwie ich modułów
Politechnika Świętokrzyska. Laboratorium. Cyfrowe przetwarzanie sygnałów. Ćwiczenie 6. Transformata cosinusowa. Krótkookresowa transformata Fouriera.
Politechnika Świętokrzyska Laboratorium Cyfrowe przetwarzanie sygnałów Ćwiczenie 6 Transformata cosinusowa. Krótkookresowa transformata Fouriera. Cel ćwiczenia Celem ćwiczenia jest zapoznanie studentów
Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38
Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem zajęcia 1 dr Jakub Boratyński pok. A38 Program zajęć Bazy danych jako podstawowy element systemów informatycznych wykorzystywanych
Multi-wyszukiwarki. Mediacyjne Systemy Zapytań wprowadzenie. Architektury i technologie integracji danych Systemy Mediacyjne
Architektury i technologie integracji danych Systemy Mediacyjne Multi-wyszukiwarki Wprowadzenie do Mediacyjnych Systemów Zapytań (MQS) Architektura MQS Cechy funkcjonalne MQS Cechy implementacyjne MQS
Podstawy informatyki. Elektrotechnika I rok. Język C++ Operacje na danych - wskaźniki Instrukcja do ćwiczenia
Podstawy informatyki Elektrotechnika I rok Język C++ Operacje na danych - wskaźniki Instrukcja do ćwiczenia Katedra Energoelektroniki i Automatyki Systemów Przetwarzania Energii AGH Kraków 2017 Tematyka
E-1EZ s1. Technologie informacyjne. Elektrotechnika I stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny)
KARTA MODUŁU / KARTA PRZEDMIOTU. Kod modułu E-1EZ1-1001-s1 Nazwa modułu Technologie informacyjne Nazwa modułu w języku angielskim Information technologies Obowiązuje od roku akademickiego 2012/13 (aktualizacja
Wykład 14. Elementy algebry macierzy
Wykład 14 Elementy algebry macierzy dr Mariusz Grządziel 26 stycznia 2009 Układ równań z dwoma niewiadomymi Rozważmy układ równań z dwoma niewiadomymi: a 11 x + a 12 y = h 1 a 21 x + a 22 y = h 2 a 11,
KARTA PRZEDMIOTU. WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY, UMIEJĘTNOŚCI I INNYCH KOMPETENCJI Ogólne umiejętności posługiwania się komputerem
WYDZIAŁ INFORMATYKI I ZARZĄDZANIA Zał. nr 4 do ZW 33/01 KARTA PRZEDMIOTU Nazwa w języku polskim: Nazwa w języku angielskim: Kierunek studiów (jeśli dotyczy): Specjalność (jeśli dotyczy): Stopień studiów
5. Rozwiązywanie układów równań liniowych
5. Rozwiązywanie układów równań liniowych Wprowadzenie (5.1) Układ n równań z n niewiadomymi: a 11 +a 12 x 2 +...+a 1n x n =a 10, a 21 +a 22 x 2 +...+a 2n x n =a 20,..., a n1 +a n2 x 2 +...+a nn x n =a
Zad. 5: Układ równań liniowych liczb zespolonych
Zad. 5: Układ równań liniowych liczb zespolonych 1 Cel ćwiczenia Wykształcenie zdolności abstrahowania operacji arytmetycznych od konkretnych typów. Unaocznienie problemów związanych z programowaniem uogólnionym
Ćwiczenie 1. Wprowadzenie do programu Octave
Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L Ćwiczenie 1. Wprowadzenie do programu Octave Mimo że program Octave został stworzony do
Macierze. Rozdział Działania na macierzach
Rozdział 5 Macierze Funkcję, która każdej parze liczb naturalnych (i, j) (i 1,..., n; j 1,..., m) przyporządkowuje dokładnie jedną liczbę a ij F, gdzie F R lub F C, nazywamy macierzą (rzeczywistą, gdy
Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 1 Wprowadzenie do narzędzia CASE. Materiały dla nauczyciela
Zakład Elektrotechniki Teoretycznej i Informatyki Stosowanej Wydział Elektryczny, Politechnika Warszawska Laboratorium modelowania oprogramowania w języku UML Ćwiczenie 1 Wprowadzenie do narzędzia CASE
Zaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene
2..22 Zaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene Dominika Puzio Indeks Podstawy: dokument Dokument: jednostka danych, pojedynczy element na liście wyników wyszukiwania,
Grupa kursów: Wykład Ćwiczenia Laboratorium Projekt Seminarium 15 30
Zał. nr 4 do ZW 33/01 WYDZIAŁ INFORMATYKI I ZĄRZADZANIA KARTA PRZEDMIOTU Nazwa w języku polskim: Wprowadzenie do SQL Nazwa w języku angielskim: Introduction to SQL Kierunek studiów (jeśli dotyczy): Zarządzanie
Systemy uczące się wykład 1
Systemy uczące się wykład 1 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 5 X 2018 e-mail: przemyslaw.juszczuk@ue.katowice.pl Konsultacje: na stronie katedry + na stronie domowej
Bazy dokumentów tekstowych
Bazy dokumentów tekstowych Bazy dokumentów tekstowych Dziedzina zastosowań Automatyzacja bibliotek Elektroniczne encyklopedie Bazy aktów prawnych i patentów Szukanie informacji w Internecie Dokumenty tekstowe
Procesy i systemy dynamiczne Nazwa przedmiotu SYLABUS A. Informacje ogólne
Elementy składowe sylabusu Nazwa jednostki prowadzącej kierunek Nazwa kierunku studiów Poziom kształcenia Profil studiów Forma studiów Kod przedmiotu Język przedmiotu Procesy i systemy dynamiczne Nazwa
PODSTAWY AUTOMATYKI. MATLAB - komputerowe środowisko obliczeń naukowoinżynierskich - podstawowe operacje na liczbach i macierzach.
WYDZIAŁ ELEKTROTECHNIKI I AUTOMATYKI Katedra Inżynierii Systemów Sterowania PODSTAWY AUTOMATYKI MATLAB - komputerowe środowisko obliczeń naukowoinżynierskich - podstawowe operacje na liczbach i macierzach.
Semantyczne podobieństwo stron internetowych
Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana
Politechnika Poznańska Wydział Budowy Maszyn i Zarządzania
1) Cel ćwiczenia Celem ćwiczenia jest zapoznanie się z podstawowymi elementami obiektowymi systemu Windows wykorzystując Visual Studio 2008 takimi jak: przyciski, pola tekstowe, okna pobierania danych
PRZESTRZENNE BAZY DANYCH WYKŁAD 2
PRZESTRZENNE BAZY DANYCH WYKŁAD 2 Baza danych to zbiór plików, które fizycznie przechowują dane oraz system, który nimi zarządza (DBMS, ang. Database Management System). Zadaniem DBMS jest prawidłowe przechowywanie
Zał nr 4 do ZW. Dla grupy kursów zaznaczyć kurs końcowy. Liczba punktów ECTS charakterze praktycznym (P)
Zał nr 4 do ZW WYDZIAŁ PODSTAWOWYCH PROBLEMÓW TECHNIKI KARTA PRZEDMIOTU Nazwa w języku polskim : Algebra numeryczna Nazwa w języku angielskim : Numerical algebra Kierunek studiów : Informatyka Specjalność
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
Co wylicza Jasnopis? Bartosz Broda
Co wylicza Jasnopis? Bartosz Broda Analiza języka polskiego Ekstrakcja tekstu Dokument narzędzie do mierzenia zrozumiałości Analiza morfologiczna Analiza morfosyntaktyczna Indeksy Klasa trudności:
BAZY DANYCH LABORATORIUM. Studia niestacjonarne I stopnia
BAZY DANYCH LABORATORIUM Studia niestacjonarne I stopnia Gdańsk, 2011 1. Cel zajęć Celem zajęć laboratoryjnych jest wyrobienie praktycznej umiejętności tworzenia modelu logicznego danych a nastepnie implementacji
Systemy Wspomagania Decyzji
Rodzaje danych oraz ich przetwarzanie Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności January 29, 2014 1 Dane tabelaryczne 2 Dane tekstowe 3 Dane sensoryczne 4 Dane multimedialne 5 Podsumowanie
Zadanie 2: Arytmetyka symboli
1 Cel ćwiczenia Zadanie 2: Arytmetyka symboli Wykształcenie umiejętności abstrahowania operacji arytmetycznych. Zapoznanie się i przećwiczenie mechanizmu tworzenia przeciążeń funkcji operatorowych. Utrwalenie
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: Kierunek: Mechatronika Rodzaj przedmiotu: obowiązkowy w ramach treści kierunkowych Rodzaj zajęć: wykład, laboratorium BAZY DANYCH I SYSTEMY EKSPERTOWE Database and expert systems Forma
dr Mariusz Grządziel 15,29 kwietnia 2014 Przestrzeń R k R k = R R... R k razy Elementy R k wektory;
Wykłady 8 i 9 Pojęcia przestrzeni wektorowej i macierzy Układy równań liniowych Elementy algebry macierzy dodawanie, odejmowanie, mnożenie macierzy; macierz odwrotna dr Mariusz Grządziel 15,29 kwietnia
ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia
ZP/ITS/11/2012 Załącznik nr 1a do SIWZ ZMODYFIKOWANY Szczegółowy opis przedmiotu zamówienia Przedmiotem zamówienia jest: Przygotowanie zajęć dydaktycznych w postaci kursów e-learningowych przeznaczonych
KARTA PRZEDMIOTU. Hurtownie i eksploracja danych D1_5
KARTA PRZEDMIOTU 1. Informacje ogólne Nazwa przedmiotu i kod (wg planu studiów): Nazwa przedmiotu (j. ang.): Kierunek studiów: Specjalność/specjalizacja: Poziom kształcenia: Profil kształcenia: Forma studiów:
METODY KOMPUTEROWE W OBLICZENIACH INŻYNIERSKICH
METODY KOMPUTEROWE W OBLICZENIACH INŻYNIERSKICH ĆWICZENIE NR 9 WYRAŻENIA LOGICZNE, INSTRUKCJE WARUNKOWE I INSTRUKCJE ITERACYJNE W PROGRAMIE KOMPUTEROWYM MATLAB Dr inż. Sergiusz Sienkowski ĆWICZENIE NR
Wykład 4. Informatyka Stosowana. Magdalena Alama-Bućko. 25 marca Magdalena Alama-Bućko Wykład 4 25 marca / 25
Wykład 4 Informatyka Stosowana Magdalena Alama-Bućko 25 marca 2019 Magdalena Alama-Bućko Wykład 4 25 marca 2019 1 / 25 Macierze Magdalena Alama-Bućko Wykład 4 25 marca 2019 2 / 25 Macierza wymiaru m n
I. KARTA PRZEDMIOTU CEL PRZEDMIOTU
I. KARTA PRZEDMIOTU 1. Nazwa przedmiotu: ROBOTYKA1 2. Kod przedmiotu: Ro1 3. Jednostka prowadząca: Wydział Mechaniczno-Elektryczny 4. Kierunek: Automatyka i Robotyka 5. Specjalność: Elektroautomatyka Okrętowa
Specjalnościowy Obowiązkowy Polski Semestr VI
KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angieskim Obowiązuje od roku akademickiego 0/06 Z-ID-608a Anaiza danych niestrukturanych Unstructured Data Anaysis A. USYTUOWANIE
Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania
Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania Teoria sterowania MATLAB funkcje zewnętrzne (m-pliki, funkcje) Materiały pomocnicze do ćwiczeń laboratoryjnych
LABORATORIUM 3 ALGORYTMY OBLICZENIOWE W ELEKTRONICE I TELEKOMUNIKACJI. Wprowadzenie do środowiska Matlab
LABORATORIUM 3 ALGORYTMY OBLICZENIOWE W ELEKTRONICE I TELEKOMUNIKACJI Wprowadzenie do środowiska Matlab 1. Podstawowe informacje Przedstawione poniżej informacje maja wprowadzić i zapoznać ze środowiskiem
Metody systemowe i decyzyjne w informatyce
Metody systemowe i decyzyjne w informatyce Laboratorium JAVA Zadanie nr 2 Rozpoznawanie liter autorzy: A. Gonczarek, J.M. Tomczak Cel zadania Celem zadania jest zapoznanie się z problemem klasyfikacji
Rok akademicki: 2013/2014 Kod: STC s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: -
Nazwa modułu: Technologie informacyjne Rok akademicki: 2013/2014 Kod: STC-1-205-s Punkty ECTS: 3 Wydział: Energetyki i Paliw Kierunek: Technologia Chemiczna Specjalność: - Poziom studiów: Studia I stopnia
Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego
Arytmetyka cyfrowa Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego (binarnego). Zapis binarny - to system liczenia
LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS
UNIWERSYTET ZIELONOGÓRSKI INSTYTUT INFORMATYKI I ELEKTROTECHNIKI ZAKŁAD INŻYNIERII KOMPUTEROWEJ Przygotowali: mgr inż. Arkadiusz Bukowiec mgr inż. Remigiusz Wiśniewski LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS
Treści programowe. Matematyka. Efekty kształcenia. Literatura. Terminy wykładów i ćwiczeń. Warunki zaliczenia. tnij.org/ktrabka
Treści programowe Matematyka Katarzyna Trąbka-Więcław Elementy algebry liniowej. Macierze i wyznaczniki. Ciągi liczbowe, granica ciągu i granica funkcji, rachunek granic, wyrażenia nieoznaczone, ciągłość
Metodyki i techniki programowania
Metodyki i techniki programowania dr inż. Maciej Kusy Katedra Podstaw Elektroniki Wydział Elektrotechniki i Informatyki Politechnika Rzeszowska Elektronika i Telekomunikacja, sem. 2 Plan wykładu Sprawy
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury
Rozdział 5. Macierze. a 11 a a 1m a 21 a a 2m... a n1 a n2... a nm
Rozdział 5 Macierze Funkcję, która każdej parze liczb naturalnych (i,j) (i = 1,,n;j = 1,,m) przyporządkowuje dokładnie jedną liczbę a ij F, gdzie F = R lub F = C, nazywamy macierzą (rzeczywistą, gdy F
Podstawy MATLABA, cd.
Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Przetwarzanie Sygnałów Studia Podyplomowe, Automatyka i Robotyka Podstawy MATLABA, cd. 1. Wielomiany 1.1. Definiowanie
Działania na przekształceniach liniowych i macierzach
Działania na przekształceniach liniowych i macierzach Mirosław Sobolewski Wydział Matematyki, Informatyki i Mechaniki UW 5 wykład z algebry liniowej Warszawa, listopad 2013 Mirosław Sobolewski (UW) Warszawa,
Baza danych. Modele danych
Rola baz danych Systemy informatyczne stosowane w obsłudze działalności gospodarczej pełnią funkcję polegającą na gromadzeniu i przetwarzaniu danych. Typowe operacje wykonywane na danych w systemach ewidencyjno-sprawozdawczych
Rok akademicki: 2014/2015 Kod: CCB s Punkty ECTS: 3. Poziom studiów: Studia I stopnia Forma i tryb studiów: -
Nazwa modułu: Technologie informacyjne Rok akademicki: 2014/2015 Kod: CCB-1-104-s Punkty ECTS: 3 Wydział: Inżynierii Materiałowej i Ceramiki Kierunek: Chemia Budowlana Specjalność: - Poziom studiów: Studia
W poszukiwaniu sensu w świecie widzialnym
W poszukiwaniu sensu w świecie widzialnym Andrzej Śluzek Nanyang Technological University Singapore Uniwersytet Mikołaja Kopernika Toruń AGH, Kraków, 28 maja 2010 1 Podziękowania Przedstawione wyniki powstały
Wykład Ćwiczenia Laboratorium Projekt Seminarium Liczba godzin zajęć zorganizowanych w Uczelni ,5 1
Zał. nr 4 do ZW WYDZIAŁ ***** KARTA PRZEDMIOTU Nazwa w języku polskim ALGEBRA Z GEOMETRIĄ ANALITYCZNĄ B Nazwa w języku angielskim Algebra and Analytic Geometry B Kierunek studiów (jeśli dotyczy): Specjalność
Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja I
Zespół TI Instytut Informatyki Uniwersytet Wrocławski ti@ii.uni.wroc.pl http://www.wsip.com.pl/serwisy/ti/ Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja I Rozkład zgodny
SYLABUS DOTYCZY CYKLU KSZTAŁCENIA Bieżący sylabus w semestrze zimowym roku 2016/17
Załącznik nr 4 do Uchwały Senatu nr 430/01/2015 SYLABUS DOTYCZY CYKLU KSZTAŁCENIA 2016-2018 Bieżący sylabus w semestrze zimowym roku 2016/17 1.1. PODSTAWOWE INFORMACJE O PRZEDMIOCIE/MODULE Nazwa przedmiotu/
Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja II
Zespół TI Instytut Informatyki Uniwersytet Wrocławski ti@ii.uni.wroc.pl http://www.wsip.com.pl/serwisy/ti/ Rozkład materiału do nauczania informatyki w liceum ogólnokształcącym Wersja II Rozkład wymagający
I. KARTA PRZEDMIOTU CEL PRZEDMIOTU
I. KARTA PRZEDMIOTU 1. Nazwa przedmiotu: TECHNOLOGIA INFORMACYJNA 2. Kod przedmiotu: Ot 3. Jednostka prowadząca: Wydział Mechaniczno-Elektryczny 4. Kierunek: Automatyka i Robotyka 5. Specjalność: Elektroautomatyka
Egzamin / zaliczenie na ocenę* 0,5 0,5
Zał. nr 4 do ZW 33/01 WYDZIAŁ INFORMATYKI I ZARZĄDZANIA KARTA PRZEDMIOTU Nazwa w języku polskim: Technologia przetwarzania danych Nazwa w języku angielskim: Data processing technology Kierunek studiów
Politechnika Krakowska im. Tadeusza Kościuszki. Karta przedmiotu. obowiązuje studentów rozpoczynających studia w roku akademickim 2013/2014
Politechnika Krakowska im. Tadeusza Kościuszki Karta przedmiotu Wydział Mechaniczny obowiązuje studentów rozpoczynających studia w roku akademickim 2013/2014 Kierunek studiów: Informatyka Stosowana Forma
Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9
Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9 Uruchamianie edytora OpenOffice.ux.pl Writer 9 Dostosowywanie środowiska pracy 11 Menu Widok 14 Ustawienia dokumentu 16 Rozdział 2. OpenOffice
Ćwiczenie 1. Wprowadzenie do programu Octave
Politechnika Wrocławska Wydział Elektroniki Mikrosystemów i Fotoniki Przetwarzanie sygnałów laboratorium ETD5067L Ćwiczenie 1. Wprowadzenie do programu Octave Mimo że program Octave został stworzony do
Cel przedmiotu. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji 1 Język angielski 2 Inżynieria oprogramowania
Przedmiot: Bazy danych Rok: III Semestr: V Rodzaj zajęć i liczba godzin: Studia stacjonarne Studia niestacjonarne Wykład 30 21 Ćwiczenia Laboratorium 30 21 Projekt Liczba punktów ECTS: 4 C1 C2 C3 Cel przedmiotu
1 Macierze i wyznaczniki
1 Macierze i wyznaczniki 11 Definicje, twierdzenia, wzory 1 Macierzą rzeczywistą (zespoloną) wymiaru m n, gdzie m N oraz n N, nazywamy prostokątną tablicę złożoną z mn liczb rzeczywistych (zespolonych)
Metody numeryczne Wykład 4
Metody numeryczne Wykład 4 Dr inż. Michał Łanczont Instytut Elektrotechniki i Elektrotechnologii E419, tel. 4293, m.lanczont@pollub.pl, http://m.lanczont.pollub.pl Zakres wykładu Metody skończone rozwiązywania
Urządzenia Techniki. Klasa I TI. System dwójkowy (binarny) -> BIN. Przykład zamiany liczby dziesiętnej na binarną (DEC -> BIN):
1. SYSTEMY LICZBOWE UŻYWANE W TECHNICE KOMPUTEROWEJ System liczenia - sposób tworzenia liczb ze znaków cyfrowych oraz zbiór reguł umożliwiających wykonywanie operacji arytmetycznych na liczbach. Do zapisu
KARTA PRZEDMIOTU. Programowanie aplikacji internetowych
KARTA PRZEDMIOTU Nazwa przedmiotu/modułu: Nazwa angielska: Kierunek studiów: Poziom studiów: Profil studiów Jednostka prowadząca: Programowanie aplikacji internetowych Web application development edukacja
INSTRUKCJA DO ĆWICZENIA NR 1
L01 ---2014/10/17 ---10:52---page1---#1 KATEDRA MECHANIKI STOSOWANEJ Wydział Mechaniczny POLITECHNIKA LUBELSKA INSTRUKCJA DO ĆWICZENIA NR 1 PRZEDMIOT TEMAT Wybrane zagadnienia z optymalizacji elementów
Sztuczna inteligencja : Zbiory rozmyte cz. 2
Sztuczna inteligencja : Zbiory rozmyte cz. 2 Przemysław Juszczuk Instytut Informatyki Uniwersytetu Śląskiego 1 marca 2012 Funkcja trójkątna: Funkcja trójkątna: Funkcja przynależności γ (gamma): Rysunek:
Sylabus do programu kształcenia obowiązującego od roku akademickiego 2014/15
Sylabus do programu kształcenia obowiązującego od roku akademickiego 204/5 Nazwa Bazy danych Nazwa jednostki prowadzącej przedmiot Wydział Matematyczno - Przyrodniczy Kod Studia Kierunek studiów Poziom
Algebra WYKŁAD 3 ALGEBRA 1
Algebra WYKŁAD 3 ALGEBRA 1 Liczby zespolone Postać wykładnicza liczby zespolonej Niech e oznacza stałą Eulera Definicja Równość e i cos isin nazywamy wzorem Eulera. ALGEBRA 2 Liczby zespolone Każdą liczbę
Macierze - obliczanie wyznacznika macierzy z użyciem permutacji
Macierze - obliczanie wyznacznika macierzy z użyciem permutacji I LO im. F. Ceynowy w Świeciu Radosław Rudnicki joix@mat.uni.torun.pl 17.03.2009 r. Typeset by FoilTEX Streszczenie Celem wykładu jest wprowadzenie
Z-EKO-085 Algebra liniowa Linear Algebra. Ekonomia I stopień (I stopień / II stopień) Ogólnoakademicki (ogólno akademicki / praktyczny)
KARTA MODUŁU / KARTA PRZEDMIOTU Z-EKO-085 Algebra liniowa Linear Algebra Kod modułu Nazwa modułu Nazwa modułu w języku angielskim Obowiązuje od roku akademickiego 2012/2013 A. USYTUOWANIE MODUŁU W SYSTEMIE
Algorytmy sztucznej inteligencji
Algorytmy sztucznej inteligencji Dynamiczne sieci neuronowe 1 Zapis macierzowy sieci neuronowych Poniżej omówione zostaną części składowe sieci neuronowych i metoda ich zapisu za pomocą macierzy. Obliczenia
Sztuczna inteligencja: zbiory rozmyte
Instytut Informatyki Uniwersytetu Śląskiego lab 1 1 Klasyczna teoria zbiorów 2 Teoria zbiorów rozmytych 3 Zmienne lingwistyczne i funkcje przynależności 4 System rozmyty 5 Preprocesing danych Każdy element
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu: ALGEBRA LINIOWA I GEOMETRIA ANALITYCZNA Kierunek: Mechatronika Linear algebra and analytical geometry Kod przedmiotu: A01 Rodzaj przedmiotu: obowiązkowy dla wszystkich specjalności Poziom
ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza
ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ Joanna Bryndza Wprowadzenie Jednym z kluczowych problemów w szacowaniu poziomu ryzyka przedsięwzięcia informatycznego
Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa. Diagnostyka i niezawodność robotów
Instytut Politechniczny Państwowa Wyższa Szkoła Zawodowa Diagnostyka i niezawodność robotów Laboratorium nr 3 Generacja realizacji zmiennych losowych Prowadzący: mgr inż. Marcel Luzar Cele ćwiczenia: Generowanie
Wykład z Technologii Informacyjnych. Piotr Mika
Wykład z Technologii Informacyjnych Piotr Mika Uniwersalna forma graficznego zapisu algorytmów Schemat blokowy zbiór bloków, powiązanych ze sobą liniami zorientowanymi. Jest to rodzaj grafu, którego węzły
Optymalizacja systemów
Optymalizacja systemów Laboratorium Zadanie nr 3 Sudoku autor: A. Gonczarek Cel zadania Celem zadania jest napisanie programu rozwiązującego Sudoku, formułując problem optymalizacji jako zadanie programowania
KARTA PRZEDMIOTU. 1. Informacje ogólne. 2. Ogólna charakterystyka przedmiotu. Metody drążenia danych D1.3
KARTA PRZEDMIOTU 1. Informacje ogólne Nazwa przedmiotu i kod (wg planu studiów): Nazwa przedmiotu (j. ang.): Kierunek studiów: Specjalność/specjalizacja: Poziom kształcenia: Profil kształcenia: Forma studiów:
METODY INŻYNIERII WIEDZY ASOCJACYJNA REPREZENTACJA POWIĄZANYCH TABEL I WNIOSKOWANIE IGOR CZAJKOWSKI
METODY INŻYNIERII WIEDZY ASOCJACYJNA REPREZENTACJA POWIĄZANYCH TABEL I WNIOSKOWANIE IGOR CZAJKOWSKI CELE PROJEKTU Transformacja dowolnej bazy danych w min. 3 postaci normalnej do postaci Asocjacyjnej Grafowej
Uniwersytet w Białymstoku Wydział Ekonomiczno-Informatyczny w Wilnie SYLLABUS na rok akademicki 2010/2011 http://www.wilno.uwb.edu.
SYLLABUS na rok akademicki 010/011 Tryb studiów Studia stacjonarne Kierunek studiów Informatyka Poziom studiów Pierwszego stopnia Rok studiów/ semestr 1(rok)/1(sem) Specjalność Bez specjalności Kod katedry/zakładu
14. Przedmiot: N/PM2012/11/14/I1 INFORMATYKA moduł 1 Semestr. Liczba tygodni Liczba godzin w tygodniu Liczba godzin w semestrze ECTS
14. Przedmiot: N/PM2012/11/14/I1 INFORMATYKA moduł 1 Semestr Liczba tygodni Liczba godzin w tygodniu Liczba godzin w semestrze w semestrze A C L A C L ECTS I 15 2 30 2 II 15 2 30 1 I. Cele kształcenia
3. Macierze i Układy Równań Liniowych
3. Macierze i Układy Równań Liniowych Rozważamy równanie macierzowe z końcówki ostatniego wykładu ( ) 3 1 X = 4 1 ( ) 2 5 Podstawiając X = ( ) x y i wymnażając, otrzymujemy układ 2 równań liniowych 3x
TEORETYCZNE PODSTAWY INFORMATYKI
1 TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień Wykład 16 2 Data Science: Uczenie maszynowe Uczenie maszynowe: co to znaczy? Metody Regresja Klasyfikacja Klastering
Wielowymiarowy model danych
Plan wykładu Wielowymiarowy model danych 1. Model danych 2. Analiza wielowymiarowa 3. Model wielowymiarowy: koncepcja wymiarów i faktów 4. Operacje modelu wielowymiarowego 5. Implementacje modelu wielowymiarowego:
Techniki uczenia maszynowego nazwa przedmiotu SYLABUS
Techniki uczenia maszynowego nazwa SYLABUS Obowiązuje od cyklu kształcenia: 2014/20 Część A. Informacje ogólne Elementy składowe sylabusu Nazwa jednostki prowadzącej studiów Poziom kształcenia Profil studiów