Automatyczna identyfikacja słów i fraz kluczowych algorytm RAKE

Wielkość: px
Rozpocząć pokaz od strony:

Download "Automatyczna identyfikacja słów i fraz kluczowych algorytm RAKE"

Transkrypt

1 GŁADYSZ Anna 1 Automatyczna identyfikacja słów i fraz kluczowych algorytm RAKE WSTĘP Zagadnienie automatycznej identyfikacji słów i fraz kluczowych należy do grupy najistotniejszych problemów rozpatrywanych na gruncie eksploracyjnej analizy tekstów. Wypracowane w tym zakresie metody podzielić można na grupy, wśród których na szczególną uwagę zasługują metody: bazujące na macierzy częstości [3, 10], korzystające z dekompozycji macierzy częstości według wartości osobliwych [2], oparte na modelowaniu tematów [7], wykorzystujące wyniki klasyfikacji bezwzorcowej lub wzorcowej oraz oparte na teorii grafów [4].Do tej ostatniej grupy należy miedzy innymi algorytm RAKE (RapidAutomticKeywordExractionalgorithm) zaproponowany w [1, 9]. Celem algorytmu RAKE jest opracowanie skutecznej metody ekstrakcji słów lub fraz kluczowych, która działałaby na tekstach niezależnie od ich zakresu tematycznego oraz gramatyki języka, w którym zostały przygotowane. Do podstawowych cech algorytmu RAKE należy zaliczyć: zdolność do identyfikacji fraz, możliwość funkcjonowania na tekstach przygotowanych w dowolnych językach, niezależność od dziedziny zastosowań, brak konieczności korzystania z wiedzy zewnętrznej (jedynym elementem wymaganym poza analizowanym tekstem jest stop-lista), stosunkowo niewielka złożoność obliczeniowa. W artykule poddane zostało analizie działanie algorytmu RAKE. Przeprowadzona została także własna empiryczna analiza wybranych zbiorów dokumentów polskojęzycznych z wykorzystaniem algorytmu RAKE. Celem badania doświadczalnego było określenie skuteczności działania badanego algorytmu dla tekstów polskojęzycznych. 1 ANALIZA DZIAŁANIA ALGORYTMU RAKE Algorytm RAKE opiera się na spostrzeżeniu, że ręcznie określane frazy kluczowe często złożone są z wielu słów, ale zwykle pomijane są w nich słowa pełniące w większym stopniu funkcje gramatyczne niż leksykalne (np. się w języku polskim lub of w języku angielskim). Zbiór słów pomijanych we frazach kluczowych zwykle w dużym stopniu pokrywa się ze zbiorem tworzącym stop-listę [6]. Takie rozumowanie opiera się na założeniu, że są to słowa zbyt często i szeroko wykorzystywane przez użytkowników jako pomocnicze do analizy lub w zadaniach wyszukiwania. Słowa które niosą sens w dokumencie są opisane jako mające zawartość informacyjną i często określane są jako słowa treści. Potwierdzeniem tego jest rysunek 1, gdzie przeglądając ręcznie przypisane słowa kluczowe streszczenia można wyłonić tylko jedno słowo występujące na stop liście języka angielskiego (jest to słowo of). 1 Politechnika Rzeszowska im. Ignacego Łukasiewicza, Wydział Zarządzania; Rzeszów; al. Powstańców Warszawy 12. Tel: , anna.gladysz@prz.edu.pl 3930

2 Rys. 1.Przykład streszczenia artykułu z ręcznie określonymi słowami kluczowymi [1]. Frazy kluczowe, które określamy jako sekwencję jednego lub wielu słów zapewniają kompaktową reprezentacje treści dokumentu. Słowa i frazy kluczowe winny stanowić w skondensowanej formie zasadniczą treść dokumentu. Są one szeroko stosowane do definiowania zapytań w ramach systemów wyszukiwania informacji (Information Retrieval), ponieważ są łatwe do zdefiniowania, zmiany, zapamiętania i udostępniania [4]. Parametry wejściowe dla algorytmu RAKE zawierają stop listę, zestaw separatorów fraz, oraz zestaw ograniczników słów. RAKE używa stop listy i ograniczników fraz do partycjonowania tekstu dokumentu na kandydujące frazy kluczowe, które są spójną sekwencją słów treści występujących w tekście. 1.1 Kandydujące słowa kluczowe Algorytm RAKE rozpoczyna ekstrakcję słów i fraz kluczowych z dokumentu poprzez utworzenie zestawu kandydujących słów kluczowych. W pierwszym kroku tekst dokumentu zostaje podzielony na: wyrazy podział następuje w miejscu pojawienia się seperatora wyrazów, frazy będące sekwencją wyrazów ograniczaną na początku i końcu przez ograniczniki fraz. Utworzona lista fraz zawiera frazy kandydujące, które mogą stać się frazami kluczowymi. Rys. 2.Przeanalizowane kandydujące słowa kluczowe z przykładowego streszczenia [1]. Rysunek2 wskazuje kandydujące frazy kluczowe w kolejności, w której są przetwarzane z przykładowego streszczenia zobrazowanego na rysunku1. Na przykład fraza lineardiophantineequation (liniowe równanie diofantyczne) jako kandydująca fraza kluczowa zaczyna się po słowie ze stop listy (of), zaś kończy się przecinkiem. Po separatorze znajduje się następne słowo, które zaczyna kolejną kandydującą frazę kluczową przykładowego streszczenia. 1.2 Ocena słów kluczowych W kolejnym kroku analizowany jest zbiór wszystkich słów wyróżnionych w tekście. Dla każdej pary słów wyznacza się miernik określający liczbę fraz, w których te dwa słowa łącznie się pojawiły. Każde zidentyfikowane łączne pojawienie się słów w tej samej frazie zapamiętywane jest jako waga związana z krawędzią grafu, w którym wierzchołkami są poszczególne słowa. Graf ten pokazany jest w postaci macierzy sąsiedztwa na rysunku 3. Elementy występujące na głównej przekątnej macierzy wskazują na liczbę wystąpień danego słowa. 3931

3 Rys. 3.Graf współwystępowania słów do zawartości słów przykładowego streszczenia [1]. Następnie słowa oceniane są za pomocą miar wyznaczanych na podstawie macierzy sąsiedztwa. Autorzy algorytmu proponują następujące miary służące do oceny słów: częstotliwość słowa (freq (w)), stopień słowa (deg (w)), iloraz stopnia do częstotliwości (deg (w) / freq (w)). Wyniki metod pomiaru punktów obliczeniowych dla przykładowego tekstu streszczenia przedstawia rysunek 4. Rys. 4.Wyniki obliczeń dla poszczególnych słów występujących w grafie współwystępowania [1]. Podsumowując, pomiary wykorzystujące stopień słowa - deg(w) faworyzują słowa, które występują częściej. Słowa, które często występują niezależnie od liczby słów z którym współwystępują są preferowane przez pomiar częstotliwości słowa - freq(w). Słowa, które przeważnie występują z dłuższymi kandydującymi słowami kluczowymi są preferowane przez wskaźnik ilorazu stopnia do częstości - deg(w)/freq(w). Następnie obliczana jest liczba punktów dla fraz kluczowych. Jest ona obliczana jako suma miar wyznaczonych dla pojedynczych słów składających się na kandydującą frazę kluczową. 3932

4 1.3 Sąsiadujące słowa kluczowe Jedną z przyczyn, dla których algorytm RAKE wzbudził duże zainteresowanie jest jego zdolność do identyfikacji fraz kluczowych, w których występują słowa zawarte na stop liście, np. axis of evil (oś zła). W celu wykrycia fraz zawierających element pochodzący ze stop listy algorytm RAKE sprawdza, czy w dokumencie pojawia się przynajmniej dwukrotnie identyczna sekwencja złożona z dwóch fraz oddzielona jednym słowem pochodzącym ze stop listy. Jeśli odpowiedź na sformułowane pytanie jest pozytywna, to sekwencja ta staje się kandydującą frazą kluczową. Jej ocena jest równa sumie ocen łączonych fraz. Należy zauważyć, że dzięki słowom ze stop listy niektóre z tych połączonych słów kluczowych nabierają całkiem innego znaczenia niż poszczególne słowa składające się na kandydujące słowo kluczowe. Ponieważ sąsiadujące frazy kluczowe muszą wystąpić dwa razy w tej samej kolejności w dokumencie, ich ekstrakcja jest bardziej powszechna dla tekstów, które są dłuższe. 1.4 Uzyskane słowa kluczowe Ostatnim etapem analizy jest uszeregowanie kandydujących fraz kluczowych zgodnie z wartościami wyznaczonych dla nich mierników. Najlepiej ocenionych T fraz kandydujących jest wybrane jako frazy kluczowe dokumentu. T stanowi jedną trzecią liczby słów na grafie współwystępowania [5]. Przykładowy tekst zawiera w treści 28 słów, stąd T = 9 słów kluczowych. Rysunek 5 przedstawia listę słów kluczowych wyodrębnionych przez algorytm RAKE w porównaniu z wyznaczonymi ręcznie słowami kluczowymi dla przykładowego teksu. Rys. 5.Porównanie słów kluczowych uzyskanych algorytmem RAKE z ręcznie przypisanymi [1]. Z dziewięciu wyodrębnionych słów kluczowych, sześć pokrywa się, co oznacza, że dokładnie sześć z ręcznie wyznaczonych słów kluczowych odpowiada słowom wyznaczonym przez algorytm RAKE. Słowo kluczowe naturalnumbers jest podobne do słowa kluczowego set of naturalnumbers, jednak do celów omówienia uzyskanych wyników zostaną one pominięte. Analizując uzyskane wyniki można wyodrębnić trzy niepoprawnie wyodrębnione słowa kluczowe dla przykładowego tekstu, co w wyniku daje nam dokładność 67%. Porównując sześć prawdziwych wyników w zbiorze wyodrębnionych słów kluczowych z sumy siedmiu ręcznie przypisanych słów kluczowych, dokładność trafień wynosi 86%. Uzyskane wyniki procentowe świadczą o bardzo dobrej skuteczności algorytmu RAKE, który nie tylko przynosi korzyści ale także uwalnia zasoby obliczeniowe dla innych metod analitycznych. 3933

5 2 ZASTOSOWANIE ALGORYTMU RAKE DLA POLSKOJĘZYCZNYCH DOKUMENTÓW Podejmowane próby zastosowania algorytmu RAKE do analizy tekstów przygotowanych w języku polskim wskazują na kilka problemów związanych z jego zastosowaniem. Najistotniejszym z nich wydaje się być konieczność jednoczesnej analizy tekstu oryginalnego (aby odtworzyć prawidłową postać frazy) oraz tekstu złożonego z wyrazów w formie podstawowej (w celu zliczania wszystkich wystąpień fraz). Również należy zwrócić uwagę na potrzebę właściwego zdefiniowania separatorów fraz oraz oceny jakości fraz kandydujących. 2.1 Empiryczna analiza wybranych kolekcji dokumentów tekstowych W badaniu wykorzystane zostały kolekcje dokumentów tekstowych dotyczące streszczeń polskojęzycznych artykułów naukowych oraz opinii konsumenckich o danym produkcie telefonie komórkowym. Zestaw streszczeń artykułów zawiera także ręcznie przypisane przez autorów artykułów słowa kluczowe. Umożliwiają one określenie skuteczności zastosowania danej metody identyfikacji słów i fraz kluczowych. Należy jednak zauważyć, że czasami wybrane przez autora słowa kluczowe wynikają z analizy całej treści artykułu, nie zaś jego streszczenia. Wiąże się to z faktem występowania w słowach kluczowych fraz które nie są ani razu użyte w streszczeniu danego artykułu. Wybrany zestaw streszczeń artykułów pochodzi z Kongresu Statystyki Polskiej, który miał miejsce w 2012 roku. Opinie klientów danego modelu telefonu komórkowego zostały zaczerpnięte ze strony internetowej Zebranych zostało 100 opinii na temat wybranego modelu, zaś analiza słów kluczowych możliwa jest po uwzględnieniu dostępnych możliwości wyboru plusów i minusów dostępnych przy wystawianiu opinii przez klienta. Algorytm RAKE działa nie na zbiorze dokumentów, lecz na pojedynczych plikach, jednak wyniki można uzyskać automatycznie dla wszystkich plików z kolekcji dokumentów. Punktem wyjścia dla algorytmu RAKE było określenie parametrów wejściowych: stop-listy, zestawu separatorów fraz oraz ograniczników słów (m.in. spacja, przecinek, kropka). W tym celu dla analizowanych kolekcji opinii konsumenckich oraz streszczeń artykułów naukowych napisano skrypt, który dodawał znak. po tytule, w miejscu przejścia do nowej linii oraz na koniec dokumentu (jeśli brakowało). Skrypt został napisany w języku R. W pierwszym kroku tekst dokumentu podzielono na frazy będące sekwencją wyrazów ograniczaną na początku i końcu przez ograniczniki fraz. W kolejnym kroku analizowano zbiór wszystkich słów i fraz wyróżnionych w tekście. Dla każdego zdania wyznaczono miernik określający liczbę fraz, w których te frazy łącznie się pojawiły. Algorytm został zaimplementowany w języku Python w wersji [8]. Wykonano obliczenia dla kolekcji zarówno opinii konsumenckich jak i streszczeń artykułów naukowych bez redukcji słów do ich form podstawowych. Wynika to z faktu, iż redukcja do rdzenia spowodowałaby wystąpienie frazy w niepoprawnej formie. W tabeli 1 zestawiono uzyskane wyniki działania algorytmu RAKE dla przykładowych dwóch plików zawierających opinie konsumenckie na temat telefonu komórkowego. W tabeli 2 zestawiono uzyskane wyniki działania algorytmu RAKE dla przykładowego pliku zawierającego streszczenie artykułu naukowego. Tab. 1. Wyniki działania algorytmu RAKE dla przykładowego dokumentu zawierającego opinię konsumencką opracowanie własne. Wyniki działania algorytmu RAKE Tekst źródłowy Istotność Słowa i frazy kandydujace frazy Zakupiłem telefonik około miesiąca temu. Zapewne interesuje was opinia co i jak z telefonem. Telefon bardzo dobry w swojej trochę krótko trzyma bateria, posiadałem htc hd2, zakupiłem telefonik, 25,0 15,5 9,5 3934

6 klasie. Jest po prostu rewelacyjny. Wcześniej posiadałem HTC HD2 ale Samsung bije we wszystkich kategoriach. Szybki i co najważniejsze nie wiesza się. Trochę krótko trzyma bateria ale jest to minusem chyba wszystkich smartfonów. Jeżeli miał bym jeszcze raz dokonywać wyboru to kupił bym samsunga z zamkniętymi oczami. Polecam wszystkim ten telefon. Telefon idealny mam go już dwa tyg. i nie widzę żadnych wad lecz same zalety. Gorąco polecam. miesiąca temu, jeżeli miał bym, zamkniętymi oczami, kupił bym samsunga, dokonywać wyboru, widzę żadnych wad, telefon idealny, 4,0 4,0 Tab. 2. Wyniki działania algorytmu RAKE dla przykładowego dokumentu zawierającego streszczenie artykułu naukowego opracowanie własne. Wyniki działania algorytmu RAKE Tekst źródłowy edukacja, Słowa kluczowe statystyka społeczna, wskaźniki, Wykorzystanie wskaźników w obszarze edukacji w kontekście rozwoju polityki opartej na faktach. Artykuł ma na celu prezentacje i analizę wskaźników, które mogą być używane do monitorowania oraz ewaluacji polityki edukacyjnej w Polsce oraz efektów aktywności edukacyjnej. Analiza będzie się skupiać na istniejących źródłach danych, w tym danych administracyjnych (System Informacji Oświatowej) oraz dane z badan reprezentacyjnych, takich jak Badanie Aktywności Ekonomicznej Ludności, Badanie Dochodów i Warunków Życia (EU- SILC), badania międzynarodowe (badanie PISA, badanie Generation and GenderSurvey) oraz badania krajowe (np. Diagnoza Społeczna). Edukacja jest obszarem polityki publicznej, który ma wpływ na wiele obszarów rozwoju społecznego. W artykule chciała wskazać na określone grupy wskaźników z wybranych obszarów, zarówno z perspektywy indywidualnego uczestnictwa w edukacji i efektów tego uczestnictwa, jak również międzypokoleniowe aspekty aktywności edukacyjnej gospodarstw domowych. Pierwszym obszarem jest uczestnictwo w uczeniu się przez całe życie, w tym udział w edukacji dzieci i młodzieży, ale także uczenie się dorosłych w różnych formach uczenia się formalnego, pozaformalnego oraz nieformalnego. W tym celu ważne jest wskazanie uwagi na potrzebę Słowa i frazy kandydujace uwzględnione zostanie również międzypokoleniowy kontekst poziomu wykształcanie, tym również deprywacja gospodarstw domowych dotycząca możliwości uczestnictwa, również międzypokoleniowe aspekty aktywności edukacyjnej gospodarstw domowych, wskazane są rekomendacje dotyczące dalszego rozwoju statystyki edukacyjnej, analiza uwzględni również charakterystyki demograficzne (wiek, czwarty obszar dotyczy rozwoju kapitału ludzkiego osób, zależności pomiędzy aktywnością edukacyjna dzieci, drugi obszar uwzględnia powiazanie pomiędzy edukacją, uwzględniony zostanie również rola pracodawców, trzeci obszar uwzględnia zasoby gospodarstw domowych, również przechodzenie pomiędzy edukacja, istniejących źródłach danych, badanie aktywności ekonomicznej ludności, Istotność frazy 101, , , ,4 63, ,25 60, , , , , , ,7 3935

7 precyzyjnego zdefiniowania różnych form uczenia się tak, aby możliwe było ich właściwe monitorowanie. Uwzględnione zostanie również międzypokoleniowy kontekst poziomu wykształcanie, uwzględniając wpływ wykształcenia rodziców na wykształcenie dzieci. Analiza uwzględni również charakterystyki demograficzne (wiek, płeć, niepełnosprawność, stan cywilny). Drugi obszar uwzględnia powiazanie pomiędzy edukacją i rynkiem pracy. W szczególności, dotyczy to statusu na rynku pracy osób w zależności od wykształcenia, ale też zależności pomiędzy aktywnością edukacyjna dzieci i statusem rodziców na rynku pracy. Uwzględniony zostanie również rola pracodawców w organizowaniu uczenia się przez całe życie pracowników, jak również przechodzenie pomiędzy edukacja a rynkiem pracy. Trzeci obszar uwzględnia zasoby gospodarstw domowych i ich wykorzystanie na cele edukacyjne, w tym również deprywacja gospodarstw domowych dotycząca możliwości uczestnictwa w edukacji. Zwrócona zostanie uwaga zarówno na zasoby finansowe, jak i czasowe gospodarstw domowych przeznaczone na edukacje osób dorosłych oraz dzieci. Czwarty obszar dotyczy rozwoju kapitału ludzkiego osób, w tym ich umiejętności i kompetencji (językowych, ICT). Piąty obszar dotyczy terytorialnych aspektów polityki edukacyjnej, takich jak zróżnicowanie wyników edukacyjnych lub dostęp do wybranych usług edukacyjnych. W podsumowaniu wskazane są rekomendacje dotyczące dalszego rozwoju statystyki edukacyjnej, w tym rekomendacje badań mających na celu wypełnienie istniejących luk informacyjnych. wypełnienie istniejących luk informacyjnych, które mogą być używane, zwrócona zostanie uwaga zarówno, tym rekomendacje badań mających, badania międzynarodowe (badanie pisania, edukacje osób dorosłych, analiza będzie się skupiać, piąty obszar dotyczy terytorialnych aspektów, tym danych administracyjnych (system informacji, kontekście rozwoju polityki opartej, badanie generation and gendersurvey), czasowe gospodarstw domowych przeznaczone, tym ich umiejętności, że uczenie się dorosłych, aby możliwe był, aktywności edukacyjnej, zależności, całe życie pracowników, rynku pracy osób, wybranych usług edukacyjnych, edukacyjnych lub dostęp, formach uczenia się formalnego, 35, ,0 34,0 27, , ,75 25, ,5 25,5 24,75 24,5 24,5 24, , ,0 1 18,6 17, ,25 15,0 15,0 15,0 2.2 Ocena działania algorytmu RAKE W badaniu algorytmu RAKE dla dokumentów polskojęzycznych modelem bazowym słów jest listowy model dokumentu. Konieczność zastosowania listy w miejsce macierzy częstości wynika z potrzeby zachowania informacji o kolejności wyrazów w dokumencie.frazy istotne są wyznaczane niezależnie dla poszczególnych dokumentów. Nie ma możliwości wyznaczenia fraz istotnych dla całego zbioru dokumentów. Badania pokazały, że w przypadku opinii konsumenckich uzyskane frazy kluczowe w bardzo wysokim stopniu oddają sens i przesłanie opinii. W przypadku badania streszczeń artykułów naukowych algorytm RAKE wyodrębnia sporą ilość fraz pokazując ich mierniki. Bardzo ciężko na podstawie jego działania określić ich istotność w porównaniu ze słowami kluczowymi zaproponowanymi przez autora abstraktu. Wynika to z faktu, że większość słów kluczowych stanowią pojedyncze wyrazy. Nie ma informacji o frazach kluczowych autora abstraktu. 3936

8 Przeprowadzone badania wskazują na potrzebę dostosowania algorytmu do specyfiki języka polskiego i słownictwa właściwego dla obszaru zastosowań, z którego pochodzą analizowane dokumenty. WNIOSKI Należy pozytywnie ocenić funkcjonowanie algorytmu RAKE. Jednakże w przypadku jego zastosowania dużym utrudnieniem okazała się jego duża wrażliwość na zawartość stop-listy. Problemy z zastosowaniem tej metody w dużej mierze są wynikiem opracowania i implementowania badanego algorytmu dla tekstów anglojęzycznych. Specyfika języka polskiego jest zgoła odmienna i wymaga stworzenia wersji algorytmu dostosowanej do języka polskiego. Nie dokonano także porównania wyników działania algorytmu z frazami kluczowymi zaproponowanymi przez autora, bo takie nie zostały podane. Próby automatycznej analizy dokumentów tekstowych w zdecydowanej większości opierają się na identyfikacji słów i fraz kluczowych. Podejście takie bez wiedzy o zwyczajach językowych autoró w wypowiedzi, uwzględnienia specyfiki słów czy też kontekstowej zmienności znaczeń nastręcza wiele trudnych do rozwiązania problemów. W przypadku analizy tekstów polskojęzycznych dostępne narzędzia i możliwości jakie oferują od prostych po bardziej zaawansowane budujące ontologie pojęć lub też mające wbudowane zaawansowane algorytmy analizy składni nie przynoszą oczekiwanych rezultatów. Problemem jest nie tylko sposób kodowania polskich znaków, ale chyba co ważniejsze programy analizujące składnię. W świetle tych rozważań automatyzacja translacji tekstów w języku naturalnym na język formalny jest jednym z najbardziej pożądanych i obiecujących kierunków współczesnych badań. Streszczenie Frazy kluczowe, które są definiowane jako sekwencja kliku słów, zapewniają zwartą reprezentację treści danego dokumentu. Słowa i frazy kluczowe są powszechnie wykorzystywane w ramach systemów wyszukiwania informacji IR ponieważ są łatwe do zdefiniowania, zmiany, zapamiętania i udostępniania. Jednak pomimo ich przydatności do analizy, indeksowania i wyszukiwania większość dokumentów nie przypisuje automatycznie słów i fraz kluczowych. Rozwiązaniem może być algorytm RAKE niezależny od języka, prezentujący metodę ekstrakcji słów i fraz kluczowych z poszczególnych dokumentów. Podejmowane próby zastosowania algorytmu RAKE do analizy tekstów przygotowanych w języku polskim wskazują na kilka problemów związanych z jego zastosowaniem. Najistotniejszym z nich wydaje się być konieczność jednoczesnej analizy tekstu oryginalnego (aby odtworzyć prawidłową postać frazy) oraz tekstu złożonego z wyrazów w formie podstawowej (w celu zliczania wszystkich wystąpień fraz). Również należy zwrócić uwagę na potrzebę właściwego zdefiniowania separatorów fraz oraz oceny jakości fraz kandydujących. Próba rozwiązania wymienionych problemów stanowi główny cel artykułu. Automatic identification words and key phrases - RAKE algorithm Abstract Key phrases, which we define as a sequence of more words, provide a compact representation of a document s content. Keywords and key phrases are widely used to define queries within information retrieval (IR) systems as they are easy to define, revise, remember, and share. However, despite their utility for analysis, indexing, and retrieval, most documents do not have assigned automatically keywords and key phrases. The solution may be Rapid Automatic Keyword Extraction (RAKE), an unsupervised, domain-independent, and language-independent method for extracting keywords and key phrases from individual documents. Attempts to use RAKE algorithm to analyze texts in Polish indicate many problems associated with its use. The most important of them seems to be a need for simultaneous analysis of the original text (in order to reproduce the correct form of the phrase) and a text composed of words in primary forms (to count all occurrences of the phrase). Also, pay attention to the need to properly define separators phrases and quality evaluation of candidate phrases. Attempt to solve these problems is the main purpose of the article. 3937

9 BIBLIOGRAFIA 1. Berry M. W., Kogan J., Text Mining Applications and Theory. John Wiley & Sons Ltd, United Kingdom Deerwester S., Dumais S. T., Furnas G., Landauer T. K, Harshman R., Indexing by Latent Semantic Analysisis. Journal of the American Society for Information Science, 41(6), Hand D., Mannila H., Smyth P., Eksploracja danych. WNT, Warszawa Manning C., Schuetze H., Foundations of Statistical Natural Language Processing. The MIT Press, Mihalcea R., Tarau P., Textrank: Bringing order into texts.in Proceedings of EMNLP 2004 (ed, Lin D., Wu D.), Association for Computational Linguistics, Barcelona 2004, s Mykowiecka A, Inżynieria lingwistyczna. Komputerowe przetwarzanie tekstów w języku naturalnym. PJWSTK, Warszawa, Pang B., Lee L., Vaithyanathan S., Thumbs up? Sentiment Classification using Machine Learning Techniques. EMNLP, Perkins J., Python Text Processing with NLTK 2.0 Cookbook. Packt Publishing, Rose S., Engel D., Cramer N., Cowley W., Automatic Keyword Extraction from Individual Documents. M. W. Berry & J. Kogan (red.), Text Mining: Theory and Applications, John Wiley & Sons, 2010, s Salton G., Wong A., Yang C. S., A vector space model for automatic indexing. Communications of the ACM, vol, 18, 1975, s

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Wpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji cha- rakteru opinii konsumenckich. 1 Wstęp

Wpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji cha- rakteru opinii konsumenckich. 1 Wstęp mgr Katarzyna Wójcik mgr Janusz Tuchowski Uniwersytet Ekonomiczny w Krakowie Wpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji charakteru opinii konsumenckich. 1 Wstęp Analiza opinii

Bardziej szczegółowo

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po

Bardziej szczegółowo

Analiza korespondencji

Analiza korespondencji Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy

Bardziej szczegółowo

Lokalizacja Oprogramowania

Lokalizacja Oprogramowania mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji

Bardziej szczegółowo

Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka

Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka L.p. Nazwisko i imię studenta Promotor Temat pracy magisterskiej 1. Wojciech Kłopocki dr Bartosz Ziemkiewicz Automatyczne

Bardziej szczegółowo

AiSD zadanie trzecie

AiSD zadanie trzecie AiSD zadanie trzecie Gliwiński Jarosław Marek Kruczyński Konrad Marek Grupa dziekańska I5 5 czerwca 2008 1 Wstęp Celem postawionym przez zadanie trzecie było tzw. sortowanie topologiczne. Jest to typ sortowania

Bardziej szczegółowo

Systemy uczące się Lab 4

Systemy uczące się Lab 4 Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego

Bardziej szczegółowo

SPOTKANIE 2: Wprowadzenie cz. I

SPOTKANIE 2: Wprowadzenie cz. I Wrocław University of Technology SPOTKANIE 2: Wprowadzenie cz. I Piotr Klukowski Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.edu.pl 17.10.2016 UCZENIE MASZYNOWE 2/27 UCZENIE MASZYNOWE = Konstruowanie

Bardziej szczegółowo

Dobór optymalnego zestawu słów istotnych w opiniach konsumentów na potrzeby ich automatycznej analizy

Dobór optymalnego zestawu słów istotnych w opiniach konsumentów na potrzeby ich automatycznej analizy Katarzyna Wójcik, Janusz Tuchowski Uniwersytet Ekonomiczny w Krakowie Dobór optymalnego zestawu słów istotnych w opiniach konsumentów na potrzeby ich automatycznej analizy Streszczenie. Analiza opinii

Bardziej szczegółowo

Priorytetyzacja przypadków testowych za pomocą macierzy

Priorytetyzacja przypadków testowych za pomocą macierzy Priorytetyzacja przypadków testowych za pomocą macierzy W niniejszym artykule przedstawiony został problem przyporządkowania priorytetów do przypadków testowych przed rozpoczęciem testów oprogramowania.

Bardziej szczegółowo

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury

Bardziej szczegółowo

Biblioteka Wirtualnej Nauki

Biblioteka Wirtualnej Nauki Biblioteka Wirtualnej Nauki BAZA SCOPUS Scopus jest największą na świecie bibliograficzną bazą abstraktów i cytowań recenzowanej literatury naukowej, wyposażoną w narzędzia bibliometryczne do śledzenia,

Bardziej szczegółowo

SKUTECZNOŚĆ WYSZUKIWANIA W INTERNECIE INFORMACJI ZWIĄZANYCH Z INŻYNIERIĄ ROLNICZĄ

SKUTECZNOŚĆ WYSZUKIWANIA W INTERNECIE INFORMACJI ZWIĄZANYCH Z INŻYNIERIĄ ROLNICZĄ Inżynieria Rolnicza 6(104)/2008 SKUTECZNOŚĆ WYSZUKIWANIA W INTERNECIE INFORMACJI ZWIĄZANYCH Z INŻYNIERIĄ ROLNICZĄ Michał Cupiał Katedra Inżynierii Rolniczej i Informatyki, Uniwersytet Rolniczy w Krakowie

Bardziej szczegółowo

WYBÓR PUNKTÓW POMIAROWYCH

WYBÓR PUNKTÓW POMIAROWYCH Scientific Bulletin of Che lm Section of Technical Sciences No. 1/2008 WYBÓR PUNKTÓW POMIAROWYCH WE WSPÓŁRZĘDNOŚCIOWEJ TECHNICE POMIAROWEJ MAREK MAGDZIAK Katedra Technik Wytwarzania i Automatyzacji, Politechnika

Bardziej szczegółowo

Pattern Classification

Pattern Classification Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors

Bardziej szczegółowo

10. Redukcja wymiaru - metoda PCA

10. Redukcja wymiaru - metoda PCA Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component

Bardziej szczegółowo

Monitoring procesów z wykorzystaniem systemu ADONIS

Monitoring procesów z wykorzystaniem systemu ADONIS Monitoring procesów z wykorzystaniem systemu ADONIS BOC Information Technologies Consulting Sp. z o.o. e-mail: boc@boc-pl.com Tel.: (+48 22) 628 00 15, 696 69 26 Fax: (+48 22) 621 66 88 BOC Management

Bardziej szczegółowo

Hierarchiczna analiza skupień

Hierarchiczna analiza skupień Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym

Bardziej szczegółowo

Łączenie liczb i tekstu.

Łączenie liczb i tekstu. Łączenie liczb i tekstu. 1 (Pobrane z slow7.pl) Rozpoczynamy od sposobu pierwszego. Mamy arkusz przedstawiony na rysunku poniżej w którym zostały zawarte wypłaty pracowników z wykonanym podsumowaniem.

Bardziej szczegółowo

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD

SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD Dr inż. Jacek WARCHULSKI Dr inż. Marcin WARCHULSKI Mgr inż. Witold BUŻANTOWICZ Wojskowa Akademia Techniczna SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD Streszczenie: W referacie przedstawiono możliwości

Bardziej szczegółowo

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot

Bardziej szczegółowo

Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL. Łukasz Degórski

Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL. Łukasz Degórski Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL Łukasz Degórski LT4eL Language Technology for e-learning Wykorzystanie narzędzi językowych oraz technik sieci

Bardziej szczegółowo

PROBLEM ROZMIESZCZENIA MASZYN LICZĄCYCH W DUŻYCH SYSTEMACH PRZEMYSŁOWYCH AUTOMATYCZNIE STEROWANYCH

PROBLEM ROZMIESZCZENIA MASZYN LICZĄCYCH W DUŻYCH SYSTEMACH PRZEMYSŁOWYCH AUTOMATYCZNIE STEROWANYCH CZESŁAW KULIK PROBLEM ROZMIESZCZENIA MASZYN LICZĄCYCH W DUŻYCH SYSTEMACH PRZEMYSŁOWYCH AUTOMATYCZNIE STEROWANYCH Duże systemy przemysłowe, jak kopalnie, kombinaty metalurgiczne, chemiczne itp., mają złożoną

Bardziej szczegółowo

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu

Data Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu

Bardziej szczegółowo

WSPÓŁCZYNNIK GOTOWOŚCI SYSTEMU LOKOMOTYW SPALINOWYCH SERII SM48

WSPÓŁCZYNNIK GOTOWOŚCI SYSTEMU LOKOMOTYW SPALINOWYCH SERII SM48 TECHNIKA TRANSPORTU SZYNOWEGO Andrzej MACIEJCZYK, Zbigniew ZDZIENNICKI WSPÓŁCZYNNIK GOTOWOŚCI SYSTEMU LOKOMOTYW SPALINOWYCH SERII SM48 Streszczenie W artykule wyznaczono współczynniki gotowości systemu

Bardziej szczegółowo

Zapisywanie algorytmów w języku programowania

Zapisywanie algorytmów w języku programowania Temat C5 Zapisywanie algorytmów w języku programowania Cele edukacyjne Zrozumienie, na czym polega programowanie. Poznanie sposobu zapisu algorytmu w postaci programu komputerowego. Zrozumienie, na czym

Bardziej szczegółowo

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka

Modelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka Modelowanie jako sposób opisu rzeczywistości Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka 2015 Wprowadzenie: Modelowanie i symulacja PROBLEM: Podstawowy problem z opisem otaczającej

Bardziej szczegółowo

Widzenie komputerowe (computer vision)

Widzenie komputerowe (computer vision) Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja

Bardziej szczegółowo

WYMAGANIA EDUKACYJNE I KRYTERIA OCENIANIA UCZNIÓW Z JĘZYKA ROSYJSKIEGO

WYMAGANIA EDUKACYJNE I KRYTERIA OCENIANIA UCZNIÓW Z JĘZYKA ROSYJSKIEGO WYMAGANIA EDUKACYJNE I KRYTERIA OCENIANIA UCZNIÓW Z JĘZYKA ROSYJSKIEGO Ocenie podlegają wiadomości i umiejętności ujęte w programie nauczania w zakresie czterech sprawności językowych: słuchania, mówienia,

Bardziej szczegółowo

Zasady interpretacji Raportu antyplagiatowego

Zasady interpretacji Raportu antyplagiatowego Zasady interpretacji Raportu antyplagiatowego Strona 1 z 8 Spis treści 1. Informacje ogólne... 3 2. Wskaźniki analizy antyplagiatowej... 4 3. Wskaźniki dodatkowe analizy antyplagiatowej... 5 4. Konflikty...

Bardziej szczegółowo

Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska

Algorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska Algorytmy rozpoznawania obrazów 11. Analiza skupień dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Analiza skupień Określenia: analiza skupień (cluster analysis), klasteryzacja (clustering), klasyfikacja

Bardziej szczegółowo

Ćwiczenie 1 Planowanie trasy robota mobilnego w siatce kwadratów pól - Algorytm A

Ćwiczenie 1 Planowanie trasy robota mobilnego w siatce kwadratów pól - Algorytm A Ćwiczenie 1 Planowanie trasy robota mobilnego w siatce kwadratów pól - Algorytm A Zadanie do wykonania 1) Utwórz na pulpicie katalog w formacie Imię nazwisko, w którym umieść wszystkie pliki związane z

Bardziej szczegółowo

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska

Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja

Bardziej szczegółowo

SCENARIUSZ LEKCJI. Streszczenie. Czas realizacji. Podstawa programowa

SCENARIUSZ LEKCJI. Streszczenie. Czas realizacji. Podstawa programowa Autorzy scenariusza: SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH

Bardziej szczegółowo

BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI

BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI 14 BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI 14.1 WSTĘP Ogólne wymagania prawne dotyczące przy pracy określają m.in. przepisy

Bardziej szczegółowo

Analiza wybranych aspektów wyników egzaminu gimnazjalnego

Analiza wybranych aspektów wyników egzaminu gimnazjalnego Wroclaw Univesity of Economics From the SelectedWorks of Józef Z. Dziechciarz 2012 Analiza wybranych aspektów wyników egzaminu gimnazjalnego Jozef Z. Dziechciarz, Wroclaw Univesity of Economics Agnieszka

Bardziej szczegółowo

Rozdział 1 PROGRAMOWANIE LINIOWE

Rozdział 1 PROGRAMOWANIE LINIOWE Wprowadzenie do badań operacyjnych z komputerem Opisy programów, ćwiczenia komputerowe i zadania. T. Trzaskalik (red.) Rozdział 1 PROGRAMOWANIE LINIOWE 1.2 Ćwiczenia komputerowe Ćwiczenie 1.1 Wykorzystując

Bardziej szczegółowo

Biblioteka Wirtualnej Nauki

Biblioteka Wirtualnej Nauki Biblioteka Wirtualnej Nauki BAZA EBSCO EBSCO Publishing oferuje użytkownikom w Polsce dostęp online do pakietu podstawowego baz danych w ramach projektu Electronic Information for Libraries Direct eifl

Bardziej szczegółowo

Przedmiotowy system oceniania z języka angielskiego obowiązujący od roku szkolnego 2009/2010 (nowa podstawa programowa)

Przedmiotowy system oceniania z języka angielskiego obowiązujący od roku szkolnego 2009/2010 (nowa podstawa programowa) Przedmiotowy system oceniania z języka angielskiego obowiązujący od roku szkolnego 2009/2010 (nowa podstawa programowa) Co i jak oceniamy na lekcjach języka angielskiego? kompetencje ucznia w zakresie

Bardziej szczegółowo

MODELOWANIE STANÓW CZYNNOŚCIOWYCH W JĘZYKU SIECI BAYESOWSKICH

MODELOWANIE STANÓW CZYNNOŚCIOWYCH W JĘZYKU SIECI BAYESOWSKICH Inżynieria Rolnicza 7(105)/2008 MODELOWANIE STANÓW CZYNNOŚCIOWYCH W JĘZYKU SIECI BAYESOWSKICH Katedra Podstaw Techniki, Uniwersytet Przyrodniczy w Lublinie Streszczenie. Zastosowanie sieci bayesowskiej

Bardziej szczegółowo

Ocena kondycji finansowej organizacji

Ocena kondycji finansowej organizacji Ocena kondycji finansowej organizacji 1 2 3 4 5 6 7 8 Analiza płynności Analiza rentowności Analiza zadłużenia Analiza sprawności działania Analiza majątku i źródeł finansowania Ocena efektywności projektów

Bardziej szczegółowo

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling

Summary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Summary in Polish Fatimah Mohammed Furaiji Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Zastosowanie symulacji wieloagentowej w modelowaniu zachowania konsumentów Streszczenie

Bardziej szczegółowo

Zad. 3: Układ równań liniowych

Zad. 3: Układ równań liniowych 1 Cel ćwiczenia Zad. 3: Układ równań liniowych Wykształcenie umiejętności modelowania kluczowych dla danego problemu pojęć. Definiowanie właściwego interfejsu klasy. Zwrócenie uwagi na dobór odpowiednich

Bardziej szczegółowo

Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych

Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie

Bardziej szczegółowo

Liczbę 29 możemy zaprezentować na siedem różnych sposobów:

Liczbę 29 możemy zaprezentować na siedem różnych sposobów: Numeryczna analiza rozkładu liczb naturalnych na określoną sumę liczb pierwszych Świerczewski Ł. Od blisko 200 lat matematycy poszukują odpowiedzi na pytanie zadane przez Christiana Goldbacha, który w

Bardziej szczegółowo

OCENA EFEKTYWNOŚCI INWESTYCJI. Jerzy T. Skrzypek

OCENA EFEKTYWNOŚCI INWESTYCJI. Jerzy T. Skrzypek OCENA EFEKTYWNOŚCI INWESTYCJI Jerzy T. Skrzypek 1 2 3 4 5 6 7 8 Analiza płynności Analiza rentowności Analiza zadłużenia Analiza sprawności działania Analiza majątku i źródeł finansowania Ocena efektywności

Bardziej szczegółowo

1. Międzynarodowy program CLIL - kontekst edukacyjny i kulturowy...l5

1. Międzynarodowy program CLIL - kontekst edukacyjny i kulturowy...l5 Spis treści WSTĘP 9 1. Międzynarodowy program CLIL - kontekst edukacyjny i kulturowy...l5 1.1. Charakterystyka nauczania dwujęzycznego w Europie na poziomie szkoły podstawowej i ponadpodstawowej 15 1.2.

Bardziej szczegółowo

PRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE

PRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE PRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE Rok szkolny: 2016/2017 Przedmiot/ty: język angielski dla liceum Nauczyciel/le: Oliwia Mróz, Swietłana Błażejczyk, Jakub Maćkowski Obszary PSO wynikające z

Bardziej szczegółowo

Kumulowanie się defektów jest możliwe - analiza i potwierdzenie tezy

Kumulowanie się defektów jest możliwe - analiza i potwierdzenie tezy Kumulowanie się defektów jest możliwe - analiza i potwierdzenie tezy Marek Żukowicz 14 marca 2018 Streszczenie Celem napisania artykułu jest próba podania konstruktywnego dowodu, który wyjaśnia, że niewielka

Bardziej szczegółowo

Przykłady grafów. Graf prosty, to graf bez pętli i bez krawędzi wielokrotnych.

Przykłady grafów. Graf prosty, to graf bez pętli i bez krawędzi wielokrotnych. Grafy Graf Graf (ang. graph) to zbiór wierzchołków (ang. vertices), które mogą być połączone krawędziami (ang. edges) w taki sposób, że każda krawędź kończy się i zaczyna w którymś z wierzchołków. Graf

Bardziej szczegółowo

PRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE

PRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE PRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE Od roku szkolnego: 2015/2016 Przedmiot/ty: język angielski, język niemiecki dla liceum Nauczyciel/le: Swietłana Błażejczyk, Jakub Maćkowski, Sandra Sawa,

Bardziej szczegółowo

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle

Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Paweł Szołtysek 12 czerwca 2008 Streszczenie Planowanie produkcji jest jednym z problemów optymalizacji dyskretnej,

Bardziej szczegółowo

Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego. II seminarium konsultacyjne.

Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego. II seminarium konsultacyjne. Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego II seminarium konsultacyjne w ramach projektu Analiza czynników wpływających na zwiększenie ryzyka długookresowego

Bardziej szczegółowo

SPRAWDZIAN W KLASIE VI SZKOŁY PODSTAWOWEJ W ROKU SZKOLNYM 2015/2016

SPRAWDZIAN W KLASIE VI SZKOŁY PODSTAWOWEJ W ROKU SZKOLNYM 2015/2016 SPRAWDZIAN W KLASIE VI SZKOŁY PODSTAWOWEJ W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI I MATEMATYKA ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ SP-8 KWIECIEŃ 2016 Zadanie 1. (0 1) JĘZYK POLSKI TAK Zadanie

Bardziej szczegółowo

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery

XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery http://xqtav.sourceforge.net XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery dr hab. Jerzy Tyszkiewicz dr Andrzej Kierzek mgr Jacek Sroka Grzegorz Kaczor praca mgr pod

Bardziej szczegółowo

Identyfikacja znamion ukrytego plagiatu. Z wykorzystaniem IDEA Caseware

Identyfikacja znamion ukrytego plagiatu. Z wykorzystaniem IDEA Caseware Identyfikacja znamion ukrytego plagiatu Z wykorzystaniem IDEA Caseware Dzięki zastosowaniu w IDEI zaawansowanego modułu importu danych istnieje możliwość wykorzystania oprogramowania do identyfikacji tzw.

Bardziej szczegółowo

Wyszukiwanie dokumentów/informacji

Wyszukiwanie dokumentów/informacji Wyszukiwanie dokumentów/informacji Wyszukiwanie dokumentów (ang. document retrieval, text retrieval) polega na poszukiwaniu dokumentów tekstowych z pewnego zbioru, które pasują do zapytania. Wyszukiwanie

Bardziej szczegółowo

Programowanie dynamiczne cz. 2

Programowanie dynamiczne cz. 2 Programowanie dynamiczne cz. 2 Wykład 7 16 kwietnia 2019 (Wykład 7) Programowanie dynamiczne cz. 2 16 kwietnia 2019 1 / 19 Outline 1 Mnożenie ciągu macierzy Konstruowanie optymalnego rozwiązania 2 Podstawy

Bardziej szczegółowo

Instrukcje dla zawodników

Instrukcje dla zawodników Płock, 17 marca 2018 r. Instrukcje dla zawodników Arkusze otwieramy na wyraźne polecenie komisji. Wszystkie poniższe instrukcje zostaną odczytane i wyjaśnione. 1. Arkusz składa się z 3 zadań. 2. Każde

Bardziej szczegółowo

Edukacja dla bezpieczeństwa. Przedmiotowy system oceniania

Edukacja dla bezpieczeństwa. Przedmiotowy system oceniania Edukacja dla bezpieczeństwa Przedmiotowy system oceniania 1.Ocenianiu podlegają: wiedza i umiejętności ucznia, wymienione niżej obszary aktywności ucznia, dodatkowe prace wykonane, zlecone przez nauczyciela.

Bardziej szczegółowo

Odniesienie do efektów kształcenia dla obszaru nauk EFEKTY KSZTAŁCENIA Symbol

Odniesienie do efektów kształcenia dla obszaru nauk EFEKTY KSZTAŁCENIA Symbol KIERUNKOWE EFEKTY KSZTAŁCENIA Wydział Informatyki i Zarządzania Kierunek studiów INFORMATYKA (INF) Stopień studiów - pierwszy Profil studiów - ogólnoakademicki Projekt v1.0 z 18.02.2015 Odniesienie do

Bardziej szczegółowo

Praktyczne aspekty stosowania metody punktów funkcyjnych COSMIC. Jarosław Świerczek

Praktyczne aspekty stosowania metody punktów funkcyjnych COSMIC. Jarosław Świerczek Praktyczne aspekty stosowania metody punktów funkcyjnych COSMIC Jarosław Świerczek Punkty funkcyjne Punkt funkcyjny to metryka złożoności oprogramowania wyznaczana w oparciu o określające to oprogramowanie

Bardziej szczegółowo

O czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich

O czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich O czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich mgr Aleksander Nosarzewski Szkoła Główna Handlowa w Warszawie pod kierunkiem naukowym dr hab. Bogumiła Kamińskiego, prof. SGH Problem Potrzeba

Bardziej szczegółowo

Automatyczna klasyfikacja zespołów QRS

Automatyczna klasyfikacja zespołów QRS Przetwarzanie sygnałów w systemach diagnostycznych Informatyka Stosowana V Automatyczna klasyfikacja zespołów QRS Anna Mleko Tomasz Kotliński AGH EAIiE 9 . Opis zadania Tematem projektu było zaprojektowanie

Bardziej szczegółowo

WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI

WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI Stefan WÓJTOWICZ, Katarzyna BIERNAT ZAKŁAD METROLOGII I BADAŃ NIENISZCZĄCYCH INSTYTUT ELEKTROTECHNIKI ul. Pożaryskiego 8, 04-703 Warszawa tel. (0)

Bardziej szczegółowo

Tajemnice skutecznego wyszukiwania na przykładzie

Tajemnice skutecznego wyszukiwania na przykładzie Tajemnice skutecznego wyszukiwania na przykładzie Przeglądarka program otwierający wrota Internetu Wyszukiwarka a przeglądarka Wyszukiwarka program pozwalający wyszukiwać linki do stron WWW Kilka podstawowych

Bardziej szczegółowo

Wynik maksymalny Wynik minimalny Rozstęp Wynik średni 11,30 13,75 20,99. Łatwość zestawu 0,63 0,69 0,70

Wynik maksymalny Wynik minimalny Rozstęp Wynik średni 11,30 13,75 20,99. Łatwość zestawu 0,63 0,69 0,70 Raport z badania diagnostycznego uczniów klas czwartych 218 r. Zgodnie z Uchwałą Rady Pedagogicznej z dnia 17 czerwca 21 roku objęto badaniem diagnozującym stopień opanowania umiejętności polonistycznych,

Bardziej szczegółowo

EmotiWord, semantyczne powiązanie i podobieństwo, odległość znaczeniowa

EmotiWord, semantyczne powiązanie i podobieństwo, odległość znaczeniowa , semantyczne powiązanie i podobieństwo, odległość Projekt przejściowy ARR Politechnika Wrocławska Wydział Elektroniki Wrocław, 22 października 2013 Spis treści 1 językowa 2, kryteria 3 Streszczenie artykułu

Bardziej szczegółowo

Reprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów

Reprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów Wykład 2. Reprezentacja komputerowa grafów 1 / 69 Macierz incydencji Niech graf G będzie grafem nieskierowanym bez pętli o n wierzchołkach (x 1, x 2,..., x n) i m krawędziach (e 1, e 2,..., e m). 2 / 69

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

KRYTERIA OCENIANIA KLASA I KLASA II KLASA III

KRYTERIA OCENIANIA KLASA I KLASA II KLASA III KRYTERIA OCENIANIA II ETAP EDUKACYJNY - JĘZYK ANGIELSKI KLASA I KLASA II KLASA III DOPUSZCZAJĄCY: rozumie proste polecenia nauczyciela, poparte gestem; rozumie proste zwroty grzecznościowe i proste pytania;

Bardziej szczegółowo

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania

Analiza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania Analiza skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania Analiza Skupień Elementy składowe procesu grupowania obiekt Ekstrakcja cech Sprzężenie zwrotne Grupowanie klastry Reprezentacja

Bardziej szczegółowo

Efektywność Projektów Inwestycyjnych. 1. Mierniki opłacalności projektów inwestycyjnych Metoda Wartości Bieżącej Netto - NPV

Efektywność Projektów Inwestycyjnych. 1. Mierniki opłacalności projektów inwestycyjnych Metoda Wartości Bieżącej Netto - NPV Efektywność Projektów Inwestycyjnych Jednym z najczęściej modelowanych zjawisk przy użyciu arkusza kalkulacyjnego jest opłacalność przedsięwzięcia inwestycyjnego. Skuteczność arkusza kalkulacyjnego w omawianym

Bardziej szczegółowo

System Korekty Tekstu Polskiego

System Korekty Tekstu Polskiego System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Wersja algorytmu dla języka hiszpańskiego Wnioski

Bardziej szczegółowo

Maciej Piotr Jankowski

Maciej Piotr Jankowski Reduced Adder Graph Implementacja algorytmu RAG Maciej Piotr Jankowski 2005.12.22 Maciej Piotr Jankowski 1 Plan prezentacji 1. Wstęp 2. Implementacja 3. Usprawnienia optymalizacyjne 3.1. Tablica ekspansji

Bardziej szczegółowo

Modelowanie niezawodności prostych struktur sprzętowych

Modelowanie niezawodności prostych struktur sprzętowych Modelowanie niezawodności prostych struktur sprzętowych W ćwiczeniu tym przedstawione zostaną proste struktury sprzętowe oraz sposób obliczania ich niezawodności przy założeniu, że funkcja niezawodności

Bardziej szczegółowo

REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką

REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką Autor: Paweł Konieczny Promotor: dr Jadwigi Bakonyi Kategorie: aplikacja www Słowa kluczowe: Serwis

Bardziej szczegółowo

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych

Bardziej szczegółowo

Wyszukiwanie informacji w internecie. Nguyen Hung Son

Wyszukiwanie informacji w internecie. Nguyen Hung Son Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy

Bardziej szczegółowo

III TUTORIAL Z METOD OBLICZENIOWYCH

III TUTORIAL Z METOD OBLICZENIOWYCH III TUTORIAL Z METOD OBLICZENIOWYCH ALGORYTMY ROZWIĄZYWANIA UKŁADÓW RÓWNAŃ LINIOWYCH Opracowanie: Agata Smokowska Marcin Zmuda Trzebiatowski Koło Naukowe Mechaniki Budowli KOMBO Spis treści: 1. Wstęp do

Bardziej szczegółowo

Instrukcja interpretacji Raportu podobieństwa systemu Antyplagiat

Instrukcja interpretacji Raportu podobieństwa systemu Antyplagiat Instrukcja interpretacji Raportu podobieństwa systemu Antyplagiat Użytkownik Indywidualny Raport podobieństwa: ułatwia ocenę samodzielności badanego tekstu, wskazuje liczbę zapożyczonych fragmentów i podaje

Bardziej szczegółowo

ŁAMIEMY SZYFR CEZARA. 1. Wstęp. 2. Szyfr Cezara w szkole. Informatyka w Edukacji, XV UMK Toruń, 2018

ŁAMIEMY SZYFR CEZARA. 1. Wstęp. 2. Szyfr Cezara w szkole. Informatyka w Edukacji, XV UMK Toruń, 2018 Informatyka w Edukacji, XV UMK Toruń, 2018 ŁAMIEMY SZYFR CEZARA Ośrodek Edukacji Informatycznej i Zastosowań Komputerów 02-026 Warszawa, ul. Raszyńska 8/10 {maciej.borowiecki, krzysztof.chechlacz}@oeiizk.waw.pl

Bardziej szczegółowo

4.3 Grupowanie według podobieństwa

4.3 Grupowanie według podobieństwa 4.3 Grupowanie według podobieństwa Przykłady obiektów to coś więcej niż wektory wartości atrybutów. Reprezentują one poszczególne rasy psów. Ważnym pytaniem, jakie można sobie zadać, jest to jak dobrymi

Bardziej szczegółowo

Wymagania edukacyjne z języka niemieckiego w roku szkolnym 2017/2018. Kryteria Oceniania

Wymagania edukacyjne z języka niemieckiego w roku szkolnym 2017/2018. Kryteria Oceniania Wymagania edukacyjne z języka niemieckiego w roku szkolnym 2017/2018 Kryteria Oceniania Przedmiotowy System Oceniania z języka niemieckiego jest zgodny z Wewnątrzszkolnym Systemem Oceniania (WSO), Rozporządzeniem

Bardziej szczegółowo

Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych i szczegółowych kryteriów oceniania wiedzy i umiejętności dla przedmiotu

Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych i szczegółowych kryteriów oceniania wiedzy i umiejętności dla przedmiotu Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych i szczegółowych kryteriów oceniania wiedzy i umiejętności dla przedmiotu FIZYKA MEDYCZNA 1 Informacje wstępne 1. Nauczyciel ocenia

Bardziej szczegółowo

I. Cele Przedmiotowego Systemu Oceniania:

I. Cele Przedmiotowego Systemu Oceniania: Przedmiotowy System Oceniania (PSO) Język angielski kl.4-6 PSO stanowi załącznik do WSO i definiuje wymagania edukacyjne, sposoby ich realizacji oraz wszystkie inne kryteria oceniania nie zawarte w WSO.

Bardziej szczegółowo

Recenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność biznesu a dokonania przedsiębiorstwa

Recenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność biznesu a dokonania przedsiębiorstwa Prof. dr hab. Edward Nowak Uniwersytet Ekonomiczny we Wrocławiu Katedra Rachunku Kosztów, Rachunkowości Zarządczej i Controllingu Recenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność

Bardziej szczegółowo

MODELOWANIE I SYMULACJA Kościelisko, 19-23 czerwca 2006r. Oddział Warszawski PTETiS Wydział Elektryczny Politechniki Warszawskiej Polska Sekcja IEEE

MODELOWANIE I SYMULACJA Kościelisko, 19-23 czerwca 2006r. Oddział Warszawski PTETiS Wydział Elektryczny Politechniki Warszawskiej Polska Sekcja IEEE ODELOWANIE I SYULACJA Kościelisko, 9-3 czerwca 006r. Oddział Warszawski PTETiS Wydział Elektryczny Politechniki Warszawskiej Polska Sekcja IEEE SYSTE DO KOPUTEROWEGO ODELOWANIA I SYULACJI UKŁADÓW DYNAICZNYCH

Bardziej szczegółowo

WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW

WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW Uniwersytet Ekonomiczny we Wrocławiu WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW Wprowadzenie Wrażliwość wyników analizy wielokryterialnej na zmiany wag kryteriów, przy

Bardziej szczegółowo

TADEUSZ KWATER 1, ROBERT PĘKALA 2, ALEKSANDRA SALAMON 3

TADEUSZ KWATER 1, ROBERT PĘKALA 2, ALEKSANDRA SALAMON 3 Wydawnictwo UR 2016 ISSN 2080-9069 ISSN 2450-9221 online Edukacja Technika Informatyka nr 4/18/2016 www.eti.rzeszow.pl DOI: 10.15584/eti.2016.4.46 TADEUSZ KWATER 1, ROBERT PĘKALA 2, ALEKSANDRA SALAMON

Bardziej szczegółowo

Projekt przejściowy 2016/2017 BARTOSZ JABŁOŃSKI

Projekt przejściowy 2016/2017 BARTOSZ JABŁOŃSKI Projekt przejściowy 2016/2017 BARTOSZ JABŁOŃSKI Kto, co, jak i kiedy Kto? dr inż. Bartosz Jabłoński bartosz.jablonski@pwr.edu.pl s. P0.2, C-16 http://jablonski.wroclaw.pl O co chodzi? Celem przedmiotu

Bardziej szczegółowo

Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner

Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Elementy nieprzystające Definicja odrzucania Klasyfikacja

Bardziej szczegółowo

Program Wiarygodne Opinie 1 / 27

Program Wiarygodne Opinie 1 / 27 Program Wiarygodne Opinie 1 / 27 Wprowadzenie. Program Wiarygodne Opinie został przygotowany z myślą o Tobie i Twoich klientach. Jeśli przywiązujesz wagę do opinii na temat swojego sklepu i chcesz wzbudzać

Bardziej szczegółowo

-stopień celujący -stopień bardzo dobry:

-stopień celujący -stopień bardzo dobry: Zakres wymagań edukacyjnych niezbędnych do uzyskania poszczególnych ocen w wyniku klasyfikacji rocznej i śródrocznej z języka niemieckiego: -stopień celujący: uczeń w pełni rozumie wszystkie polecenia

Bardziej szczegółowo

Sposoby przedstawiania algorytmów

Sposoby przedstawiania algorytmów Temat 1. Sposoby przedstawiania algorytmów Realizacja podstawy programowej 5. 1) wyjaśnia pojęcie algorytmu, podaje odpowiednie przykłady algorytmów rozwiązywania różnych problemów; 2) formułuje ścisły

Bardziej szczegółowo

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction TTIC 31210: Advanced Natural Language Processing Kevin Gimpel Spring 2019 Lecture 9: Inference in Structured Prediction 1 intro (1 lecture) Roadmap deep learning for NLP (5 lectures) structured prediction

Bardziej szczegółowo

Omówienie wyników II części sprawdzianu po klasie szóstej 2015 r. - język angielski

Omówienie wyników II części sprawdzianu po klasie szóstej 2015 r. - język angielski Omówienie wyników II części sprawdzianu po klasie szóstej 2015 r. - język angielski Sprawdzian dla klas szóstych odbył się 1 kwietnia 2015 r. Część 2 zawierała zadania z języka obcego nowożytnego. Był

Bardziej szczegółowo

Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych

Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych Probabilistic Topic Models Jakub M. TOMCZAK Politechnika Wrocławska, Instytut Informatyki 30.03.2011, Wrocław Plan 1. Wstęp

Bardziej szczegółowo

Metody indeksowania dokumentów tekstowych

Metody indeksowania dokumentów tekstowych Metody indeksowania dokumentów tekstowych Paweł Szołtysek 21maja2009 Metody indeksowania dokumentów tekstowych 1/ 19 Metody indeksowania dokumentów tekstowych 2/ 19 Czym jest wyszukiwanie informacji? Wyszukiwanie

Bardziej szczegółowo