Automatyczna identyfikacja słów i fraz kluczowych algorytm RAKE
|
|
- Sabina Wójtowicz
- 5 lat temu
- Przeglądów:
Transkrypt
1 GŁADYSZ Anna 1 Automatyczna identyfikacja słów i fraz kluczowych algorytm RAKE WSTĘP Zagadnienie automatycznej identyfikacji słów i fraz kluczowych należy do grupy najistotniejszych problemów rozpatrywanych na gruncie eksploracyjnej analizy tekstów. Wypracowane w tym zakresie metody podzielić można na grupy, wśród których na szczególną uwagę zasługują metody: bazujące na macierzy częstości [3, 10], korzystające z dekompozycji macierzy częstości według wartości osobliwych [2], oparte na modelowaniu tematów [7], wykorzystujące wyniki klasyfikacji bezwzorcowej lub wzorcowej oraz oparte na teorii grafów [4].Do tej ostatniej grupy należy miedzy innymi algorytm RAKE (RapidAutomticKeywordExractionalgorithm) zaproponowany w [1, 9]. Celem algorytmu RAKE jest opracowanie skutecznej metody ekstrakcji słów lub fraz kluczowych, która działałaby na tekstach niezależnie od ich zakresu tematycznego oraz gramatyki języka, w którym zostały przygotowane. Do podstawowych cech algorytmu RAKE należy zaliczyć: zdolność do identyfikacji fraz, możliwość funkcjonowania na tekstach przygotowanych w dowolnych językach, niezależność od dziedziny zastosowań, brak konieczności korzystania z wiedzy zewnętrznej (jedynym elementem wymaganym poza analizowanym tekstem jest stop-lista), stosunkowo niewielka złożoność obliczeniowa. W artykule poddane zostało analizie działanie algorytmu RAKE. Przeprowadzona została także własna empiryczna analiza wybranych zbiorów dokumentów polskojęzycznych z wykorzystaniem algorytmu RAKE. Celem badania doświadczalnego było określenie skuteczności działania badanego algorytmu dla tekstów polskojęzycznych. 1 ANALIZA DZIAŁANIA ALGORYTMU RAKE Algorytm RAKE opiera się na spostrzeżeniu, że ręcznie określane frazy kluczowe często złożone są z wielu słów, ale zwykle pomijane są w nich słowa pełniące w większym stopniu funkcje gramatyczne niż leksykalne (np. się w języku polskim lub of w języku angielskim). Zbiór słów pomijanych we frazach kluczowych zwykle w dużym stopniu pokrywa się ze zbiorem tworzącym stop-listę [6]. Takie rozumowanie opiera się na założeniu, że są to słowa zbyt często i szeroko wykorzystywane przez użytkowników jako pomocnicze do analizy lub w zadaniach wyszukiwania. Słowa które niosą sens w dokumencie są opisane jako mające zawartość informacyjną i często określane są jako słowa treści. Potwierdzeniem tego jest rysunek 1, gdzie przeglądając ręcznie przypisane słowa kluczowe streszczenia można wyłonić tylko jedno słowo występujące na stop liście języka angielskiego (jest to słowo of). 1 Politechnika Rzeszowska im. Ignacego Łukasiewicza, Wydział Zarządzania; Rzeszów; al. Powstańców Warszawy 12. Tel: , anna.gladysz@prz.edu.pl 3930
2 Rys. 1.Przykład streszczenia artykułu z ręcznie określonymi słowami kluczowymi [1]. Frazy kluczowe, które określamy jako sekwencję jednego lub wielu słów zapewniają kompaktową reprezentacje treści dokumentu. Słowa i frazy kluczowe winny stanowić w skondensowanej formie zasadniczą treść dokumentu. Są one szeroko stosowane do definiowania zapytań w ramach systemów wyszukiwania informacji (Information Retrieval), ponieważ są łatwe do zdefiniowania, zmiany, zapamiętania i udostępniania [4]. Parametry wejściowe dla algorytmu RAKE zawierają stop listę, zestaw separatorów fraz, oraz zestaw ograniczników słów. RAKE używa stop listy i ograniczników fraz do partycjonowania tekstu dokumentu na kandydujące frazy kluczowe, które są spójną sekwencją słów treści występujących w tekście. 1.1 Kandydujące słowa kluczowe Algorytm RAKE rozpoczyna ekstrakcję słów i fraz kluczowych z dokumentu poprzez utworzenie zestawu kandydujących słów kluczowych. W pierwszym kroku tekst dokumentu zostaje podzielony na: wyrazy podział następuje w miejscu pojawienia się seperatora wyrazów, frazy będące sekwencją wyrazów ograniczaną na początku i końcu przez ograniczniki fraz. Utworzona lista fraz zawiera frazy kandydujące, które mogą stać się frazami kluczowymi. Rys. 2.Przeanalizowane kandydujące słowa kluczowe z przykładowego streszczenia [1]. Rysunek2 wskazuje kandydujące frazy kluczowe w kolejności, w której są przetwarzane z przykładowego streszczenia zobrazowanego na rysunku1. Na przykład fraza lineardiophantineequation (liniowe równanie diofantyczne) jako kandydująca fraza kluczowa zaczyna się po słowie ze stop listy (of), zaś kończy się przecinkiem. Po separatorze znajduje się następne słowo, które zaczyna kolejną kandydującą frazę kluczową przykładowego streszczenia. 1.2 Ocena słów kluczowych W kolejnym kroku analizowany jest zbiór wszystkich słów wyróżnionych w tekście. Dla każdej pary słów wyznacza się miernik określający liczbę fraz, w których te dwa słowa łącznie się pojawiły. Każde zidentyfikowane łączne pojawienie się słów w tej samej frazie zapamiętywane jest jako waga związana z krawędzią grafu, w którym wierzchołkami są poszczególne słowa. Graf ten pokazany jest w postaci macierzy sąsiedztwa na rysunku 3. Elementy występujące na głównej przekątnej macierzy wskazują na liczbę wystąpień danego słowa. 3931
3 Rys. 3.Graf współwystępowania słów do zawartości słów przykładowego streszczenia [1]. Następnie słowa oceniane są za pomocą miar wyznaczanych na podstawie macierzy sąsiedztwa. Autorzy algorytmu proponują następujące miary służące do oceny słów: częstotliwość słowa (freq (w)), stopień słowa (deg (w)), iloraz stopnia do częstotliwości (deg (w) / freq (w)). Wyniki metod pomiaru punktów obliczeniowych dla przykładowego tekstu streszczenia przedstawia rysunek 4. Rys. 4.Wyniki obliczeń dla poszczególnych słów występujących w grafie współwystępowania [1]. Podsumowując, pomiary wykorzystujące stopień słowa - deg(w) faworyzują słowa, które występują częściej. Słowa, które często występują niezależnie od liczby słów z którym współwystępują są preferowane przez pomiar częstotliwości słowa - freq(w). Słowa, które przeważnie występują z dłuższymi kandydującymi słowami kluczowymi są preferowane przez wskaźnik ilorazu stopnia do częstości - deg(w)/freq(w). Następnie obliczana jest liczba punktów dla fraz kluczowych. Jest ona obliczana jako suma miar wyznaczonych dla pojedynczych słów składających się na kandydującą frazę kluczową. 3932
4 1.3 Sąsiadujące słowa kluczowe Jedną z przyczyn, dla których algorytm RAKE wzbudził duże zainteresowanie jest jego zdolność do identyfikacji fraz kluczowych, w których występują słowa zawarte na stop liście, np. axis of evil (oś zła). W celu wykrycia fraz zawierających element pochodzący ze stop listy algorytm RAKE sprawdza, czy w dokumencie pojawia się przynajmniej dwukrotnie identyczna sekwencja złożona z dwóch fraz oddzielona jednym słowem pochodzącym ze stop listy. Jeśli odpowiedź na sformułowane pytanie jest pozytywna, to sekwencja ta staje się kandydującą frazą kluczową. Jej ocena jest równa sumie ocen łączonych fraz. Należy zauważyć, że dzięki słowom ze stop listy niektóre z tych połączonych słów kluczowych nabierają całkiem innego znaczenia niż poszczególne słowa składające się na kandydujące słowo kluczowe. Ponieważ sąsiadujące frazy kluczowe muszą wystąpić dwa razy w tej samej kolejności w dokumencie, ich ekstrakcja jest bardziej powszechna dla tekstów, które są dłuższe. 1.4 Uzyskane słowa kluczowe Ostatnim etapem analizy jest uszeregowanie kandydujących fraz kluczowych zgodnie z wartościami wyznaczonych dla nich mierników. Najlepiej ocenionych T fraz kandydujących jest wybrane jako frazy kluczowe dokumentu. T stanowi jedną trzecią liczby słów na grafie współwystępowania [5]. Przykładowy tekst zawiera w treści 28 słów, stąd T = 9 słów kluczowych. Rysunek 5 przedstawia listę słów kluczowych wyodrębnionych przez algorytm RAKE w porównaniu z wyznaczonymi ręcznie słowami kluczowymi dla przykładowego teksu. Rys. 5.Porównanie słów kluczowych uzyskanych algorytmem RAKE z ręcznie przypisanymi [1]. Z dziewięciu wyodrębnionych słów kluczowych, sześć pokrywa się, co oznacza, że dokładnie sześć z ręcznie wyznaczonych słów kluczowych odpowiada słowom wyznaczonym przez algorytm RAKE. Słowo kluczowe naturalnumbers jest podobne do słowa kluczowego set of naturalnumbers, jednak do celów omówienia uzyskanych wyników zostaną one pominięte. Analizując uzyskane wyniki można wyodrębnić trzy niepoprawnie wyodrębnione słowa kluczowe dla przykładowego tekstu, co w wyniku daje nam dokładność 67%. Porównując sześć prawdziwych wyników w zbiorze wyodrębnionych słów kluczowych z sumy siedmiu ręcznie przypisanych słów kluczowych, dokładność trafień wynosi 86%. Uzyskane wyniki procentowe świadczą o bardzo dobrej skuteczności algorytmu RAKE, który nie tylko przynosi korzyści ale także uwalnia zasoby obliczeniowe dla innych metod analitycznych. 3933
5 2 ZASTOSOWANIE ALGORYTMU RAKE DLA POLSKOJĘZYCZNYCH DOKUMENTÓW Podejmowane próby zastosowania algorytmu RAKE do analizy tekstów przygotowanych w języku polskim wskazują na kilka problemów związanych z jego zastosowaniem. Najistotniejszym z nich wydaje się być konieczność jednoczesnej analizy tekstu oryginalnego (aby odtworzyć prawidłową postać frazy) oraz tekstu złożonego z wyrazów w formie podstawowej (w celu zliczania wszystkich wystąpień fraz). Również należy zwrócić uwagę na potrzebę właściwego zdefiniowania separatorów fraz oraz oceny jakości fraz kandydujących. 2.1 Empiryczna analiza wybranych kolekcji dokumentów tekstowych W badaniu wykorzystane zostały kolekcje dokumentów tekstowych dotyczące streszczeń polskojęzycznych artykułów naukowych oraz opinii konsumenckich o danym produkcie telefonie komórkowym. Zestaw streszczeń artykułów zawiera także ręcznie przypisane przez autorów artykułów słowa kluczowe. Umożliwiają one określenie skuteczności zastosowania danej metody identyfikacji słów i fraz kluczowych. Należy jednak zauważyć, że czasami wybrane przez autora słowa kluczowe wynikają z analizy całej treści artykułu, nie zaś jego streszczenia. Wiąże się to z faktem występowania w słowach kluczowych fraz które nie są ani razu użyte w streszczeniu danego artykułu. Wybrany zestaw streszczeń artykułów pochodzi z Kongresu Statystyki Polskiej, który miał miejsce w 2012 roku. Opinie klientów danego modelu telefonu komórkowego zostały zaczerpnięte ze strony internetowej Zebranych zostało 100 opinii na temat wybranego modelu, zaś analiza słów kluczowych możliwa jest po uwzględnieniu dostępnych możliwości wyboru plusów i minusów dostępnych przy wystawianiu opinii przez klienta. Algorytm RAKE działa nie na zbiorze dokumentów, lecz na pojedynczych plikach, jednak wyniki można uzyskać automatycznie dla wszystkich plików z kolekcji dokumentów. Punktem wyjścia dla algorytmu RAKE było określenie parametrów wejściowych: stop-listy, zestawu separatorów fraz oraz ograniczników słów (m.in. spacja, przecinek, kropka). W tym celu dla analizowanych kolekcji opinii konsumenckich oraz streszczeń artykułów naukowych napisano skrypt, który dodawał znak. po tytule, w miejscu przejścia do nowej linii oraz na koniec dokumentu (jeśli brakowało). Skrypt został napisany w języku R. W pierwszym kroku tekst dokumentu podzielono na frazy będące sekwencją wyrazów ograniczaną na początku i końcu przez ograniczniki fraz. W kolejnym kroku analizowano zbiór wszystkich słów i fraz wyróżnionych w tekście. Dla każdego zdania wyznaczono miernik określający liczbę fraz, w których te frazy łącznie się pojawiły. Algorytm został zaimplementowany w języku Python w wersji [8]. Wykonano obliczenia dla kolekcji zarówno opinii konsumenckich jak i streszczeń artykułów naukowych bez redukcji słów do ich form podstawowych. Wynika to z faktu, iż redukcja do rdzenia spowodowałaby wystąpienie frazy w niepoprawnej formie. W tabeli 1 zestawiono uzyskane wyniki działania algorytmu RAKE dla przykładowych dwóch plików zawierających opinie konsumenckie na temat telefonu komórkowego. W tabeli 2 zestawiono uzyskane wyniki działania algorytmu RAKE dla przykładowego pliku zawierającego streszczenie artykułu naukowego. Tab. 1. Wyniki działania algorytmu RAKE dla przykładowego dokumentu zawierającego opinię konsumencką opracowanie własne. Wyniki działania algorytmu RAKE Tekst źródłowy Istotność Słowa i frazy kandydujace frazy Zakupiłem telefonik około miesiąca temu. Zapewne interesuje was opinia co i jak z telefonem. Telefon bardzo dobry w swojej trochę krótko trzyma bateria, posiadałem htc hd2, zakupiłem telefonik, 25,0 15,5 9,5 3934
6 klasie. Jest po prostu rewelacyjny. Wcześniej posiadałem HTC HD2 ale Samsung bije we wszystkich kategoriach. Szybki i co najważniejsze nie wiesza się. Trochę krótko trzyma bateria ale jest to minusem chyba wszystkich smartfonów. Jeżeli miał bym jeszcze raz dokonywać wyboru to kupił bym samsunga z zamkniętymi oczami. Polecam wszystkim ten telefon. Telefon idealny mam go już dwa tyg. i nie widzę żadnych wad lecz same zalety. Gorąco polecam. miesiąca temu, jeżeli miał bym, zamkniętymi oczami, kupił bym samsunga, dokonywać wyboru, widzę żadnych wad, telefon idealny, 4,0 4,0 Tab. 2. Wyniki działania algorytmu RAKE dla przykładowego dokumentu zawierającego streszczenie artykułu naukowego opracowanie własne. Wyniki działania algorytmu RAKE Tekst źródłowy edukacja, Słowa kluczowe statystyka społeczna, wskaźniki, Wykorzystanie wskaźników w obszarze edukacji w kontekście rozwoju polityki opartej na faktach. Artykuł ma na celu prezentacje i analizę wskaźników, które mogą być używane do monitorowania oraz ewaluacji polityki edukacyjnej w Polsce oraz efektów aktywności edukacyjnej. Analiza będzie się skupiać na istniejących źródłach danych, w tym danych administracyjnych (System Informacji Oświatowej) oraz dane z badan reprezentacyjnych, takich jak Badanie Aktywności Ekonomicznej Ludności, Badanie Dochodów i Warunków Życia (EU- SILC), badania międzynarodowe (badanie PISA, badanie Generation and GenderSurvey) oraz badania krajowe (np. Diagnoza Społeczna). Edukacja jest obszarem polityki publicznej, który ma wpływ na wiele obszarów rozwoju społecznego. W artykule chciała wskazać na określone grupy wskaźników z wybranych obszarów, zarówno z perspektywy indywidualnego uczestnictwa w edukacji i efektów tego uczestnictwa, jak również międzypokoleniowe aspekty aktywności edukacyjnej gospodarstw domowych. Pierwszym obszarem jest uczestnictwo w uczeniu się przez całe życie, w tym udział w edukacji dzieci i młodzieży, ale także uczenie się dorosłych w różnych formach uczenia się formalnego, pozaformalnego oraz nieformalnego. W tym celu ważne jest wskazanie uwagi na potrzebę Słowa i frazy kandydujace uwzględnione zostanie również międzypokoleniowy kontekst poziomu wykształcanie, tym również deprywacja gospodarstw domowych dotycząca możliwości uczestnictwa, również międzypokoleniowe aspekty aktywności edukacyjnej gospodarstw domowych, wskazane są rekomendacje dotyczące dalszego rozwoju statystyki edukacyjnej, analiza uwzględni również charakterystyki demograficzne (wiek, czwarty obszar dotyczy rozwoju kapitału ludzkiego osób, zależności pomiędzy aktywnością edukacyjna dzieci, drugi obszar uwzględnia powiazanie pomiędzy edukacją, uwzględniony zostanie również rola pracodawców, trzeci obszar uwzględnia zasoby gospodarstw domowych, również przechodzenie pomiędzy edukacja, istniejących źródłach danych, badanie aktywności ekonomicznej ludności, Istotność frazy 101, , , ,4 63, ,25 60, , , , , , ,7 3935
7 precyzyjnego zdefiniowania różnych form uczenia się tak, aby możliwe było ich właściwe monitorowanie. Uwzględnione zostanie również międzypokoleniowy kontekst poziomu wykształcanie, uwzględniając wpływ wykształcenia rodziców na wykształcenie dzieci. Analiza uwzględni również charakterystyki demograficzne (wiek, płeć, niepełnosprawność, stan cywilny). Drugi obszar uwzględnia powiazanie pomiędzy edukacją i rynkiem pracy. W szczególności, dotyczy to statusu na rynku pracy osób w zależności od wykształcenia, ale też zależności pomiędzy aktywnością edukacyjna dzieci i statusem rodziców na rynku pracy. Uwzględniony zostanie również rola pracodawców w organizowaniu uczenia się przez całe życie pracowników, jak również przechodzenie pomiędzy edukacja a rynkiem pracy. Trzeci obszar uwzględnia zasoby gospodarstw domowych i ich wykorzystanie na cele edukacyjne, w tym również deprywacja gospodarstw domowych dotycząca możliwości uczestnictwa w edukacji. Zwrócona zostanie uwaga zarówno na zasoby finansowe, jak i czasowe gospodarstw domowych przeznaczone na edukacje osób dorosłych oraz dzieci. Czwarty obszar dotyczy rozwoju kapitału ludzkiego osób, w tym ich umiejętności i kompetencji (językowych, ICT). Piąty obszar dotyczy terytorialnych aspektów polityki edukacyjnej, takich jak zróżnicowanie wyników edukacyjnych lub dostęp do wybranych usług edukacyjnych. W podsumowaniu wskazane są rekomendacje dotyczące dalszego rozwoju statystyki edukacyjnej, w tym rekomendacje badań mających na celu wypełnienie istniejących luk informacyjnych. wypełnienie istniejących luk informacyjnych, które mogą być używane, zwrócona zostanie uwaga zarówno, tym rekomendacje badań mających, badania międzynarodowe (badanie pisania, edukacje osób dorosłych, analiza będzie się skupiać, piąty obszar dotyczy terytorialnych aspektów, tym danych administracyjnych (system informacji, kontekście rozwoju polityki opartej, badanie generation and gendersurvey), czasowe gospodarstw domowych przeznaczone, tym ich umiejętności, że uczenie się dorosłych, aby możliwe był, aktywności edukacyjnej, zależności, całe życie pracowników, rynku pracy osób, wybranych usług edukacyjnych, edukacyjnych lub dostęp, formach uczenia się formalnego, 35, ,0 34,0 27, , ,75 25, ,5 25,5 24,75 24,5 24,5 24, , ,0 1 18,6 17, ,25 15,0 15,0 15,0 2.2 Ocena działania algorytmu RAKE W badaniu algorytmu RAKE dla dokumentów polskojęzycznych modelem bazowym słów jest listowy model dokumentu. Konieczność zastosowania listy w miejsce macierzy częstości wynika z potrzeby zachowania informacji o kolejności wyrazów w dokumencie.frazy istotne są wyznaczane niezależnie dla poszczególnych dokumentów. Nie ma możliwości wyznaczenia fraz istotnych dla całego zbioru dokumentów. Badania pokazały, że w przypadku opinii konsumenckich uzyskane frazy kluczowe w bardzo wysokim stopniu oddają sens i przesłanie opinii. W przypadku badania streszczeń artykułów naukowych algorytm RAKE wyodrębnia sporą ilość fraz pokazując ich mierniki. Bardzo ciężko na podstawie jego działania określić ich istotność w porównaniu ze słowami kluczowymi zaproponowanymi przez autora abstraktu. Wynika to z faktu, że większość słów kluczowych stanowią pojedyncze wyrazy. Nie ma informacji o frazach kluczowych autora abstraktu. 3936
8 Przeprowadzone badania wskazują na potrzebę dostosowania algorytmu do specyfiki języka polskiego i słownictwa właściwego dla obszaru zastosowań, z którego pochodzą analizowane dokumenty. WNIOSKI Należy pozytywnie ocenić funkcjonowanie algorytmu RAKE. Jednakże w przypadku jego zastosowania dużym utrudnieniem okazała się jego duża wrażliwość na zawartość stop-listy. Problemy z zastosowaniem tej metody w dużej mierze są wynikiem opracowania i implementowania badanego algorytmu dla tekstów anglojęzycznych. Specyfika języka polskiego jest zgoła odmienna i wymaga stworzenia wersji algorytmu dostosowanej do języka polskiego. Nie dokonano także porównania wyników działania algorytmu z frazami kluczowymi zaproponowanymi przez autora, bo takie nie zostały podane. Próby automatycznej analizy dokumentów tekstowych w zdecydowanej większości opierają się na identyfikacji słów i fraz kluczowych. Podejście takie bez wiedzy o zwyczajach językowych autoró w wypowiedzi, uwzględnienia specyfiki słów czy też kontekstowej zmienności znaczeń nastręcza wiele trudnych do rozwiązania problemów. W przypadku analizy tekstów polskojęzycznych dostępne narzędzia i możliwości jakie oferują od prostych po bardziej zaawansowane budujące ontologie pojęć lub też mające wbudowane zaawansowane algorytmy analizy składni nie przynoszą oczekiwanych rezultatów. Problemem jest nie tylko sposób kodowania polskich znaków, ale chyba co ważniejsze programy analizujące składnię. W świetle tych rozważań automatyzacja translacji tekstów w języku naturalnym na język formalny jest jednym z najbardziej pożądanych i obiecujących kierunków współczesnych badań. Streszczenie Frazy kluczowe, które są definiowane jako sekwencja kliku słów, zapewniają zwartą reprezentację treści danego dokumentu. Słowa i frazy kluczowe są powszechnie wykorzystywane w ramach systemów wyszukiwania informacji IR ponieważ są łatwe do zdefiniowania, zmiany, zapamiętania i udostępniania. Jednak pomimo ich przydatności do analizy, indeksowania i wyszukiwania większość dokumentów nie przypisuje automatycznie słów i fraz kluczowych. Rozwiązaniem może być algorytm RAKE niezależny od języka, prezentujący metodę ekstrakcji słów i fraz kluczowych z poszczególnych dokumentów. Podejmowane próby zastosowania algorytmu RAKE do analizy tekstów przygotowanych w języku polskim wskazują na kilka problemów związanych z jego zastosowaniem. Najistotniejszym z nich wydaje się być konieczność jednoczesnej analizy tekstu oryginalnego (aby odtworzyć prawidłową postać frazy) oraz tekstu złożonego z wyrazów w formie podstawowej (w celu zliczania wszystkich wystąpień fraz). Również należy zwrócić uwagę na potrzebę właściwego zdefiniowania separatorów fraz oraz oceny jakości fraz kandydujących. Próba rozwiązania wymienionych problemów stanowi główny cel artykułu. Automatic identification words and key phrases - RAKE algorithm Abstract Key phrases, which we define as a sequence of more words, provide a compact representation of a document s content. Keywords and key phrases are widely used to define queries within information retrieval (IR) systems as they are easy to define, revise, remember, and share. However, despite their utility for analysis, indexing, and retrieval, most documents do not have assigned automatically keywords and key phrases. The solution may be Rapid Automatic Keyword Extraction (RAKE), an unsupervised, domain-independent, and language-independent method for extracting keywords and key phrases from individual documents. Attempts to use RAKE algorithm to analyze texts in Polish indicate many problems associated with its use. The most important of them seems to be a need for simultaneous analysis of the original text (in order to reproduce the correct form of the phrase) and a text composed of words in primary forms (to count all occurrences of the phrase). Also, pay attention to the need to properly define separators phrases and quality evaluation of candidate phrases. Attempt to solve these problems is the main purpose of the article. 3937
9 BIBLIOGRAFIA 1. Berry M. W., Kogan J., Text Mining Applications and Theory. John Wiley & Sons Ltd, United Kingdom Deerwester S., Dumais S. T., Furnas G., Landauer T. K, Harshman R., Indexing by Latent Semantic Analysisis. Journal of the American Society for Information Science, 41(6), Hand D., Mannila H., Smyth P., Eksploracja danych. WNT, Warszawa Manning C., Schuetze H., Foundations of Statistical Natural Language Processing. The MIT Press, Mihalcea R., Tarau P., Textrank: Bringing order into texts.in Proceedings of EMNLP 2004 (ed, Lin D., Wu D.), Association for Computational Linguistics, Barcelona 2004, s Mykowiecka A, Inżynieria lingwistyczna. Komputerowe przetwarzanie tekstów w języku naturalnym. PJWSTK, Warszawa, Pang B., Lee L., Vaithyanathan S., Thumbs up? Sentiment Classification using Machine Learning Techniques. EMNLP, Perkins J., Python Text Processing with NLTK 2.0 Cookbook. Packt Publishing, Rose S., Engel D., Cramer N., Cowley W., Automatic Keyword Extraction from Individual Documents. M. W. Berry & J. Kogan (red.), Text Mining: Theory and Applications, John Wiley & Sons, 2010, s Salton G., Wong A., Yang C. S., A vector space model for automatic indexing. Communications of the ACM, vol, 18, 1975, s
SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
Bardziej szczegółowoWpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji cha- rakteru opinii konsumenckich. 1 Wstęp
mgr Katarzyna Wójcik mgr Janusz Tuchowski Uniwersytet Ekonomiczny w Krakowie Wpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji charakteru opinii konsumenckich. 1 Wstęp Analiza opinii
Bardziej szczegółowoText mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
Bardziej szczegółowoAnaliza korespondencji
Analiza korespondencji Kiedy stosujemy? 2 W wielu badaniach mamy do czynienia ze zmiennymi jakościowymi (nominalne i porządkowe) typu np.: płeć, wykształcenie, status palenia. Punktem wyjścia do analizy
Bardziej szczegółowoLokalizacja Oprogramowania
mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji
Bardziej szczegółowoWykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka
Wykaz tematów prac magisterskich w roku akademickim 2018/2019 kierunek: informatyka L.p. Nazwisko i imię studenta Promotor Temat pracy magisterskiej 1. Wojciech Kłopocki dr Bartosz Ziemkiewicz Automatyczne
Bardziej szczegółowoAiSD zadanie trzecie
AiSD zadanie trzecie Gliwiński Jarosław Marek Kruczyński Konrad Marek Grupa dziekańska I5 5 czerwca 2008 1 Wstęp Celem postawionym przez zadanie trzecie było tzw. sortowanie topologiczne. Jest to typ sortowania
Bardziej szczegółowoSystemy uczące się Lab 4
Systemy uczące się Lab 4 dr Przemysław Juszczuk Katedra Inżynierii Wiedzy, Uniwersytet Ekonomiczny 26 X 2018 Projekt zaliczeniowy Podstawą zaliczenia ćwiczeń jest indywidualne wykonanie projektu uwzględniającego
Bardziej szczegółowoSPOTKANIE 2: Wprowadzenie cz. I
Wrocław University of Technology SPOTKANIE 2: Wprowadzenie cz. I Piotr Klukowski Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.edu.pl 17.10.2016 UCZENIE MASZYNOWE 2/27 UCZENIE MASZYNOWE = Konstruowanie
Bardziej szczegółowoDobór optymalnego zestawu słów istotnych w opiniach konsumentów na potrzeby ich automatycznej analizy
Katarzyna Wójcik, Janusz Tuchowski Uniwersytet Ekonomiczny w Krakowie Dobór optymalnego zestawu słów istotnych w opiniach konsumentów na potrzeby ich automatycznej analizy Streszczenie. Analiza opinii
Bardziej szczegółowoPriorytetyzacja przypadków testowych za pomocą macierzy
Priorytetyzacja przypadków testowych za pomocą macierzy W niniejszym artykule przedstawiony został problem przyporządkowania priorytetów do przypadków testowych przed rozpoczęciem testów oprogramowania.
Bardziej szczegółowoInteraktywne wyszukiwanie informacji w repozytoriach danych tekstowych
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury
Bardziej szczegółowoBiblioteka Wirtualnej Nauki
Biblioteka Wirtualnej Nauki BAZA SCOPUS Scopus jest największą na świecie bibliograficzną bazą abstraktów i cytowań recenzowanej literatury naukowej, wyposażoną w narzędzia bibliometryczne do śledzenia,
Bardziej szczegółowoSKUTECZNOŚĆ WYSZUKIWANIA W INTERNECIE INFORMACJI ZWIĄZANYCH Z INŻYNIERIĄ ROLNICZĄ
Inżynieria Rolnicza 6(104)/2008 SKUTECZNOŚĆ WYSZUKIWANIA W INTERNECIE INFORMACJI ZWIĄZANYCH Z INŻYNIERIĄ ROLNICZĄ Michał Cupiał Katedra Inżynierii Rolniczej i Informatyki, Uniwersytet Rolniczy w Krakowie
Bardziej szczegółowoWYBÓR PUNKTÓW POMIAROWYCH
Scientific Bulletin of Che lm Section of Technical Sciences No. 1/2008 WYBÓR PUNKTÓW POMIAROWYCH WE WSPÓŁRZĘDNOŚCIOWEJ TECHNICE POMIAROWEJ MAREK MAGDZIAK Katedra Technik Wytwarzania i Automatyzacji, Politechnika
Bardziej szczegółowoPattern Classification
Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors
Bardziej szczegółowo10. Redukcja wymiaru - metoda PCA
Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component
Bardziej szczegółowoMonitoring procesów z wykorzystaniem systemu ADONIS
Monitoring procesów z wykorzystaniem systemu ADONIS BOC Information Technologies Consulting Sp. z o.o. e-mail: boc@boc-pl.com Tel.: (+48 22) 628 00 15, 696 69 26 Fax: (+48 22) 621 66 88 BOC Management
Bardziej szczegółowoHierarchiczna analiza skupień
Hierarchiczna analiza skupień Cel analizy Analiza skupień ma na celu wykrycie w zbiorze obserwacji klastrów, czyli rozłącznych podzbiorów obserwacji, wewnątrz których obserwacje są sobie w jakimś określonym
Bardziej szczegółowoŁączenie liczb i tekstu.
Łączenie liczb i tekstu. 1 (Pobrane z slow7.pl) Rozpoczynamy od sposobu pierwszego. Mamy arkusz przedstawiony na rysunku poniżej w którym zostały zawarte wypłaty pracowników z wykonanym podsumowaniem.
Bardziej szczegółowoSPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD
Dr inż. Jacek WARCHULSKI Dr inż. Marcin WARCHULSKI Mgr inż. Witold BUŻANTOWICZ Wojskowa Akademia Techniczna SPOSOBY POMIARU KĄTÓW W PROGRAMIE AutoCAD Streszczenie: W referacie przedstawiono możliwości
Bardziej szczegółowoLingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Bardziej szczegółowoZastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL. Łukasz Degórski
Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL Łukasz Degórski LT4eL Language Technology for e-learning Wykorzystanie narzędzi językowych oraz technik sieci
Bardziej szczegółowoPROBLEM ROZMIESZCZENIA MASZYN LICZĄCYCH W DUŻYCH SYSTEMACH PRZEMYSŁOWYCH AUTOMATYCZNIE STEROWANYCH
CZESŁAW KULIK PROBLEM ROZMIESZCZENIA MASZYN LICZĄCYCH W DUŻYCH SYSTEMACH PRZEMYSŁOWYCH AUTOMATYCZNIE STEROWANYCH Duże systemy przemysłowe, jak kopalnie, kombinaty metalurgiczne, chemiczne itp., mają złożoną
Bardziej szczegółowoData Mining Wykład 9. Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster. Plan wykładu. Sformułowanie problemu
Data Mining Wykład 9 Analiza skupień (grupowanie) Grupowanie hierarchiczne O-Cluster Plan wykładu Wprowadzanie Definicja problemu Klasyfikacja metod grupowania Grupowanie hierarchiczne Sformułowanie problemu
Bardziej szczegółowoWSPÓŁCZYNNIK GOTOWOŚCI SYSTEMU LOKOMOTYW SPALINOWYCH SERII SM48
TECHNIKA TRANSPORTU SZYNOWEGO Andrzej MACIEJCZYK, Zbigniew ZDZIENNICKI WSPÓŁCZYNNIK GOTOWOŚCI SYSTEMU LOKOMOTYW SPALINOWYCH SERII SM48 Streszczenie W artykule wyznaczono współczynniki gotowości systemu
Bardziej szczegółowoZapisywanie algorytmów w języku programowania
Temat C5 Zapisywanie algorytmów w języku programowania Cele edukacyjne Zrozumienie, na czym polega programowanie. Poznanie sposobu zapisu algorytmu w postaci programu komputerowego. Zrozumienie, na czym
Bardziej szczegółowoModelowanie jako sposób opisu rzeczywistości. Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka
Modelowanie jako sposób opisu rzeczywistości Katedra Mikroelektroniki i Technik Informatycznych Politechnika Łódzka 2015 Wprowadzenie: Modelowanie i symulacja PROBLEM: Podstawowy problem z opisem otaczającej
Bardziej szczegółowoWidzenie komputerowe (computer vision)
Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja
Bardziej szczegółowoWYMAGANIA EDUKACYJNE I KRYTERIA OCENIANIA UCZNIÓW Z JĘZYKA ROSYJSKIEGO
WYMAGANIA EDUKACYJNE I KRYTERIA OCENIANIA UCZNIÓW Z JĘZYKA ROSYJSKIEGO Ocenie podlegają wiadomości i umiejętności ujęte w programie nauczania w zakresie czterech sprawności językowych: słuchania, mówienia,
Bardziej szczegółowoZasady interpretacji Raportu antyplagiatowego
Zasady interpretacji Raportu antyplagiatowego Strona 1 z 8 Spis treści 1. Informacje ogólne... 3 2. Wskaźniki analizy antyplagiatowej... 4 3. Wskaźniki dodatkowe analizy antyplagiatowej... 5 4. Konflikty...
Bardziej szczegółowoAlgorytmy rozpoznawania obrazów. 11. Analiza skupień. dr inż. Urszula Libal. Politechnika Wrocławska
Algorytmy rozpoznawania obrazów 11. Analiza skupień dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. Analiza skupień Określenia: analiza skupień (cluster analysis), klasteryzacja (clustering), klasyfikacja
Bardziej szczegółowoĆwiczenie 1 Planowanie trasy robota mobilnego w siatce kwadratów pól - Algorytm A
Ćwiczenie 1 Planowanie trasy robota mobilnego w siatce kwadratów pól - Algorytm A Zadanie do wykonania 1) Utwórz na pulpicie katalog w formacie Imię nazwisko, w którym umieść wszystkie pliki związane z
Bardziej szczegółowoMetody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja
Bardziej szczegółowoSCENARIUSZ LEKCJI. Streszczenie. Czas realizacji. Podstawa programowa
Autorzy scenariusza: SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH
Bardziej szczegółowoBADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI
14 BADANIA ZRÓŻNICOWANIA RYZYKA WYPADKÓW PRZY PRACY NA PRZYKŁADZIE ANALIZY STATYSTYKI WYPADKÓW DLA BRANŻY GÓRNICTWA I POLSKI 14.1 WSTĘP Ogólne wymagania prawne dotyczące przy pracy określają m.in. przepisy
Bardziej szczegółowoAnaliza wybranych aspektów wyników egzaminu gimnazjalnego
Wroclaw Univesity of Economics From the SelectedWorks of Józef Z. Dziechciarz 2012 Analiza wybranych aspektów wyników egzaminu gimnazjalnego Jozef Z. Dziechciarz, Wroclaw Univesity of Economics Agnieszka
Bardziej szczegółowoRozdział 1 PROGRAMOWANIE LINIOWE
Wprowadzenie do badań operacyjnych z komputerem Opisy programów, ćwiczenia komputerowe i zadania. T. Trzaskalik (red.) Rozdział 1 PROGRAMOWANIE LINIOWE 1.2 Ćwiczenia komputerowe Ćwiczenie 1.1 Wykorzystując
Bardziej szczegółowoBiblioteka Wirtualnej Nauki
Biblioteka Wirtualnej Nauki BAZA EBSCO EBSCO Publishing oferuje użytkownikom w Polsce dostęp online do pakietu podstawowego baz danych w ramach projektu Electronic Information for Libraries Direct eifl
Bardziej szczegółowoPrzedmiotowy system oceniania z języka angielskiego obowiązujący od roku szkolnego 2009/2010 (nowa podstawa programowa)
Przedmiotowy system oceniania z języka angielskiego obowiązujący od roku szkolnego 2009/2010 (nowa podstawa programowa) Co i jak oceniamy na lekcjach języka angielskiego? kompetencje ucznia w zakresie
Bardziej szczegółowoMODELOWANIE STANÓW CZYNNOŚCIOWYCH W JĘZYKU SIECI BAYESOWSKICH
Inżynieria Rolnicza 7(105)/2008 MODELOWANIE STANÓW CZYNNOŚCIOWYCH W JĘZYKU SIECI BAYESOWSKICH Katedra Podstaw Techniki, Uniwersytet Przyrodniczy w Lublinie Streszczenie. Zastosowanie sieci bayesowskiej
Bardziej szczegółowoOcena kondycji finansowej organizacji
Ocena kondycji finansowej organizacji 1 2 3 4 5 6 7 8 Analiza płynności Analiza rentowności Analiza zadłużenia Analiza sprawności działania Analiza majątku i źródeł finansowania Ocena efektywności projektów
Bardziej szczegółowoSummary in Polish. Fatimah Mohammed Furaiji. Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling
Summary in Polish Fatimah Mohammed Furaiji Application of Multi-Agent Based Simulation in Consumer Behaviour Modeling Zastosowanie symulacji wieloagentowej w modelowaniu zachowania konsumentów Streszczenie
Bardziej szczegółowoZad. 3: Układ równań liniowych
1 Cel ćwiczenia Zad. 3: Układ równań liniowych Wykształcenie umiejętności modelowania kluczowych dla danego problemu pojęć. Definiowanie właściwego interfejsu klasy. Zwrócenie uwagi na dobór odpowiednich
Bardziej szczegółowoWydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych
Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie
Bardziej szczegółowoLiczbę 29 możemy zaprezentować na siedem różnych sposobów:
Numeryczna analiza rozkładu liczb naturalnych na określoną sumę liczb pierwszych Świerczewski Ł. Od blisko 200 lat matematycy poszukują odpowiedzi na pytanie zadane przez Christiana Goldbacha, który w
Bardziej szczegółowoOCENA EFEKTYWNOŚCI INWESTYCJI. Jerzy T. Skrzypek
OCENA EFEKTYWNOŚCI INWESTYCJI Jerzy T. Skrzypek 1 2 3 4 5 6 7 8 Analiza płynności Analiza rentowności Analiza zadłużenia Analiza sprawności działania Analiza majątku i źródeł finansowania Ocena efektywności
Bardziej szczegółowo1. Międzynarodowy program CLIL - kontekst edukacyjny i kulturowy...l5
Spis treści WSTĘP 9 1. Międzynarodowy program CLIL - kontekst edukacyjny i kulturowy...l5 1.1. Charakterystyka nauczania dwujęzycznego w Europie na poziomie szkoły podstawowej i ponadpodstawowej 15 1.2.
Bardziej szczegółowoPRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE
PRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE Rok szkolny: 2016/2017 Przedmiot/ty: język angielski dla liceum Nauczyciel/le: Oliwia Mróz, Swietłana Błażejczyk, Jakub Maćkowski Obszary PSO wynikające z
Bardziej szczegółowoKumulowanie się defektów jest możliwe - analiza i potwierdzenie tezy
Kumulowanie się defektów jest możliwe - analiza i potwierdzenie tezy Marek Żukowicz 14 marca 2018 Streszczenie Celem napisania artykułu jest próba podania konstruktywnego dowodu, który wyjaśnia, że niewielka
Bardziej szczegółowoPrzykłady grafów. Graf prosty, to graf bez pętli i bez krawędzi wielokrotnych.
Grafy Graf Graf (ang. graph) to zbiór wierzchołków (ang. vertices), które mogą być połączone krawędziami (ang. edges) w taki sposób, że każda krawędź kończy się i zaczyna w którymś z wierzchołków. Graf
Bardziej szczegółowoPRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE
PRZEDMIOTOWY SYSTEM OCENIANIA W ZSO W BIELAWIE Od roku szkolnego: 2015/2016 Przedmiot/ty: język angielski, język niemiecki dla liceum Nauczyciel/le: Swietłana Błażejczyk, Jakub Maćkowski, Sandra Sawa,
Bardziej szczegółowoBadania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle
Badania operacyjne: Wykład Zastosowanie kolorowania grafów w planowaniu produkcji typu no-idle Paweł Szołtysek 12 czerwca 2008 Streszczenie Planowanie produkcji jest jednym z problemów optymalizacji dyskretnej,
Bardziej szczegółowoProjekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego. II seminarium konsultacyjne.
Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego II seminarium konsultacyjne w ramach projektu Analiza czynników wpływających na zwiększenie ryzyka długookresowego
Bardziej szczegółowoSPRAWDZIAN W KLASIE VI SZKOŁY PODSTAWOWEJ W ROKU SZKOLNYM 2015/2016
SPRAWDZIAN W KLASIE VI SZKOŁY PODSTAWOWEJ W ROKU SZKOLNYM 2015/2016 CZĘŚĆ 1. JĘZYK POLSKI I MATEMATYKA ZASADY OCENIANIA ROZWIĄZAŃ ZADAŃ ARKUSZ SP-8 KWIECIEŃ 2016 Zadanie 1. (0 1) JĘZYK POLSKI TAK Zadanie
Bardziej szczegółowoXQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery
http://xqtav.sourceforge.net XQTav - reprezentacja diagramów przepływu prac w formacie SCUFL przy pomocy XQuery dr hab. Jerzy Tyszkiewicz dr Andrzej Kierzek mgr Jacek Sroka Grzegorz Kaczor praca mgr pod
Bardziej szczegółowoIdentyfikacja znamion ukrytego plagiatu. Z wykorzystaniem IDEA Caseware
Identyfikacja znamion ukrytego plagiatu Z wykorzystaniem IDEA Caseware Dzięki zastosowaniu w IDEI zaawansowanego modułu importu danych istnieje możliwość wykorzystania oprogramowania do identyfikacji tzw.
Bardziej szczegółowoWyszukiwanie dokumentów/informacji
Wyszukiwanie dokumentów/informacji Wyszukiwanie dokumentów (ang. document retrieval, text retrieval) polega na poszukiwaniu dokumentów tekstowych z pewnego zbioru, które pasują do zapytania. Wyszukiwanie
Bardziej szczegółowoProgramowanie dynamiczne cz. 2
Programowanie dynamiczne cz. 2 Wykład 7 16 kwietnia 2019 (Wykład 7) Programowanie dynamiczne cz. 2 16 kwietnia 2019 1 / 19 Outline 1 Mnożenie ciągu macierzy Konstruowanie optymalnego rozwiązania 2 Podstawy
Bardziej szczegółowoInstrukcje dla zawodników
Płock, 17 marca 2018 r. Instrukcje dla zawodników Arkusze otwieramy na wyraźne polecenie komisji. Wszystkie poniższe instrukcje zostaną odczytane i wyjaśnione. 1. Arkusz składa się z 3 zadań. 2. Każde
Bardziej szczegółowoEdukacja dla bezpieczeństwa. Przedmiotowy system oceniania
Edukacja dla bezpieczeństwa Przedmiotowy system oceniania 1.Ocenianiu podlegają: wiedza i umiejętności ucznia, wymienione niżej obszary aktywności ucznia, dodatkowe prace wykonane, zlecone przez nauczyciela.
Bardziej szczegółowoOdniesienie do efektów kształcenia dla obszaru nauk EFEKTY KSZTAŁCENIA Symbol
KIERUNKOWE EFEKTY KSZTAŁCENIA Wydział Informatyki i Zarządzania Kierunek studiów INFORMATYKA (INF) Stopień studiów - pierwszy Profil studiów - ogólnoakademicki Projekt v1.0 z 18.02.2015 Odniesienie do
Bardziej szczegółowoPraktyczne aspekty stosowania metody punktów funkcyjnych COSMIC. Jarosław Świerczek
Praktyczne aspekty stosowania metody punktów funkcyjnych COSMIC Jarosław Świerczek Punkty funkcyjne Punkt funkcyjny to metryka złożoności oprogramowania wyznaczana w oparciu o określające to oprogramowanie
Bardziej szczegółowoO czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich
O czym w Sejmie piszczy? Analiza tekstowa przemówień poselskich mgr Aleksander Nosarzewski Szkoła Główna Handlowa w Warszawie pod kierunkiem naukowym dr hab. Bogumiła Kamińskiego, prof. SGH Problem Potrzeba
Bardziej szczegółowoAutomatyczna klasyfikacja zespołów QRS
Przetwarzanie sygnałów w systemach diagnostycznych Informatyka Stosowana V Automatyczna klasyfikacja zespołów QRS Anna Mleko Tomasz Kotliński AGH EAIiE 9 . Opis zadania Tematem projektu było zaprojektowanie
Bardziej szczegółowoWYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI
WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI Stefan WÓJTOWICZ, Katarzyna BIERNAT ZAKŁAD METROLOGII I BADAŃ NIENISZCZĄCYCH INSTYTUT ELEKTROTECHNIKI ul. Pożaryskiego 8, 04-703 Warszawa tel. (0)
Bardziej szczegółowoTajemnice skutecznego wyszukiwania na przykładzie
Tajemnice skutecznego wyszukiwania na przykładzie Przeglądarka program otwierający wrota Internetu Wyszukiwarka a przeglądarka Wyszukiwarka program pozwalający wyszukiwać linki do stron WWW Kilka podstawowych
Bardziej szczegółowoWynik maksymalny Wynik minimalny Rozstęp Wynik średni 11,30 13,75 20,99. Łatwość zestawu 0,63 0,69 0,70
Raport z badania diagnostycznego uczniów klas czwartych 218 r. Zgodnie z Uchwałą Rady Pedagogicznej z dnia 17 czerwca 21 roku objęto badaniem diagnozującym stopień opanowania umiejętności polonistycznych,
Bardziej szczegółowoEmotiWord, semantyczne powiązanie i podobieństwo, odległość znaczeniowa
, semantyczne powiązanie i podobieństwo, odległość Projekt przejściowy ARR Politechnika Wrocławska Wydział Elektroniki Wrocław, 22 października 2013 Spis treści 1 językowa 2, kryteria 3 Streszczenie artykułu
Bardziej szczegółowoReprezentacje grafów nieskierowanych Reprezentacje grafów skierowanych. Wykład 2. Reprezentacja komputerowa grafów
Wykład 2. Reprezentacja komputerowa grafów 1 / 69 Macierz incydencji Niech graf G będzie grafem nieskierowanym bez pętli o n wierzchołkach (x 1, x 2,..., x n) i m krawędziach (e 1, e 2,..., e m). 2 / 69
Bardziej szczegółowoSposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
Bardziej szczegółowoKRYTERIA OCENIANIA KLASA I KLASA II KLASA III
KRYTERIA OCENIANIA II ETAP EDUKACYJNY - JĘZYK ANGIELSKI KLASA I KLASA II KLASA III DOPUSZCZAJĄCY: rozumie proste polecenia nauczyciela, poparte gestem; rozumie proste zwroty grzecznościowe i proste pytania;
Bardziej szczegółowoAnaliza skupień. Analiza Skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania
Analiza skupień W sztucznej inteligencji istotną rolę ogrywają algorytmy grupowania Analiza Skupień Elementy składowe procesu grupowania obiekt Ekstrakcja cech Sprzężenie zwrotne Grupowanie klastry Reprezentacja
Bardziej szczegółowoEfektywność Projektów Inwestycyjnych. 1. Mierniki opłacalności projektów inwestycyjnych Metoda Wartości Bieżącej Netto - NPV
Efektywność Projektów Inwestycyjnych Jednym z najczęściej modelowanych zjawisk przy użyciu arkusza kalkulacyjnego jest opłacalność przedsięwzięcia inwestycyjnego. Skuteczność arkusza kalkulacyjnego w omawianym
Bardziej szczegółowoSystem Korekty Tekstu Polskiego
System Korekty Tekstu Polskiego Plan prezentacji Geneza problemu i cele pracy Opis algorytmu bezkontekstowego Opis algorytmów kontekstowych Wyniki testów Wersja algorytmu dla języka hiszpańskiego Wnioski
Bardziej szczegółowoMaciej Piotr Jankowski
Reduced Adder Graph Implementacja algorytmu RAG Maciej Piotr Jankowski 2005.12.22 Maciej Piotr Jankowski 1 Plan prezentacji 1. Wstęp 2. Implementacja 3. Usprawnienia optymalizacyjne 3.1. Tablica ekspansji
Bardziej szczegółowoModelowanie niezawodności prostych struktur sprzętowych
Modelowanie niezawodności prostych struktur sprzętowych W ćwiczeniu tym przedstawione zostaną proste struktury sprzętowe oraz sposób obliczania ich niezawodności przy założeniu, że funkcja niezawodności
Bardziej szczegółowoREFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką
REFERAT PRACY DYPLOMOWEJ Temat pracy: Projekt i realizacja serwisu ogłoszeń z inteligentną wyszukiwarką Autor: Paweł Konieczny Promotor: dr Jadwigi Bakonyi Kategorie: aplikacja www Słowa kluczowe: Serwis
Bardziej szczegółowoINDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH
INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych
Bardziej szczegółowoWyszukiwanie informacji w internecie. Nguyen Hung Son
Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy
Bardziej szczegółowoIII TUTORIAL Z METOD OBLICZENIOWYCH
III TUTORIAL Z METOD OBLICZENIOWYCH ALGORYTMY ROZWIĄZYWANIA UKŁADÓW RÓWNAŃ LINIOWYCH Opracowanie: Agata Smokowska Marcin Zmuda Trzebiatowski Koło Naukowe Mechaniki Budowli KOMBO Spis treści: 1. Wstęp do
Bardziej szczegółowoInstrukcja interpretacji Raportu podobieństwa systemu Antyplagiat
Instrukcja interpretacji Raportu podobieństwa systemu Antyplagiat Użytkownik Indywidualny Raport podobieństwa: ułatwia ocenę samodzielności badanego tekstu, wskazuje liczbę zapożyczonych fragmentów i podaje
Bardziej szczegółowoŁAMIEMY SZYFR CEZARA. 1. Wstęp. 2. Szyfr Cezara w szkole. Informatyka w Edukacji, XV UMK Toruń, 2018
Informatyka w Edukacji, XV UMK Toruń, 2018 ŁAMIEMY SZYFR CEZARA Ośrodek Edukacji Informatycznej i Zastosowań Komputerów 02-026 Warszawa, ul. Raszyńska 8/10 {maciej.borowiecki, krzysztof.chechlacz}@oeiizk.waw.pl
Bardziej szczegółowo4.3 Grupowanie według podobieństwa
4.3 Grupowanie według podobieństwa Przykłady obiektów to coś więcej niż wektory wartości atrybutów. Reprezentują one poszczególne rasy psów. Ważnym pytaniem, jakie można sobie zadać, jest to jak dobrymi
Bardziej szczegółowoWymagania edukacyjne z języka niemieckiego w roku szkolnym 2017/2018. Kryteria Oceniania
Wymagania edukacyjne z języka niemieckiego w roku szkolnym 2017/2018 Kryteria Oceniania Przedmiotowy System Oceniania z języka niemieckiego jest zgodny z Wewnątrzszkolnym Systemem Oceniania (WSO), Rozporządzeniem
Bardziej szczegółowoPrzedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych i szczegółowych kryteriów oceniania wiedzy i umiejętności dla przedmiotu
Przedmiotowy system oceniania wraz z określeniem wymagań edukacyjnych i szczegółowych kryteriów oceniania wiedzy i umiejętności dla przedmiotu FIZYKA MEDYCZNA 1 Informacje wstępne 1. Nauczyciel ocenia
Bardziej szczegółowoI. Cele Przedmiotowego Systemu Oceniania:
Przedmiotowy System Oceniania (PSO) Język angielski kl.4-6 PSO stanowi załącznik do WSO i definiuje wymagania edukacyjne, sposoby ich realizacji oraz wszystkie inne kryteria oceniania nie zawarte w WSO.
Bardziej szczegółowoRecenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność biznesu a dokonania przedsiębiorstwa
Prof. dr hab. Edward Nowak Uniwersytet Ekonomiczny we Wrocławiu Katedra Rachunku Kosztów, Rachunkowości Zarządczej i Controllingu Recenzja rozprawy doktorskiej mgr Bartosza Rymkiewicza pt. Społeczna odpowiedzialność
Bardziej szczegółowoMODELOWANIE I SYMULACJA Kościelisko, 19-23 czerwca 2006r. Oddział Warszawski PTETiS Wydział Elektryczny Politechniki Warszawskiej Polska Sekcja IEEE
ODELOWANIE I SYULACJA Kościelisko, 9-3 czerwca 006r. Oddział Warszawski PTETiS Wydział Elektryczny Politechniki Warszawskiej Polska Sekcja IEEE SYSTE DO KOPUTEROWEGO ODELOWANIA I SYULACJI UKŁADÓW DYNAICZNYCH
Bardziej szczegółowoWIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW
Uniwersytet Ekonomiczny we Wrocławiu WIELOKRYTERIALNE PORZĄDKOWANIE METODĄ PROMETHEE ODPORNE NA ZMIANY WAG KRYTERIÓW Wprowadzenie Wrażliwość wyników analizy wielokryterialnej na zmiany wag kryteriów, przy
Bardziej szczegółowoTADEUSZ KWATER 1, ROBERT PĘKALA 2, ALEKSANDRA SALAMON 3
Wydawnictwo UR 2016 ISSN 2080-9069 ISSN 2450-9221 online Edukacja Technika Informatyka nr 4/18/2016 www.eti.rzeszow.pl DOI: 10.15584/eti.2016.4.46 TADEUSZ KWATER 1, ROBERT PĘKALA 2, ALEKSANDRA SALAMON
Bardziej szczegółowoProjekt przejściowy 2016/2017 BARTOSZ JABŁOŃSKI
Projekt przejściowy 2016/2017 BARTOSZ JABŁOŃSKI Kto, co, jak i kiedy Kto? dr inż. Bartosz Jabłoński bartosz.jablonski@pwr.edu.pl s. P0.2, C-16 http://jablonski.wroclaw.pl O co chodzi? Celem przedmiotu
Bardziej szczegółowoProblem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner
Problem eliminacji nieprzystających elementów w zadaniu rozpoznania wzorca Marcin Luckner Wydział Matematyki i Nauk Informacyjnych Politechnika Warszawska Elementy nieprzystające Definicja odrzucania Klasyfikacja
Bardziej szczegółowoProgram Wiarygodne Opinie 1 / 27
Program Wiarygodne Opinie 1 / 27 Wprowadzenie. Program Wiarygodne Opinie został przygotowany z myślą o Tobie i Twoich klientach. Jeśli przywiązujesz wagę do opinii na temat swojego sklepu i chcesz wzbudzać
Bardziej szczegółowo-stopień celujący -stopień bardzo dobry:
Zakres wymagań edukacyjnych niezbędnych do uzyskania poszczególnych ocen w wyniku klasyfikacji rocznej i śródrocznej z języka niemieckiego: -stopień celujący: uczeń w pełni rozumie wszystkie polecenia
Bardziej szczegółowoSposoby przedstawiania algorytmów
Temat 1. Sposoby przedstawiania algorytmów Realizacja podstawy programowej 5. 1) wyjaśnia pojęcie algorytmu, podaje odpowiednie przykłady algorytmów rozwiązywania różnych problemów; 2) formułuje ścisły
Bardziej szczegółowoTTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction
TTIC 31210: Advanced Natural Language Processing Kevin Gimpel Spring 2019 Lecture 9: Inference in Structured Prediction 1 intro (1 lecture) Roadmap deep learning for NLP (5 lectures) structured prediction
Bardziej szczegółowoOmówienie wyników II części sprawdzianu po klasie szóstej 2015 r. - język angielski
Omówienie wyników II części sprawdzianu po klasie szóstej 2015 r. - język angielski Sprawdzian dla klas szóstych odbył się 1 kwietnia 2015 r. Część 2 zawierała zadania z języka obcego nowożytnego. Był
Bardziej szczegółowoAnaliza zawartości dokumentów za pomocą probabilistycznych modeli graficznych
Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych Probabilistic Topic Models Jakub M. TOMCZAK Politechnika Wrocławska, Instytut Informatyki 30.03.2011, Wrocław Plan 1. Wstęp
Bardziej szczegółowoMetody indeksowania dokumentów tekstowych
Metody indeksowania dokumentów tekstowych Paweł Szołtysek 21maja2009 Metody indeksowania dokumentów tekstowych 1/ 19 Metody indeksowania dokumentów tekstowych 2/ 19 Czym jest wyszukiwanie informacji? Wyszukiwanie
Bardziej szczegółowo