TEXT MINING W ANALIZIE ZBIORÓW PUBLIKACJI NAUKOWYCH TEXT MINING IN ANALYSIS OF SCIENTIFIC PUBLICATIONS
|
|
- Ksawery Czerwiński
- 6 lat temu
- Przeglądów:
Transkrypt
1 ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ 2017 Seria: ORGANIZACJA I ZARZĄDZANIE z. 114 Nr kol Marcin WYSKWARSKI Politechnika Śląska Wydział Organizacji i Zarządzania marcin.wyskwarski@polsl.pl TEXT MINING W ANALIZIE ZBIORÓW PUBLIKACJI NAUKOWYCH Streszczenie. Często stosowaną form przechowywania informacji w organizacjach i społeczeństwie jest tekst. Tekst może zostać poddany eksploracji w celu pozyskania wcześniej nieznanej i użytecznej wiedzy. Celem niniejszego artykułu jest prezentacja wyników analizy wybranych publikacji naukowych. Analiza została przeprowadzona z wykorzystaniem text mining u, a jej celem było ustalenie jakich słów najczęściej używali autorzy publikacji, oraz obliczenie korelacji tych słów z innymi. Słowa kluczowe: text mining, chmura słów, publikacje naukowe TEXT MINING IN ANALYSIS OF SCIENTIFIC PUBLICATIONS Abstract. Text is often used to store information in organizations and society. Text can be explored to gain previously unknown and useful knowledge. The aim of this article is to present the results of the analysis of selected scientific publications. The analysis was done using text mining. Its purpose was to determine what words were most used by the authors, and to calculate the correlation of those words with others words. Keywords: text mining, word clouds, text mining, scientific publications 1. Wstęp Jedną z cech współczesnego świata są stale i szybko rosnące zasoby informacji. Często problemem nie jest już brak informacji lecz jej nadmiar. Wzrasta liczba zasobów informacyjnych organizacji gospodarczych, publicznych, społecznych ale również osób prywatnych. W obszarze nauki również zauważa się dynamiczny przyrost informacji gromadzonych w postaci publikacji naukowych. Fakt ten sprawia, że zapoznanie się z bieżącą
2 636 M. Wyskwarski literaturą dotycząca wybranego obszaru może okazać się bardzo trudne, lub wręcz niemożliwe. Jednym ze sposobów wspomagania analizy informacji przechowywanych w formie tekstu pisanego jest zastosowanie odpowiednich rozwiązań informatycznych, które pozwalają całkowicie, lub częściowo zautomatyzować proces przetwarzania i analizowania tekstu. Jednym z takich rozwiązań jest tzw. eksploracyjna analiza tekstu (ang. text mining), dzięki której można przyśpieszyć proces wydobywania informacji z zasobów tekstowych. Celem niniejszego artykułu jest prezentacja wyników analizy wybranych publikacji naukowych. Analiza została przeprowadzona z wykorzystaniem text mining u, a jej celem było wyszukanie najczęściej używanych słów, oraz ustalenie ich związku z innymi słowami. Adekwatnie do przyjętego celu podporządkowana została struktura pracy. W punkcie drugim przedstawiono podstawowe informacje związane z przeprowadzaniem analizy tekstu z wykorzystaniem text mining u. Punkt trzeci omawia sposób przeprowadzonej analizy, oraz prezentuje uzyskane wyniki. 2. Text mining - istota Text mining to stosunkowo młoda i interdyscyplinarna dziedzina. Wywodzi się m.in. z data mining, wyszukiwania informacji, kategoryzacji tekstu i modelowania probabilistycznego [4]. Według Marti Hearst text mining to "proces mający na celu wydobycie z zasobów tekstowych nieznanych wcześniej informacji" [3]. To metody, koncepcje oraz algorytmy przetwarzania zasobów tekstowych sporządzonych w językach naturalnych, które są implementowane w postaci programów komputerowych, co prowadzi do zautomatyzowania procesów przetwarzania dokumentów [2]. Zakres zastosowań text miningu jest dość rozległy. Według P. Lula najpopularniejsze obszary to pozyskiwanie informacji z dokumentów, identyfikacja wiadomości zawierających określone treści, generowanie streszczeń, klasyfikacja wzorcowa, klasyfikacja bezwzorcowa (grupowanie, klasteryzacja), identyfikacja powiązań, wizualizacja oraz generowanie odpowiedzi na pytanie [5]. A. Tan podaje, że 80% informacji przedsiębiorstw jest przechowywanych w dokumentach tekstowych, co przyczynia się do ciągłego zainteresowania tą tematyką [7]. Na popularność text miningu wpływa również nieustanny rozwój Internetu i towarzyszący mu wzrost znaczenia opiniotwórczej roli portali społecznościowych [1]. Duża część rozwiązań text miningowych nie analizuje znaczenia wyrazów oraz zdań, lecz próbuje wykryć reguły i prawidłowości dotyczące występowania określonych ciągów znaków czyli słów. W dużym uproszczeniu proces analizy tekstu można podzielić na trzy części tj.
3 Text mining w analizie zbiorów publikacji naukowych 637 wstępne przetwarzanie tekstu, budowę macierzy częstości występowania słów oraz wykorzystanie klasycznych metod pochodzących z obszaru data mining [2]. Wstępne przetwarzanie tekstu polega na przekształceniu dokumentu tekstowego (dokumentów tekstowych) w listę wyrazów określanych mianem worka słów (ang. bag of words). Pomijane są informacje o kolejności słów i związkach pomiędzy nimi, przyjmuje się, że wystąpienia słów są niezależne od siebie [2]. Z dokumentu tekstowego usunięte zostają cyfry, oraz wszelkie znaki interpunkcyjne (np. kropki, przecinki, średniki, myślnik). W kolejnym kroku bez szkody dla jakości analizy, dzięki tzw. stop-liście (ang. stop-words) usunięte zostają słowa nie wnoszące dodatkowych informacji (usunięte zostają m.in. spójniki, przyimki itp.). Usunięciu mogę ulec również inne nieprzydatne w analizie słowa, tzn. występujące bardzo rzadko (ang. least frequent ) bądź bardzo często (ang. most frequent) - tzw. przycinanie (ang. pruning). W celu przekształcenia różnych form tego samego słowa do wersji uznawanej za podstawową stosuje się tzw. ekstrakcję rdzeni słów (ang. stemming) oraz lematyzację. Stemming polega na wybraniu z danego słowa, części niezmiennej dla wszystkich form gramatycznych czyli tzw. rdzenia (to usunięcie wszelkiego rodzaju przedrostków i przyrostków). Lematyzacja to natomiast analiza morfologiczna umożliwiająca znalezienie podstawowej formy danego wyrazu tj. identyfikacji leksemu (np. czasownik zostaje przekształcony do bezokolicznika, a rzeczownik do mianownika liczby pojedynczej). Do przeprowadzenia lematyzacji niezbędny jest słownik lub rozbudowany zestaw reguł fleksyjnych dla danego języka. Inna możliwą do wykonania operacją podczas wstępnego przetwarzania tekstu jest tagowanie (ang. tagging), które polega na wyborze odpowiedniego opisu morfoskładniowego [6]. Budowa macierzy częstości występowania słów wykorzystuje tzw. model przestrzeni wektorowej (ang. Vector Space Model), w którym dokumenty i występujące w nich słowa są reprezentowane w postaci macierzy. Każdy analizowany dokument jest reprezentowany przez osobny wektor przedstawiający liczbę wystąpień poszczególnych słów [2, 6]. Macierzową postać reprezentacji dokumentów oraz związanych z nimi słów określa się macierzą dokumentów-wyrażeń (ang. document - term matrix). Jej wiersze reprezentują analizowane dokumenty, a kolumny znajdujące się w nich słowa 1. W zależności od przyjętego sposobu kodowania informacji w elementach macierzy, istniej możliwość uzyskania różnych odmian reprezentacji przestrzenno-wektorowej tekstu. Wśród często stosowanych wymienia się reprezentację boolowska (binarna), częstotliwościową występowania wyrażeń (ang. term frequency - TF), odwrotnej częstości dokumentu (ang. inverse-documentfrequency IDF), mieszaną TF-IDF, logarytmiczną, ważoną logatytmiczną, okapi BM25 [6]. W lingwistyce informatycznej spotyka się także określenie korpus dokumentów. Korpus jest kolekcją 1 Utworzona może zostać także tzw. macierz wyrażeń-dokumentów (ang. term - document matrix), w której dokumenty są prezentowane przez kolumny, a słowa przez wiersze.
4 638 M. Wyskwarski dokumentów, które będą analizowane. Na jego podstawie tworzona jest macierz dokumentów-wyrażeń lub macierz wyrażeń-dokumentów. Po wstępnym przetwarzaniu tekstu i utworzeniu macierzy częstości występowania słów, można przejść do kolejnych czynności związanych z analizowanym tekstem np. do grupowania dokumentów tekstowych (tzw. klasteryzacji), obliczenia częstości występowania słów, korelacji między używanymi słowami, wizualizacji przeprowadzonych obliczeń itd. 3. Analiza text minig wybranych zeszytów naukowych serii Organizacja i Zarządzanie Analizie poddano zawartość trzech zeszytów naukowych serii Organizacja i Zarządzanie. Zeszyty zostały opublikowane w 2016 r. i miały zbliżoną liczbę artykułów. Przeanalizowano tylko artykuły, których językiem podstawowym był język polski. Tabela 1 Informacja o zeszytach naukowych poddanych analizie Information about the scientific papers analyzed Nr zeszytu naukowego Liczba artykułów w zeszycie Liczba artykułów wybranych do analizy W opracowaniu przeprowadzono podstawową analizę tekstu, której celem było: - wyszukanie najczęściej używanych słów - przedstawiono je w postaci wykresu słupkowego prezentującego liczbę użytych słów, oraz tzw. chmury słów, - określenie związku najczęściej używanych słów z innymi słowami (na bazie współczynnika korelacji). Z artykułów utworzono cztery oddzielnie analizowane korpusy. Korpus pierwszy stanowiły artykuły z zeszytu nr 89, korpus drugi z zeszytu 95 a korpus trzeci z zeszytu 97. Korpus czwarty objął artykuły wchodzące w skład korpusów 1, 2 i 3. Liczbę artykułów poddanych analizie przedstawia tabela 1. Pominięto trzy artykuły z zeszytu nr 97, gdyż zostały one opublikowane w języku angielskim. W przeprowadzonej analizie zostały wykorzystane następujące aplikacje: - JDownloader - niezależna, open source'owa platformowa programowa do pobierania plików z Internetu;
5 Text mining w analizie zbiorów publikacji naukowych Free PDF to Text Converter - program firmy Free PDF Solutions Inc przeznaczony do zmiany formatu plików, - Notepad++ v edytor tekstu, - RStudio v zintegrowane środowisko programistyczne dla języka R. Aplikacja JDownloader została wykorzystana do automatycznego pobrania plików pdf z artykułami, które zostały zamieszone na stronie własnej Zeszytów Naukowych Politechniki Śląskiej Seria Organizacja i Zarządzanie 2. Za pomocą aplikacji Free PDF to Text zmieniono format plików artykułów z pdf na txt. Format plików został zmieniony z dwóch powodów: - problemów z poprawnym odkodowaniem polskich znaków podczas tworzenia korpusów w aplikacji RStudio na podstawie plików pdf, - uzyskania możliwości oczyszczania dokumentów ze zbędnych nieprzydatnych fragmentów. Do wstępnego oczyszczenia dokumentów posłużyła aplikacja Notepad++, w której skorzystano z mechanizmu wyrażeń regularnych (ang. regular expressions) i możliwości tworzenia makr automatyzujących ten proces. Za pomocą makr połączono w całość słowa, które były w dwóch częściach w wyniku wcześniejszego zastosowania podziału wyrazów, oraz usunięto: - zawartość nagłówka i stopki, - tytuł, streszczenia i słowa kluczowe napisane w języku angielskim, - spis literatury, - dane osobowe autora/autorów oraz afiliację, - słowa uznane w tej analizie przez autora za tzw. sotp word s: m.in. słowa wstęp, zakończenie, streszczenie, podsumowanie stanowiące tytuły rozdziałów, słowa tabela, rysunek, tab., rys (oraz ich odpowiedniki w języku angielskim), które znajdowały się w tytułach tabel i rysunków, słowo źródło znajdujące się pod rysunkiem / tabelą 3. Dalsze operacje czyszczenia dokumentów przeprowadzono z wykorzystaniem aplikacji RStudio. Za pomocą wyrażeń regularnych usunięto wszystkie znaki z wyjątkiem liter, zamieniono duże litery na małe, a następnie podzielono zawartość dokumentu w taki sposób, aby każdy wyraz znajdował się w osobnej linii. Kolejne działania również zostały przeprowadzone w aplikacji RStudio. Istotnym zagadnieniem było sprowadzenie słów do ich podstawowej formy oraz usunięcie tzw. stopword s. Niesyty funkcje pakietu TM (opracowanego do przeprowadzania analizy Text Mining w języku R) nie zapewniają operacji stemming u, lematyzacji oraz usunięcia stop- 2 adres www strony to: 3 nie było usuwane słowo źródło znajdujące się w treści danego artykuł, np. ze zdania Opinie klientów są istotnym źródłem informacji dla przedsiębiorstwa.
6 640 M. Wyskwarski word s dla języka polskiego. W związku z powyższym w celu przekształcenia słów do ich formy podstawowej wykorzystano słownik morfosyntaktyczny polimorfologik 2.1 udostępniony na portalu Github 4. Słownik ten stanowi zwykły plik tekstowy w kodowaniu UTF-8 o formacie: forma podstawowa; forma odmieniona; znaczniki gramatyczne. Po prawidłowym zaimportowaniu pliku do programu RStudio zawartość pliku może przyjąć postać tabeli składającej się trzech kolumn. W momencie korzystania ze słownika miał on linii tekstu 5. W tabeli 2 przedstawiono przykładowe trzy wyrazy z tego pliku (zestaw użytych znaczników gramatycznych został przez autorów opisany w dokumentacji). Tabela 2 Struktura pliku polimorfologik 2.1 Forma Forma Znaczniki gramatyczne podstawowa odmieniona projektowy projektowo adja projekt projektu subst:sg:gen:m3 projektujący projektującemu adj:sg:dat:m1.m2.m3.n1.n2:pos+subst:sg:dat:m1 Przekształcenie słowa do postaci podstawowej polegało na odszukaniu go w kolumnie Forma odmieniona i jego zamianie na słowo znajdujące się w tym samym wierszu, w kolumnie Forma podstawowa. Dzięki znacznikom gramatycznym do dalszej analizy zostały wybrane rzeczowniki oraz przymiotniki. Jeżeli dane słowo nie zostało odnalezione w kolumnie Forma odmieniona to do dalszej analizy przechodziło w niezmienionej formie (dlatego występujące w tekście słowa w języku innym niż polski nie zostały usunięte) - w tym przypadku nie uwzględniano także formy gramatycznej danego słowa. W celu usunięcia tzw. stop-word s utworzono własną listę tych słów dla języka polskiego składającą się z 407 słów. Wykorzystano listy zamieszczone w Internecie 6 oraz słowa wytypowane przez autora tej analizy (np. m.in. liczebniki pierwszy, pierwszym, pierwszego itd.). Rys. 1. Fragment macierzy dokumentów-wyrażeń dla korpusu 1 Kolejnym krokiem było utworzenie czterech korpusów, dla których wykonano macierze dokumentów-wyrażeń (ang. document - term matrix) z częstotliwościową reprezentacją występowania wyrażeń (ang. term frequency - TF). Na rysunku 1 przedstawiono fragment maj np. lista ze strony
7 Text mining w analizie zbiorów publikacji naukowych 641 macierzy dokumentów-wyrażeń 7 utworzonej dla korpusu 1, czyli artykułów z zeszytu nr 89. Przedstawia ona liczbę wystąpień poszczególnych słów w danych artykułach np. w artykule (tj. artykuł 37 z zeszytu 89) wystąpiło 4 razy słowo inspekcja oraz 2 razy słowo inspektor a w artykule raz słowo inspirowanie. Następnie dla każdego korpusu obliczono liczbę najczęściej występujących słów oraz ich korelację z innymi słowami. Wyniki zaprezentowano na rysunkach nr 3, 4, 5 i 6. Rys. 2. Przykładowe macierz dokumentów-wyrażeń oraz wartość korelacji dla słowa auto Korelacja pomiędzy słowami została obliczona za pomocą funkcji findassocs() bazującej na standardowej funkcji cor() z pakietu statystycznego języka R. Na rys. 2 przedstawiono przykładowe dwie macierze dokumentów-wyrażeń oraz obliczoną wartość korelacji dla słowa auto z wykorzystanikolem funkcji findassocs(). W macierzy przedstawionej po lewej stronie rys. 2 słowa wystąpiły tylko raz w danym dokumencie. W macierzy przedstawionej po prawej stronie rys. 2 niektóre ze słów wystąpiły częściej niż jeden raz (np. słowo dom wystąpiło 3 razy w dokumencie nr 4, 2 razy w dokumencie nr 5, oraz 1 raz w dokumencie nr 3 i nr 6). W związku z innymi wartościami tych dwóch macierzy wartość korelacji słowa auto ze słowami dom oraz piłka jest inna. Wartość korelacji równa 1 oznacza, że dane dwa słowa zawsze występują razem w dokumentach. Wartość 0 oznacza, że słowa nigdy nie wystąpiły razem. Prawa górna część rysunków nr 3, 4, 5 oraz 6 przedstawia w postaci tzw. chmury słów 8, pięćdziesiąt najczęściej używanych słów. Wielkość słów zależy od liczby wystąpień danego słowa. Im dane słowo częściej występowało w analizowanym korpusie tym jest większe. Doskonale widać to na chmurze słów wykonanej dla zeszytu nr 95 (rys.4), gdzie górują słowa społeczny oraz rozwój wstąpiły one odpowiednio 768 i 687 razy. W dolnej części rysunków nr 3, 4, 5 oraz 6 przedstawiono dla ośmiu najczęściej używanych słów ich związek (na bazie obliczonego współczynnika korelacji) z innymi słowami użytymi w danym korpusie. Lewa strona przedstawia korelację dla pierwszych 7 Oryginalna macierz ma rozmiary 42 x (42-dokumenty, wyrażeń (słów)). 8 Chmury słów były tworzone z zastosowaniem tych samych parametrów dla wszystkich korpusów.
8 642 M. Wyskwarski czterech, najczęściej używanych słów a prawa dla kolejnych czterech. Na przykład słowo badanie (551 użyć), czyli czwarte najczęściej używane słowo w ZN nr 89 (rys. 3), miało największą korelację ze słowami jakościowy, ilościowy, interpretacja, badawczy itd. 9 Rys. 3. Analiza korpusu nr 1 9 znajdujące się obok tych słów liczby informują ile razy dane słowo zostało użyte w korpusie np. słowo jakościowy a ilościowy - 49 razy.
9 Text mining w analizie zbiorów publikacji naukowych 643 Wartość korelacji dla słowa badanie przedstawia znak +, słowa projekt znak, słowa przedsiębiorstwo znak a słowa proces znak. Dla lepszej przejrzystości, dane na wykresie posortowano w porządku malejącym według liczby wystąpień danego słowa w korpusie, a następnie według wartości jego korelacji z innymi słowami. Rys. 4. Analiza korpusu nr 2
10 644 M. Wyskwarski Rys. 5. Analiza korpusu nr 3 Według wyników przedstawionych na rys. 6 najczęściej używanym, przez autorów słowem w korpusie nr 4 było przedsiębiorstwo. Słowo to było również najczęściej używanym słowem w korpusie nr 3 (rys. 5). W korpusie nr 1 było na miejscu drugim (rys. 3) a w korpusie nr 2 na miejscu czternastym (rys. 4). Drugie najczęściej używane słowo
11 Text mining w analizie zbiorów publikacji naukowych 645 z korpusu nr 4 to słowo proces. Było ono na miejscu trzecim w korpusie nr 1 (rys. 3) i nr 2 (rys. 4) oraz na piątym w korpusie nr 3 (rys. 5). Rys. 6. Analiza korpusu nr 4 Warto również przyjrzeć się korelacji najczęściej używanych słów. Na przykład gdy w artykule wystąpiło słowo projekt (rys. 3) to używane były również m.in. takie słowa jak projektowy, sukces, interesariusze, kierownik, zespół, gdy wystąpiło słowo
12 646 M. Wyskwarski przedsiębiorstwo (rys. 3) to towarzyszyły mu m.in. słowa biznesowy, handlowy, minimalizacja, partner, usługowy a ze słowem rozwój (rys. 4) występowały m.in. słowa zrównoważony i ekologiczny. Na rys. 6 można zauważyć że dwa najczęściej używane słowa z korpusu nr 4 czyli przedsiębiorstwo i proces, są równocześnie skorelowane ze słowami logistyczny (ikony nakładają się na siebie) i operacyjny (dwie ikony w jednej linii) - jedyny taki przypadek na prezentowanych wykresach. Autorami części artykułów analizowanych w ramach korpusu nr 2 byli pracownicy Katedry Stosowanych Nauk Społecznych Wydziału Organizacji i Zarządzania Politechniki Śląskiej. Ten fakt a raczej zainteresowania badawcze autorów spowodowały, że najczęściej używanym słowem w tym korpusie było słowo społeczny. W korpusie nr 1 autorami części publikacji byli pracownicy Instytutu Zarządzania, Administracji i Logistyki wspomnianego wydziału. Jak wynika z analizy część autorów zajmuje się najprawdopodobniej tematyką zarządzania projektami, zarządzania wiedzą, zarządzaniem przedsiębiorstwem. Autorami części artykułów wchodzących w skład korpusu nr 3 byli natomiast pracownicy Instytutu Ekonomii i Informatyki w/w wydziału. Z utworzonej dla tego korpusu chmury słów można wnioskować, że zainteresowania badawcze autorów są generalnie skupione na badaniu przedsiębiorstw. Oczywiście w skład każdego z analizowanych korpusów wchodziły także artykuły osób prowadzących badania w ramach zewnętrznych jednostek naukowych. Ponieważ część zeszytów naukowych jest efektem ubocznym organizowanych konferencji i seminariów naukowych to można przyjąć, że zainteresowania badawcze autorów z zewnętrznych jednostek naukowych i autorów z Wydziału Organizacji i Zarządzania w ramach danego korpusu dotyczyły wspólnych obszarów tematycznych. 4. Zakończenie Przeprowadzona analiza text mining pozwoliła pozyskać nowe wcześniej nie znane informacje na temat analizowanych publikacji. Uzyskano informacje na temat liczby najczęściej używanych słów oraz ich korelacji z innymi słowami, które przedstawiono w formie graficznej. Przeprowadzając tego typu analizę trzeba podjąć kilka istotnych decyzji. Jedną z nich jest np. pytanie: Czy usunąć ewentualne synonimy? Czy słowo przedsiębiorstwo powinno zostać scalone w jedno słowo, ze słowem organizacja? Słowo organizacja (rys. 6) mogło przecież zostać użyte w różnych kontekstach. Mogło występować jako rzeczownik np. organizacja gospodarcza (i w tym przypadku mogłoby zostać potraktowane jako synonimi
13 Text mining w analizie zbiorów publikacji naukowych 647 słowa przedsiębiorstwo ) ale również jak czasownik w wyrażeniu organizacja zespołu projektowego. Istotnym zagadnieniem jest także stworzenie listy tzw. stop-words, w celu usunięcia nieprzydatnych w analizie słów w przedstawionej analizie usunięto np. słowo źródło użyte w celu wskazania pozycji literaturowej. W przypadku analizy tekstu w języku polskim należy również rozważyć co zrobić ze znajdującymi się w treści słowami w języku obcym np. business intelligence usunąć, zostawić, a może przetłumaczyć na język polski. Bibliografia 1. Berry, M.W., Kogan, J.: Text mining: applications and theory. John Wiley & Sons Gładysz A., Zastosowanie metod eksploracyjnej analizy tekstu w logistyce., Logistyka No 3, 2012, s Hearst M.A.: Untangling Text Data Mining, Proceedings of ACL'99: the 37th Annual Meeting of the Association for Computational Linguistics, University of Maryland, June 20-26, Dostępny : 4. Kao A., Poteet S.: Natural Language Processing and Text Mining, London, Springer Lula P., Text mining jako narzędzie pozyskiwania informacji dokumentów tekstowych Dostępny : wania.pdf. 6. Mirończuk M.: Przegląd metod i technik eksploracji danych tekstowych." Studia i Materiały Informatyki Stosowanej, Tom 4, Nr 6, Tan A.: Text Mining: The state of the art and the challenges, Pacific Asia Conference on Knowledge Discovery and Data Mining PAKDA
KOMPETENCJE KIEROWNIKÓW PROJEKTÓW ANALIZA TEXT MINING
W Y D A W N I C T W O P O L I T E C H N I K I Ś L Ą S K I E J W G L I W I C A C H ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ 2018 Seria: ORGANIZACJA I ZARZĄDZANIE z. 130 KOMPETENCJE KIEROWNIKÓW PROJEKTÓW ANALIZA
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
Semantyczne podobieństwo stron internetowych
Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana
Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych
Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie
EKSPLORACJA DANYCH TEKSTOWYCH (TEXT MINING) W PRZEDSIĘBIORSTWIE (TEXT MINING METHODS AND APPLICATIONS IN THE ENTERPRISE)
KAROLINA KULIGOWSKA MIROSŁAWA LASEK Katedra Informatyki Gospodarczej i Analiz Ekonomicznych Uniwersytet Warszawski, Wydział Nauk Ekonomicznych (TEXT MINING METHODS AND APPLICATIONS IN THE ENTERPRISE) Streszczenie
PRZEWODNIK PO PRZEDMIOCIE
Nazwa przedmiotu Kierunek PRZEWODNIK PO PRZEDMIOCIE Metody prezentacji informacji Logistyka Forma studiów niestacjonarne Poziom kwalifikacji I stopnia Rok 2 Semestr 3 Jednostka prowadząca Instytut Logistyki
Imię Nazwisko, Imię Nazwisko 1 Uczelnia/Firma. Imię Nazwisko 2 Uczelnia/Firma. Tytuł artykułu
Imię Nazwisko, Imię Nazwisko 1 Uczelnia/Firma Imię Nazwisko 2 Uczelnia/Firma Tytuł artykułu Tekst artykułu należy pisać przy użyciu edytora zgodnego z MS WORD 2003, 2007, 2010. Do pisania podstawowego
CAŁOŚĆ OPRACOWANIA POWINNA ZAWIERAĆ MAKSYMALNIE 10 STRON.
CAŁOŚĆ OPRACOWANIA POWINNA ZAWIERAĆ MAKSYMALNIE 10 STRON. REDAKCJA NIE INGERUJE W ZAWARTOŚĆ MERYTORYCZNĄ NADESŁANYCH ARTYKUŁÓW I NIE DOKONUJE KOREKTY PISOWNI. REDAKCJA PRZYJMUJE PLIKI WYŁĄCZNIE W FORMACIE
INSTRUKCJA DLA AUTORÓW. INFORMATION FOR AUTHORS (Tłumaczenie tytułu artykułu w języku angielskim.)
XVII Sympozjum Modelowanie i Symulacja Systemów Pomiarowych 20-24 września 2009r., Krynica INSTRUKCJA DLA AUTORÓW Imię i nazwisko autora(-ów) 1) STRESZCZENIE Niniejsza instrukcja dotyczy sposobu przygotowania
Analiza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
WSKAZÓWKI DLA AUTORÓW REFERATÓW
WSKAZÓWKI DLA AUTORÓW REFERATÓW Spis treści: I. Wymogi formalne... 2 II. WZÓR... 3 III. Bibliografia... 4 IV. Streszczenie... 5 V. Cytaty i przypisy... 6 VI. Tabele, rysunki, wzory... 7 1 I. Wymogi formalne
Word. Korespondencja seryjna
1 (Pobrane z slow7.pl) Korespondencja seryjnajestto taki sposób utworzenia jednolitego dokumentu, który będzie różnił się jedynie zawartością wybranych pól. Pola te będą automatycznie wypełniane przez
5. Bazy danych Base Okno bazy danych
5. Bazy danych Base 5.1. Okno bazy danych Podobnie jak inne aplikacje środowiska OpenOffice, program do tworzenia baz danych uruchamia się po wybraniu polecenia Start/Programy/OpenOffice.org 2.4/OpenOffice.org
Wymagania dotyczące pracy dyplomowej
Wymagania dotyczące pracy dyplomowej Spis treści 1 Wstęp... 2 2 Cel i zakres pracy... 2 3 Wymagania ogólne... 2 3.1 Forma i zawartość pracy... 2 3.2 Dokumenty do złożenia w Dziekanacie... 2 4 Marginesy...
POLITECHNIKA WARSZAWSKA
POLITECHNIKA WARSZAWSKA WYDZIAŁ ELEKTRONIKI I TECHNIK INFORMACYJNYCH Repozytorium PW Instrukcja importowania danych Opracowanie: mgr inż. Wacław Struk Warszawa, lipiec 2013 Spis treści 1. Generowanie formatu
ŁAMIEMY SZYFR CEZARA. 1. Wstęp. 2. Szyfr Cezara w szkole. Informatyka w Edukacji, XV UMK Toruń, 2018
Informatyka w Edukacji, XV UMK Toruń, 2018 ŁAMIEMY SZYFR CEZARA Ośrodek Edukacji Informatycznej i Zastosowań Komputerów 02-026 Warszawa, ul. Raszyńska 8/10 {maciej.borowiecki, krzysztof.chechlacz}@oeiizk.waw.pl
KATEGORIA OBSZAR WIEDZY
Moduł 3 - Przetwarzanie tekstów - od kandydata wymaga się zaprezentowania umiejętności wykorzystywania programu do edycji tekstu. Kandydat powinien wykonać zadania o charakterze podstawowym związane z
Egzamin zawodowy: Technik Informatyk 312[01] Oprogramowanie biurowe pytania i odpowiedzi
Egzamin zawodowy: Technik Informatyk 312[01] Oprogramowanie biurowe pytania i odpowiedzi 1. Obiekt bazy danych, który w programie Microsoft Access służy do tworzenia zestawień i sprawozdań, ale nie daje
Wymogi edytorskie dla artykułów przygotowywanych do Zeszytów Naukowych Wyższej Szkoły Zarządzania i Bankowości w Krakowie
Wymogi edytorskie dla artykułów przygotowywanych do Zeszytów Naukowych Wyższej Szkoły Zarządzania i Bankowości w Krakowie 1. Uwagi ogólne Artykuły publikowane w Zeszytach Naukowych WSZiB są recenzowane,
Instrukcja dla autorów monografii
Instrukcja dla autorów monografii SPIS TREŚCI czcionka Times New Roman (dalej: TNR), rozmiar 16 STRESZCZENIE TNR 11... 6 1. WSTĘP... 7 2. ROZDZIAŁ 2... 23 2.1. Podrozdział TNR 11... 36 2.2. Podrozdział
Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu
i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2012 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę
Niestandardowa tabela częstości
raportowanie Niestandardowa tabela częstości Przemysław Budzewski Predictive Solutions Do czego dążymy W Generalnym Sondażu Społecznym USA w 1991 roku badaniu poddano respondentów należących do szeregu
Strona tytułowa jest standardowa i dostępna na:
Strona tytułowa jest standardowa i dostępna na: http://www.eka.pwr.wroc.pl/dyplomanci,41.dhtml Streszczenie Streszczenie 1. W pracach dyplomowych Politechniki Wrocławskiej element raczej nie stosowany
Wpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji cha- rakteru opinii konsumenckich. 1 Wstęp
mgr Katarzyna Wójcik mgr Janusz Tuchowski Uniwersytet Ekonomiczny w Krakowie Wpływ automatycznego tłumaczenia na wyniki automatycznej identyfikacji charakteru opinii konsumenckich. 1 Wstęp Analiza opinii
ZASADY PISANIA ARTYKUŁÓW
ZASADY PISANIA ARTYKUŁÓW XXIV Ogólnopolska Konferencja RACHUNKOWOŚĆ W ZARZĄDZANIU JEDNOSTKAMI GOSPODARCZYMI Świnoujście, 16 18 maja 2017 r. Uprzejmie prosimy o dostosowanie się do poniższych zasad edytorskich.
INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA.
SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:
WYDZIAŁ BEZPIECZEŃSTWA NARODOWEGO AKADEMII OBRONY NARODOWEJ ZESZYTY DOKTORANCKIE WYMOGI EDYTORSKIE
WYDZIAŁ BEZPIECZEŃSTWA NARODOWEGO AKADEMII OBRONY NARODOWEJ ZESZYTY DOKTORANCKIE WYMOGI EDYTORSKIE Wymogi edytorskie publikowania w Zeszytach Doktoranckich WBN UWAGI OGÓLNE Artykuł przeznaczony do wydania
Wyższej Szkoły Przedsiębiorczości i Marketingu w Chrzanowie
ZASADY PRZYGOTOWANIA PRACY KOŃCOWEJ NA STUDIACH PODYPLOMOWYCH PEDAGOGIKA KWALIFIKACYJNA DLA NAUCZYCIELI PRZEDMIOTÓW ZAWOWOWYCH PROWADZONYCH W RAMACH PROJEKTU "NAUCZYCIEL NA 6+" Wyższej Szkoły Przedsiębiorczości
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej
ZASADY REDAGOWANIA PRACY LICENCJACKIEJ
1 ZASADY REDAGOWANIA PRACY LICENCJACKIEJ ZASADY OGÓLNE Praca licencjacka pisana jest samodzielnie przez studenta. Format papieru: A4. Objętość pracy: 40-90 stron. Praca drukowana jest dwustronnie. Oprawa:
Prezentacja i udostępnianie wyników sprzedaży drewna
Prezentacja i udostępnianie wyników sprzedaży drewna Ver. 04 Zespół zadaniowy do spraw budowy, utrzymania i rozwoju elektronicznego systemu sprzedaży drewna w Lasach Państwowych styczeń 2018 A. Wprowadzenie
Praca licencjacka. Seminarium dyplomowe Zarządzanie przedsiębiorstwem dr Kalina Grzesiuk
Praca licencjacka Seminarium dyplomowe Zarządzanie przedsiębiorstwem dr Kalina Grzesiuk 1.Wymagania formalne 1. struktura pracy zawiera: stronę tytułową, spis treści, Wstęp, rozdziały merytoryczne (teoretyczne
EDYCJA TEKSTU MS WORDPAD
EDYCJA TEKSTU MS WORDPAD EDYCJA TEKSTU - MS WORDPAD WordPad (ryc. 1 ang. miejsce na słowa) to bardzo przydatny program do edycji i pisania tekstów, który dodatkowo dostępny jest w każdym systemie z rodziny
Wyszukiwanie dokumentów/informacji
Wyszukiwanie dokumentów/informacji Wyszukiwanie dokumentów (ang. document retrieval, text retrieval) polega na poszukiwaniu dokumentów tekstowych z pewnego zbioru, które pasują do zapytania. Wyszukiwanie
Pobieranie i przetwarzanie treści stron WWW
Eksploracja zasobów internetowych Wykład 2 Pobieranie i przetwarzanie treści stron WWW mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Jedną z funkcji silników wyszukiwania danych, a właściwie ich modułów
MS Excel. Podstawowe wiadomości
MS Excel Podstawowe wiadomości Do czego służy arkusz kalkulacyjny? Arkusz kalkulacyjny wykorzystywany jest tam gdzie wykonywana jest olbrzymia ilość żmudnych, powtarzających się według określonego schematu
SZKOLENIA SAS. ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie
SZKOLENIA SAS ONKO.SYS Kompleksowa infrastruktura inforamtyczna dla badań nad nowotworami CENTRUM ONKOLOGII INSTYTUT im. Marii Skłodowskiej Curie DANIEL KUBIK ŁUKASZ LESZEWSKI ROLE ROLE UŻYTKOWNIKÓW MODUŁU
PRZEWODNIK PO PRZEDMIOCIE RODZAJ ZAJĘĆ LICZBA GODZIN W SEMESTRZE WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM 15 15
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu Kierunek Forma studiów Poziom kwalifikacji Rok Semestr Jednostka prowadząca Osoba sporządzająca Profil Wizualizacja
AUTOMATYKA INFORMATYKA
AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów
Funkcje wyszukiwania i adresu PODAJ.POZYCJĘ
Funkcje wyszukiwania i adresu PODAJ.POZYCJĘ Mariusz Jankowski autor strony internetowej poświęconej Excelowi i programowaniu w VBA; Bogdan Gilarski właściciel firmy szkoleniowej Perfect And Practical;
Wymagania dla cyklu dwugodzinnego w ujęciu tabelarycznym. Gimnazjum nr 1 w Miechowie
Wymagania dla cyklu dwugodzinnego w ujęciu tabelarycznym Gimnazjum nr 1 w Miechowie Informatyka Lp. Uczeń: 1. Zna regulamin i przepisy BHP w pracowni komputerowej 2. Wie, na czym polega bezpieczna praca
Przykłady zastosowań funkcji tekstowych w arkuszu kalkulacyjnym
S t r o n a 1 Bożena Ignatowska Przykłady zastosowań funkcji tekstowych w arkuszu kalkulacyjnym Wprowadzenie W artykule zostaną omówione zagadnienia związane z wykorzystaniem funkcji tekstowych w arkuszu
WYMAGANIA REDAKCYJNE DOTYCZĄCE PISANIA PRAC KOŃCOWYCH
WYMAGANIA REDAKCYJNE DOTYCZĄCE PISANIA PRAC KOŃCOWYCH na studiach podyplomowych MECHANIZMY FUNKCJONOWANIA STREFY EURO Projekt realizowany z Narodowym Bankiem Polskim w ramach programu edukacji ekonomicznej
Po wstawieniu tabeli (i zawsze wtedy, gdy w tabeli jest kursor) pojawia się na wstążce nowa grupa zakładek o nazwie Narzędzia tabel.
Tabelę można szybko wstawić do dokumentu, korzystając z przycisku Tabela w zakładce Wstawianie na wstążce. Komputer umożliwia zakreślenie myszką, ile wierszy i kolumn ma mieć tabela. Można też skorzystać
I PODZIAŁ TREŚCI. 3. Studium przypadku*
Załącznik do Uchwały Rady Wydziału z dn. 29.10.2017r. w sprawie określenia standardów pisania pracy dyplomowej w formie studium przypadku na studiach II stopnia na kierunku pielęgniarstwo STANDARDY PISANIA
WYMAGANIA REDAKCYJNE DOTYCZĄCE PISANIA PRAC KOŃCOWYCH
WYMAGANIA REDAKCYJNE DOTYCZĄCE PISANIA PRAC KOŃCOWYCH na studiach podyplomowych MECHANIZMY FUNKCJONOWANIA STREFY EURO Projekt realizowany z Narodowym Bankiem Polskim w ramach programu edukacji ekonomicznej
Instrukcja obsługi dla studenta
Instrukcja obsługi dla studenta Akademicki System Archiwizacji Prac (ASAP) to nowoczesne, elektroniczne archiwum prac dyplomowych zintegrowane z systemem antyplagiatowym Plagiat.pl. Student korzystający
PRZEWODNIK PO PRZEDMIOCIE TECHNOLOGIE INFORMACYJNE. Logistyka (inżynierskie) niestacjonarne. I stopnia. Dr inż. Tomasz Lis.
Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE Nazwa przedmiotu Kierunek Forma studiów Poziom kwalifikacji Rok Semestr Jednostka prowadząca Osoba sporządzająca Profil Rodzaj
Autorski program nauczania
Grzegorz Kaczorowski Innowacja pedagogiczna: Algorytmika i programowanie Typ innowacji: programowa Autorski program nauczania poziom edukacyjny: PONADGIMNAZJALNY Realizatorzy innowacji: uczniowie klas
Zasady interpretacji Raportu antyplagiatowego
Zasady interpretacji Raportu antyplagiatowego Strona 1 z 8 Spis treści 1. Informacje ogólne... 3 2. Wskaźniki analizy antyplagiatowej... 4 3. Wskaźniki dodatkowe analizy antyplagiatowej... 5 4. Konflikty...
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Przetwarzanie Języka Naturalnego dr inż. Krzysztof Rzecki. Przetwarzanie Języka Naturalnego konspekt (30 godzin) Dr inż.
Przetwarzanie Języka Naturalnego konspekt (30 godzin) Dr inż. Krzysztof Rzecki Literatura: W. Lubaszewski, Słowniki komputerowe i automatyczna ekstrakcja informacji z tekstu, AGH Kraków 2009. Kłopotek
Spis treści. Analiza i modelowanie_nowicki, Chomiak_Księga1.indb :03:08
Spis treści Wstęp.............................................................. 7 Część I Podstawy analizy i modelowania systemów 1. Charakterystyka systemów informacyjnych....................... 13 1.1.
QUERY język zapytań do tworzenia raportów w AS/400
QUERY język zapytań do tworzenia raportów w AS/400 Dariusz Bober Katedra Informatyki Politechniki Lubelskiej Streszczenie: W artykule przedstawiony został język QUERY, standardowe narzędzie pracy administratora
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego Publikacja jest dystrybuowana bezpłatnie Program Operacyjny Kapitał Ludzki Priorytet 9 Działanie 9.1 Poddziałanie
SPOTKANIE 2: Wprowadzenie cz. I
Wrocław University of Technology SPOTKANIE 2: Wprowadzenie cz. I Piotr Klukowski Studenckie Koło Naukowe Estymator piotr.klukowski@pwr.edu.pl 17.10.2016 UCZENIE MASZYNOWE 2/27 UCZENIE MASZYNOWE = Konstruowanie
Jak przygotować artykuł naukowy? Podział na grupy i wybór tematu projektu. Projekt zespołowy 2017/2018 Zbigniew Chaniecki Krzysztof Grudzień
Jak przygotować artykuł naukowy? Podział na grupy i wybór tematu projektu Projekt zespołowy 2017/2018 Zbigniew Chaniecki Krzysztof Grudzień Na podstawie http://ekulczycki.pl/warsztat_badacza/ http://www.imp.lodz.pl/upload/biblioteka/2014/wprowadzenie.pdf
Widzenie komputerowe (computer vision)
Widzenie komputerowe (computer vision) dr inż. Marcin Wilczewski 2018/2019 Organizacja zajęć Tematyka wykładu Cele Python jako narzędzie uczenia maszynowego i widzenia komputerowego. Binaryzacja i segmentacja
Propozycje wymagań dla cyklu dwugodzinnego w ujęciu tabelarycznym
Propozycje wymagań dla cyklu dwugodzinnego w ujęciu tabelarycznym Klasa III Informatyka Nauczyciel prowadzący: Tokar Jan Lp. Uczeń: K (2) P (3) R (4) D (5) N Uwagi 1. Zna regulamin i przepisy BHP w pracowni
SIECI KOMPUTEROWE I TECHNOLOGIE INTERNETOWE
Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Inżynierii Systemów Sterowania SIECI KOMPUTEROWE I TECHNOLOGIE INTERNETOWE Temat: Prosty serwis internetowy oparty o zestaw powiązanych
AKADEMIA im. JANA DŁUGOSZA w CZĘSTOCHOWIE
AKADEMIA im. JANA DŁUGOSZA w CZĘSTOCHOWIE Wydział Matematyczno-Przyrodniczy Kierunek: nazwa kierunku Specjalność: nazwa specjalności JAN KOWALSKI Nr albumu:. TYTUŁ PRACY Praca przygotowana w nazwa zakładu/katedry
Instrukcja Użytkownika (Nauczyciel Akademicki) Akademickiego Systemu Archiwizacji Prac
Instrukcja Użytkownika (Nauczyciel Akademicki) Akademickiego Systemu Archiwizacji Prac Akademicki System Archiwizacji Prac (ASAP) to nowoczesne, elektroniczne archiwum prac dyplomowych zintegrowane z systemem
Bioinformatyka. Ocena wiarygodności dopasowania sekwencji.
Bioinformatyka Ocena wiarygodności dopasowania sekwencji www.michalbereta.pl Załóżmy, że mamy dwie sekwencje, które chcemy dopasować i dodatkowo ocenić wiarygodność tego dopasowania. Interesujące nas pytanie
Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu.
Centralna Komisja Egzaminacyjna Arkusz zawiera informacje prawnie chronione do momentu rozpoczęcia egzaminu. Układ graficzny CKE 2010 KOD WPISUJE ZDAJĄCY PESEL EGZAMIN MATURALNY Z INFORMATYKI POZIOM PODSTAWOWY
Sposoby prezentacji problemów w statystyce
S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki
Instrukcja Użytkownika (Studenta) Akademickiego Systemu Archiwizacji Prac
Instrukcja Użytkownika (Studenta) Akademickiego Systemu Archiwizacji Prac Akademicki System Archiwizacji Prac (ASAP) to nowoczesne, elektroniczne archiwum prac dyplomowych zintegrowane z systemem antyplagiatowym
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych
Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury
Wymagania na poszczególne oceny w klasach 3 gimnazjum
Wymagania na poszczególne oceny w klasach 3 gimnazjum Znaczenie komputera we współczesnym świecie Przypomnienie wiadomości na temat języka HTML Wstawianie tabeli na stronę WWW Wstawianie listy punktowanej
INFORMATYKA TEST DIAGNOZUJĄCY WIEDZĘ Z ZAKRESU GIMNAZJUM
INFORMATYKA TEST DIAGNOZUJĄCY WIEDZĘ Z ZAKRESU GIMNAZJUM Wybierz prawidłową odpowiedź i zaznacz ją na Karcie odpowiedzi. Stawiając znak X w odpowiedniej kratce. 1. Która z wymienionych nazw nie oznacza
Logowanie do systemu. Rys. 1 Strona logowania
Spis treści Logowanie do systemu... 2 Dostępne operacje... 3 Zarządzanie dokumentami... 4 Zarządzanie katalogami... 4 Dodawanie dokumentów do analizy... 4 Uzupełnianie dodatkowego opisu dokumentu... 5
Imię i Nazwisko (Calibri Light, 10 punktów, wyrównaj do lewej; odstęp / interlinia wielokrotne
ASO.A 3(1) / 2014, 120-125 (element wpisywany przez Redakcję) Imię i Nazwisko (Calibri Light, 10 punktów, wyrównaj do lewej; odstęp / interlinia wielokrotne 1,15; odstępy przed i po 3 punkty) Katedra /
Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) prezentacja znakowania morfosyntaktycznego i możliwości wyszukiwarki
Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) prezentacja znakowania morfosyntaktycznego i możliwości wyszukiwarki Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk
Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego
Arytmetyka cyfrowa Dla człowieka naturalnym sposobem liczenia jest korzystanie z systemu dziesiętnego, dla komputera natomiast korzystanie z zapisu dwójkowego (binarnego). Zapis binarny - to system liczenia
WYMAGANIA NA POSZCZEGÓLNE OCENY Z INFORMATYKI /GIMNAZJUM W SŁAWĘCINIE/
WYMAGANIA NA POSZCZEGÓLNE OCENY Z INFORMATYKI /GIMNAZJUM W SŁAWĘCINIE/ Lp. Uczeń: K (2) P (3) R (4) D (5) 1. Zna regulamin i przepisy BHP w pracowni komputerowej 2. Wie, na czym polega bezpieczna praca
Hurtownia danych. Załącznik Nr 1 do SIWZ. Opis przedmiotu zamówienia. Lp. FUNKCJONALNOŚĆ/PARAMETRY WYMAGANE
Załącznik Nr 1 do SIWZ Opis przedmiotu zamówienia Lp. FUNKCJONALNOŚĆ/PARAMETRY WYMAGANE Hurtownia danych 1. Wielowymiarowa hurtownia danych oparta o model konstelacji faktów. 2. Brak ograniczenia na liczbę
STANDARDY PRACY DYPLOMOWEJ NA WYDZIALE NAUK O ZDROWIU ELBLĄSKIEJ UCZELNI HUMANISTYCZNO -EKONOMICZNEJ
Załącznik nr 1 do uchwały RWNoZ z dn. 26.09.2014r. w sprawie standardów pisania prac dyplomowych STANDARDY PRACY DYPLOMOWEJ NA WYDZIALE NAUK O ZDROWIU ELBLĄSKIEJ UCZELNI HUMANISTYCZNO -EKONOMICZNEJ 1.
Specjalnościowy Obowiązkowy Polski Semestr VI
KARTA MODUŁU / KARTA PRZEDMIOTU Kod modułu Nazwa modułu Nazwa modułu w języku angieskim Obowiązuje od roku akademickiego 0/06 Z-ID-608a Anaiza danych niestrukturanych Unstructured Data Anaysis A. USYTUOWANIE
Szablon i zasady pisana pracy dyplomowej. Aneta Poniszewska-Marańda
Szablon i zasady pisana pracy dyplomowej Aneta Poniszewska-Marańda Spis treści Spis treści powinien zawierać spis wszystkich rozdziałów oraz podrozdziałów wraz z numerami stron, na których się rozpoczynają
Ćwiczenie 2 (Word) Praca z dużym tekstem
Ćwiczenie 2 (Word) Praca z dużym tekstem 1. Przygotowanie dokumentu głównego (Tworzenie rozdziałów i podrozdziałów) Otwórz dokument o nazwie Duży tekst.docx znajdujący się na stronie prowadzącego zajęcia.
Analiza i projektowanie aplikacji Java
Analiza i projektowanie aplikacji Java Modele analityczne a projektowe Modele analityczne (konceptualne) pokazują dziedzinę problemu. Modele projektowe (fizyczne) pokazują system informatyczny. Utrzymanie
Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych
dr Piotr Sulewski POMORSKA AKADEMIA PEDAGOGICZNA W SŁUPSKU KATEDRA INFORMATYKI I STATYSTYKI Porównanie generatorów liczb losowych wykorzystywanych w arkuszach kalkulacyjnych Wprowadzenie Obecnie bardzo
Prezentacja i udostępnianie wyników sprzedaży drewna. Ver. 01
Prezentacja i udostępnianie wyników sprzedaży drewna Ver. 01 Zespół zadaniowy do spraw budowy, utrzymania i rozwoju internetowego systemu sprzedaży drewna w Lasach Państwowych marzec 2013 A. Wprowadzenie
Mariusz Piotrowski Węzeł Centralny OŻK- SB
Mariusz Piotrowski Węzeł Centralny OŻK- SB Analiza frekwencyjna słów używanych w dokumentach JST na przykładzie Strategia marki i promocji miasta Augustowa w latach 2010-2015. Instrukcja użytkowania programu
Instrukcja użytkownika NAUCZYCIELA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC
Instrukcja użytkownika NAUCZYCIELA AKADEMICKIEGO SYSTEMU ARCHIWIZACJI PRAC 1. Logowanie do systemu ASAP Logowanie do systemu ASAP odbywa się na stronie www. asap.pwsz-ns.edu.pl W pola login i hasło znajdujące
Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9
Wstęp 7 Rozdział 1. OpenOffice.ux.pl Writer środowisko pracy 9 Uruchamianie edytora OpenOffice.ux.pl Writer 9 Dostosowywanie środowiska pracy 11 Menu Widok 14 Ustawienia dokumentu 16 Rozdział 2. OpenOffice
SKUTECZNOŚĆ WYSZUKIWANIA W INTERNECIE INFORMACJI ZWIĄZANYCH Z INŻYNIERIĄ ROLNICZĄ
Inżynieria Rolnicza 6(104)/2008 SKUTECZNOŚĆ WYSZUKIWANIA W INTERNECIE INFORMACJI ZWIĄZANYCH Z INŻYNIERIĄ ROLNICZĄ Michał Cupiał Katedra Inżynierii Rolniczej i Informatyki, Uniwersytet Rolniczy w Krakowie
WYMAGANIA EDUKACYJNE NA POSZCZEGÓLNE STOPNIE Z INFORMATYKI W KLASIE 8 opracowane na podstawie podręcznika
WYMAGANIA EDUKACYJNE NA POSZCZEGÓLNE STOPNIE Z INFORMATYKI W KLASIE 8 opracowane na podstawie podręcznika Informatyka Europejczyka. Podręcznik do informatyki dla szkoły podstawowej. Klasa 8. Prowadzące:
Instrukcja obsługi dla studenta
Instrukcja obsługi dla studenta Akademicki System Archiwizacji Prac (ASAP) to nowoczesne, elektroniczne archiwum prac dyplomowych zintegrowane z systemem antyplagiatowym Plagiat.pl. Student korzystający
Temat: Ułatwienia wynikające z zastosowania Frameworku CakePHP podczas budowania stron internetowych
PAŃSTWOWA WYŻSZA SZKOŁA ZAWODOWA W ELBLĄGU INSTYTUT INFORMATYKI STOSOWANEJ Sprawozdanie z Seminarium Dyplomowego Temat: Ułatwienia wynikające z zastosowania Frameworku CakePHP podczas budowania stron internetowych
FORMAT MARC 21 dla rekordów stosowanych w BAZACH BIBLIOGRAFICZNYCH
Zintegrowany System Zarządzania Biblioteką SOWA2/MARC21 FORMAT MARC 21 dla rekordów stosowanych w BAZACH BIBLIOGRAFICZNYCH Poznań 2011 1 Spis treści 1. Wstęp...3 2. Zredagowany wydruk bibliografii...4
WSKAZÓWKI DLA AUTORÓW Optymalizacja publikacji naukowych dla wyników wyszukiwarek ASEO 1
WSKAZÓWKI DLA AUTORÓW Optymalizacja publikacji naukowych dla wyników wyszukiwarek ASEO 1 W celu zwiększenia indeksowania i przeszukiwania publikacji autorskich przez naukowe wyszukiwarki internetowe, należy
Usługi analityczne budowa kostki analitycznej Część pierwsza.
Usługi analityczne budowa kostki analitycznej Część pierwsza. Wprowadzenie W wielu dziedzinach działalności człowieka analiza zebranych danych jest jednym z najważniejszych mechanizmów podejmowania decyzji.
Zadania. Przygotowanie zbiorów danych. 1. Sposób 1: 2. Sposób 2:
Wstęp Jednym z typowych zastosowań metod sztucznej inteligencji i uczenia maszynowego jest przetwarzanie języka naturalnego (ang. Natural Language Processing, NLP), której typowych przykładem jest analiza
Hurtownie danych i business intelligence. Plan na dziś : Wprowadzenie do przedmiotu
i business intelligence Paweł Skrobanek, C-3 pok. 321 pawel.skrobanek@pwr.wroc.pl Wrocław 2005-2007 Plan na dziś : 1. Wprowadzenie do przedmiotu (co będzie omawiane oraz jak będę weryfikował zdobytą wiedzę
S O M SELF-ORGANIZING MAPS. Przemysław Szczepańczyk Łukasz Myszor
S O M SELF-ORGANIZING MAPS Przemysław Szczepańczyk Łukasz Myszor Podstawy teoretyczne Map Samoorganizujących się stworzył prof. Teuvo Kohonen (1982 r.). SOM wywodzi się ze sztucznych sieci neuronowych.
ROZPORZĄDZENIE MINISTRA SPRAW WEWNĘTRZNYCH I ADMINISTRACJI [1]) z dnia... 2006 r.
Źródło: http://bip.mswia.gov.pl/bip/projekty-aktow-prawnyc/2006/584,projekt-rozporzadzenia-ministra-swia-z-dnia-2006-r-w-s prawie-wymagan-technicznyc.html Wygenerowano: Poniedziałek, 4 stycznia 2016, 08:37
WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI
WYZNACZANIE NIEPEWNOŚCI POMIARU METODAMI SYMULACYJNYMI Stefan WÓJTOWICZ, Katarzyna BIERNAT ZAKŁAD METROLOGII I BADAŃ NIENISZCZĄCYCH INSTYTUT ELEKTROTECHNIKI ul. Pożaryskiego 8, 04-703 Warszawa tel. (0)
10. Redukcja wymiaru - metoda PCA
Algorytmy rozpoznawania obrazów 10. Redukcja wymiaru - metoda PCA dr inż. Urszula Libal Politechnika Wrocławska 2015 1 1. PCA Analiza składowych głównych: w skrócie nazywana PCA (od ang. Principle Component
Zadanie 9. Projektowanie stron dokumentu
Zadanie 9. Projektowanie stron dokumentu Przygotowany dokument można: wydrukować i oprawić, zapisać jako strona sieci Web i opublikować w Internecie przekonwertować na format PDF i udostępnić w postaci