Metody i narzêdzia automatycznego przetwarzania informacji tekstowej i ich wykorzystanie w procesie zarz¹dzania wiedz¹
|
|
- Dominika Rudnicka
- 8 lat temu
- Przeglądów:
Transkrypt
1 AUTOMATYKA 2011 Tom 15 Zeszyt 2 Piotr Potiopa* Metody i narzêdzia automatycznego przetwarzania informacji tekstowej i ich wykorzystanie w procesie zarz¹dzania wiedz¹ 1. Wprowadzenie Przewa aj¹ca wiêkszoœæ informacji wykorzystywanych we wspó³czesnych firmach i instytucjach przechowywana jest nadal w postaci informacji w jêzyku naturalnym. Stanowi on podstawowy noœnik i œrodek komunikacji w procesach dzielenia siê wiedz¹. Jednoczeœnie coraz wiêksze znaczenie maj¹ systemy i narzêdzia informatyczne, które umo liwiaj¹ ³atwe i zautomatyzowane przetwarzanie danych i informacji przechowywanych w³aœnie za pomoc¹ jêzyka naturalnego. Problematyka analizy tekstów, dokumentów od d³u szego czasu w ró nych organizacjach nabieraj¹ coraz wiêkszego znaczenia. Zasadnie jest zatem, aby zadania realizowane w zakresie zarz¹dzania wiedz¹, najbardziej w obszarze jej reprezentacji i ekstrakcji, spe³nia³y systemy przetwarzania jêzyka naturalnego. Jednym z wa nych aspektów realizacji takich zadañ jest budowa odpowiednich ontologii dziedzinowych. S³u ¹ one poprawnemu modelowaniu i reprezentacji struktur wiedzy w sposób zarówno czytelny dla cz³owieka, jak i umo liwiaj¹cy jej przetwarzanie przez komputer. Obecnie ontologie s¹ obiektem badañ w ro nych œrodowiskach naukowych, m.in. w in ynierii jêzyka naturalnego, w in ynierii systemów informatycznych, w in ynierii wiedzy, a tak e w teorii zarz¹dzania wiedz¹ [1]. Drugim wa nym obszarem dzia³añ w zakresie zarz¹dzania wiedz¹ jest wyszukiwanie, analiza i obróbka dokumentów zawieraj¹cych potrzebne nam informacje. Nierzadko informacja zawarta w tych dokumentach stanowi bazê do rozwi¹zania aktualnych, nowych problemów wystepujacych w danym systemie wiedzy. Zdobywanie wiedzy i dzielenie siê przesz³ymi doœwiadczeniami do ponownego wykorzystania jest coraz bardziej istotne ze wzglêdu na iloœæ technicznych informacji, od których jestesmy uzale nieni obecnie. W systemach zarz¹dzania wiedz¹ techniki te s¹ okreœlane mianem wnioskowania na podstawie przypadków (Case-Based Reasoning) [2]. * AGH Akademia Górniczo-Hutnicza, Wydzia³ Zarz¹dzania, Katedra Informatyki Stosowanej 409
2 410 Piotr Potiopa Analizy tekstów w jêzyku naturalnym s¹ mo liwe dziêki, ju dziœ rozwiniêtym, metodom jego przetwarzania. Wykorzystanie podejœæ i metod takich jak: information retrieval, information extraction, text mining czy natural language processing pozwala na budowanie bazy wiedzy i na jej usystematyzowanie, a co za tym idzie na efektywne ni¹ zarz¹dzanie. W tym artykule zostan¹ przedstawione metody analizy tekstów wykorzystuj¹ce znane algorytmy wspomagaj¹ce ich przetwarzanie. Nacisk po³o ono na aspekty podobieñstwa dokumentów i technik zwi¹zanych z metodami jego okreœlania. Przedstawiono te przyk³ady istniej¹cych narzêdzi obróbki i analizy dokumentów. 2. Metody wyszukiwania i analizy tekstu W procesach wyszukiwania i analizy dokumentów tekstowych wyró nia siê m.in. nastêpuj¹ce metody: Systemy wyszukiwania informacji (Information Retrieval, IR). Rozumienie jêzyków naturalnych (Natural Language Processing). Metody ekstrakcji informacji (Information Extraction, IE). Metody eksploracji tekstu (Text Mining). Poni ej zosta³y one wyjaœnione i opisane z uwzglêdnieniem technik jakie umo liwiaj¹ dzia³anie danej metody Information Retrieval Information Retrieval, IR (wyszukiwanie informacji) jest okreœleniem powszechnie u ywanym, chocia niezupe³nie trafnie. System wyszukiwania informacji nie tyle informuje u ytkownika na temat, który go interesuje, co informuje o istnieniu (lub jego braku) miejsca, gdzie dokument odpowiadaj¹cy wymaganiom u ytkownika siê znajduje [3]. W typowym IR u ytkownik tworzy zapytanie, z³o one z jednego lub kilku wyrazów, na podstawie którego system wyszukuje dokumenty. Wyró nia siê dwa g³ówne podejœcia IR: model boolowski (Boolean Logic Model, BLM) oraz rankingowy (ranked-output systems) [3, 8]. Zapytanie BML sk³ada siê ze s³ów lub fraz po³¹czonych logicznymi operatorami AND, OR oraz NOT. Rezultatem zapytania jest zazwyczaj podzia³ zbioru dokumentów na dwie czêœci: jedn¹ zawieraj¹c¹ dopasowane dokumenty oraz drug¹ zawieraj¹c¹ dokumenty niedopasowane. System rankingowy, stosuj¹c algebrê wektorów ocenia podobieñstwo treœci dokumentów z treœci¹ zapytania i na tej podstawie dokonuje rankingu znalezionych dokumentow. Systemy rankingowe wykorzystuj¹ najczêœciej nastêpuj¹ce modele do oceny podobieñstwa dokumentów: model wektorowy (Vector Space Model, VSM), model probabilistyczny (Probabilistic Model, PM), a tak e inne, m.in. Inference Network Model (INM). Zalet¹ systemów IR jest dziedzinowa niezale noœæ oraz elastycznoœæ jêzykowa (zmiana jêzyka nie wymaga zbyt wielu adaptacji). Natomiast do najwa niejszych ograniczeñ tych
3 Metody i narzêdzia automatycznego przetwarzania informacji tekstowej systemów nale y za³o enie niezale noœci indeksów termów, co mo e prowadziæ do oszacowania zerowego podobieñstwa miêdzy dokumentami zawieraj¹cymi synonimiczne wyra enia [3, 8] Information Extraction Zadaniem ekstrakcji informacji (Information Extraction, IE) jest zidentyfikowanie instancji pewnej predefiniowanej klasy zdarzeñ, ich powi¹zañ oraz wyst¹pieñ w dokumentach pisanych w jêzyku naturalnym [4]. W odró nieniu od systemów IR, systemy IE nie wyszukuj¹ samych dokumentów, ale zgodnie z nazw¹ dokonuj¹ ekstrakcji informacji z ich treœci. Pozyskane informacje mog¹ zostaæ umieszczone w bazie danych. Informacja, jaka bêdzie pozyskiwana z dokumentu, jest specyfikowana przez u ytkownika, który tworzy wzorzec. Zawiera on okreœlone sekcje dziury (slots), ktore wype³niane s¹ fragmentami tekstu. J¹dro systemu ekstrakcji informacji sk³ada siê z dwóch komponentów: procesora tekstów (którym mo e byæ jedna z metod NLP) oraz generatora wzorców, które osadzone s¹ w wiedzy dziedzinowej. Zadaniem procesora tekstów jest analiza leksykalna tekstu (obecnie najczêœciej stosuje siê p³ytk¹ analizê) Text Mining Text mining jest metodologi¹ wywodz¹c¹ siê z data mining, wyszukiwania informacji, ekstrakcji danych, kategoryzacji tekstu, modelowania probabilistycznego, algebry liniowej, uczenia maszynowego zastosowanych w celu wykrycia wiedzy z dokumentów tekstowych [4]. Definicja wskazuje na podobieñstwo z technikami IE. Ekstrakcji informacji dokonuje siê jednak zwykle w oparciu o znane wzorce, w przypadku text mining wzorce wychwytywane s¹ dopiero w procesie przetwarzania dokumentu. Do typowych zadañ text mining nale y: znajdowanie dokumentów najbardziej pasuj¹cych do zapytania u ytkownika, tworzenie rankingow dokumentów, grupowanie dokumentów (analiza skupieñ), klasyfikowanie dokumentów (kategoryzacja), analiza powi¹zañ miêdzy jednostkami tekstu, dokonywanie automatycznych streszczeñ dokumentów [4] Natural Language Processing Metody Natural Language Processing NLP (rozumienie jêzyków naturalnych) zawieraj¹ mechanizmy próbuj¹ce dokonaæ zrozumienia kontekstu tekstu. W metodach tych nie oblicza siê podobieñstwa termów, ale oznacza siê poszczególne czêœci mowy (analiza p³ytka) oraz szuka siê znaczenia danego wyra enia w kontekœcie poprzez pe³n¹ analizê gramatyczn¹ (analiza g³êboka) [4]. Niektóre serwisy internetowe proponuj¹ u ytkownikom alternatywnie dla metod IR wyszukiwanie informacji poprzez systemy wzbogacone o NLP, co mo e daæ w wyniku lepiej dopasowane do danego zapytania dokumenty. Metody NLP maj¹ jednak swoje wady, nale ¹ do nich: wiêksza z³o onoœæ i czasoch³onnoœæ (zw³aszcza g³êboka analiza), s¹ silnie
4 412 Piotr Potiopa zwi¹zane z danym jêzykiem (adaptacja na inne jêzyki wymaga wiele pracy), trac¹ znacznie swoj¹ skutecznoœæ w przypadku wystêpowania w tekœcie terminów spoza s³owników oraz w przypadku analizy tekstów sporz¹dzonych jako krótkie notatki (doœæ czêsto pozbawione poprawnej struktury gramatycznej). Analiza dokumentów tekstowych jest ³¹czona zwykle z metodami NLP (Natural Language Processing). Skupia siê ona na pojedynczym dokumencie. Natomiast bazowy charakter ontologii z danego obszaru tematycznego wymaga dzia³añ szerszych, analizy du ych wolumenów dokumentów (korpusu), na podstawie których bêdzie ona tworzona. Do tego celu mo na zastosowaæ technikê wykorzystywan¹ przy analizie danych strukturalnych DM (Data Mining). Czêsto okreœla siê TM (Text Mining) jako DM dla dokumentów niestrukturalnych (rys. 1) [5], w których szuka wzorców i szablonów. Rys. 1. Techniki analizy danych strukturalnych i niestrukturalnych Automatyczne przetwarzanie dokumentów jêzyka naturalnego obejmuje nastêpuj¹ce zasadnicze fazy: podzia³ tekstu wejœciowego na zdania, tokeny, s³owa; odrzucenie s³ów (tagów) nieistotnych (z tzw. stop-listy); tematyzacja tzn. wybór s³ów istotnych i sprowadzenie ich do postaci podstawowe (stemmer); s¹ stosowane dwie metody: regu³y gramatyki w algorytmie lub s³owniki; automatyczne generowanie s³ów kluczowych, klasteryzacja dokumentów, ontologie, tezaurusy itp.
5 Metody i narzêdzia automatycznego przetwarzania informacji tekstowej Z kolei sam proces analizy tekstu przebiega wg schematu przedstawionego na rysunku 2 [5]. Dokumenty wejœciowe Analiza flexalna i gramatyczna Stop-lista Stemmer Dokumenty przetworzone Rys. 2. Etapy analizy dokumentów Tokeny pozwalaj¹ na podzia³ tekstu na proste elementy, czyli np.: liczby, punktacja, s³owa. Proces ten jest uzalezniony od jêzyka, w jakim dany tekst zosta³ zbudowany i do jakiego obszaru tematycznego siê odnosi. Dosyæ ³atwo go przeprowadziæ dla jêzyka niemieckiego czy angielskiego, ale o wiele trudniej dla jêzyka polskiego, poniewa gramatyka jest tu bardziej z³o ona i wymaga z³o onej analizy tekstu wejœciowego [5]. Wa nym aspektem jest równie brak równowa noœci miêdzy tekstami. Inny jest tekst literacki, z publicznie dostêpnych gazet czy te naukowy czêsto zawieraj¹cy obok terminów naukowych rysunki wykresy, wzory matematyczne czy chemiczne, litery alfabetu greckiego. Jak na razie brakuje idealnego programu, który by potrafi³ bezb³êdnie przetworzyæ ka dy dokument. Co prawda s¹ dostêpne narzêdzia zarówno komercyjne, jak i bezp³atne umo liwiaj¹ce analizê tekstów, ale ich jakoœæ jest ró na, od bardzo prostych po bardziej zaawansowane. Wiele z nich dostosowana jest do jêzyków zachodnich, niektóre z nich potrafi¹ analizowaæ nawet teksty chiñskie czy te japoñskie. Gorzej jest z jêzykiem polskim ze wzglêdu na ma³y rynek dla takiego produktu. Aczkolwiek s¹ ju dostêpne pewne rozwi¹zania, które zostan¹ przedstawione w rozdziale 4.
6 414 Piotr Potiopa Osobne zagadnienie to wymagany format wejœciowy danych do systemu analizuj¹cego dokumenty. Na ogó³ jest to.txt,.html, rzadziej.doc czy.pdf. W przypadku innych formatów ni.txt systemy maj¹ wbudowane w³asne konwertery do wymaganego formatu. A zatem czêsto trzeba dokonaæ konwersji dokumentu np. z formatu.pdf do.txt. Jednak w przypadku dokumentów naukowych zawieraj¹cych wzory matematyczne, chemiczne, specyficzne litery z ró nych jêzyków, otrzymuje siê postaæ wynikow¹ mocno zniekszta³con¹ i bardzo odbiegaj¹c¹ od orygina³u. Do analizy dokumentów testowych uzywa siê dedykowanych narzêdzi informatycznych. Ogólnie mo na je podzieliæ na: proste umo liwiaj¹ce uzyskanie podstawowych statystyk w dokumentach takich jak czêstoœæ wystêpowania, wspó³wystêpowania s³ów) (np.textstat, AntConc); silniki indeksowania i wyszukiwania informacji (np. Lucene, Windows Desktop Search, Google, Yahoo); zaawansowane pozwalaj¹ce na z³o on¹ analizê tekstów, z wykorzystaniem technik klasteryzacji, wizualizacj¹ wyników i mo liwoœci¹ budowania ontologii (np. SAS Text Miner, Oracle Text, OntoGen Text Garden). Wynikiem analizy fleksalnej i gramatycznej dokumentu jest zbiór s³ów. Tylko czêœæ z nich jest istotna dla treœci. S³owa, które najczêœciej wystêpuj¹ w wiêkszoœci dokumentów powinny zostaæ pominiête, poniewa s¹ to zaimki, przyimki i spójniki. Nastêpny etap stemming usuwa przyrostki i przedrostki oraz sprowadza s³owa do formy podstawowej w oparciu o algorytmy rozpoznaj¹ce regu³y gramatyczne lub te poprzez odwo³anie siê do stosownych s³owników. Przyk³adem s³ownika dla jêzyka angielskiego mo e byæ WordNet. Natomiast prace nad stworzeniem polskiego WordNetu s¹ prowadzone przez zespó³ kierowany przez Politechnikê Wroc³awsk¹. Wiêcej informacji na ten temat jest dostêpnych pod adresem [6]. Dokumenty s¹ przedstawiane jako zbiory s³ów (bag of words) z wyliczeniem, jak czêsto ka de z nich wystêpuje w ka dym dokumencie (term-by-document frequency) [8]. 3. Podobieñstwo dokumentów podstawy matematyczne Przeszukiwanie danych niestrukturalnych (wyszukiwanie pe³notekstowe FTS) jest technik¹ wydajnego przeszukiwania dokumentów o charakterze tekstowym, wykorzystuj¹c¹ specjalny rodzaj indeksów tzw. indeksy pe³notekstowe. FTS jest oparty na modelu przestrzeni wielowymiarowej. Tworz¹ j¹ wszystkie s³owa zawarte w przetwarzanych dokumentach. Dokument mo na interpretowaæ jako wektor sk³adaj¹cy siê z n s³ów, gdzie ka da wspó³rzêdna okreœla czêstoœæ wyst¹pieñ danego s³owa w danym dokumencie. Analizy zbioru dokumentów mo na dokonaæ, buduj¹c macierz term-by-document frequency [7 8]. Dla przyk³adowych dwóch dokumentów mo e ona wygl¹daæ nastêpuj¹co (tab. 1): D1 The cat is black D2 Black cat is my cat
7 Metody i narzêdzia automatycznego przetwarzania informacji tekstowej Tabela 1 Przyk³adowa macierz term-by-document frequency the cat is black my D D Wa noœæ s³ów w macierzy mo na zwiêkszaæ lub zmniejszaæ, stosuj¹c wspó³czynniki zwane wagami (a ij, gdzie i, j to odpowiednio indeksy wierszy i kolumn w rozpatrywanej macierzy). Otrzymujemy wówczas macierz wa onej czêstotliwoœci. Rozró niamy nastêpuj¹ce wagi: frequency Weight (dotyczy wystêpowania samego wyra enia), term Weight (dotyczy liczby wyst¹pieñ danego wyra enia w ca³ej kolekcji zbiorze dokumentów). Frequency Weight precyzuje metodê okreœlania czêstoœci wystêpowania okreœlonych zwrotów w dokumencie. Mo na tutaj wymieniæ nastêpuj¹ce metody [8]: binarna (waga w ij = 1 w przypadku wystêpowania zwrotu, a w ij = 0 przypadku jego braku; logarytmiczna wij = log 2( aij + 1) (logarytm przy podstawie 2 z liczby okreœlaj¹cej czêstoœæ wystêpowania s³owa pomniejsza wagê s³ów, które siê czêsto powtarzaj¹); none (czêstotliwoœæ wystêpowania s³ów bez modyfikacji: w ij = a ij ). Term weight wagowanie zwrotu mo na okreœlaæ m.in. za pomoc¹ metod [8]: Entropy przypisuje najwy sz¹ wagê s³owom, które wyst¹pi³y najrzadziej w danym dokumencie; IDF (Inverse Document Frequency) waga jest odwrotnoœci¹ liczby dokumentów, w których pojawi³ siê dany zwrot; GF-IDF (Global Frequency-Inverse Document Frequency) obliczamy mno ¹c IDF przez ca³kowit¹ czêstotliwoœæ; Normal waga ta jest proporcjonalna to iloœci wyst¹pienia danego s³owa w dokumencie; None ka demu zwrotowi przypisuje siê wagê 1; Chi-Squared wykorzystuje wartoœæ testu Chi-kwadrat; Mutual Information pokazuje jak rozk³ad dokumentów z wyra eniem i, znajduje siê blisko rozk³adu dokumentów w ca³ym zbiorze; Information Gain okreœla oczekiwan¹ redukcjê w Entropy w przypadku podzieleniu zbioru dokumentów wed³ug tego wyra enia i.
8 416 Piotr Potiopa Istnieje wiele algorytmów wagowania macierzy, takich jak algorytm modelu przestrzeni wektorowej, algorytm TF-IDF i tak dalej. Algorytmy wagowania w po³¹czeniu z algorytmem mierzenia podobieñstwa wektorów, takim jak na przyk³ad miara kosinusowa lub wspó³czynnik Jaccarda tworz¹ skuteczn¹ metodê miary podobieñstwa dokumentów TF-IDF Waga TF-IDF (term frequency inverse document frequency) jest czêsto u ywana w metodach information retrieval i text mining. Mimo e TF-IDF jest doœæ wiekowym algorytmem wagowania, jest prosty i skuteczny. TF-IDF polega na ustalaniu wzglêdnej czêstotliwoœci s³ów w danym, lokalnym dokumencie i porównaniu z odwrócon¹ czêstotliwoœci¹ s³owa w ca³ej kolekcji dokumentów. Dla ka dego s³owa jego TF (term frequency) jest wzgledn¹ czêstotliwoœci¹ wyst¹pieñ tego s³owa w kolekcji dokumentów, które stanowi wa noœæ s³owa wewn¹trz danego dokumentu, a jego IDF (inverse document frequency) jest odwrotnie proporcjonalna do wystapieñ s³owa w odniesieniu do korpusu dokumentu, czyli przedstawia znaczenie tego s³owa w ca³ej kolekcji dokumentów [8 9]. Algorytm dzia³a w nastêpuj¹cy sposób: maj¹c: D kolekcja dokumentów, d dany dokument, dla którego d D, w s³owo wystêpuj¹ce w dokumencie d, obliczamy: wd fw, d log( D fw, D ) a = (1) gdzie f w,d jest iloœci¹ wyst¹pieñ s³owa w dokumencie d, D jest rozmiarem korpusu dokumentu oraz f w,d jest iloœci¹ dokumentów, w których wystêpuje s³owo w. Czasami przy du- ych kolekcjach dokumentów mo emy dokonaæ normalizacji czêœci TF, stosuj¹c technikê redukcji wymiaru SVD (Singular Value Decomposition). Redukcja pomog¹ nam zmniejszyæ iloœæ wymiarów i przybli yæ macierz wa onej czêstotliwoœci [8 9] Miara kosinusowa Miara kosinusowa jest wydajnym algorytmem obliczania podobieñstwa w przypadku tekstów. Podstawowym za³o eniem tej metody obliczania podobieñstwa jest nastêpuj¹ca idea: Dla dwóch punktów A, B na skali xy jak pokazuje rysunek 3, podobieñstwa miêdzy A i B s¹ zdefiniowane nastêpuj¹co: Sim( A, B) = cos Θ= A B A B (2)
9 Metody i narzêdzia automatycznego przetwarzania informacji tekstowej gdzie Sim(A, B) jest podobieñstwem dokumentu A do dokumentu B, A B jest iloczynem skalarnym wektorów A i B, który to równa siê: x1*x2 + y1*y2, A B okreœla odleg³oœæ pomiêdzy A i B, która jest okreœlona wzorem: (x y 1 2 ) 1/2 (x y 2 2 ) 1/2 [8, 10]. Rys. 3. Wspó³rzêdne punktów A i B na dwuwymiarowej skali liczbowej 4. Przyk³ady narzêdzi do analizy tekstów Do analizy danych tekstowych dostêpne s¹ narzêdzia zarówno ogólnodostêpne typu open source, jak i komercyjne. Ich mo liwoœci s¹ bardzo zró nicowane od prostych podaj¹cych podstawowe informacje statystyczne na temat dokumentów po bardziej wyrafinowanie systemy buduj¹ce ontologie pojêæ lub maj¹ce wbudowane zaawansowane algorytmy analizy sk³adni. Wszystkie dobrze sobie radz¹ z jêzykami zachodnimi, chiñskim czy nawet japoñskim. Problem jest z jêzykiem polskim. Nie dotyczy on tylko sposobu kodowania polskich znaków, ale i programów analizuj¹cych sk³adniê. W ramach opracowania przeanalizowano kilka wybranych narzêdzi TextSTAT TextSTAT to prosty program do analizy tekstów. Potrafi on obs³ugiwaæ pliki ASCII/ ANSI, HTML, formaty MS Word (.doc i.docx) oraz OpenOffice (sxw i.odt), z których tworzy listê czêstotliwoœci wystêpowania poszczególnych s³ów, ma mo liwoœæ tworzenia konkordancji oraz list frekwencyjnych. TextStat posiada a 6 wersji jêzykowych interfejsu (równie j. polski) i pracuje we wszystkich systemach operacyjnych. To co wyró nia go spoœród innych darmowych programów tego typu, to mo liwoœæ tworzenia korpusu ze stron internetowych wczytywanych przez program bezpoœrednio z sieci. Niestety, program nie posiada kilku istotnych funkcji, takich jak tworzenie listy s³ów kluczowych czy wyszukiwanie kolokacji oraz ci¹gów wielowyrazowych [11].
10 418 Piotr Potiopa 4.2. AntConc AntConc to darmowy program do analizy tekstów oferuj¹cy szeroki wachlarz funkcji. Wœród nich znajduje siê tworzenie konkordancji, list frekwencyjnych, list s³ów kluczowych i wykresów dystrybucji, a tak e wyszukiwanie ci¹gów wielowyrazowych i kolokacji. Przyjazny interfejs, szybkoœæ wykonywanych analiz i funkcjonalnoœæ dorównuj¹ca wielu komercyjnym aplikacjom sprawiaj¹, e AntConc jest szczególnie godny polecenia zarówno dla osób stawiaj¹cych swoje pierwsze kroki w pracy z korpusami dokumentów, jak i dla bardziej zaawansowanych u ytkowników [12] WordSmith WordSmith Tools to prawdopodobnie najbardziej popularny w oœrodkach akademickich pakiet narzêdzi do analizy danych tekstowych. Oferuje imponuj¹cy wachlarz funkcji oraz mo liwoœci dostosowania poszczególnych narzêdzi do konkretnych zadañ. Obs³uguje znaczniki, dzia³a szybko i dobrze radzi sobie nawet z du ymi korpusami. WordSmith Tools dzia³a w Windows oraz Mac OS X. Pe³na wersja oprogramowania jest p³atna, ale istnieje mo liwoœæ wypróbowania wersji demo o ograniczonej funkcjonalnoœci. Program opiera siê na trzech podstawowych funkcjach: konkordancja (Concord), lista s³ów kluczowych (Key- Word) oraz lista frekwencyjna (WordList) [12] Poliqarp Poliqarp to darmowe oprogramowanie do przeszukiwania du ych korpusów. Powsta³ w efekcie prac nad Korpusem IPI PAN i obs³uguje ten korpus zarówno w wersji on-line, jak i off-line. Dziêki przejrzystemu interfejsowi korzystanie z podstawowych funkcji programu oraz wykorzystanie jego mo liwoœci konfiguracyjnych nie powinno sprawiaæ trudnoœci nawet pocz¹tkuj¹cym u ytkownikom. Program mo na uruchamiaæ zarówno w œrodowisku Windows, jak i Linux. Dodatkowym atutem jest fakt, e istniej¹ dwie wersje jêzykowe polska i angielska. Poliqarp daje mo liwoœæ wyszukiwania okreœlonych s³ów czy fraz. Pozwala tak e na znajdowanie sekwencji okreœlanych za pomoc¹ wyra eñ regularnych, na przyk³ad: wszystkich wystêpuj¹cych w korpusie fraz sk³adaj¹cych siê z rzeczownika i przymiotnika lub wszystkich form fleksyjnych wybranego wyrazu (funkcja szczególnie przydatna w przypadku badañ nad jêzykiem polskim). Operacje te, zarówno w wersji on-line, jak i off-line, przebiegaj¹ doœæ szybko przy prostych zapytaniach wyszukiwanie nie zajmuje wiêcej ni kilka sekund. [12-13] 5. Podsumowanie Technologie przetwarzania jêzyka naturalnego mo na wskazywaæ jako jedne z podstawowych dla technologii zarz¹dzania wiedz¹, poniewa umo liwiaj¹:
11 Metody i narzêdzia automatycznego przetwarzania informacji tekstowej automatyczne przetwarzanie dokumentów (treœci) np. WWW, maszynowo przetwarzane opisywanie (annotation) tekstów w jêzyku naturalnym za pomoc¹ pojêæ zawartych w ontologii, odkrywanie nowych elementów ontologii (tj. pojêæ, klas, instancji, atrybutów, relacji, twierdzeñ), automatyczne wyszukiwanie elementów wiedzy. Wymienione aspekty mo na traktowaæ w œwietle automatyzacji t³umaczenia tekstów zapisanych w jêzyku naturalnym na sformalizowany jêzyk reprezentacji wiedzy. Tak postawione zagadnienie, tzn. automatyzacja translacji tekstów w jêzyku naturalnym na jêzyk formalny, jest jednym z najbardziej po ¹danych i obiecuj¹cych kierunków wspó³czesnych badañ w dziedzinie systemów zarz¹dzania wiedz¹. Celem automatyzacji jest tworzenie baz wiedzy zapisanej w jêzyku sformalizowanym, umo liwiaj¹cym operowanie t¹ wiedz¹ w sposób automatyczny. Literatura [1] Go³uchowski J., Technologie informatyczne w zarz¹dzaniu wiedz¹ w organizacji. AE, Katowice [2] Aamodt A., Plaza E., Case-Based Reasoning: Foundational Issues. Methodological Variations, and System Approaches, AICom, Artificial Intelligence Communications, IOS Press [3] Tomassen S.L., Semi-automatic generation of ontologies for knowledge-intensive CBR. Norwegian University of Science and Technology, [4] Filipowska A., Jak zaoszczêdziæ na czytaniu? Automatyczne tworzenie abstraktów z dokumentów. Gazeta IT nr 3, marzec [5] Wybrane problemy zarz¹dzania wiedz¹. Instytut ¹cznoœci, Pañstwowy Instytut Badawczy, Praca nr , [6] [7] Ikonomakis M., Kotsiantis S., Tampakas V., Text Classification Using Machine Learning Techniques. WSEAS TRANSACTIONS on COMPUTERS, Issue 8, vol. 4, August 2005, [8] K³opotek M.A., Inteligentne wyszukiwarki internetowe. Exit, [9] Ramos J., Using TF-IDF to Determine Word Relevance in Document Queries [10] [11] [12] [13]
Czy przedsiêbiorstwo, którym zarz¹dzasz, intensywnie siê rozwija, ma wiele oddzia³ów lub kolejne lokalizacje w planach?
Czy przedsiêbiorstwo, którym zarz¹dzasz, intensywnie siê rozwija, ma wiele oddzia³ów lub kolejne lokalizacje w planach? Czy masz niedosyt informacji niezbêdnych do tego, by mieæ pe³en komfort w podejmowaniu
Bardziej szczegółoworevati.pl Drukarnia internetowa Szybki kontakt z klientem Obs³uga zapytañ ofertowych rozwi¹zania dla poligrafii Na 100% procent wiêcej klientów
revati.pl rozwi¹zania dla poligrafii Systemy do sprzeda y us³ug poligraficznych w internecie Drukarnia Szybki kontakt z klientem Obs³uga zapytañ ofertowych Na 100% procent wiêcej klientów drukarnia drukarnia
Bardziej szczegółowoARKUSZ III KRYTERIA OCENIANIA
Egzamin maturalny z jêzyka angielskiego dla klas dwujêzycznych maj 2002 1 ARKUSZ III KRYTERIA OCENIANIA ZADANIE 9 Proszê zaznaczyæ w tabeli przyznan¹ liczbê punktów i zsumowaæ wynik. Kryteria oceniania
Bardziej szczegółowoEthernet VPN tp. Twój œwiat. Ca³y œwiat.
Ethernet VPN tp 19330 Twój œwiat. Ca³y œwiat. Efektywna komunikacja biznesowa pozwala na bardzo szybkie i bezpieczne po³¹czenie poszczególnych oddzia³ów firmy przez wirtualn¹ sieæ prywatn¹ (VPN) oraz zapewnia
Bardziej szczegółowoProjektowanie procesów logistycznych w systemach wytwarzania
GABRIELA MAZUR ZYGMUNT MAZUR MAREK DUDEK Projektowanie procesów logistycznych w systemach wytwarzania 1. Wprowadzenie Badania struktury kosztów logistycznych w wielu krajach wykaza³y, e podstawowym ich
Bardziej szczegółowoEGZAMIN MATURALNY Z INFORMATYKI
Miejsce na naklejkê z kodem (Wpisuje zdaj¹cy przed rozpoczêciem pracy) KOD ZDAJ CEGO MIN-W2A1P-021 EGZAMIN MATURALNY Z INFORMATYKI Instrukcja dla zdaj¹cego Czas pracy 120 minut 1. Proszê sprawdziæ, czy
Bardziej szczegółowoInformacje o omawianym programie. Założenia programu omawianego w przykładzie
1 Komunikacja człowiek - komputer Przedmiot: Komunikacja człowiek - komputer Ćwiczenie: 3 Temat dwiczenia: Projektowanie interfejsu programu typu bazodanowego dr Artur Bartoszewski CZĘŚD I analiza przykładowego
Bardziej szczegółowoWydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych
Wydział Elektrotechniki, Informatyki i Telekomunikacji Instytut Informatyki i Elektroniki Instrukcja do zajęć laboratoryjnych wersja: 1.0 Nr ćwiczenia: 12, 13 Temat: Cel ćwiczenia: Wymagane przygotowanie
Bardziej szczegółowoPREZENTACJA INFORMACJI FINANSOWEJ w analizach i modelowaniu finansowym. - dane z rynków finansowych DANE RÓD OWE
DANE RÓD OWE PREZENTACJA INFORMACJI FINANSOWEJ - dane z rynków finansowych - w formie baz danych - w formie tabel na stronach internetowych - w formie plików tekstowych o uk³adzie kolumnowym - w formie
Bardziej szczegółowoInstalacja. Zawartość. Wyszukiwarka. Instalacja... 1. Konfiguracja... 2. Uruchomienie i praca z raportem... 4. Metody wyszukiwania...
Zawartość Instalacja... 1 Konfiguracja... 2 Uruchomienie i praca z raportem... 4 Metody wyszukiwania... 6 Prezentacja wyników... 7 Wycenianie... 9 Wstęp Narzędzie ściśle współpracujące z raportem: Moduł
Bardziej szczegółowosystemy informatyczne SIMPLE.ERP Bud etowanie dla Jednostek Administracji Publicznej
SIMPLE systemy informatyczne SIMPLE.ERP Bud etowanie dla Jednostek Administracji Publicznej SIMPLE.ERP Bud etowanie dla Jednostek Administracji Publicznej to nowoczesny system informatyczny kompleksowo
Bardziej szczegółowoRys Mo liwe postacie funkcji w metodzie regula falsi
5.3. Regula falsi i metoda siecznych 73 Rys. 5.1. Mo liwe postacie funkcji w metodzie regula falsi Rys. 5.2. Przypadek f (x), f (x) > w metodzie regula falsi 74 V. Równania nieliniowe i uk³ady równañ liniowych
Bardziej szczegółowoPrzypomnienie najważniejszych pojęć z baz danych. Co to jest baza danych?
Przypomnienie najważniejszych pojęć z baz danych. Co to jest baza danych? 1 Podstawowe pojęcia: 2 3 4 5 Dana (ang.data) najmniejsza, elementarna jednostka informacji o obiekcie będąca przedmiotem przetwarzania
Bardziej szczegółowoPodstawowe działania w rachunku macierzowym
Podstawowe działania w rachunku macierzowym Marcin Detka Katedra Informatyki Stosowanej Kielce, Wrzesień 2004 1 MACIERZE 1 1 Macierze Macierz prostokątną A o wymiarach m n (m wierszy w n kolumnach) definiujemy:
Bardziej szczegółowoSYS CO. TYLU MENAD ERÓW ROCZNIE na ca³ym œwiecie uzyskuje kwalifikacje ILM
Rozwój organizacji zale y od doskonale przygotowanej kadry mened erskiej, która potrafi sprawiæ, e ludzie pracuj¹cy dla naszej firmy chc¹ byæ jej czêœci¹ i realizowaæ wspólnie wyznaczone cele. POZNAJ JAKOŒÆ
Bardziej szczegółowoPodstawy Informatyki Gramatyki formalne
Podstawy Informatyki alina.momot@polsl.pl http://zti.polsl.pl/amomot/pi Plan wykładu 1 Języki i gramatyki Analiza syntaktyczna Semantyka 2 Podstawowe pojęcia Gramatyki wg Chomsky ego Notacja Backusa-Naura
Bardziej szczegółowoSYMULACJA STOCHASTYCZNA W ZASTOSOWANIU DO IDENTYFIKACJI FUNKCJI GÊSTOŒCI PRAWDOPODOBIEÑSTWA WYDOBYCIA
Górnictwo i Geoin ynieria Rok 29 Zeszyt 4 2005 Ryszard Snopkowski* SYMULACJA STOCHASTYCZNA W ZASTOSOWANIU DO IDENTYFIKACJI FUNKCJI GÊSTOŒCI PRAWDOPODOBIEÑSTWA WYDOBYCIA 1. Wprowadzenie W monografii autora
Bardziej szczegółowoProjektowanie bazy danych
Projektowanie bazy danych Pierwszą fazą tworzenia projektu bazy danych jest postawienie definicji celu, założeo wstępnych i określenie podstawowych funkcji aplikacji. Każda baza danych jest projektowana
Bardziej szczegółowogdy wielomian p(x) jest podzielny bez reszty przez trójmian kwadratowy x rx q. W takim przypadku (5.10)
5.5. Wyznaczanie zer wielomianów 79 gdy wielomian p(x) jest podzielny bez reszty przez trójmian kwadratowy x rx q. W takim przypadku (5.10) gdzie stopieñ wielomianu p 1(x) jest mniejszy lub równy n, przy
Bardziej szczegółowoProgram szkoleniowy Efektywni50+ Moduł III Standardy wymiany danych
Program szkoleniowy Efektywni50+ Moduł III 1 Wprowadzenie do zagadnienia wymiany dokumentów. Lekcja rozpoczynająca moduł poświęcony standardom wymiany danych. Wprowadzenie do zagadnień wymiany danych w
Bardziej szczegółowoAutomatyka przemys³owa
- 6 - Doœwiadczenie Firma uesa dzia³a na miêdzynarodowym rynku automatyki od 1991 roku, zaœ na rynku polskim od 2007. Zakres realizacji Œwiadczymy us³ugi zarówno dla przemys³u jak i energetyki zawodowej
Bardziej szczegółowowww.klimatycznykolobrzeg.pl OFERTA PROMOCYJNA
Portal Klimatyczny Ko³obrzeg www.klimatycznykolobrzeg.pl OFERTA PROMOCYJNA Centrum Promocji i Informacji Turystycznej w Ko³obrzegu widz¹c koniecznoœæ zmiany wizerunku oraz funkcjonalnoœci turystycznej
Bardziej szczegółowoIV. UK ADY RÓWNAÑ LINIOWYCH
IV. UK ADY RÓWNAÑ LINIOWYCH 4.1. Wprowadzenie Uk³ad równañ liniowych gdzie A oznacza dan¹ macierz o wymiarze n n, a b dany n-elementowy wektor, mo e byæ rozwi¹zany w skoñczonej liczbie kroków za pomoc¹
Bardziej szczegółowoGEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla uŝytkowników modułu wyszukiwania danych Warszawa 2007
GEO-SYSTEM Sp. z o.o. 02-732 Warszawa, ul. Podbipięty 34 m. 7, tel./fax 847-35-80, 853-31-15 http:\\www.geo-system.com.pl e-mail:geo-system@geo-system.com.pl GEO-RCiWN Rejestr Cen i Wartości Nieruchomości
Bardziej szczegółowoIda Kurcz. Psychologia języka i komunikacji
Ida Kurcz Psychologia języka i komunikacji Spis treœci PRZEDMOWA DO WYDANIA DRUGIEGO............................... 9 ROZDZIA I. PSYCHOLOGIA JÊZYKA A PSYCHOLINGWISTYKA I SOCJOLINGWISTYKA. UWAGI WSTÊPNE..................
Bardziej szczegółowo1. Podstawy budowania wyra e regularnych (Regex)
Dla wi kszo ci prostych gramatyk mo na w atwy sposób napisa wyra enie regularne które b dzie s u y o do sprawdzania poprawno ci zda z t gramatyk. Celem niniejszego laboratorium b dzie zapoznanie si z wyra
Bardziej szczegółowoSpis treści 1. Wstęp 2. Projektowanie systemów informatycznych
Spis treści 1. Wstęp... 9 1.1. Inżynieria oprogramowania jako proces... 10 1.1.1. Algorytm... 11 1.2. Programowanie w językach wysokiego poziomu... 11 1.3. Obiektowe podejście do programowania... 12 1.3.1.
Bardziej szczegółowo(wymiar macierzy trójk¹tnej jest równy liczbie elementów na g³ównej przek¹tnej). Z twierdzen 1 > 0. Zatem dla zale noœci
56 Za³ó my, e twierdzenie jest prawdziwe dla macierzy dodatnio okreœlonej stopnia n 1. Macierz A dodatnio okreœlon¹ stopnia n mo na zapisaæ w postaci n 1 gdzie A n 1 oznacza macierz dodatnio okreœlon¹
Bardziej szczegółowo3.2 Warunki meteorologiczne
Fundacja ARMAAG Raport 1999 3.2 Warunki meteorologiczne Pomiary podstawowych elementów meteorologicznych prowadzono we wszystkich stacjach lokalnych sieci ARMAAG, równolegle z pomiarami stê eñ substancji
Bardziej szczegółowoWdrożenie modułu płatności eservice dla systemu Virtuemart 2.0.x
Wdrożenie modułu płatności eservice dla systemu Virtuemart 2.0.x Wersja 02 Styczeń 2016 Centrum Elektronicznych Usług Płatniczych eservice Sp. z o.o. Spis treści 1. Wstęp... 3 1.1. Przeznaczenie dokumentu...
Bardziej szczegółowoAnaliza danych tekstowych i języka naturalnego
Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach
Bardziej szczegółowoSkanowanie trójwymiarowej przestrzeni pomieszczeñ
AUTOMATYKA 2008 Tom 12 Zeszyt 3 S³awomir Je ewski*, Micha³ Jaros* Skanowanie trójwymiarowej przestrzeni pomieszczeñ 1. Wprowadzenie Obecnie w erze komputerów, które pozwalaj¹ na wizualizacje scen nie tylko
Bardziej szczegółowoZapraszamy. codziennej pracy. ka dego naukowca. Efektywne narzêdzie. Platforma ³¹cz¹ca ludzi nauki. Platforma ³¹cz¹ca ludzi nauki.
dowiedz siê wiêcej: iprofesor Efektywne narzêdzie codziennej pracy ka dego naukowca Zapraszamy Biuro projektu: Kiliñskiego 177 lok 14A 93-106 ódÿ Telefon: +48 883 321 883 Mail: Biuro@iProfesor ? Czym jest
Bardziej szczegółowoMarcin Werla mwerla@man.poznan.pl
Dobre praktyki udostępniania on-line baz bibliograficznych i pełnotekstowych Marcin Werla mwerla@man.poznan.pl Udostępnianie on-line baz bibliograficznych i pełnotekstowych Budując i udostępniając bazę
Bardziej szczegółowoWprowadzenie nowego pracownika. wydanie 1. ISBN 978-83-255-0049-8. Autor: Justyna Tyborowska. Redakcja: Joanna Tyszkiewicz
Wprowadzenie nowego pracownika wydanie 1. ISBN 978-83-255-0049-8 Autor: Justyna Tyborowska Redakcja: Joanna Tyszkiewicz Wydawnictwo C.H. Beck Ul. Gen. Zajączka 9, 01-518 Warszawa Tel. (022) 311 22 22 Faks
Bardziej szczegółowoBaza danych. Baza danych jest to zbiór danych powi zanych mi dzy sob pewnymi zale no ciami.
Access Baza danych Baza danych jest to zbiór danych powi zanych mi dzy sob pewnymi zale no ciami. Baza danych sk ada si z danych oraz programu komputerowego wyspecjalizowanego do gromadzenia i przetwarzania
Bardziej szczegółowoRozdział 6. Pakowanie plecaka. 6.1 Postawienie problemu
Rozdział 6 Pakowanie plecaka 6.1 Postawienie problemu Jak zauważyliśmy, szyfry oparte na rachunku macierzowym nie są przerażająco trudne do złamania. Zdecydowanie trudniejszy jest kryptosystem oparty na
Bardziej szczegółowoPowszechność nauczania języków obcych w roku szkolnym
Z PRAC INSTYTUTÓW Jadwiga Zarębska Warszawa, CODN Powszechność nauczania języków obcych w roku szkolnym 2000 2001 Ö I. Powszechność nauczania języków obcych w różnych typach szkół Dane przedstawione w
Bardziej szczegółowoPodstawa programowa kształcenia ogólnego informatyki w gimnazjum
1 Podstawa programowa kształcenia ogólnego informatyki w gimnazjum Obowiązująca podstawa programowa nauczania informatyki w gimnazjum, w odniesieniu do propozycji realizacji tych zagadnień w podręcznikach
Bardziej szczegółowoZbuduj prywatnπ chmurê backupu w? rmie. Xopero Backup. Centralnie zarzπdzane rozwiπzanie do backupu serwerów i stacji roboczych
Zbuduj prywatnπ chmurê backupu w? rmie Centralne i zdalne zarzπdzanie kopiami zapasowymi Dedykowane rozwiπzanie dla dowolnej infrastruktury w? rmie Backup stacji roboczych i serwerów Bezpieczne przechowywanie
Bardziej szczegółowoCharakterystyka systemów plików
Charakterystyka systemów plików Systemy plików są rozwijane wraz z systemami operacyjnymi. Windows wspiera systemy FAT oraz system NTFS. Różnią się one sposobem przechowywania informacji o plikach, ale
Bardziej szczegółowoMetody opracowywania dokumentów wielostronicowych. Technologia Informacyjna Lekcja 28
Metody opracowywania dokumentów wielostronicowych Technologia Informacyjna Lekcja 28 Tworzenie stylów w tekstu Jeśli pisze się długie teksty, stosując, zwłaszcza w jednym dokumencie róŝne r rodzaje formatowania,
Bardziej szczegółowoAutomatyzacja procesu publikowania w bibliotece cyfrowej
Automatyzacja procesu publikowania w bibliotece cyfrowej Jakub Bajer Biblioteka Politechniki Poznańskiej Krzysztof Ober Poznańska Fundacja Bibliotek Naukowych Plan prezentacji 1. Cel prezentacji 2. Proces
Bardziej szczegółowoGie³da Papierów Wartoœciowych w Warszawie S.A.
Gie³da Papierów Wartoœciowych w Warszawie S.A. (spó³ka akcyjna z siedzib¹ w Warszawie przy ul. Ksi¹ êcej 4, zarejestrowana w rejestrze przedsiêbiorców Krajowego Rejestru S¹dowego pod numerem 0000082312)
Bardziej szczegółowoECDL Advanced Moduł AM3 Przetwarzanie tekstu Syllabus, wersja 2.0
ECDL Advanced Moduł AM3 Przetwarzanie tekstu Syllabus, wersja 2.0 Copyright 2010, Polskie Towarzystwo Informatyczne Zastrzeżenie Dokument ten został opracowany na podstawie materiałów źródłowych pochodzących
Bardziej szczegółowoJacek Mrzyg³ód, Tomasz Rostkowski* Rozwi¹zania systemowe zarz¹dzania kapita³em ludzkim (zkl) w bran y energetycznej
Komunikaty 99 Jacek Mrzyg³ód, Tomasz Rostkowski* Rozwi¹zania systemowe zarz¹dzania kapita³em ludzkim (zkl) w bran y energetycznej Artyku³ przedstawi skrócony raport z wyników badania popularnoœci rozwi¹zañ
Bardziej szczegółowoProcedura weryfikacji badania czasu przebiegu 1 paczek pocztowych
Procedura weryfikacji badania czasu przebiegu 1 paczek pocztowych Warszawa 2012 (nowelizacja 2014) 1 zmiana nazwy zgodnie z terminologią zawartą w ustawie Prawo pocztowe Jednostka zlecająca: Urząd Komunikacji
Bardziej szczegółowoFirma Informatyczna JazzBIT
Artykuły i obrazy Autor: Stefan Wajda [zwiastun] 10.02.2006. Dodawanie i publikowanie artykułów to najczęstsze zadanie. I chociaż nie jest skomplikowane, może początkujacych wprawiać w zakłopotanie. Trzeba
Bardziej szczegółowoAUTOMATYKA INFORMATYKA
AUTOMATYKA INFORMATYKA Technologie Informacyjne Sieć Semantyczna Przetwarzanie Języka Naturalnego Internet Edytor Serii: Zdzisław Kowalczuk Inteligentne wydobywanie informacji z internetowych serwisów
Bardziej szczegółowoCzęść 2 struktura e-paczki
e-paczka, czyli wysyłam dokumenty do e-urzędu. Andrzej Matejko, Mirosław Januszewski Stowarzyszenie PEMI Część 2 struktura e-paczki.. zaraz po opublikowaniu pierwszej części opracowania otrzymaliśmy szereg
Bardziej szczegółowoWyszukiwanie informacji w internecie. Nguyen Hung Son
Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy
Bardziej szczegółowoZASTOSOWANIE ROSZERZONEJ METODOLOGII WNIOSKOWANIA NA PODSTAWIE PRZYPADKÓW TEXTUAL CBR W PRACY Z DOKUMENTAMI TEKSTOWYMI
ZASTOSOWANIE ROSZERZONEJ METODOLOGII WNIOSKOWANIA NA PODSTAWIE PRZYPADKÓW TEXTUAL CBR W PRACY Z DOKUMENTAMI TEKSTOWYMI Anna Kempa Wstęp Próby automatycznego wyszukiwania, analizy i obróbki dokumentów tekstowych
Bardziej szczegółowoOferta pozycjonowania
www.kamelot.pl 2012 Oferta pozycjonowania Iloœæ stron w Google Iloœæ stron Iloœæ linków w Google Iloœæ linków podstron w Pañstwa strony w wyszukiwarce google: podstron w Pañstwa strony wed³ug Majesticseo:
Bardziej szczegółowoPrzygotowały: Magdalena Golińska Ewa Karaś
Przygotowały: Magdalena Golińska Ewa Karaś Druk: Drukarnia VIVA Copyright by Infornext.pl ISBN: 978-83-61722-03-8 Wydane przez Infornext Sp. z o.o. ul. Okopowa 58/72 01 042 Warszawa www.wieszjak.pl Od
Bardziej szczegółowoAutomatyczne przetwarzanie recenzji konsumenckich dla oceny użyteczności produktów i usług
Uniwersytet Ekonomiczny w Poznaniu Wydział Informatyki i Gospodarki Elektronicznej Katedra Informatyki Ekonomicznej Streszczenie rozprawy doktorskiej Automatyczne przetwarzanie recenzji konsumenckich dla
Bardziej szczegółowoOpis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej
Opis programu do wizualizacji algorytmów z zakresu arytmetyki komputerowej 3.1 Informacje ogólne Program WAAK 1.0 służy do wizualizacji algorytmów arytmetyki komputerowej. Oczywiście istnieje wiele narzędzi
Bardziej szczegółowoTechniki korekcyjne wykorzystywane w metodzie kinesiotapingu
Techniki korekcyjne wykorzystywane w metodzie kinesiotapingu Jak ju wspomniano, kinesiotaping mo e byç stosowany jako osobna metoda terapeutyczna, jak równie mo e stanowiç uzupe nienie innych metod fizjoterapeutycznych.
Bardziej szczegółowoIII. INTERPOLACJA Ogólne zadanie interpolacji. Niech oznacza funkcjê zmiennej x zale n¹ od n + 1 parametrów tj.
III. INTERPOLACJA 3.1. Ogólne zadanie interpolacji Niech oznacza funkcjê zmiennej x zale n¹ od n + 1 parametrów tj. Definicja 3.1. Zadanie interpolacji polega na okreœleniu parametrów tak, eby dla n +
Bardziej szczegółowoKorpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Bardziej szczegółowoSystemy mikroprocesorowe - projekt
Politechnika Wrocławska Systemy mikroprocesorowe - projekt Modbus master (Linux, Qt) Prowadzący: dr inż. Marek Wnuk Opracował: Artur Papuda Elektronika, ARR IV rok 1. Wstępne założenia projektu Moje zadanie
Bardziej szczegółowoPOMIAR STRUMIENIA PRZEP YWU METOD ZWÊ KOW - KRYZA.
POMIAR STRUMIENIA PRZEP YWU METOD ZWÊ KOW - KRYZA. Do pomiaru strumienia przep³ywu w rurach metod¹ zwê kow¹ u ywa siê trzech typów zwê ek pomiarowych. S¹ to kryzy, dysze oraz zwê ki Venturiego. (rysunek
Bardziej szczegółowoSPIS TRESCI SERWERY WSTEP CENNIK KONTAKT. Kamelot radzi: ...
www.kamelot.pl , SPIS TRESCI, WSTEP CENNIK KONTAKT Kamelot radzi:... Informacje Ogólne Serwer - program œwiadcz¹cy us³ugi na rzecz innych programów, zazwyczaj korzystaj¹cych z innych komputerów po³¹czonych
Bardziej szczegółowoPADY DIAMENTOWE POLOR
PADY DIAMENTOWE POLOR Pad czerwony gradacja 400 Pady diamentowe to doskona³e narzêdzie, które bez u ycia œrodków chemicznych, wyczyœci, usunie rysy i wypoleruje na wysoki po³ysk zniszczone powierzchnie
Bardziej szczegółowoINSTRUKCJA DLA UCZESTNIKÓW ZAWODÓW ZADANIA
INSTRUKCJA DLA UCZESTNIKÓW ZAWODÓW 1. Zawody III stopnia trwają 150 min. 2. Arkusz egzaminacyjny składa się z 2 pytań otwartych o charakterze problemowym, 1 pytania opisowego i 1 mini testu składającego
Bardziej szczegółowoS I M P L E. E R P ZARZ DZANIE MA J TKIEM. www.simple.com.pl
S I M P L E. E R P ZARZ DZANIE MA J TKIEM www.simple.com.pl SIMPLE.ERP ZARZ DZANIE MA J TKIEM Obszar funkcjonalny systemu ZARZ DZANIE MA J TKIEM umo liwia prowadzenie w systemie pe³nej obs³ugi maj¹tku
Bardziej szczegółowoWyszukiwanie dokumentów WWW bazujące na słowach kluczowych
Eksploracja zasobów internetowych Wykład 3 Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych mgr inż. Maciej Kopczyński Białystok 2014 Wstęp Wyszukiwanie dokumentów za pomocą słów kluczowych bazujące
Bardziej szczegółowoPRAWA ZACHOWANIA. Podstawowe terminy. Cia a tworz ce uk ad mechaniczny oddzia ywuj mi dzy sob i z cia ami nie nale cymi do uk adu za pomoc
PRAWA ZACHOWANIA Podstawowe terminy Cia a tworz ce uk ad mechaniczny oddzia ywuj mi dzy sob i z cia ami nie nale cymi do uk adu za pomoc a) si wewn trznych - si dzia aj cych na dane cia o ze strony innych
Bardziej szczegółowoROCZNIKI 2010 GEOMATYKI. Metodyka i technologia budowy geoserwera tematycznego jako komponentu INSPIRE. Tom VIII Zeszyt 3(39) Warszawa
POLSKIE TOWARZYSTWO INFORMACJI PRZESTRZENNEJ ROCZNIKI 2010 GEOMATYKI Metodyka i technologia budowy geoserwera tematycznego jako komponentu INSPIRE Tom VIII Zeszyt 3(39) Warszawa PROPOZYCJA ZASAD POLSKIE
Bardziej szczegółowoPLANY WYNIKOWE W ZAKRESIE III KLASY GIMNAZJUM. opracowane na podstawie materia³ów katechetycznych Jezus prowadzi i zbawia z serii W DRODZE DO EMAUS
PLANY WYNIKOWE W ZAKRESIE III KLASY GIMNAZJUM opracowane na podstawie materia³ów katechetycznych Jezus prowadzi i zbawia z serii W DRODZE DO EMAUS Dzia³anie nauczyciela, w tym równie katechety, jest œciœle
Bardziej szczegółowoLaboratorium z przedmiotu MED. Lab1 - wprowadzenie
Laboratorium z przedmiotu MED Lab1 - wprowadzenie Grzegorz Protaziuk Konsultacje: środa godz. 11.00 12.00 pok. 301 Gmach EiTI email: gprotazi@elka.pw.edu.pl (w temacie mejla proszę dodać frazę MED) www.ii.pw.edu.pl/~gprotazi
Bardziej szczegółowoWSTĘP DO PROGRAMOWANIA
Stefan Sokołowski WSTĘP DO PROGRAOWANIA Inst Informatyki UG, Gdańsk, 2011/2012 Wykład1ALGORYTAPROGRA,str1 WSTĘP DO PROGRAOWANIA reguły gry Zasadnicze informacje: http://infugedupl/ stefan/dydaktyka/wstepdoprog
Bardziej szczegółowoRaport z przeprowadzenia ankiety dotyczącej oceny pracy dziekanatu POLITECHNIKA CZĘSTOCHOWSKA. WYDZIAŁ INŻYNIERII MECHANICZNEJ i INFORMATYKI
POLITECHNIKA CZĘSTOCHOWSKA WYDZIAŁ INŻYNIERII MECHANICZNEJ i INFORMATYKI WEWNĘTRZNY SYSTEM ZAPEWNIENIA JAKOŚCI KSZTAŁCENIA Raport z przeprowadzenia ankiety dotyczącej oceny pracy dziekanatu CZĘSTOCHOWA
Bardziej szczegółowoCZY JEDNYM POSUNIÊCIEM DA SIÊ ROZWI ZAÆ WSZYSTKIE UK ADY DWÓCH RÓWNAÑ LINIOWYCH?
47. CZY JEDNYM POSUNIÊCIEM DA SIÊ ROZI ZAÆ SZYSTKIE UK ADY DÓCH RÓNAÑ LINIOYCH? 1. Realizowane treœci podstawy programowej Przedmiot Matematyka Informatyka Realizowana treœæ podstawy programowej 7. Równania.
Bardziej szczegółowoW dobie postępującej digitalizacji zasobów oraz zwiększającej się liczby dostawców i wydawców
W dobie postępującej digitalizacji zasobów oraz zwiększającej się liczby dostawców i wydawców oferujących dostępy do tytułów elektronicznych, zarówno bibliotekarze jak i użytkownicy coraz większą ilość
Bardziej szczegółowoRegulamin organizacji przetwarzania i ochrony danych osobowych w Powiatowym Centrum Kształcenia Zawodowego im. Komisji Edukacji Narodowej w Jaworze
Załącznik nr 1 do zarządzenia nr 9/11/12 dyrektora PCKZ w Jaworze z dnia 30 marca 2012 r. Regulamin organizacji przetwarzania i ochrony danych osobowych w Powiatowym Centrum Kształcenia Zawodowego im.
Bardziej szczegółowoModelowanie œrodowiska 3D z danych pomiarowych**
AUTOMATYKA 2005 Tom 9 Zeszyt 3 Jacek Nowakowski *, Daniel Kaczorowski * Modelowanie œrodowiska 3D z danych pomiarowych** 1. Wprowadzenie Jednym z obszarów mo liwego wykorzystania symulacji komputerowej
Bardziej szczegółowoSzczegółowe zasady obliczania wysokości. i pobierania opłat giełdowych. (tekst jednolity)
Załącznik do Uchwały Nr 1226/2015 Zarządu Giełdy Papierów Wartościowych w Warszawie S.A. z dnia 3 grudnia 2015 r. Szczegółowe zasady obliczania wysokości i pobierania opłat giełdowych (tekst jednolity)
Bardziej szczegółowoPKN ORLEN S.A. Elektroniczny słownik lub tłumacz multijęzyczny. Zapytanie ofertowe. Dotyczy: Wersja: 1.0 Data: 26.07.2010r.
PKN ORLEN S.A. Zapytanie ofertowe Dotyczy: Elektroniczny słownik lub tłumacz multijęzyczny. Wersja: 1.0 Data: 26.07.2010r. 1 1. KLAUZULA OCHRONY INFORMACJI Dostawca zobowiązuje się do traktowania wszelkich
Bardziej szczegółowoNieruchomości Komercyjne
Nieruchomości Komercyjne To takie proste z Ober-Haus! Wiemy, że każdy klient jest inny, niezależnie od tego, czy jest to firma lokalna czy międzynarodowy koncern. Specjaliści Ober-Haus, w ponad 30 biurach
Bardziej szczegółowoPolitechnika Warszawska Wydział Matematyki i Nauk Informacyjnych ul. Koszykowa 75, 00-662 Warszawa
Zamawiający: Wydział Matematyki i Nauk Informacyjnych Politechniki Warszawskiej 00-662 Warszawa, ul. Koszykowa 75 Przedmiot zamówienia: Produkcja Interaktywnej gry matematycznej Nr postępowania: WMiNI-39/44/AM/13
Bardziej szczegółowoSystem zarządzania bazą danych (SZBD) Proces przechodzenia od świata rzeczywistego do jego informacyjnej reprezentacji w komputerze nazywać będziemy
System zarządzania bazą danych (SZBD) Proces przechodzenia od świata rzeczywistego do jego informacyjnej reprezentacji w komputerze nazywać będziemy modelowaniem, a pewien dobrze zdefiniowany sposób jego
Bardziej szczegółowoHarmonogramowanie projektów Zarządzanie czasem
Harmonogramowanie projektów Zarządzanie czasem Zarządzanie czasem TOMASZ ŁUKASZEWSKI INSTYTUT INFORMATYKI W ZARZĄDZANIU Zarządzanie czasem w projekcie /49 Czas w zarządzaniu projektami 1. Pojęcie zarządzania
Bardziej szczegółowoPAKIET MathCad - Część III
Opracowanie: Anna Kluźniak / Jadwiga Matla Ćw3.mcd 1/12 Katedra Informatyki Stosowanej - Studium Podstaw Informatyki PAKIET MathCad - Część III RÓWNANIA I UKŁADY RÓWNAŃ 1. Równania z jedną niewiadomą MathCad
Bardziej szczegółowoWiedza niepewna i wnioskowanie (c.d.)
Wiedza niepewna i wnioskowanie (c.d.) Dariusz Banasiak Katedra Informatyki Technicznej Wydział Elektroniki Wnioskowanie przybliżone Wnioskowanie w logice tradycyjnej (dwuwartościowej) polega na stwierdzeniu
Bardziej szczegółowoSemantyczne podobieństwo stron internetowych
Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana
Bardziej szczegółowoText mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
Bardziej szczegółowoBase 6T - widok z przodu
PL ase 6T - widok z przodu JP JP10 JP9 JP8 JP7 X3 JP14 JP12 NTC 40 50 JP6 JP5 JP4 JP3 JP2 JP1 30 60 R26 9 10 3 COMM JP13 TEST 4 18 2 12 1 17 8 X1 X7 X10 X4 X8 POMP LL UX LINE 16 7 5 6 15 13 14 2 ase 6T
Bardziej szczegółowoElementy cyfrowe i układy logiczne
Elementy cyfrowe i układy logiczne Wykład Legenda Zezwolenie Dekoder, koder Demultiplekser, multiplekser 2 Operacja zezwolenia Przykład: zamodelować podsystem elektroniczny samochodu do sterowania urządzeniami:
Bardziej szczegółowona dostawę licencji na oprogramowanie przeznaczone do prowadzenia zaawansowanej analizy statystycznej
Warszawa, dnia 16.10.2015r. ZAPYTANIE OFERTOWE na dostawę licencji na oprogramowanie przeznaczone do prowadzenia zaawansowanej analizy statystycznej Do niniejszego postępowania nie mają zastosowania przepisy
Bardziej szczegółowoElementy typografii. Technologia Informacyjna Lekcja 22
Elementy typografii Technologia Informacyjna Lekcja 22 Jakie sąs zalety komputerowego tworzenia tekstu? Podstawowe kroje pisma Krój szeryfowy uŝywany jest do składu gazet, ksiąŝ ąŝek, wypracowań,, małe
Bardziej szczegółowoJak usprawnić procesy controllingowe w Firmie? Jak nadać im szerszy kontekst? Nowe zastosowania naszych rozwiązań na przykładach.
Jak usprawnić procesy controllingowe w Firmie? Jak nadać im szerszy kontekst? Nowe zastosowania naszych rozwiązań na przykładach. 1 PROJEKTY KOSZTOWE 2 PROJEKTY PRZYCHODOWE 3 PODZIAŁ PROJEKTÓW ZE WZGLĘDU
Bardziej szczegółowoRudniki, dnia 10.02.2016 r. Zamawiający: PPHU Drewnostyl Zenon Błaszak Rudniki 5 64-330 Opalenica NIP 788-000-22-12 ZAPYTANIE OFERTOWE
Zamawiający: Rudniki, dnia 10.02.2016 r. PPHU Drewnostyl Zenon Błaszak Rudniki 5 64-330 Opalenica NIP 788-000-22-12 ZAPYTANIE OFERTOWE W związku z planowaną realizacją projektu pn. Rozwój działalności
Bardziej szczegółowoInstrukcja U ytkownika Systemu Antyplagiatowego Plagiat.pl
Instrukcja U ytkownika Systemu Antyplagiatowego Plagiat.pl System Plagiat.pl jest programem komputerowym s³u ¹cym do porównywania dokumentów tekstowych. Wytypowani przez W³adze Uczelni U ytkownicy otrzymuj¹
Bardziej szczegółowoS I M P L E. E O D ELEKTRONICZNY OBIEG DOKUMENTÓW. www.simple.com.pl
S I M P L E. E O D ELEKTRONICZNY OBIEG DOKUMENTÓW www.simple.com.pl SIMPLE.EOD ELEKTRONICZNY OBIEG DOKUMENTÓW SIMPLE.EOD to innowacyjna platforma dotycz¹cy przetwarzania informacji mo e internetowa do
Bardziej szczegółowoWyszukiwanie dokumentów/informacji
Wyszukiwanie dokumentów/informacji Wyszukiwanie dokumentów (ang. document retrieval, text retrieval) polega na poszukiwaniu dokumentów tekstowych z pewnego zbioru, które pasują do zapytania. Wyszukiwanie
Bardziej szczegółowoPodstawy Informatyki i Technologii Informacyjnej
Automatyka i Robotyka, Rok I Komputerowe przetwarzanie tekstu PWSZ Gªogów, 2009 Nomenklatura Edytor tekstu (ang. word processor) - program komputerowy sªu» cy tworzeniu, edycji i odpowiedniemu formatowaniu
Bardziej szczegółowoWspółczesne nowoczesne budownictwo pozwala na wyrażenie indywidualnego stylu domu..
Współczesne nowoczesne budownictwo pozwala na wyrażenie indywidualnego stylu domu.. w którym będziemy mieszkać. Coraz więcej osób, korzystających ze standardowych projektów, decyduje się nadać swojemu
Bardziej szczegółowoARKUSZ OCENY OKRESOWEJ DLA STANOWISK PRACOWNICZYCH
Załącznik Nr 5 Do Regulaminu okresowych ocen pracowników Urzędu Miasta Piekary Śląskie zatrudnionych na stanowiskach urzędniczych, w tym kierowniczych stanowiskach urzędniczych oraz kierowników gminnych
Bardziej szczegółowo