ZASTOSOWANIE SIECI SEMANTYCZNEJ DO DISAMBIGUACJI POJĘĆ W JĘZYKU POLSKIM

Wielkość: px
Rozpocząć pokaz od strony:

Download "ZASTOSOWANIE SIECI SEMANTYCZNEJ DO DISAMBIGUACJI POJĘĆ W JĘZYKU POLSKIM"

Transkrypt

1 ZASTOSOWANIE SIECI SEMANTYCZNEJ DO DISAMBIGUACJI POJĘĆ W JĘZYKU POLSKIM Dariusz Ceglarek Wprowadzenie Zjawisko polisemii (wieloznaczności pojęciowej) dotyczy kaŝdego języka naturalnego i oznacza, Ŝe jednemu słowu (lub związkowi frazeologicznemu) odpowiada wiele znaczeń, czyli Ŝe róŝne pojęcia nazywane są tak samo. Disambiguacja pojęciowa (ujednoznacznianie pojęć), czyli wybór właściwego znaczenia dla pojęcia, które posiada wiele znaczeń i pojawiło się w dłuŝszej sentencji, nie sprawia człowiekowi większej trudności w jego codziennym Ŝyciu. MoŜe poza występującymi w codziennym Ŝyciu Ŝartami, które zazwyczaj opierają się na parainformacji powstającej z wieloznaczności pojęć: MoŜesz na mnie liczyć, powiedział informatykowi jego komputer". Natomiast podczas przetwarzania tekstu przez program operujący na tekście, wieloznaczność stanowi znaczący problem. KaŜdemu pojęciu odpowiada w języku naturalnym zapis w postaci wyrazu, kolokacji 1 lub związku frazeologicznego (np. puścić farbę, jabłko Adama ) będących jego odzwierciedleniem. Zapis pojęcia w języku naturalnym będziemy dalej nazywać konceptem. Celem disambiguacji jest stworzenie przetwarzalnej przez systemy informacyjne reprezentacji dokumentu, tak aby w analizowanym dokumencie na podstawie pochodzącej z niego treści - wyodrębnić jednostki odpowiadające znaczeniu informacyjnemu konceptów z tekstu. 1 Kolokacja to związek semantyczny, którego znaczenie wynika z połączenia znaczeń kilku słów wchodzących w jego skład (np. wirus komputerowy ).

2 W niniejszym artykule pokazana jest nowa metoda automatycznego usuwania wieloznaczności w tekście, czyli automatycznego wyznaczania właściwego znaczenia pojęć. Proponowana metoda wykorzystuje zaleŝności semantyczne pomiędzy pojęciami zapamiętane w zbudowanej uprzednio dla języka polskiego sieci semantycznej. Działanie metody opiera się na wskazaniu najbardziej prawdopodobnego znaczenia pojęcia wieloznacznego biorąc pod uwagę kontekst uŝycia owego pojęcia w badanym dokumencie. Pozbawianie pojęć wieloznaczności Przeszkodami w usuwaniu wieloznaczności są najczęściej: brak wystarczającego kontekstu, metafory tworzące wieloznaczne askryptory pojęć na przykład kraj kwitnącej wiśni, zjawisko homonimii (tzw. wieloznaczność właściwa, której przykładem jest pojęcie zamek : zamek błyskawiczny, zamek królewski, zamek w drzwiach, zamek hokejowy), czy powszechnie występujące zjawisko metonimii 2. Przykładami metonimii są: metonimia przyczyny (np. czytam Słowackiego zamiast czytam utwory Słowackiego), metonimia skutku (np. pot zamiast wysiłek), metonimia miejsca (np. Biały Dom zamiast prezydent USA), metonimia narzędzia, metonimia zawartości, metonimia oznaki czy metonimia konkretu. Celem disambiguacji jest lepsze odwzorowanie konceptów (słów, kolokacji) z dokumentów we właściwe pojęcia, a dzięki temu lepsze dopasowanie informacji wywnioskowanej z dokumentów do potrzeb informacyjnych uŝytkownika systemu wyszukiwania informacji. 2 Metonimia (zamiennia) to w literaturze środek stylistyczny mająca na celu zastąpienie nazwy jakiegoś przedmiotu lub zjawiska nazwą innego, pozostającego z nim w uchwytnej zaleŝności. Jednak z figury tej korzysta się takŝe często w codziennym języku.

3 Zadaniem disambiguacji jest dostarczenie właściwych znaczeń pojęć, równieŝ w zaleŝności od kontekstu, co słuŝy wzrostowi precyzji odpowiedzi systemu wyszukiwania informacji. Disambiguacja pojęć przyczynia się do polepszenia funkcjonowania metod w kluczowych zadaniach systemów wyszukiwawczych: wyszukiwaniu informacji (dzięki mechanizmowi query expansion z wykorzystaniem deskryptorów i skryptorów konceptów, co pokazana w pracy [KrCr1992]), filtrowaniu informacji, klasyfikacji i kategoryzacji [HoSS2003], nawigowaniu oraz przy rozbudowie sieci semantycznych czy ontologii [HoSS2003], [KhMH2004] czy [Łabu2004]. Pierwsze metody, które zastosowano do disambiguacji pojęć miały charakter statystyczny lub lingwistyczny. Metody statystyczne posługiwały się standardowymi strukturami reprezentacji wiedzy: słowo, kolokacje oraz współwystąpienie słów. Najbardziej popularne metody z tej grupy, to analiza współwystępowania pojęć [Sand1997], analiza definicji pojęć poprzez ustalenie słów współwystępujących w pewnym otoczeniu pojęcia [Lesk1986], klastering pojęciowy cech [HePe1996], metody wykorzystujące słowniki wielojęzyczne [LeTV1993]. Metody lingwistyczne, w tym morfologiczne to m. in. analiza morfologiczna pojęć wprowadzona przez Zernika (zobacz [Sand2000]) czy metoda grafów konceptualnych [Sowa1991]. Warto zaznaczyć, Ŝe metody lingwistyczne mają charakter regułowy i charakteryzują się duŝą złoŝonością obliczeniową. W pracy [Sand1997] stwierdzono, Ŝe wyłącznie metody analizy lingwistycznej są w stanie pokonać poziom 90% skuteczności disambiguacji. JednakŜe wyniki tej pracy nie uwzględniały rozbudowy struktur reprezentacji wiedzy, takich jak sieć semantyczna WordNet 3 o 3 WordNet ((www.wordnet.princeton,edu) jest siecią semantyczną rozwijaną przez Cognitive Science Laboratory na Uniwersytecie Princeton. 3

4 nowe związki semantyczne i moŝliwości, choćby rejestrowanie polisemii, organizowanie znaczeń w grupy tematyczne. W ostatnich latach wyjątkowo skutecznymi metodami usuwania wieloznaczności są metody oparte na bardziej złoŝonej reprezentacji wiedzy, w której wykorzystuje się takie struktury reprezentacji wiedzy jak tezaurusy, sieci semantyczne czy ontologie. Wyjątkowo dobrą skutecznością disambiguacji mogą poszczycić się reguły przetwarzania relacji dla pojęć z sieci semantycznej [KhMH2004], [Navi2004], klastering metodą COSA [HoSS2003] czy klastering kontekstu pojęć [PuPe2004]. W pracy [GChY1992] stwierdzono, Ŝe człowiek podczas disambiguacji dokonuje w 96,8% właściwego wyboru znaczenia pojęć polisemicznych. W pracy [Sand2000] znalazł się szereg wniosków waŝnych dla systemów wyszukiwawczych. Zapytania składające się z jednego lub dwóch słów prowadzą do duŝej niejednoznaczności pojęć i małej precyzji odpowiedzi. DłuŜsze zapytania wprowadzają kontekst redukujący gwałtownie wieloznaczność i przyczyniają się do wzrostu precyzji odpowiedzi systemu. Z kolei w pracy [Gonz1998] pokazano, Ŝe system dokonujący disambiguacji pojęć z 40% dokładnością wyboru właściwego znaczenia obniŝa precyzję odpowiedzi systemu wyszukiwawczego o 3,5%. Natomiast system o 70% dokładności wyboru znaczenia pojęć przyczynia się do 2,2% wzrostu precyzji odpowiedzi systemu wyszukiwawczego. Ponadto zastosowanie kombinacji najlepszych metod: uwzględnienie kolokacji, współwystąpień i częstości występowania róŝnych znaczeń dla pojęć dało 62,1% dokładność disambiguacji. Kolejnym waŝkim stwierdzeniem w tej pracy jest, Ŝe około 55% poziom dokładności wyboru znaczenia dla pojęcia wieloznacznego jest neutralny dla precyzji odpowiedzi systemu wyszukiwawczego. Zbyt wąski kontekst

5 znaczenia określany poprzez okienka kontekstowe (czyli tekst otaczający rozpatrywane pojęcie) w niektórych przypadkach powodował, Ŝe system nie był w stanie ustalić kontekstu dla pojęcia i w związku z tym wybrać jakiekolwiek jego znaczenie. Krovetz i Croft w pracy [KrCr1992] pokazali, Ŝe prawdopodobieństwo wystąpienia niejednoznaczności pojęciowej rośnie wtedy, gdy dokument jest nierelewantny do zapytania i gdy liczba słów występujących zarówno w dokumencie i zapytaniu jest mała. Jeśli w zapytaniu pojawiają się pojęcia wieloznaczne, to rośnie prawdopodobieństwo otrzymania nierelewantnych dokumentów w odpowiedzi na zapytanie. Metody reprezentacji wiedzy stosowane w systemach wyszukiwawczych Podstawowe zagadnienia systemów wyszukiwawczych (ang. information retrieval systems) to przede wszystkim reprezentacja wiedzy i sposób przechowywania dokumentów, czyli sposób, w jaki informacje zrozumiałe dla człowieka kodowane są w systemie komputerowym oraz jak są zapisywane, gromadzone i odczytywane. Istotne aspekty tego zagadnienia, to format zapisu, struktura plików oraz najistotniejsza w tym artykule logiczna reprezentacja dokumentów odzwierciedlenie informacji zawartej w dokumentach w sposób umoŝliwiający jej automatyczne przetwarzanie [BaRi1999]. Metody reprezentacji wiedzy są sposobem w jakim wiedza o świecie jest przedstawiana wraz z metodami jej przetwarzania i wnioskowania (inferencji). Stosowana metodą reprezentacji wiedzy jest więc jakiś ściśle określony język opisu wiedzy zaopatrzony w mechanizm przetwarzania. Kluczowym zadaniem systemów wyszukiwawczych jest wyszukiwanie rozumiane jako wybór ze zbioru dokumentów tych, które

6 są dopasowane do określonego wzorca. Wzorzec ten jest zazwyczaj zapytaniem uŝytkownika systemu, który formułuje swoje potrzeby informacyjne w postaci słów kluczowych. Wybór dokumentów pasujących do zapytania jest dokonywany automatycznie przez system wyszukiwawczy za pomocą mechanizmów, które porównują zawartość dokumentu z zapytaniem uŝytkownika i są w stanie ocenić ich dopasowanie (kryterium wyboru). Klasyczne metody stosowane w systemach wyszukiwawczych opierają się na prostej strukturze reprezentacji wiedzy, gdzie dokumenty reprezentowane są przez zbiory słów kluczowych (tzw. bag of words). Najbardziej znanymi modelami zapytań kierowanych do systemu wyszukiwawczego z wykorzystaniem tej reprezentacji wiedzy są model logiczny (ang. boolean model), model wektorowy (ang. vector space model), model probabilistyczny, model LSI (ang. latent semantic indexing) czy model sieci neuronowej [BaRi1999]. Bardziej złoŝone struktury reprezentacji wiedzy to: słownik definicyjny (glosariusz), słownik dziedzinowy, taksonomia, tezaurus, sieć semantyczna i ontologia. Struktury te wprowadzają róŝne relacje leksykalne pomiędzy przechowywanymi w nich konceptami. Tezaurus to zbiór semantycznie i hierarchicznie powiązanych konceptów wykorzystywanych w określonej dziedzinie wiedzy. Koncepty zawarte w tezaurusach uporządkowane są przez relacje synonimii oraz hiperonimii i hiponimii. Systemy wyszukiwawcze oparte o tezaurusy wykorzystują je do indeksowania obiektów. Koncepty są indeksowane deskryptorami (pozostałe pojęcia będące w relacji hiperonimii - hiponimii to askryptory). Korzyści wynikające ze stosowania tezaurusów w systemach wyszukiwawczych zostały dobrze opisane w [BaRi1999]. Najlepszą strukturą dla odzwierciedlania powiązań semantycznych między konceptami jest sieć semantyczna. Jest ona grafem skierowanym

7 posiadającym pojęcia jako wierzchołki oraz krawędzie dla reprezentowania relacji leksykalnych między konceptami. Sieć semantyczna posiada następujące relacje leksykalne: hiperonimy (pojazd jest-nadrzędny-dla samochód) hiponimy (samochód jest-podrzędny-dla pojazd) meronimy (pokój ma-część ściana) holonimy (ściana jest-częścią pokój) konotacje (róŝa ma-cechę zapach) atrybutów (suchy jest-wartością wilgotność) synonimy (piękny jest-synonimem śliczny) Krawędzie w sieci mogą posiadać wagi ilustrujące ich waŝność. MoŜna za pomocą relacji określać proste atrybuty konceptów. Wnioskowanie z wykorzystaniem sieci semantycznej odbywa się po krawędziach, jest to po prostu przeszukiwanie grafu. Rozpoczynając z jednego punktu (węzła grafu) i poruszając się po krawędziach, wychodzących z danego punktu, docieramy do kolejnych węzłów, co odpowiada wnioskowaniu o właściwościach pojęć. Sieć semantyczna gromadzi całą dostępną wiedzę o semantyce pojęć. Stąd moŝliwość jej wykorzystania w systemach wyszukiwawczych. Informacje z sieci mogą być zastosowane do ustalania podobieństwa pomiędzy pojęciami w zadaniach klasyfikacji czy kategoryzacji dokumentów. Ponadto sieć semantyczna moŝe słuŝyć do ograniczenia liczby słów kluczowych opisujących dokument na przykład poprzez sprowadzenie grup synonimów do podanego konceptu jako ich reprezentanta (deskryptora). Najbardziej popularną siecią semantyczną, która jest powszechnie stosowana w systemach wyszukiwawczych dla języka angielskiego jest sieć WordNet, która składa się z ponad słów i kolokacji

8 zorganizowanych w tzw. synsety. KaŜdy synset zawiera słowa które są wzajemnie synonimami, a odnośniki pomiędzy synsetami reprezentują relacje hiperonimii i hiponimii tworząc w ten sposób tezaurus, w którym występuje około słów polisemicznych. W chwili obecnej relacje występujące w WordNecie, to relacje hiperonimii, hiponimii, synonimii, metonimii, homonimii i antonimii. Obejmowanie tych relacji czyni z WordNetu pełnowartościową sieć semantyczną dla języka angielskiego. Wobec braku powszechnie dostępnej analogicznej struktury dla języka polskiego autor posłuŝył się zbudowaną w ramach projektu SeNeCa 4 w Katedrze Informatyki Ekonomicznej Akademii Ekonomicznej w Poznaniu strukturą, którą moŝna określić jako sieć semantyczna dla języka polskiego. Zawiera ona słów i kolokacji i zawiera odmian słów, w tym pojęć jest wieloznaczne. Pojęcia w sieci połączone są ze sobą, relacjami hiperonimii i hiponimii, synonimii, meronimii, homonimii oraz konotacjami. Eksperyment W eksperymencie postawiono zadanie wyznaczenia - na podstawie posiadanej sieci semantycznej - właściwego znaczenia pojęć (konceptów) w zbiorze dokumentów poprzez analizę bliskości pojęciowej pomiędzy konceptem wieloznacznym a konceptami, które wystąpiły razem z nim w dokumencie. W ramach eksperymentu sprawdzono dwie nowe metody disambiguacji pojęć. W pierwszej metodzie wyznacza się znaczenie kaŝdego konceptu wieloznacznego wykorzystując powiązania semantyczne (w sieci semantycznej) pomiędzy nim a wszystkimi konceptami, które pojawiły się w badanym dokumencie. Wpływ na wybór właściwego znaczenia 4 Zadaniem projektu SeNeCa (Semantic Network and Categorization, jest automatyzacja rozbudowy sieci semantycznej dla języka polskiego.

9 danego konceptu wieloznacznego mają te pojęcia z sieci semantycznej, które wystąpiły w dokumencie i ich odległość od analizowanego konceptu jest nie większa od zadanego parametru ϕ oznaczającego głębokość przeszukiwania sieci. Przez odległość pomiędzy konceptami a i b w sieci semantycznej naleŝy rozumieć liczbę krawędzi pomiędzy konceptami, jakie naleŝy pokonać aby dotrzeć od konceptu a do konceptu b. Druga metoda wyznacza znaczenie kaŝdego pojęcia wieloznacznego tworząc tzw. okienko wokół pojęcia w tekście o zadanym promieniu tj. do ustalenia właściwego znaczenia pojęcia brane pod uwagę są wyłącznie pojęcia występujące w dokumencie w bezpośrednim sąsiedztwie konceptu wieloznacznego, gdzie promień sąsiedztwa jest ustalanym parametrem. Przykładowo jeśli promień okienka wynosi 10, oznacza to, Ŝe znaczenie pojęcia wieloznacznego określane jest na podstawie występujących w dokumencie dziesięciu słów przed i dziesięciu słów występujących za badanym pojęciem. W metodzie tej stosowany jest równieŝ parametr ϕ - głębokość przeszukiwania sieci. Obie proponowane tu metody dokonując disambiguacji wykonują uprzednio następujące kroki: wyodrębnienie słów z dokumentu, zastąpienie słów konceptami (wykrycie kolokacji lub związków frazeologicznych) i na końcu lematyzowanie konceptów, czyli sprowadzenie form fleksyjnych do wspólnej formy. Ostatnim krokiem jest odnalezienie w dokumencie pojęć posiadających więcej niŝ jedno znaczenie i ustalenie dlań właściwego znaczenia. ZałóŜmy, Ŝe posiadamy (przykładowy) dokument tekstowy o następującej treści: Na mitingu w Poznaniu Adam Nowak, będący zawodnikiem Olimpii Poznań rzucił dyskiem 60,32 metra. Innym wartościowym rezultatem tych zawodów lekkoatletycznych było 59,50 m w rzucie młotem, osiągnięte przez Sylwię Kowalską.. Na rysunku 2

10 pokazano jak wygląda oznakowanie sieci semantycznej dla takiego dokumentu. Wypełnione okręgi na rysunku oznaczają, Ŝe koncept wystąpił w dokumencie. Tak więc wybierając dla wieloznacznego pojęcia dysk jego właściwe znaczenie (z moŝliwych znaczeń: chrząstka, krąŝek, nośnik pamięci, kształt ) o właściwym wyborze zadecyduje występowanie w sieci takich pojęć jak zawodnik, mityng, młot w otoczeniu pojęcia krąŝek ). Rysunek 1: Automatyczne odszukanie kontekstu w dokumencie. Źródło: opracowanie własne

11 Tabela 1: Algorytm disambiguacji pojęć z wykorzystaniem relacji leksykalnych przechowywanych w sieci semantycznej foreach t P /* dla kaŝdego nierozstrzygniętego pojęcia */ { bestsense := maxvalue := 0 foreach sense S of t { M(S) := 0; foreach concept x where r(s, x) > 0 M(S i ) := M(S i ) + SSR(x, 1) } foreach sense S i of t if (M(S i ) > maxvalue} { bestsense := S i maxvalue := M(S i ) } return bestsense } function SSR(concept x, level δ) { foreach concept y where relation r(x, y) > 0 { M(x) := M(x) + f(y) w(r) if (δ < ϕ ) M(x) = M(x) + SSR(y, δ +1) } } return M(x) } gdzie: r(x,y) relacja semantyczna pomiędzy konceptami x i y f(x) ilość wystąpień konceptu x przechowywana w sieci w(r) waga znaczenia relacji r (relacje hiperonimie, hiponimii, synonimii i inne mają róŝne wagi) M(S i ) wartość współczynnika wskazującego na i-te znaczenie konceptu S. ϕ - jest parametrem głębokości przeszukiwania otoczenia konceptów w sieci semantycznej. W ramach eksperymentu sprawdzono 114 dokumentów tekstowych pochodzących z 2006 roku. Dokumenty pochodzą z portalu dziennika Rzeczpospolita (www.rzeczpospolita.pl) i zawierają 2316 słów wieloznacznych. Wyniki disambiguacji pojęć zawiera tabela 2. Dla analizy lokalnej przyjęto głębokość przeszukania sieci semantycznej ϕ = 4 oraz szerokość okienka wokół pojęć wieloznacznych wynoszącą 12

12 słów. Wartości parametru ϕ oraz szerokości okienka zostały wyznaczone eksperymentalnie, przyczyniając się do stosunkowo wysokiej jakości disambiguacji. Tabela 2: Wyniki disambiguacji pojęć metodą analizy globalnej i metodą analizy lokalnej. Źródło: obliczenia własne Liczba dokumentów Liczba pojęć wieloznacznych Metoda globalna Liczba poprawnych rozpoznań polisemii Skutecz ność metody w % Metoda lokalna Liczba poprawnych rozpoznań polisemii Skutecz ność metody w % Wielkość artykułu (liczba słów) , , , , , , razem , , Wnioski Uzyskane wyniki (umieszczone w tabeli 1) obu zaproponowanych metod są obiecujące i są porównywalne do innych metod disambiguacji pojęć z wykorzystaniem sieci semantycznej [KhMH2004], [Navi2004], czy klasteringu kontekstu pojęć [PuPe2004]. Warte podkreślenia jest, Ŝe zastosowano je z powodzeniem dla bogatego w fleksję języka jakim jest język polski. Zaprezentowana tu metoda globalna, badająca znaczenie pojęcia na podstawie kontekstu całego dokumentu z wykorzystaniem sieci semantycznej ma skuteczność disambiguacji około 76%, z tym, Ŝe skuteczność ta maleje wraz ze wzrostem rozmiaru dokumentów. Metoda lokalna okienka tekstowego korzystająca z sieci semantycznej daje najlepsze rezultaty. Skuteczność disambiguacji pojęć tą metodą, która oscyluje wokół 83%, jest wyjątkowo wysoka i stabilna przy wzroście wielkości dokumentu tekstowego.

13 Prawdopodobnie rozbudowa sieci semantycznej o wieloznaczności skatalogowane na przykład w ramach projektu pl.wikipedia.org oraz uwzględnienie w sieci większej liczby powiązań pozwoliłoby otrzymać precyzję disambiguacji w okolicach 90%. Bibliografia [AbCe2002] Abramowicz W., Ceglarek D.: Zastosowanie metod pełnotekstowej analizy skupień do kategoryzacji dokumentów w języku polskim, [w:] Konferencja SWO 2002, Akademia Ekonomiczna w Katowicach [BaRi1999] Baeza-Yates R., Ribeiro-Neto B.: Modern Information Retrieval, ACM Press, Addison-Wesley Longman Publishing Co., New York 1999 [GChY1992] Gale W., Church K., Yarowsky D.: Estimating upper and lower bounds on the Performance of word-sense Disambiguation programs, [w:] Proceeding of 30 th Annual Meeting of the Association for Computational Linguistics, 1992 [Gonz1998] Gonzalo J. i inni: Indexing with WordNet Synsets can improve Text Retrieval, 1998 [HePe1996] Hearst M.A., Pedersen J.O. : Reexamining the cluster hypothesis: Scatter/Gather on retrieval results. [w:] 19th Annual International Conference on Research and Development in Information Retrieval, 1996 [HoSS2003] Hotho A., Staab S., Stumme: Ontologies improves Text Document Clustering, 2003 [Jone2002] Jones Ch.B.: Spatial Information Retrieval and Geographical Ontologies. An overview of the SPIRIT Project, SIGIR 2002 [HoSS2003a] Hotho A., Staab S., Stumme: Wordnet improves Text Document Clustering, The major Technical Report 425, University of Karlsruhe, Institute AIFB 2003 [KhMH2004] Khan L., McLeod D., Hovy E.: Retrieval effectiveness of an ontology-based model for information selection, 2004 [KrCr1992] Krovetz R, Croft WB.: Lexical Ambiguity and Information Retrieval, 1992 [LeTV1993] Leacock, C., Towell, G., Voorhes E.: Towards Building Contextual Representations of Word Senses Using

14 Statistical Models, [w:] SIGLEX workshop: Acquisition of Lexical Knowledge from Text, 1993 [Łabu2004] Łabuzek M.: Wykorzystanie metamodelowania do specyfikacji ontologii znaczenia opisów rzeczywistości, projekt badawczy KBN, Warszawa 2004 [Navi2004] Navigli R.: Learning Domain Ontologies from Document Warehouses and Dedicated Web Sites, 2004 [PuPe2004] Purandare A., Pedersen T.: Word sense discrimination by clustering contexts in vector and similarity spaces, 2004 [PuPK2005] Purandare A., Pedersen T., Kulkarni A.: Name Discrimination by Clustering Similar Contexts, 2005 [Sand1997] Sanderson M.: Word Sense Disambiguation and Information Retrieval, 1997 [Sand2000] Sanderson M.: Retrieving with Good Sense, 2000 [Sowa1991] Sowa J. F.: Principles of Semantic Networks: Explorations in the Representation of Knowledge, Morgan Kaufmann Publishers, San Mateo 1991 [StOT2003] Stokoe Ch., Oakes M.P., Tait J.: Word Sense Disambiguation in Information Retrieval Revisited, SIGIR 2003 dr Dariusz Ceglarek Katedra Informatyki Ekonomicznej Akademia Ekonomiczna ul. Powstańców Wielkopolskich Poznań - Polska Numer telefonu (fax) +48/61/

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe (maneo@man.poznan.pl) I Konferencja Polskie Biblioteki

Bardziej szczegółowo

technologii informacyjnych kształtowanie , procesów informacyjnych kreowanie metod dostosowania odpowiednich do tego celu środków technicznych.

technologii informacyjnych kształtowanie , procesów informacyjnych kreowanie metod dostosowania odpowiednich do tego celu środków technicznych. Informatyka Coraz częściej informatykę utoŝsamia się z pojęciem technologii informacyjnych. Za naukową podstawę informatyki uwaŝa się teorię informacji i jej związki z naukami technicznymi, np. elektroniką,

Bardziej szczegółowo

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1 Bazy danych wprowadzenie teoretyczne Piotr Prekurat 1 Baza danych Jest to zbiór danych lub jakichkolwiek innych materiałów i elementów zgromadzonych według określonej systematyki lub metody. Zatem jest

Bardziej szczegółowo

Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska

Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie

Bardziej szczegółowo

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po

Bardziej szczegółowo

Centralność w sieciach społecznych. Radosław Michalski Social Network Group - kwiecień 2009

Centralność w sieciach społecznych. Radosław Michalski Social Network Group - kwiecień 2009 Centralność w sieciach społecznych Radosław Michalski Social Network Group - kwiecień 2009 Agenda spotkania Pojęcie centralności Potrzeba pomiaru centralności Miary centralności degree centrality betweenness

Bardziej szczegółowo

Ontologie, czyli o inteligentnych danych

Ontologie, czyli o inteligentnych danych 1 Ontologie, czyli o inteligentnych danych Bożena Deka Andrzej Tolarczyk PLAN 2 1. Korzenie filozoficzne 2. Ontologia w informatyce Ontologie a bazy danych Sieć Semantyczna Inteligentne dane 3. Zastosowania

Bardziej szczegółowo

CLUSTERING. Metody grupowania danych

CLUSTERING. Metody grupowania danych CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means

Bardziej szczegółowo

4.3 Grupowanie według podobieństwa

4.3 Grupowanie według podobieństwa 4.3 Grupowanie według podobieństwa Przykłady obiektów to coś więcej niż wektory wartości atrybutów. Reprezentują one poszczególne rasy psów. Ważnym pytaniem, jakie można sobie zadać, jest to jak dobrymi

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Ekran Wyszukiwania Podstawowego w multiwyszukiwarce EBSCO Discovery Service zapewnia dostęp poprzez jedno okienko wyszukiwawcze na platformie EBSCOhost do wszystkich zasobów biblioteki. Na ekranie do wyszukiwania

Bardziej szczegółowo

prof. dr hab. Jadwiga Woźniak-Kasperek Instytut Informacji Naukowej i Studiów Bibliologicznych Uniwersytet Warszawski

prof. dr hab. Jadwiga Woźniak-Kasperek Instytut Informacji Naukowej i Studiów Bibliologicznych Uniwersytet Warszawski prof. dr hab. Jadwiga Woźniak-Kasperek Instytut Informacji Naukowej i Studiów Bibliologicznych Uniwersytet Warszawski Rola języka i semantyki w procesach reprezentowania i wyszukiwania treści Możliwości

Bardziej szczegółowo

Języki deskryptorowe. Dr Marek Nahotko

Języki deskryptorowe. Dr Marek Nahotko Języki deskryptorowe Dr Marek Nahotko 1 Literatura: Języki deskryptorowe dla SINTO / Lucyna Bielicka, Joanna Tomasik-Beck. Warszawa, 1981; Zasady budowy tezaurusów / Kazimierz Leski. Warszawa, 1978; Języki

Bardziej szczegółowo

PLAN ZARZĄDZANIA WYMAGANIAMI PROJEKT WERSJA

PLAN ZARZĄDZANIA WYMAGANIAMI PROJEKT <NAZWA PROJEKTU> WERSJA <NUMER WERSJI DOKUMENTU> Załącznik nr 4.4 do Umowy nr 35-ILGW-253-.../20.. z dnia... MINISTERSTWO FINANSÓW DEPARTAMENT INFORMATYKI PLAN ZARZĄDZANIA WYMAGANIAMI PROJEKT WERSJA numer wersji

Bardziej szczegółowo

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2 InŜynieria Rolnicza 14/2005 Michał Cupiał, Maciej Kuboń Katedra InŜynierii Rolniczej i Informatyki Akademia Rolnicza im. Hugona Kołłątaja w Krakowie DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY

Bardziej szczegółowo

PageRank i HITS. Mikołajczyk Grzegorz

PageRank i HITS. Mikołajczyk Grzegorz PageRank i HITS Mikołajczyk Grzegorz PageRank Metoda nadawania indeksowanym stronom internetowym określonej wartości liczbowej, oznaczającej jej jakość. Algorytm PageRank jest wykorzystywany przez popularną

Bardziej szczegółowo

Za pomocą atrybutu ROWS moŝemy dokonać podziału ekranu w poziomie. Odpowiedni kod powinien wyglądać następująco:

Za pomocą atrybutu ROWS moŝemy dokonać podziału ekranu w poziomie. Odpowiedni kod powinien wyglądać następująco: 1 1. Ramki Najbardziej elastycznym sposobem budowania stron jest uŝycie ramek. Ułatwiają one nawigowanie w wielostronicowych dokumentach HTML, poprzez podział ekranu na kilka obszarów. KaŜdy z nich zawiera

Bardziej szczegółowo

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji

Bardziej szczegółowo

The University of Michigan Digital Library Production Service Collection http://www.umdl.umich.edu/

The University of Michigan Digital Library Production Service Collection http://www.umdl.umich.edu/ 1 The University of Michigan Digital Library Production Service Collection http://www.umdl.umich.edu/ 1. Zawartość Biblioteka elektroniczna Uniwersytetu w Michigan, która oferuje elektroniczne dane i usługi.

Bardziej szczegółowo

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika ska Katedra Inteligencji

Bardziej szczegółowo

Technologia informacyjna

Technologia informacyjna Technologia informacyjna Pracownia nr 9 (studia stacjonarne) - 05.12.2008 - Rok akademicki 2008/2009 2/16 Bazy danych - Plan zajęć Podstawowe pojęcia: baza danych, system zarządzania bazą danych tabela,

Bardziej szczegółowo

Program do obsługi ubezpieczeń minifort

Program do obsługi ubezpieczeń minifort Program do obsługi ubezpieczeń minifort Dokumentacja uŝytkownika Akwizycja wznowień polis Kraków, grudzień 2008r. Akwizycja Jedną z podstawowych funkcji programu ubezpieczeń majątkowych są funkcje wspomagające

Bardziej szczegółowo

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

CLARIN rozproszony system technologii językowych dla różnych języków europejskich CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

Metrologia: organizacja eksperymentu pomiarowego

Metrologia: organizacja eksperymentu pomiarowego Metrologia: organizacja eksperymentu pomiarowego (na podstawie: Żółtowski B. Podstawy diagnostyki maszyn, 1996) dr inż. Paweł Zalewski Akademia Morska w Szczecinie Teoria eksperymentu: Teoria eksperymentu

Bardziej szczegółowo

Laboratorium nr 5. Temat: Funkcje agregujące, klauzule GROUP BY, HAVING

Laboratorium nr 5. Temat: Funkcje agregujące, klauzule GROUP BY, HAVING Laboratorium nr 5 Temat: Funkcje agregujące, klauzule GROUP BY, HAVING Celem ćwiczenia jest zaprezentowanie zagadnień dotyczących stosowania w zapytaniach języka SQL predefiniowanych funkcji agregujących.

Bardziej szczegółowo

Sposoby wyszukiwania multimedialnych zasobów w Internecie

Sposoby wyszukiwania multimedialnych zasobów w Internecie Sposoby wyszukiwania multimedialnych zasobów w Internecie Lidia Derfert-Wolf Biblioteka Główna Uniwersytetu Technologiczno-Przyrodniczego w Bydgoszczy e-mail: lidka@utp.edu.pl III seminarium z cyklu INFOBROKER:

Bardziej szczegółowo

Instrukcja do panelu administracyjnego. do zarządzania kontem FTP WebAs. www.poczta.greenlemon.pl

Instrukcja do panelu administracyjnego. do zarządzania kontem FTP WebAs. www.poczta.greenlemon.pl Instrukcja do panelu administracyjnego do zarządzania kontem FTP WebAs www.poczta.greenlemon.pl Opracowanie: Agencja Mediów Interaktywnych GREEN LEMON Spis treści 1.Wstęp 2.Konfiguracja 3.Konto FTP 4.Domeny

Bardziej szczegółowo

Lista ikonek stosowanych do oznaczenia róŝnych nośników:

Lista ikonek stosowanych do oznaczenia róŝnych nośników: Korzystając z przeglądarki internetowej otwórz stronę http://www.bibliotekacen.pl. Wejdź w zakładkę katalog on-line, następnie wybierz Bibliotekę Pedagogiczną w Koszalinie. Informacje o zbiorach Biblioteki

Bardziej szczegółowo

Systemy ekspertowe i ich zastosowania. Katarzyna Karp Marek Grabowski

Systemy ekspertowe i ich zastosowania. Katarzyna Karp Marek Grabowski Systemy ekspertowe i ich zastosowania Katarzyna Karp Marek Grabowski Plan prezentacji Wstęp Własności systemów ekspertowych Rodzaje baz wiedzy Metody reprezentacji wiedzy Metody wnioskowania Języki do

Bardziej szczegółowo

Baza danych. Baza danych to:

Baza danych. Baza danych to: Baza danych Baza danych to: zbiór danych o określonej strukturze, zapisany na zewnętrznym nośniku (najczęściej dysku twardym komputera), mogący zaspokoić potrzeby wielu użytkowników korzystających z niego

Bardziej szczegółowo

Podstawowe pojęcia dotyczące relacyjnych baz danych. mgr inż. Krzysztof Szałajko

Podstawowe pojęcia dotyczące relacyjnych baz danych. mgr inż. Krzysztof Szałajko Podstawowe pojęcia dotyczące relacyjnych baz danych mgr inż. Krzysztof Szałajko Czym jest baza danych? Co rozumiemy przez dane? Czym jest system zarządzania bazą danych? 2 / 25 Baza danych Baza danych

Bardziej szczegółowo

CAMBRIDGE ESOL PRETESTING (PILOTAś EGZAMINÓW CAMBRIDGE ESOL)

CAMBRIDGE ESOL PRETESTING (PILOTAś EGZAMINÓW CAMBRIDGE ESOL) CAMBRIDGE ESOL PRETESTING (PILOTAś EGZAMINÓW CAMBRIDGE ESOL) Wszystkie materiały egzaminacyjne ESOL (egzaminy z języka angielskiego dla obcokrajowców) Uniwersytetu Cambridge są poddawane pretestingowi/pilotaŝowi

Bardziej szczegółowo

System do rekrutacji nowej generacji

System do rekrutacji nowej generacji System do rekrutacji nowej generacji PYTON Falcon pozwala usprawnić proces rekrutacji zewnętrznej i wewnętrznej, zarządza całym procesem rekrutacyjnym: wakatami, ofertami pracy, rozmowami kwalifikacyjnymi,

Bardziej szczegółowo

Definicje. Algorytm to:

Definicje. Algorytm to: Algorytmy Definicje Algorytm to: skończony ciąg operacji na obiektach, ze ściśle ustalonym porządkiem wykonania, dający możliwość realizacji zadania określonej klasy pewien ciąg czynności, który prowadzi

Bardziej szczegółowo

KURS ACCESS 2003 Wiadomości wstępne

KURS ACCESS 2003 Wiadomości wstępne KURS ACCESS 2003 Wiadomości wstępne Biorąc c udział w kursie uczestnik zapozna się z tematyką baz danych i systemu zarządzania bazami danych jakim jest program Microsoft Access 2003. W trakcie kursu naleŝy

Bardziej szczegółowo

Spis treści. spis treści wygenerowany automatycznie

Spis treści. spis treści wygenerowany automatycznie Spis treści Rozdział 2.Wymagania edytorskie 2 2.1. Wymagania ogólne 2 2.2. Tytuły rozdziałów i podrozdziałów 2 2.3. Rysunki, tabele i wzory 3 2.3.1. Rysunki 3 2.3.2. Tabele 4 2.3.3. Wzory 4 2.4. Odsyłacze

Bardziej szczegółowo

NEURAL NETWORK ) FANN jest biblioteką implementującą SSN, którą moŝna wykorzystać. w C, C++, PHP, Pythonie, Delphi a nawet w środowisku. Mathematica.

NEURAL NETWORK ) FANN jest biblioteką implementującą SSN, którą moŝna wykorzystać. w C, C++, PHP, Pythonie, Delphi a nawet w środowisku. Mathematica. Wykorzystanie sztucznych sieci neuronowych do rozpoznawania języków: polskiego, angielskiego i francuskiego Tworzenie i nauczanie sieci przy pomocy języka C++ i biblioteki FANN (Fast Artificial Neural

Bardziej szczegółowo

Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB

Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB IX Krajowe Forum Informacji Naukowej i Technicznej Zakopane wrzesień 2007 Biblioteka CIOP-PIB Biblioteka CIOP-PIB

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

Metadane. Przykry obowiązek czy przydatny zasób?

Metadane. Przykry obowiązek czy przydatny zasób? Metadane Przykry obowiązek czy przydatny zasób? A D A M I W A N I A K Administracja publiczna a ustawa o Infrastrukturze Informacji Przestrzennej, Kielce, 13-14 października 2011 r. Problem nadmiaru informacji

Bardziej szczegółowo

Semantyczne podobieństwo stron internetowych

Semantyczne podobieństwo stron internetowych Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana

Bardziej szczegółowo

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak Wyszukiwanie boolowskie i strukturalne Adam Srebniak Wyszukiwanie boolowskie W wyszukiwaniu boolowskim zapytanie traktowane jest jako zdanie logiczne. Zwracane są dokumenty, dla których to zdanie jest

Bardziej szczegółowo

Systemy ekspertowe - wiedza niepewna

Systemy ekspertowe - wiedza niepewna Instytut Informatyki Uniwersytetu Śląskiego lab 8 Rozpatrzmy następujący przykład: Miażdżyca powoduje często zwężenie tętnic wieńcowych. Prowadzi to zazwyczaj do zmniejszenia przepływu krwi w tych naczyniach,

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

PROJEKT CZĘŚCIOWO FINANSOWANY PRZEZ UNIĘ EUROPEJSKĄ. Opis działania raportów w ClearQuest

PROJEKT CZĘŚCIOWO FINANSOWANY PRZEZ UNIĘ EUROPEJSKĄ. Opis działania raportów w ClearQuest PROJEKT CZĘŚCIOWO FINANSOWANY PRZEZ UNIĘ EUROPEJSKĄ Opis działania raportów w ClearQuest Historia zmian Data Wersja Opis Autor 2008.08.26 1.0 Utworzenie dokumentu. Wersja bazowa dokumentu. 2009.12.11 1.1

Bardziej szczegółowo

SYSTEMY OPERACYJNE WYKLAD 4 - zarządzanie pamięcią

SYSTEMY OPERACYJNE WYKLAD 4 - zarządzanie pamięcią Wrocław 2007 SYSTEMY OPERACYJNE WYKLAD 4 - zarządzanie pamięcią Paweł Skrobanek C-3, pok. 323 e-mail: pawel.skrobanek@pwr.wroc.pl www.equus.wroc.pl/studia.html 1 PLAN: 2. Pamięć rzeczywista 3. Pamięć wirtualna

Bardziej szczegółowo

Katalog wymagań programowych na poszczególne stopnie szkolne. Matematyka. Poznać, zrozumieć

Katalog wymagań programowych na poszczególne stopnie szkolne. Matematyka. Poznać, zrozumieć Katalog wymagań programowych na poszczególne stopnie szkolne Matematyka. Poznać, zrozumieć Kształcenie w zakresie podstawowym. Klasa 3 Poniżej podajemy umiejętności, jakie powinien zdobyć uczeń z każdego

Bardziej szczegółowo

Opis ćwiczeń zrealizowanych podczas szkolenia

Opis ćwiczeń zrealizowanych podczas szkolenia Opis ćwiczeń zrealizowanych podczas szkolenia Szkolenie dedykowane dla pracowników JST I. Weryfikacja zapisów dokumentów planistycznych Wykorzystana funkcjonalność oprogramowania QGIS: Wizualizacja zasobów

Bardziej szczegółowo

Rola i zadania. eczeństwie wiedzy. w społecze. Instytut Informacji Naukowej i Bibliotekoznawstwa Akademia Pedagogiczna w Krakowie skorka@ap.krakow.

Rola i zadania. eczeństwie wiedzy. w społecze. Instytut Informacji Naukowej i Bibliotekoznawstwa Akademia Pedagogiczna w Krakowie skorka@ap.krakow. Rola i zadania architekta informacji w społecze eczeństwie wiedzy dr Stanisław Skórka Instytut Informacji Naukowej i Bibliotekoznawstwa Akademia Pedagogiczna w Krakowie skorka@ap.krakow.pl Architektura

Bardziej szczegółowo

Laboratorium z Grafiki InŜynierskiej CAD. Rozpoczęcie pracy z AutoCAD-em. Uruchomienie programu

Laboratorium z Grafiki InŜynierskiej CAD. Rozpoczęcie pracy z AutoCAD-em. Uruchomienie programu Laboratorium z Grafiki InŜynierskiej CAD W przygotowaniu ćwiczeń wykorzystano m.in. następujące materiały: 1. Program AutoCAD 2010. 2. Graf J.: AutoCAD 14PL Ćwiczenia. Mikom 1998. 3. Kłosowski P., Grabowska

Bardziej szczegółowo

Wstęp do przetwarzania języka naturalnego. Wykład 10 Zaawansowana wektoryzacja i klasyfikacja

Wstęp do przetwarzania języka naturalnego. Wykład 10 Zaawansowana wektoryzacja i klasyfikacja Wstęp do przetwarzania języka naturalnego Wykład 10 Zaawansowana wektoryzacja i klasyfikacja Wojciech Czarnecki 8 stycznia 2014 Section 1 Wektoryzacja tfidf document x y z Antony and Cleopatra 5.25 1.21

Bardziej szczegółowo

Bazy danych - wykład wstępny

Bazy danych - wykład wstępny Bazy danych - wykład wstępny Wykład: baza danych, modele, hierarchiczny, sieciowy, relacyjny, obiektowy, schemat logiczny, tabela, kwerenda, SQL, rekord, krotka, pole, atrybut, klucz podstawowy, relacja,

Bardziej szczegółowo

Józef Myrczek, Justyna Partyka Bank Spółdzielczy w Katowicach, Akademia Techniczno-Humanistyczna w Bielsku-Białej

Józef Myrczek, Justyna Partyka Bank Spółdzielczy w Katowicach, Akademia Techniczno-Humanistyczna w Bielsku-Białej Józef Myrczek, Justyna Partyka Bank Spółdzielczy w Katowicach, Akademia Techniczno-Humanistyczna w Bielsku-Białej Analiza wraŝliwości Banków Spółdzielczych na dokapitalizowanie w kontekście wzrostu akcji

Bardziej szczegółowo

Baza danych AGRO 16 lat działalności na rzecz nauki i edukacji

Baza danych AGRO 16 lat działalności na rzecz nauki i edukacji Baza danych AGRO 16 lat działalności na rzecz nauki i edukacji Mariusz Polarczyk, Renata Tomaszewska Biblioteka Główna i Centrum Informacji Naukowej Uniwersytet Przyrodniczy w Poznaniu pol@up.poznan.pl

Bardziej szczegółowo

Pojęcie systemu informacyjnego i informatycznego

Pojęcie systemu informacyjnego i informatycznego BAZY DANYCH Pojęcie systemu informacyjnego i informatycznego DANE wszelkie liczby, fakty, pojęcia zarejestrowane w celu uzyskania wiedzy o realnym świecie. INFORMACJA - znaczenie przypisywane danym. SYSTEM

Bardziej szczegółowo

Wykład 5. Cel wykładu. Korespondencja seryjna. WyŜsza Szkoła MenedŜerska w Legnicy. Informatyka w zarządzaniu Zarządzanie, zaoczne, sem.

Wykład 5. Cel wykładu. Korespondencja seryjna. WyŜsza Szkoła MenedŜerska w Legnicy. Informatyka w zarządzaniu Zarządzanie, zaoczne, sem. Informatyka w zarządzaniu Zarządzanie, zaoczne, sem. 3 Wykład 5 MS Word korespondencja seryjna Grzegorz Bazydło Cel wykładu Celem wykładu jest omówienie wybranych zagadnień dotyczących stosowania korespondencji

Bardziej szczegółowo

Wykład I. Wprowadzenie do baz danych

Wykład I. Wprowadzenie do baz danych Wykład I Wprowadzenie do baz danych Trochę historii Pierwsze znane użycie terminu baza danych miało miejsce w listopadzie w 1963 roku. W latach sześcdziesątych XX wieku został opracowany przez Charles

Bardziej szczegółowo

Rys. 1. Dane umieszczone w oddzielnych zestawieniach

Rys. 1. Dane umieszczone w oddzielnych zestawieniach :: Trik 1. Wyszukiwanie danych w kilku tabelach jednocześnie :: Trik 2. Wygodna nawigacja po obszernych zakresach danych :: Trik 3. Szybka analiza bazy danych :: Trik 4. Wynik formuły i jej składnia w

Bardziej szczegółowo

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU

Analiza danych. http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Analiza danych Wstęp Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/ TEMATYKA PRZEDMIOTU Różne aspekty analizy danych Reprezentacja graficzna danych Metody statystyczne: estymacja parametrów

Bardziej szczegółowo

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej.

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej. Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej. Dział Zagadnienia Wymagania podstawowe Wymagania ponadpodstawowe Arkusz kalkulacyjny (Microsoft Excel i OpenOffice) Uruchomienie

Bardziej szczegółowo

Czytelnik w bibliotece cyfrowej

Czytelnik w bibliotece cyfrowej Czytelnik w bibliotece cyfrowej Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe IV Warsztaty Biblioteki Cyfrowe Poznań, 2007 Do czego służy Aplikacja Czytelnika? Udostępnianie zasobów cyfrowych

Bardziej szczegółowo

Plan wynikowy klasa 3

Plan wynikowy klasa 3 Plan wynikowy klasa 3 Przedmiot: matematyka Klasa 3 liceum (technikum) Rok szkolny:........................ Nauczyciel:........................ zakres podstawowy: 28 tyg. 3 h = 84 h (78 h + 6 h do dyspozycji

Bardziej szczegółowo

elektroniczna Platforma Usług Administracji Publicznej

elektroniczna Platforma Usług Administracji Publicznej elektroniczna Platforma Usług Administracji Publicznej Instrukcja użytkownika Katalog Usług Publicznych wersja 1.0 wersja 1.0. 1. WPROWADZENIE...3 1.1. CEL DOKUMENTU...3 1.2. SŁOWNIK POJĘĆ...3 1.3. ELEMENTY

Bardziej szczegółowo

INSTRUKCJA OBSŁUGI PORTAL B2B

INSTRUKCJA OBSŁUGI PORTAL B2B INSTRUKCJA OBSŁUGI PORTAL BB SPIS TREŚCI 1. LOGIN.. POWITANIE...3 3. KATALOG ARTYKUŁÓW...4 4. KOSZYK 6 5. LOGIN 1 Aby zamawiać on-line konieczna jest nazwa (USER) oraz hasło (Password) uŝytkownika, by

Bardziej szczegółowo

Technologie informacyjne lab. 2: Bazy danych

Technologie informacyjne lab. 2: Bazy danych Technologie informacyjne lab. 2: Bazy danych Współcześnie bazy danych i narzędzia wspierające ich przetwarzanie cieszą się ogromną popularnością, i to nie tylko w zastosowaniach profesjonalnych, ale takŝe

Bardziej szczegółowo

Podstawy tworzenie prezentacji multimedialnej w programie. MS Power Point

Podstawy tworzenie prezentacji multimedialnej w programie. MS Power Point SCENARIUSZ ZAJĘĆ Osoba prowadząca: Temat zajęć: mgr Piotr Okłót Podstawy tworzenie prezentacji multimedialnej w programie Ilość godzin: 2 x 45 min Cel ogólny zajęć: MS Power Point Sprawna komunikacja z

Bardziej szczegółowo

Internet wyszukiwarki internetowe

Internet wyszukiwarki internetowe Internet wyszukiwarki internetowe 1. WYSZUKIWARKI INTERNETOWE to doskonały sposób na znalezienie potrzebnych informacji w Internecie. Najpopularniejsze wyszukiwarki to: http://www.google.pl/ http://www.netsprint.pl/

Bardziej szczegółowo

Algorytmy grafowe. Wykład 1 Podstawy teorii grafów Reprezentacje grafów. Tomasz Tyksiński CDV

Algorytmy grafowe. Wykład 1 Podstawy teorii grafów Reprezentacje grafów. Tomasz Tyksiński CDV Algorytmy grafowe Wykład 1 Podstawy teorii grafów Reprezentacje grafów Tomasz Tyksiński CDV Rozkład materiału 1. Podstawowe pojęcia teorii grafów, reprezentacje komputerowe grafów 2. Przeszukiwanie grafów

Bardziej szczegółowo

SQL, LIKE, IN, CASE, EXISTS. Marcin Orchel

SQL, LIKE, IN, CASE, EXISTS. Marcin Orchel SQL, LIKE, IN, CASE, EXISTS Marcin Orchel Spis treści 1 LIKE 2 2 BETWEEN 4 3 IN 5 4 EXISTS 6 5 WYRAŻENIA CASE 7 6 Zadania 9 1 Rozdział 1 LIKE Predykat LIKE jest testem dopasowującym wzorzec łańcucha. Składnia

Bardziej szczegółowo

Kodowanie produktów - cz. 1

Kodowanie produktów - cz. 1 Kodowanie produktów - cz. 1 25.07.2005 r. Wstęp Do identyfikacji wyrobów od dawna używa się różnego rodzaju kodów i klasyfikacji. Obecnie stosuje się m.in. natowską kodyfikację wyrobów, kodowanie wyrobów

Bardziej szczegółowo

2. Podstawy programu Microsoft Access

2. Podstawy programu Microsoft Access 8 Wprowadzenie do projektowania baz danych 2. Podstawy programu Microsoft Access Baza danych utworzona w programie Microsoft Access składa się z wielu obiektów róŝnych typów. MoŜna podzielić je na dwie

Bardziej szczegółowo

Temat: Mechanizm uczenia się ograniczeń składniowych na potrzeby ujednoznaczniania morfo-syntaktycznego tekstów w języku polskim.

Temat: Mechanizm uczenia się ograniczeń składniowych na potrzeby ujednoznaczniania morfo-syntaktycznego tekstów w języku polskim. Temat: Mechanizm uczenia się ograniczeń składniowych na potrzeby ujednoznaczniania morfo-syntaktycznego tekstów w języku polskim. Mechanism of Learning of Syntactic Constraints for the Needs of Morfosyntactic

Bardziej szczegółowo

Bydgoskie Centrum Archiwizacji Cyfrowej sp. z o.o.

Bydgoskie Centrum Archiwizacji Cyfrowej sp. z o.o. STRONA GŁÓWNA ` Usługa earchiwizacja.pl przeznaczona jest zarówno dla osób indywidualnych, jak i firm. Wykorzystuje zasadę przetwarzania danych w chmurze. Pozwala to na dostęp do własnej bazy dokumentów

Bardziej szczegółowo

Laboratorium 10. Odkrywanie cech i algorytm Non-Negative Matrix Factorization.

Laboratorium 10. Odkrywanie cech i algorytm Non-Negative Matrix Factorization. Laboratorium 10 Odkrywanie cech i algorytm Non-Negative Matrix Factorization. 1. Uruchom narzędzie Oracle Data Miner i połącz się z serwerem bazy danych. 2. Z menu głównego wybierz Activity Build. Na ekranie

Bardziej szczegółowo

Uniwersytet Ekonomiczny w Poznaniu - Katedra Informatyki Ekonomicznej. Prowadzone projekty badawcze:

Uniwersytet Ekonomiczny w Poznaniu - Katedra Informatyki Ekonomicznej. Prowadzone projekty badawcze: Uniwersytet Ekonomiczny w Poznaniu - Katedra Informatyki Ekonomicznej Prowadzone projekty badawcze: extraspec (Zastosowanie zaawansowanych metod ekstrakcji danych na potrzeby wyszukiwania ekspertów) Rodzaj

Bardziej szczegółowo

Programowanie deklaratywne

Programowanie deklaratywne Programowanie deklaratywne Artur Michalski Informatyka II rok Plan wykładu Wprowadzenie do języka Prolog Budowa składniowa i interpretacja programów prologowych Listy, operatory i operacje arytmetyczne

Bardziej szczegółowo

z poradni pedagogicznej

z poradni pedagogicznej Kryteria oceniania zajęć komputerowych w klasach kształcenia zintegrowanego dla dzieci z opiniami z poradni pedagogicznej Zajęcia z informatyki są ćwiczeniami praktycznymi, które łączą zabawę z nauką,

Bardziej szczegółowo

Tomasz Grześ. Systemy zarządzania treścią

Tomasz Grześ. Systemy zarządzania treścią Tomasz Grześ Systemy zarządzania treścią Co to jest CMS? CMS (ang. Content Management System System Zarządzania Treścią) CMS definicje TREŚĆ Dowolny rodzaj informacji cyfrowej. Może to być np. tekst, obraz,

Bardziej szczegółowo

program dla opracowujących wnioski o dotacje

program dla opracowujących wnioski o dotacje EKOEFEKT program dla opracowujących wnioski o dotacje 1. Podstawowe informacje EKOEFEKT to program komputerowy do wykonywania obliczeń efektu ekologicznego dla działań w zakresie: modernizacji źródła ciepła,

Bardziej szczegółowo

Wirtualny Konsultant Usług Publicznych Interoperacyjność

Wirtualny Konsultant Usług Publicznych Interoperacyjność Wirtualny Konsultant Usług Publicznych Interoperacyjność ść oraz techniki semantyczne w administracji publicznej Część I wizja Dariusz Woźniak Stowarzyszenie Miasta w Internecie Część II projekt Jerzy

Bardziej szczegółowo

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych

Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji

Bardziej szczegółowo

Zamiana reprezentacji wektorowej na rastrową - rasteryzacja

Zamiana reprezentacji wektorowej na rastrową - rasteryzacja MODEL RASTROWY Siatka kwadratów lub prostokątów stanowi elementy rastra. Piksel - pojedynczy element jest najmniejszą rozróŝnialną jednostką powierzchniową, której własności są opisane atrybutami. Model

Bardziej szczegółowo

Kierunek: ETI Przedmiot: Programowanie w środowisku RAD - Delphi Rok III Semestr 5. Ćwiczenie 5 Aplikacja wielo-okienkowa

Kierunek: ETI Przedmiot: Programowanie w środowisku RAD - Delphi Rok III Semestr 5. Ćwiczenie 5 Aplikacja wielo-okienkowa Kierunek: ETI Przedmiot: Programowanie w środowisku RAD - Delphi Rok III Semestr 5 Ćwiczenie 5 Aplikacja wielo-okienkowa 1. Opracuj aplikację realizującą obliczenia na podstawie danych wpisywanych w komponencie

Bardziej szczegółowo

Podstawowe pojęcia Sieci komputerowe Sieć komputerowa - system umoŝliwiający wymianę danych między 2 lub więcej komputerami. Składają się na nią komputery środki słuŝące realizacji połączenia. Komputery

Bardziej szczegółowo

Eksploracja tekstu. Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu. Eksploracja danych. Eksploracja tekstu wykład 1

Eksploracja tekstu. Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu. Eksploracja danych. Eksploracja tekstu wykład 1 Eksploracja tekstu Wprowadzenie Wyszukiwanie dokumentów Reprezentacje tekstu Eksploracja tekstu wykład 1 Tematem wykładu są zagadnienia związane z eksploracją tekstu. Rozpoczniemy od krótkiego wprowadzenia

Bardziej szczegółowo

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji. 5 Collocations Związek frazeologiczny (kolokacja), to często używane zestawienie słów. Przykłady: strong tea, weapons of mass destruction, make up. Znaczenie całości wyrażenia, nie zawsze wynika ze znaczeń

Bardziej szczegółowo

Kurs obsługi arkusza kalkulacyjnego EXCEL dla nauczycieli Szkoły Podstawowej nr5 w Wodzisławiu Śląskim w roku szkolnym 2004/2005

Kurs obsługi arkusza kalkulacyjnego EXCEL dla nauczycieli Szkoły Podstawowej nr5 w Wodzisławiu Śląskim w roku szkolnym 2004/2005 Kurs obsługi arkusza kalkulacyjnego EXCEL dla nauczycieli Szkoły Podstawowej nr5 w Wodzisławiu Śląskim w roku szkolnym 2004/2005 Kurs z zakresu obsługi arkusza kalkulacyjnego Excel przeznaczony jest dla

Bardziej szczegółowo

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 1 Wprowadzenie do narzędzia CASE. Materiały dla nauczyciela

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 1 Wprowadzenie do narzędzia CASE. Materiały dla nauczyciela Zakład Elektrotechniki Teoretycznej i Informatyki Stosowanej Wydział Elektryczny, Politechnika Warszawska Laboratorium modelowania oprogramowania w języku UML Ćwiczenie 1 Wprowadzenie do narzędzia CASE

Bardziej szczegółowo

Indeksowanie full text search w chmurze

Indeksowanie full text search w chmurze Prezentacja przygotowana dla: 5. Konferencja MIC w Poznaniu, 16.06.20111 Lucene.NET Indeksowanie full text search w chmurze K2 i Windows Azure dlaczego dla nas to możliwe? 1. Mamy unikalne połącznie kompetencji

Bardziej szczegółowo

Analiza danych tekstowych i języka naturalnego

Analiza danych tekstowych i języka naturalnego Kod szkolenia: Tytuł szkolenia: ANA/TXT Analiza danych tekstowych i języka naturalnego Dni: 3 Opis: Adresaci szkolenia Dane tekstowe stanowią co najmniej 70% wszystkich danych generowanych w systemach

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka EDS daje możliwość przeszukania większości baz udostępnianych przez Bibliotekę Uniwersytetu Jagiellońskiego. Odnajdziesz publikacje na potrzebny Ci temat szybko, łatwo i w jednym miejscu.

Bardziej szczegółowo

Matematyczne Podstawy Informatyki

Matematyczne Podstawy Informatyki Matematyczne Podstawy Informatyki dr inż. Andrzej Grosser Instytut Informatyki Teoretycznej i Stosowanej Politechnika Częstochowska Rok akademicki 2013/2014 Informacje podstawowe 1. Konsultacje: pokój

Bardziej szczegółowo

GEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla uŝytkowników modułu wprowadzania danych Warszawa 2007

GEO-SYSTEM Sp. z o.o. GEO-RCiWN Rejestr Cen i Wartości Nieruchomości Podręcznik dla uŝytkowników modułu wprowadzania danych Warszawa 2007 GEO-SYSTEM Sp. z o.o. 02-732 Warszawa, ul. Podbipięty 34 m. 7, tel./fax 847-35-80, 853-31-15 http:\\www.geo-system.com.pl e-mail:geo-system@geo-system.com.pl GEO-RCiWN Podręcznik dla uŝytkowników modułu

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Multiwyszukiwarka EDS daje możliwość przeszukania większości baz udostępnianych przez Bibliotekę Główną Uniwersytetu Medycznego w Poznaniu. Odnajdziesz publikacje na potrzebny Ci temat szybko, łatwo i

Bardziej szczegółowo

WYMAGANIA EDUKACYJNE Z INFORMATYKI KLASA CZWARTA

WYMAGANIA EDUKACYJNE Z INFORMATYKI KLASA CZWARTA EDUACYJNE Z INFORMATYI LASA CZWARTA OPRACOWANO NA PODSTAWIE PROGRAMU likplik. Informatyka w klasach IV-VI szkoły podstawowej I PODRĘCZNIA O NR DOP. 58/09/S Przewidziane w Programie nauczania likplik treści

Bardziej szczegółowo

Grafowy model bazy danych na przykładzie GOOD

Grafowy model bazy danych na przykładzie GOOD GOOD p. 1/1 Grafowy model bazy danych na przykładzie GOOD (Graph-Oriented Object Database Model) Marcin Jakubek GOOD p. 2/1 Plan prezentacji Przykłady modeli danych Zastosowania Inne modele grafowe Wizualizacja

Bardziej szczegółowo

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH

INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH INDUKOWANE REGUŁY DECYZYJNE ALORYTM APRIORI JAROSŁAW FIBICH 1. Czym jest eksploracja danych Eksploracja danych definiowana jest jako zbiór technik odkrywania nietrywialnych zależności i schematów w dużych

Bardziej szczegółowo