ZASTOSOWANIE SIECI SEMANTYCZNEJ DO DISAMBIGUACJI POJĘĆ W JĘZYKU POLSKIM

Wielkość: px
Rozpocząć pokaz od strony:

Download "ZASTOSOWANIE SIECI SEMANTYCZNEJ DO DISAMBIGUACJI POJĘĆ W JĘZYKU POLSKIM"

Transkrypt

1 ZASTOSOWANIE SIECI SEMANTYCZNEJ DO DISAMBIGUACJI POJĘĆ W JĘZYKU POLSKIM Dariusz Ceglarek Wprowadzenie Zjawisko polisemii (wieloznaczności pojęciowej) dotyczy kaŝdego języka naturalnego i oznacza, Ŝe jednemu słowu (lub związkowi frazeologicznemu) odpowiada wiele znaczeń, czyli Ŝe róŝne pojęcia nazywane są tak samo. Disambiguacja pojęciowa (ujednoznacznianie pojęć), czyli wybór właściwego znaczenia dla pojęcia, które posiada wiele znaczeń i pojawiło się w dłuŝszej sentencji, nie sprawia człowiekowi większej trudności w jego codziennym Ŝyciu. MoŜe poza występującymi w codziennym Ŝyciu Ŝartami, które zazwyczaj opierają się na parainformacji powstającej z wieloznaczności pojęć: MoŜesz na mnie liczyć, powiedział informatykowi jego komputer". Natomiast podczas przetwarzania tekstu przez program operujący na tekście, wieloznaczność stanowi znaczący problem. KaŜdemu pojęciu odpowiada w języku naturalnym zapis w postaci wyrazu, kolokacji 1 lub związku frazeologicznego (np. puścić farbę, jabłko Adama ) będących jego odzwierciedleniem. Zapis pojęcia w języku naturalnym będziemy dalej nazywać konceptem. Celem disambiguacji jest stworzenie przetwarzalnej przez systemy informacyjne reprezentacji dokumentu, tak aby w analizowanym dokumencie na podstawie pochodzącej z niego treści - wyodrębnić jednostki odpowiadające znaczeniu informacyjnemu konceptów z tekstu. 1 Kolokacja to związek semantyczny, którego znaczenie wynika z połączenia znaczeń kilku słów wchodzących w jego skład (np. wirus komputerowy ).

2 W niniejszym artykule pokazana jest nowa metoda automatycznego usuwania wieloznaczności w tekście, czyli automatycznego wyznaczania właściwego znaczenia pojęć. Proponowana metoda wykorzystuje zaleŝności semantyczne pomiędzy pojęciami zapamiętane w zbudowanej uprzednio dla języka polskiego sieci semantycznej. Działanie metody opiera się na wskazaniu najbardziej prawdopodobnego znaczenia pojęcia wieloznacznego biorąc pod uwagę kontekst uŝycia owego pojęcia w badanym dokumencie. Pozbawianie pojęć wieloznaczności Przeszkodami w usuwaniu wieloznaczności są najczęściej: brak wystarczającego kontekstu, metafory tworzące wieloznaczne askryptory pojęć na przykład kraj kwitnącej wiśni, zjawisko homonimii (tzw. wieloznaczność właściwa, której przykładem jest pojęcie zamek : zamek błyskawiczny, zamek królewski, zamek w drzwiach, zamek hokejowy), czy powszechnie występujące zjawisko metonimii 2. Przykładami metonimii są: metonimia przyczyny (np. czytam Słowackiego zamiast czytam utwory Słowackiego), metonimia skutku (np. pot zamiast wysiłek), metonimia miejsca (np. Biały Dom zamiast prezydent USA), metonimia narzędzia, metonimia zawartości, metonimia oznaki czy metonimia konkretu. Celem disambiguacji jest lepsze odwzorowanie konceptów (słów, kolokacji) z dokumentów we właściwe pojęcia, a dzięki temu lepsze dopasowanie informacji wywnioskowanej z dokumentów do potrzeb informacyjnych uŝytkownika systemu wyszukiwania informacji. 2 Metonimia (zamiennia) to w literaturze środek stylistyczny mająca na celu zastąpienie nazwy jakiegoś przedmiotu lub zjawiska nazwą innego, pozostającego z nim w uchwytnej zaleŝności. Jednak z figury tej korzysta się takŝe często w codziennym języku.

3 Zadaniem disambiguacji jest dostarczenie właściwych znaczeń pojęć, równieŝ w zaleŝności od kontekstu, co słuŝy wzrostowi precyzji odpowiedzi systemu wyszukiwania informacji. Disambiguacja pojęć przyczynia się do polepszenia funkcjonowania metod w kluczowych zadaniach systemów wyszukiwawczych: wyszukiwaniu informacji (dzięki mechanizmowi query expansion z wykorzystaniem deskryptorów i skryptorów konceptów, co pokazana w pracy [KrCr1992]), filtrowaniu informacji, klasyfikacji i kategoryzacji [HoSS2003], nawigowaniu oraz przy rozbudowie sieci semantycznych czy ontologii [HoSS2003], [KhMH2004] czy [Łabu2004]. Pierwsze metody, które zastosowano do disambiguacji pojęć miały charakter statystyczny lub lingwistyczny. Metody statystyczne posługiwały się standardowymi strukturami reprezentacji wiedzy: słowo, kolokacje oraz współwystąpienie słów. Najbardziej popularne metody z tej grupy, to analiza współwystępowania pojęć [Sand1997], analiza definicji pojęć poprzez ustalenie słów współwystępujących w pewnym otoczeniu pojęcia [Lesk1986], klastering pojęciowy cech [HePe1996], metody wykorzystujące słowniki wielojęzyczne [LeTV1993]. Metody lingwistyczne, w tym morfologiczne to m. in. analiza morfologiczna pojęć wprowadzona przez Zernika (zobacz [Sand2000]) czy metoda grafów konceptualnych [Sowa1991]. Warto zaznaczyć, Ŝe metody lingwistyczne mają charakter regułowy i charakteryzują się duŝą złoŝonością obliczeniową. W pracy [Sand1997] stwierdzono, Ŝe wyłącznie metody analizy lingwistycznej są w stanie pokonać poziom 90% skuteczności disambiguacji. JednakŜe wyniki tej pracy nie uwzględniały rozbudowy struktur reprezentacji wiedzy, takich jak sieć semantyczna WordNet 3 o 3 WordNet ((www.wordnet.princeton,edu) jest siecią semantyczną rozwijaną przez Cognitive Science Laboratory na Uniwersytecie Princeton. 3

4 nowe związki semantyczne i moŝliwości, choćby rejestrowanie polisemii, organizowanie znaczeń w grupy tematyczne. W ostatnich latach wyjątkowo skutecznymi metodami usuwania wieloznaczności są metody oparte na bardziej złoŝonej reprezentacji wiedzy, w której wykorzystuje się takie struktury reprezentacji wiedzy jak tezaurusy, sieci semantyczne czy ontologie. Wyjątkowo dobrą skutecznością disambiguacji mogą poszczycić się reguły przetwarzania relacji dla pojęć z sieci semantycznej [KhMH2004], [Navi2004], klastering metodą COSA [HoSS2003] czy klastering kontekstu pojęć [PuPe2004]. W pracy [GChY1992] stwierdzono, Ŝe człowiek podczas disambiguacji dokonuje w 96,8% właściwego wyboru znaczenia pojęć polisemicznych. W pracy [Sand2000] znalazł się szereg wniosków waŝnych dla systemów wyszukiwawczych. Zapytania składające się z jednego lub dwóch słów prowadzą do duŝej niejednoznaczności pojęć i małej precyzji odpowiedzi. DłuŜsze zapytania wprowadzają kontekst redukujący gwałtownie wieloznaczność i przyczyniają się do wzrostu precyzji odpowiedzi systemu. Z kolei w pracy [Gonz1998] pokazano, Ŝe system dokonujący disambiguacji pojęć z 40% dokładnością wyboru właściwego znaczenia obniŝa precyzję odpowiedzi systemu wyszukiwawczego o 3,5%. Natomiast system o 70% dokładności wyboru znaczenia pojęć przyczynia się do 2,2% wzrostu precyzji odpowiedzi systemu wyszukiwawczego. Ponadto zastosowanie kombinacji najlepszych metod: uwzględnienie kolokacji, współwystąpień i częstości występowania róŝnych znaczeń dla pojęć dało 62,1% dokładność disambiguacji. Kolejnym waŝkim stwierdzeniem w tej pracy jest, Ŝe około 55% poziom dokładności wyboru znaczenia dla pojęcia wieloznacznego jest neutralny dla precyzji odpowiedzi systemu wyszukiwawczego. Zbyt wąski kontekst

5 znaczenia określany poprzez okienka kontekstowe (czyli tekst otaczający rozpatrywane pojęcie) w niektórych przypadkach powodował, Ŝe system nie był w stanie ustalić kontekstu dla pojęcia i w związku z tym wybrać jakiekolwiek jego znaczenie. Krovetz i Croft w pracy [KrCr1992] pokazali, Ŝe prawdopodobieństwo wystąpienia niejednoznaczności pojęciowej rośnie wtedy, gdy dokument jest nierelewantny do zapytania i gdy liczba słów występujących zarówno w dokumencie i zapytaniu jest mała. Jeśli w zapytaniu pojawiają się pojęcia wieloznaczne, to rośnie prawdopodobieństwo otrzymania nierelewantnych dokumentów w odpowiedzi na zapytanie. Metody reprezentacji wiedzy stosowane w systemach wyszukiwawczych Podstawowe zagadnienia systemów wyszukiwawczych (ang. information retrieval systems) to przede wszystkim reprezentacja wiedzy i sposób przechowywania dokumentów, czyli sposób, w jaki informacje zrozumiałe dla człowieka kodowane są w systemie komputerowym oraz jak są zapisywane, gromadzone i odczytywane. Istotne aspekty tego zagadnienia, to format zapisu, struktura plików oraz najistotniejsza w tym artykule logiczna reprezentacja dokumentów odzwierciedlenie informacji zawartej w dokumentach w sposób umoŝliwiający jej automatyczne przetwarzanie [BaRi1999]. Metody reprezentacji wiedzy są sposobem w jakim wiedza o świecie jest przedstawiana wraz z metodami jej przetwarzania i wnioskowania (inferencji). Stosowana metodą reprezentacji wiedzy jest więc jakiś ściśle określony język opisu wiedzy zaopatrzony w mechanizm przetwarzania. Kluczowym zadaniem systemów wyszukiwawczych jest wyszukiwanie rozumiane jako wybór ze zbioru dokumentów tych, które

6 są dopasowane do określonego wzorca. Wzorzec ten jest zazwyczaj zapytaniem uŝytkownika systemu, który formułuje swoje potrzeby informacyjne w postaci słów kluczowych. Wybór dokumentów pasujących do zapytania jest dokonywany automatycznie przez system wyszukiwawczy za pomocą mechanizmów, które porównują zawartość dokumentu z zapytaniem uŝytkownika i są w stanie ocenić ich dopasowanie (kryterium wyboru). Klasyczne metody stosowane w systemach wyszukiwawczych opierają się na prostej strukturze reprezentacji wiedzy, gdzie dokumenty reprezentowane są przez zbiory słów kluczowych (tzw. bag of words). Najbardziej znanymi modelami zapytań kierowanych do systemu wyszukiwawczego z wykorzystaniem tej reprezentacji wiedzy są model logiczny (ang. boolean model), model wektorowy (ang. vector space model), model probabilistyczny, model LSI (ang. latent semantic indexing) czy model sieci neuronowej [BaRi1999]. Bardziej złoŝone struktury reprezentacji wiedzy to: słownik definicyjny (glosariusz), słownik dziedzinowy, taksonomia, tezaurus, sieć semantyczna i ontologia. Struktury te wprowadzają róŝne relacje leksykalne pomiędzy przechowywanymi w nich konceptami. Tezaurus to zbiór semantycznie i hierarchicznie powiązanych konceptów wykorzystywanych w określonej dziedzinie wiedzy. Koncepty zawarte w tezaurusach uporządkowane są przez relacje synonimii oraz hiperonimii i hiponimii. Systemy wyszukiwawcze oparte o tezaurusy wykorzystują je do indeksowania obiektów. Koncepty są indeksowane deskryptorami (pozostałe pojęcia będące w relacji hiperonimii - hiponimii to askryptory). Korzyści wynikające ze stosowania tezaurusów w systemach wyszukiwawczych zostały dobrze opisane w [BaRi1999]. Najlepszą strukturą dla odzwierciedlania powiązań semantycznych między konceptami jest sieć semantyczna. Jest ona grafem skierowanym

7 posiadającym pojęcia jako wierzchołki oraz krawędzie dla reprezentowania relacji leksykalnych między konceptami. Sieć semantyczna posiada następujące relacje leksykalne: hiperonimy (pojazd jest-nadrzędny-dla samochód) hiponimy (samochód jest-podrzędny-dla pojazd) meronimy (pokój ma-część ściana) holonimy (ściana jest-częścią pokój) konotacje (róŝa ma-cechę zapach) atrybutów (suchy jest-wartością wilgotność) synonimy (piękny jest-synonimem śliczny) Krawędzie w sieci mogą posiadać wagi ilustrujące ich waŝność. MoŜna za pomocą relacji określać proste atrybuty konceptów. Wnioskowanie z wykorzystaniem sieci semantycznej odbywa się po krawędziach, jest to po prostu przeszukiwanie grafu. Rozpoczynając z jednego punktu (węzła grafu) i poruszając się po krawędziach, wychodzących z danego punktu, docieramy do kolejnych węzłów, co odpowiada wnioskowaniu o właściwościach pojęć. Sieć semantyczna gromadzi całą dostępną wiedzę o semantyce pojęć. Stąd moŝliwość jej wykorzystania w systemach wyszukiwawczych. Informacje z sieci mogą być zastosowane do ustalania podobieństwa pomiędzy pojęciami w zadaniach klasyfikacji czy kategoryzacji dokumentów. Ponadto sieć semantyczna moŝe słuŝyć do ograniczenia liczby słów kluczowych opisujących dokument na przykład poprzez sprowadzenie grup synonimów do podanego konceptu jako ich reprezentanta (deskryptora). Najbardziej popularną siecią semantyczną, która jest powszechnie stosowana w systemach wyszukiwawczych dla języka angielskiego jest sieć WordNet, która składa się z ponad słów i kolokacji

8 zorganizowanych w tzw. synsety. KaŜdy synset zawiera słowa które są wzajemnie synonimami, a odnośniki pomiędzy synsetami reprezentują relacje hiperonimii i hiponimii tworząc w ten sposób tezaurus, w którym występuje około słów polisemicznych. W chwili obecnej relacje występujące w WordNecie, to relacje hiperonimii, hiponimii, synonimii, metonimii, homonimii i antonimii. Obejmowanie tych relacji czyni z WordNetu pełnowartościową sieć semantyczną dla języka angielskiego. Wobec braku powszechnie dostępnej analogicznej struktury dla języka polskiego autor posłuŝył się zbudowaną w ramach projektu SeNeCa 4 w Katedrze Informatyki Ekonomicznej Akademii Ekonomicznej w Poznaniu strukturą, którą moŝna określić jako sieć semantyczna dla języka polskiego. Zawiera ona słów i kolokacji i zawiera odmian słów, w tym pojęć jest wieloznaczne. Pojęcia w sieci połączone są ze sobą, relacjami hiperonimii i hiponimii, synonimii, meronimii, homonimii oraz konotacjami. Eksperyment W eksperymencie postawiono zadanie wyznaczenia - na podstawie posiadanej sieci semantycznej - właściwego znaczenia pojęć (konceptów) w zbiorze dokumentów poprzez analizę bliskości pojęciowej pomiędzy konceptem wieloznacznym a konceptami, które wystąpiły razem z nim w dokumencie. W ramach eksperymentu sprawdzono dwie nowe metody disambiguacji pojęć. W pierwszej metodzie wyznacza się znaczenie kaŝdego konceptu wieloznacznego wykorzystując powiązania semantyczne (w sieci semantycznej) pomiędzy nim a wszystkimi konceptami, które pojawiły się w badanym dokumencie. Wpływ na wybór właściwego znaczenia 4 Zadaniem projektu SeNeCa (Semantic Network and Categorization, jest automatyzacja rozbudowy sieci semantycznej dla języka polskiego.

9 danego konceptu wieloznacznego mają te pojęcia z sieci semantycznej, które wystąpiły w dokumencie i ich odległość od analizowanego konceptu jest nie większa od zadanego parametru ϕ oznaczającego głębokość przeszukiwania sieci. Przez odległość pomiędzy konceptami a i b w sieci semantycznej naleŝy rozumieć liczbę krawędzi pomiędzy konceptami, jakie naleŝy pokonać aby dotrzeć od konceptu a do konceptu b. Druga metoda wyznacza znaczenie kaŝdego pojęcia wieloznacznego tworząc tzw. okienko wokół pojęcia w tekście o zadanym promieniu tj. do ustalenia właściwego znaczenia pojęcia brane pod uwagę są wyłącznie pojęcia występujące w dokumencie w bezpośrednim sąsiedztwie konceptu wieloznacznego, gdzie promień sąsiedztwa jest ustalanym parametrem. Przykładowo jeśli promień okienka wynosi 10, oznacza to, Ŝe znaczenie pojęcia wieloznacznego określane jest na podstawie występujących w dokumencie dziesięciu słów przed i dziesięciu słów występujących za badanym pojęciem. W metodzie tej stosowany jest równieŝ parametr ϕ - głębokość przeszukiwania sieci. Obie proponowane tu metody dokonując disambiguacji wykonują uprzednio następujące kroki: wyodrębnienie słów z dokumentu, zastąpienie słów konceptami (wykrycie kolokacji lub związków frazeologicznych) i na końcu lematyzowanie konceptów, czyli sprowadzenie form fleksyjnych do wspólnej formy. Ostatnim krokiem jest odnalezienie w dokumencie pojęć posiadających więcej niŝ jedno znaczenie i ustalenie dlań właściwego znaczenia. ZałóŜmy, Ŝe posiadamy (przykładowy) dokument tekstowy o następującej treści: Na mitingu w Poznaniu Adam Nowak, będący zawodnikiem Olimpii Poznań rzucił dyskiem 60,32 metra. Innym wartościowym rezultatem tych zawodów lekkoatletycznych było 59,50 m w rzucie młotem, osiągnięte przez Sylwię Kowalską.. Na rysunku 2

10 pokazano jak wygląda oznakowanie sieci semantycznej dla takiego dokumentu. Wypełnione okręgi na rysunku oznaczają, Ŝe koncept wystąpił w dokumencie. Tak więc wybierając dla wieloznacznego pojęcia dysk jego właściwe znaczenie (z moŝliwych znaczeń: chrząstka, krąŝek, nośnik pamięci, kształt ) o właściwym wyborze zadecyduje występowanie w sieci takich pojęć jak zawodnik, mityng, młot w otoczeniu pojęcia krąŝek ). Rysunek 1: Automatyczne odszukanie kontekstu w dokumencie. Źródło: opracowanie własne

11 Tabela 1: Algorytm disambiguacji pojęć z wykorzystaniem relacji leksykalnych przechowywanych w sieci semantycznej foreach t P /* dla kaŝdego nierozstrzygniętego pojęcia */ { bestsense := maxvalue := 0 foreach sense S of t { M(S) := 0; foreach concept x where r(s, x) > 0 M(S i ) := M(S i ) + SSR(x, 1) } foreach sense S i of t if (M(S i ) > maxvalue} { bestsense := S i maxvalue := M(S i ) } return bestsense } function SSR(concept x, level δ) { foreach concept y where relation r(x, y) > 0 { M(x) := M(x) + f(y) w(r) if (δ < ϕ ) M(x) = M(x) + SSR(y, δ +1) } } return M(x) } gdzie: r(x,y) relacja semantyczna pomiędzy konceptami x i y f(x) ilość wystąpień konceptu x przechowywana w sieci w(r) waga znaczenia relacji r (relacje hiperonimie, hiponimii, synonimii i inne mają róŝne wagi) M(S i ) wartość współczynnika wskazującego na i-te znaczenie konceptu S. ϕ - jest parametrem głębokości przeszukiwania otoczenia konceptów w sieci semantycznej. W ramach eksperymentu sprawdzono 114 dokumentów tekstowych pochodzących z 2006 roku. Dokumenty pochodzą z portalu dziennika Rzeczpospolita (www.rzeczpospolita.pl) i zawierają 2316 słów wieloznacznych. Wyniki disambiguacji pojęć zawiera tabela 2. Dla analizy lokalnej przyjęto głębokość przeszukania sieci semantycznej ϕ = 4 oraz szerokość okienka wokół pojęć wieloznacznych wynoszącą 12

12 słów. Wartości parametru ϕ oraz szerokości okienka zostały wyznaczone eksperymentalnie, przyczyniając się do stosunkowo wysokiej jakości disambiguacji. Tabela 2: Wyniki disambiguacji pojęć metodą analizy globalnej i metodą analizy lokalnej. Źródło: obliczenia własne Liczba dokumentów Liczba pojęć wieloznacznych Metoda globalna Liczba poprawnych rozpoznań polisemii Skutecz ność metody w % Metoda lokalna Liczba poprawnych rozpoznań polisemii Skutecz ność metody w % Wielkość artykułu (liczba słów) , , , , , , razem , , Wnioski Uzyskane wyniki (umieszczone w tabeli 1) obu zaproponowanych metod są obiecujące i są porównywalne do innych metod disambiguacji pojęć z wykorzystaniem sieci semantycznej [KhMH2004], [Navi2004], czy klasteringu kontekstu pojęć [PuPe2004]. Warte podkreślenia jest, Ŝe zastosowano je z powodzeniem dla bogatego w fleksję języka jakim jest język polski. Zaprezentowana tu metoda globalna, badająca znaczenie pojęcia na podstawie kontekstu całego dokumentu z wykorzystaniem sieci semantycznej ma skuteczność disambiguacji około 76%, z tym, Ŝe skuteczność ta maleje wraz ze wzrostem rozmiaru dokumentów. Metoda lokalna okienka tekstowego korzystająca z sieci semantycznej daje najlepsze rezultaty. Skuteczność disambiguacji pojęć tą metodą, która oscyluje wokół 83%, jest wyjątkowo wysoka i stabilna przy wzroście wielkości dokumentu tekstowego.

13 Prawdopodobnie rozbudowa sieci semantycznej o wieloznaczności skatalogowane na przykład w ramach projektu pl.wikipedia.org oraz uwzględnienie w sieci większej liczby powiązań pozwoliłoby otrzymać precyzję disambiguacji w okolicach 90%. Bibliografia [AbCe2002] Abramowicz W., Ceglarek D.: Zastosowanie metod pełnotekstowej analizy skupień do kategoryzacji dokumentów w języku polskim, [w:] Konferencja SWO 2002, Akademia Ekonomiczna w Katowicach [BaRi1999] Baeza-Yates R., Ribeiro-Neto B.: Modern Information Retrieval, ACM Press, Addison-Wesley Longman Publishing Co., New York 1999 [GChY1992] Gale W., Church K., Yarowsky D.: Estimating upper and lower bounds on the Performance of word-sense Disambiguation programs, [w:] Proceeding of 30 th Annual Meeting of the Association for Computational Linguistics, 1992 [Gonz1998] Gonzalo J. i inni: Indexing with WordNet Synsets can improve Text Retrieval, 1998 [HePe1996] Hearst M.A., Pedersen J.O. : Reexamining the cluster hypothesis: Scatter/Gather on retrieval results. [w:] 19th Annual International Conference on Research and Development in Information Retrieval, 1996 [HoSS2003] Hotho A., Staab S., Stumme: Ontologies improves Text Document Clustering, 2003 [Jone2002] Jones Ch.B.: Spatial Information Retrieval and Geographical Ontologies. An overview of the SPIRIT Project, SIGIR 2002 [HoSS2003a] Hotho A., Staab S., Stumme: Wordnet improves Text Document Clustering, The major Technical Report 425, University of Karlsruhe, Institute AIFB 2003 [KhMH2004] Khan L., McLeod D., Hovy E.: Retrieval effectiveness of an ontology-based model for information selection, 2004 [KrCr1992] Krovetz R, Croft WB.: Lexical Ambiguity and Information Retrieval, 1992 [LeTV1993] Leacock, C., Towell, G., Voorhes E.: Towards Building Contextual Representations of Word Senses Using

14 Statistical Models, [w:] SIGLEX workshop: Acquisition of Lexical Knowledge from Text, 1993 [Łabu2004] Łabuzek M.: Wykorzystanie metamodelowania do specyfikacji ontologii znaczenia opisów rzeczywistości, projekt badawczy KBN, Warszawa 2004 [Navi2004] Navigli R.: Learning Domain Ontologies from Document Warehouses and Dedicated Web Sites, 2004 [PuPe2004] Purandare A., Pedersen T.: Word sense discrimination by clustering contexts in vector and similarity spaces, 2004 [PuPK2005] Purandare A., Pedersen T., Kulkarni A.: Name Discrimination by Clustering Similar Contexts, 2005 [Sand1997] Sanderson M.: Word Sense Disambiguation and Information Retrieval, 1997 [Sand2000] Sanderson M.: Retrieving with Good Sense, 2000 [Sowa1991] Sowa J. F.: Principles of Semantic Networks: Explorations in the Representation of Knowledge, Morgan Kaufmann Publishers, San Mateo 1991 [StOT2003] Stokoe Ch., Oakes M.P., Tait J.: Word Sense Disambiguation in Information Retrieval Revisited, SIGIR 2003 dr Dariusz Ceglarek Katedra Informatyki Ekonomicznej Akademia Ekonomiczna ul. Powstańców Wielkopolskich Poznań - Polska Numer telefonu (fax) +48/61/

Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne:

Forma. Główny cel kursu. Umiejętności nabywane przez studentów. Wymagania wstępne: WYDOBYWANIE I WYSZUKIWANIE INFORMACJI Z INTERNETU Forma wykład: 30 godzin laboratorium: 30 godzin Główny cel kursu W ramach kursu studenci poznają podstawy stosowanych powszechnie metod wyszukiwania informacji

Bardziej szczegółowo

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych

Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Systemy organizacji wiedzy i ich rola w integracji zasobów europejskich bibliotek cyfrowych Adam Dudczak Poznańskie Centrum Superkomputerowo-Sieciowe (maneo@man.poznan.pl) I Konferencja Polskie Biblioteki

Bardziej szczegółowo

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.

Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot

Bardziej szczegółowo

technologii informacyjnych kształtowanie , procesów informacyjnych kreowanie metod dostosowania odpowiednich do tego celu środków technicznych.

technologii informacyjnych kształtowanie , procesów informacyjnych kreowanie metod dostosowania odpowiednich do tego celu środków technicznych. Informatyka Coraz częściej informatykę utoŝsamia się z pojęciem technologii informacyjnych. Za naukową podstawę informatyki uwaŝa się teorię informacji i jej związki z naukami technicznymi, np. elektroniką,

Bardziej szczegółowo

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl

Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po

Bardziej szczegółowo

Ontologie, czyli o inteligentnych danych

Ontologie, czyli o inteligentnych danych 1 Ontologie, czyli o inteligentnych danych Bożena Deka Andrzej Tolarczyk PLAN 2 1. Korzenie filozoficzne 2. Ontologia w informatyce Ontologie a bazy danych Sieć Semantyczna Inteligentne dane 3. Zastosowania

Bardziej szczegółowo

Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska

Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Rozróżnianie sensów polskich słów za pomoca rozwinięcia metody Leska Seminarium przetwarzania języka naturalnego Mateusz Kopeć Instytut Podstaw Informatyki Polskiej Akademii Nauk 6 lutego 2012 Plan 1 Zadanie

Bardziej szczegółowo

Centralność w sieciach społecznych. Radosław Michalski Social Network Group - kwiecień 2009

Centralność w sieciach społecznych. Radosław Michalski Social Network Group - kwiecień 2009 Centralność w sieciach społecznych Radosław Michalski Social Network Group - kwiecień 2009 Agenda spotkania Pojęcie centralności Potrzeba pomiaru centralności Miary centralności degree centrality betweenness

Bardziej szczegółowo

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1 Bazy danych wprowadzenie teoretyczne Piotr Prekurat 1 Baza danych Jest to zbiór danych lub jakichkolwiek innych materiałów i elementów zgromadzonych według określonej systematyki lub metody. Zatem jest

Bardziej szczegółowo

PLAN ZARZĄDZANIA WYMAGANIAMI PROJEKT WERSJA

PLAN ZARZĄDZANIA WYMAGANIAMI PROJEKT <NAZWA PROJEKTU> WERSJA <NUMER WERSJI DOKUMENTU> Załącznik nr 4.4 do Umowy nr 35-ILGW-253-.../20.. z dnia... MINISTERSTWO FINANSÓW DEPARTAMENT INFORMATYKI PLAN ZARZĄDZANIA WYMAGANIAMI PROJEKT WERSJA numer wersji

Bardziej szczegółowo

Wyszukiwanie informacji w internecie. Nguyen Hung Son

Wyszukiwanie informacji w internecie. Nguyen Hung Son Wyszukiwanie informacji w internecie Nguyen Hung Son Jak znaleźć informację w internecie? Wyszukiwarki internetowe: Potężne machiny wykorzystujące najnowsze metody z różnych dziedzin Architektura: trzy

Bardziej szczegółowo

CLUSTERING. Metody grupowania danych

CLUSTERING. Metody grupowania danych CLUSTERING Metody grupowania danych Plan wykładu Wprowadzenie Dziedziny zastosowania Co to jest problem klastrowania? Problem wyszukiwania optymalnych klastrów Metody generowania: k centroidów (k - means

Bardziej szczegółowo

IV.3.b. Potrafisz samodzielnie dokonać podstawowej konfiguracji sieci komputerowej

IV.3.b. Potrafisz samodzielnie dokonać podstawowej konfiguracji sieci komputerowej IV.3.b. Potrafisz samodzielnie dokonać podstawowej konfiguracji sieci komputerowej Co warto wiedzieć o łączeniu komputerów w sieci? Spójrz na rysunek IV.3p, który przedstawia właściwości Połączeń lokalnych,

Bardziej szczegółowo

Multiwyszukiwarka EBSCO Discovery Service - przewodnik

Multiwyszukiwarka EBSCO Discovery Service - przewodnik Ekran Wyszukiwania Podstawowego w multiwyszukiwarce EBSCO Discovery Service zapewnia dostęp poprzez jedno okienko wyszukiwawcze na platformie EBSCOhost do wszystkich zasobów biblioteki. Na ekranie do wyszukiwania

Bardziej szczegółowo

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2

DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY PROGRAMU AGREGAT - 2 InŜynieria Rolnicza 14/2005 Michał Cupiał, Maciej Kuboń Katedra InŜynierii Rolniczej i Informatyki Akademia Rolnicza im. Hugona Kołłątaja w Krakowie DOBÓR ŚRODKÓW TRANSPORTOWYCH DLA GOSPODARSTWA PRZY POMOCY

Bardziej szczegółowo

Języki deskryptorowe. Dr Marek Nahotko

Języki deskryptorowe. Dr Marek Nahotko Języki deskryptorowe Dr Marek Nahotko 1 Literatura: Języki deskryptorowe dla SINTO / Lucyna Bielicka, Joanna Tomasik-Beck. Warszawa, 1981; Zasady budowy tezaurusów / Kazimierz Leski. Warszawa, 1978; Języki

Bardziej szczegółowo

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji

Bardziej szczegółowo

4.3 Grupowanie według podobieństwa

4.3 Grupowanie według podobieństwa 4.3 Grupowanie według podobieństwa Przykłady obiektów to coś więcej niż wektory wartości atrybutów. Reprezentują one poszczególne rasy psów. Ważnym pytaniem, jakie można sobie zadać, jest to jak dobrymi

Bardziej szczegółowo

PageRank i HITS. Mikołajczyk Grzegorz

PageRank i HITS. Mikołajczyk Grzegorz PageRank i HITS Mikołajczyk Grzegorz PageRank Metoda nadawania indeksowanym stronom internetowym określonej wartości liczbowej, oznaczającej jej jakość. Algorytm PageRank jest wykorzystywany przez popularną

Bardziej szczegółowo

prof. dr hab. Jadwiga Woźniak-Kasperek Instytut Informacji Naukowej i Studiów Bibliologicznych Uniwersytet Warszawski

prof. dr hab. Jadwiga Woźniak-Kasperek Instytut Informacji Naukowej i Studiów Bibliologicznych Uniwersytet Warszawski prof. dr hab. Jadwiga Woźniak-Kasperek Instytut Informacji Naukowej i Studiów Bibliologicznych Uniwersytet Warszawski Rola języka i semantyki w procesach reprezentowania i wyszukiwania treści Możliwości

Bardziej szczegółowo

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa

Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika ska Katedra Inteligencji

Bardziej szczegółowo

Za pomocą atrybutu ROWS moŝemy dokonać podziału ekranu w poziomie. Odpowiedni kod powinien wyglądać następująco:

Za pomocą atrybutu ROWS moŝemy dokonać podziału ekranu w poziomie. Odpowiedni kod powinien wyglądać następująco: 1 1. Ramki Najbardziej elastycznym sposobem budowania stron jest uŝycie ramek. Ułatwiają one nawigowanie w wielostronicowych dokumentach HTML, poprzez podział ekranu na kilka obszarów. KaŜdy z nich zawiera

Bardziej szczegółowo

Instrukcja do panelu administracyjnego. do zarządzania kontem FTP WebAs. www.poczta.greenlemon.pl

Instrukcja do panelu administracyjnego. do zarządzania kontem FTP WebAs. www.poczta.greenlemon.pl Instrukcja do panelu administracyjnego do zarządzania kontem FTP WebAs www.poczta.greenlemon.pl Opracowanie: Agencja Mediów Interaktywnych GREEN LEMON Spis treści 1.Wstęp 2.Konfiguracja 3.Konto FTP 4.Domeny

Bardziej szczegółowo

Program do obsługi ubezpieczeń minifort

Program do obsługi ubezpieczeń minifort Program do obsługi ubezpieczeń minifort Dokumentacja uŝytkownika Akwizycja wznowień polis Kraków, grudzień 2008r. Akwizycja Jedną z podstawowych funkcji programu ubezpieczeń majątkowych są funkcje wspomagające

Bardziej szczegółowo

The University of Michigan Digital Library Production Service Collection http://www.umdl.umich.edu/

The University of Michigan Digital Library Production Service Collection http://www.umdl.umich.edu/ 1 The University of Michigan Digital Library Production Service Collection http://www.umdl.umich.edu/ 1. Zawartość Biblioteka elektroniczna Uniwersytetu w Michigan, która oferuje elektroniczne dane i usługi.

Bardziej szczegółowo

CLARIN rozproszony system technologii językowych dla różnych języków europejskich

CLARIN rozproszony system technologii językowych dla różnych języków europejskich CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN

Bardziej szczegółowo

Rodzaje analiz w SIT/GIS

Rodzaje analiz w SIT/GIS Rodzaje analiz w SIT/GIS Analizy przestrzenne to zbiór działań na jednej bądź kilku warstwach informacyjnych GIS, w celu uzyskania nowej informacji w postaci graficznej lub tabelarycznej Rodzaje analiz

Bardziej szczegółowo

Lokalizacja Oprogramowania

Lokalizacja Oprogramowania mgr inż. Anton Smoliński anton.smolinski@zut.edu.pl Lokalizacja Oprogramowania 16/12/2016 Wykład 6 Internacjonalizacja, Testowanie, Tłumaczenie Maszynowe Agenda Internacjonalizacja Testowanie lokalizacji

Bardziej szczegółowo

Lista ikonek stosowanych do oznaczenia róŝnych nośników:

Lista ikonek stosowanych do oznaczenia róŝnych nośników: Korzystając z przeglądarki internetowej otwórz stronę http://www.bibliotekacen.pl. Wejdź w zakładkę katalog on-line, następnie wybierz Bibliotekę Pedagogiczną w Koszalinie. Informacje o zbiorach Biblioteki

Bardziej szczegółowo

Repozytorium Zasobów Wiedzy FTP

Repozytorium Zasobów Wiedzy FTP Repozytorium Zasobów Wiedzy FTP Spis treści Wprowadzenie... 1 Architektura Repozytorium Zasobów Wiedzy... 1 Mapy Wiedzy... 4 Wprowadzanie zasobów wiedzy do repozytorium... 7 Prezentacja zasobów wiedzy

Bardziej szczegółowo

Metrologia: organizacja eksperymentu pomiarowego

Metrologia: organizacja eksperymentu pomiarowego Metrologia: organizacja eksperymentu pomiarowego (na podstawie: Żółtowski B. Podstawy diagnostyki maszyn, 1996) dr inż. Paweł Zalewski Akademia Morska w Szczecinie Teoria eksperymentu: Teoria eksperymentu

Bardziej szczegółowo

Sposoby prezentacji problemów w statystyce

Sposoby prezentacji problemów w statystyce S t r o n a 1 Dr Anna Rybak Instytut Informatyki Uniwersytet w Białymstoku Sposoby prezentacji problemów w statystyce Wprowadzenie W artykule zostaną zaprezentowane podstawowe zagadnienia z zakresu statystyki

Bardziej szczegółowo

Definicje. Algorytm to:

Definicje. Algorytm to: Algorytmy Definicje Algorytm to: skończony ciąg operacji na obiektach, ze ściśle ustalonym porządkiem wykonania, dający możliwość realizacji zadania określonej klasy pewien ciąg czynności, który prowadzi

Bardziej szczegółowo

Laboratorium nr 5. Temat: Funkcje agregujące, klauzule GROUP BY, HAVING

Laboratorium nr 5. Temat: Funkcje agregujące, klauzule GROUP BY, HAVING Laboratorium nr 5 Temat: Funkcje agregujące, klauzule GROUP BY, HAVING Celem ćwiczenia jest zaprezentowanie zagadnień dotyczących stosowania w zapytaniach języka SQL predefiniowanych funkcji agregujących.

Bardziej szczegółowo

CAMBRIDGE ESOL PRETESTING (PILOTAś EGZAMINÓW CAMBRIDGE ESOL)

CAMBRIDGE ESOL PRETESTING (PILOTAś EGZAMINÓW CAMBRIDGE ESOL) CAMBRIDGE ESOL PRETESTING (PILOTAś EGZAMINÓW CAMBRIDGE ESOL) Wszystkie materiały egzaminacyjne ESOL (egzaminy z języka angielskiego dla obcokrajowców) Uniwersytetu Cambridge są poddawane pretestingowi/pilotaŝowi

Bardziej szczegółowo

NEURAL NETWORK ) FANN jest biblioteką implementującą SSN, którą moŝna wykorzystać. w C, C++, PHP, Pythonie, Delphi a nawet w środowisku. Mathematica.

NEURAL NETWORK ) FANN jest biblioteką implementującą SSN, którą moŝna wykorzystać. w C, C++, PHP, Pythonie, Delphi a nawet w środowisku. Mathematica. Wykorzystanie sztucznych sieci neuronowych do rozpoznawania języków: polskiego, angielskiego i francuskiego Tworzenie i nauczanie sieci przy pomocy języka C++ i biblioteki FANN (Fast Artificial Neural

Bardziej szczegółowo

Rachunek prawdopodobieństwa projekt Ilustracja metody Monte Carlo obliczania całek oznaczonych

Rachunek prawdopodobieństwa projekt Ilustracja metody Monte Carlo obliczania całek oznaczonych Rachunek prawdopodobieństwa projekt Ilustracja metody Monte Carlo obliczania całek oznaczonych Autorzy: Marta Rotkiel, Anna Konik, Bartłomiej Parowicz, Robert Rudak, Piotr Otręba Spis treści: Wstęp Cel

Bardziej szczegółowo

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych

Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Interaktywne wyszukiwanie informacji w repozytoriach danych tekstowych Marcin Deptuła Julian Szymański, Henryk Krawczyk Politechnika Gdańska Wydział Elektroniki, Telekomunikacji i Informatyki Katedra Architektury

Bardziej szczegółowo

PROJEKT CZĘŚCIOWO FINANSOWANY PRZEZ UNIĘ EUROPEJSKĄ. Opis działania raportów w ClearQuest

PROJEKT CZĘŚCIOWO FINANSOWANY PRZEZ UNIĘ EUROPEJSKĄ. Opis działania raportów w ClearQuest PROJEKT CZĘŚCIOWO FINANSOWANY PRZEZ UNIĘ EUROPEJSKĄ Opis działania raportów w ClearQuest Historia zmian Data Wersja Opis Autor 2008.08.26 1.0 Utworzenie dokumentu. Wersja bazowa dokumentu. 2009.12.11 1.1

Bardziej szczegółowo

Sposoby wyszukiwania multimedialnych zasobów w Internecie

Sposoby wyszukiwania multimedialnych zasobów w Internecie Sposoby wyszukiwania multimedialnych zasobów w Internecie Lidia Derfert-Wolf Biblioteka Główna Uniwersytetu Technologiczno-Przyrodniczego w Bydgoszczy e-mail: lidka@utp.edu.pl III seminarium z cyklu INFOBROKER:

Bardziej szczegółowo

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza

ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ. Joanna Bryndza ANALIZA HIERARCHICZNA PROBLEMU W SZACOWANIU RYZYKA PROJEKTU INFORMATYCZNEGO METODĄ PUNKTOWĄ Joanna Bryndza Wprowadzenie Jednym z kluczowych problemów w szacowaniu poziomu ryzyka przedsięwzięcia informatycznego

Bardziej szczegółowo

Technologia informacyjna

Technologia informacyjna Technologia informacyjna Pracownia nr 9 (studia stacjonarne) - 05.12.2008 - Rok akademicki 2008/2009 2/16 Bazy danych - Plan zajęć Podstawowe pojęcia: baza danych, system zarządzania bazą danych tabela,

Bardziej szczegółowo

Wykład 5. Cel wykładu. Korespondencja seryjna. WyŜsza Szkoła MenedŜerska w Legnicy. Informatyka w zarządzaniu Zarządzanie, zaoczne, sem.

Wykład 5. Cel wykładu. Korespondencja seryjna. WyŜsza Szkoła MenedŜerska w Legnicy. Informatyka w zarządzaniu Zarządzanie, zaoczne, sem. Informatyka w zarządzaniu Zarządzanie, zaoczne, sem. 3 Wykład 5 MS Word korespondencja seryjna Grzegorz Bazydło Cel wykładu Celem wykładu jest omówienie wybranych zagadnień dotyczących stosowania korespondencji

Bardziej szczegółowo

EmotiWord, semantyczne powiązanie i podobieństwo, odległość znaczeniowa

EmotiWord, semantyczne powiązanie i podobieństwo, odległość znaczeniowa , semantyczne powiązanie i podobieństwo, odległość Projekt przejściowy ARR Politechnika Wrocławska Wydział Elektroniki Wrocław, 22 października 2013 Spis treści 1 językowa 2, kryteria 3 Streszczenie artykułu

Bardziej szczegółowo

Semantyczne podobieństwo stron internetowych

Semantyczne podobieństwo stron internetowych Uniwersytet Mikołaja Kopernika Wydział Matematyki i Informatyki Marcin Lamparski Nr albumu: 184198 Praca magisterska na kierunku Informatyka Semantyczne podobieństwo stron internetowych Praca wykonana

Bardziej szczegółowo

Spis treści. spis treści wygenerowany automatycznie

Spis treści. spis treści wygenerowany automatycznie Spis treści Rozdział 2.Wymagania edytorskie 2 2.1. Wymagania ogólne 2 2.2. Tytuły rozdziałów i podrozdziałów 2 2.3. Rysunki, tabele i wzory 3 2.3.1. Rysunki 3 2.3.2. Tabele 4 2.3.3. Wzory 4 2.4. Odsyłacze

Bardziej szczegółowo

SYSTEMY OPERACYJNE WYKLAD 4 - zarządzanie pamięcią

SYSTEMY OPERACYJNE WYKLAD 4 - zarządzanie pamięcią Wrocław 2007 SYSTEMY OPERACYJNE WYKLAD 4 - zarządzanie pamięcią Paweł Skrobanek C-3, pok. 323 e-mail: pawel.skrobanek@pwr.wroc.pl www.equus.wroc.pl/studia.html 1 PLAN: 2. Pamięć rzeczywista 3. Pamięć wirtualna

Bardziej szczegółowo

Instrukcja obsługi programu

Instrukcja obsługi programu Instrukcja obsługi programu 1. Wstęp Korzystając z aplikacji Reversi.NET moŝesz grać w grę Reversi (alt. Othello). Program pozwala na grę pomiędzy dwiema osobami uŝywającymi tego samego komputera, poprzez

Bardziej szczegółowo

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 3 Ćwiczenia w narzędziu CASE diagram sekwencji. Materiały dla nauczyciela

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 3 Ćwiczenia w narzędziu CASE diagram sekwencji. Materiały dla nauczyciela Zakład Elektrotechniki Teoretycznej i Informatyki Stosowanej Wydział Elektryczny, Politechnika Warszawska Laboratorium modelowania oprogramowania w języku UML Ćwiczenie 3 Ćwiczenia w narzędziu CASE diagram

Bardziej szczegółowo

Modelowanie przy uŝyciu arkusza kalkulacyjnego

Modelowanie przy uŝyciu arkusza kalkulacyjnego Wydział Odlewnictwa Wirtualizacja technologii odlewniczych Modelowanie przy uŝyciu Projektowanie informatycznych systemów zarządzania 2Modelowanie przy uŝyciu Modelowania przy uŝyciu Wprowadzenie Zasady

Bardziej szczegółowo

Internet wyszukiwarki internetowe

Internet wyszukiwarki internetowe Internet wyszukiwarki internetowe 1. WYSZUKIWARKI INTERNETOWE to doskonały sposób na znalezienie potrzebnych informacji w Internecie. Najpopularniejsze wyszukiwarki to: http://www.google.pl/ http://www.netsprint.pl/

Bardziej szczegółowo

Sieci komputerowe - składają się z co najmniej dwóch komputerów, które za pomocą fizycznych nośników (np.: kabel koncentryczny, światłowód)

Sieci komputerowe - składają się z co najmniej dwóch komputerów, które za pomocą fizycznych nośników (np.: kabel koncentryczny, światłowód) Ćw. 1 Wyróżnienia fragmentów tekstu Wyróżnij fragment tekstu przez zakreślenie. Użyj czcionki Verdana, wielkość 10, zastosuj obramowanie, jak poniżej. Sieci komputerowe - to co najmniej dwa komputery (mogą

Bardziej szczegółowo

Systemy liczenia. 333= 3*100+3*10+3*1

Systemy liczenia. 333= 3*100+3*10+3*1 Systemy liczenia. System dziesiętny jest systemem pozycyjnym, co oznacza, Ŝe wartość liczby zaleŝy od pozycji na której się ona znajduje np. w liczbie 333 kaŝda cyfra oznacza inną wartość bowiem: 333=

Bardziej szczegółowo

Baza danych. Baza danych to:

Baza danych. Baza danych to: Baza danych Baza danych to: zbiór danych o określonej strukturze, zapisany na zewnętrznym nośniku (najczęściej dysku twardym komputera), mogący zaspokoić potrzeby wielu użytkowników korzystających z niego

Bardziej szczegółowo

Systemy ekspertowe i ich zastosowania. Katarzyna Karp Marek Grabowski

Systemy ekspertowe i ich zastosowania. Katarzyna Karp Marek Grabowski Systemy ekspertowe i ich zastosowania Katarzyna Karp Marek Grabowski Plan prezentacji Wstęp Własności systemów ekspertowych Rodzaje baz wiedzy Metody reprezentacji wiedzy Metody wnioskowania Języki do

Bardziej szczegółowo

System do rekrutacji nowej generacji

System do rekrutacji nowej generacji System do rekrutacji nowej generacji PYTON Falcon pozwala usprawnić proces rekrutacji zewnętrznej i wewnętrznej, zarządza całym procesem rekrutacyjnym: wakatami, ofertami pracy, rozmowami kwalifikacyjnymi,

Bardziej szczegółowo

Rola i zadania. eczeństwie wiedzy. w społecze. Instytut Informacji Naukowej i Bibliotekoznawstwa Akademia Pedagogiczna w Krakowie skorka@ap.krakow.

Rola i zadania. eczeństwie wiedzy. w społecze. Instytut Informacji Naukowej i Bibliotekoznawstwa Akademia Pedagogiczna w Krakowie skorka@ap.krakow. Rola i zadania architekta informacji w społecze eczeństwie wiedzy dr Stanisław Skórka Instytut Informacji Naukowej i Bibliotekoznawstwa Akademia Pedagogiczna w Krakowie skorka@ap.krakow.pl Architektura

Bardziej szczegółowo

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych

Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Algorytmy decyzyjne będące alternatywą dla sieci neuronowych Piotr Dalka Przykładowe algorytmy decyzyjne Sztuczne sieci neuronowe Algorytm k najbliższych sąsiadów Kaskada klasyfikatorów AdaBoost Naiwny

Bardziej szczegółowo

Laboratorium z Grafiki InŜynierskiej CAD. Rozpoczęcie pracy z AutoCAD-em. Uruchomienie programu

Laboratorium z Grafiki InŜynierskiej CAD. Rozpoczęcie pracy z AutoCAD-em. Uruchomienie programu Laboratorium z Grafiki InŜynierskiej CAD W przygotowaniu ćwiczeń wykorzystano m.in. następujące materiały: 1. Program AutoCAD 2010. 2. Graf J.: AutoCAD 14PL Ćwiczenia. Mikom 1998. 3. Kłosowski P., Grabowska

Bardziej szczegółowo

Podstawowe pojęcia dotyczące relacyjnych baz danych. mgr inż. Krzysztof Szałajko

Podstawowe pojęcia dotyczące relacyjnych baz danych. mgr inż. Krzysztof Szałajko Podstawowe pojęcia dotyczące relacyjnych baz danych mgr inż. Krzysztof Szałajko Czym jest baza danych? Co rozumiemy przez dane? Czym jest system zarządzania bazą danych? 2 / 25 Baza danych Baza danych

Bardziej szczegółowo

Dariusz Brzeziński Instytut Informatyki, Politechnika Poznańska

Dariusz Brzeziński Instytut Informatyki, Politechnika Poznańska Dariusz Brzeziński Instytut Informatyki, Politechnika Poznańska Czym jest znaczenie Reprezentacja wektorowa Ograniczenia modelu BOW Słowa w kontekście Redukcja wymiarów Word2vec GloVe Materiały sporządzone

Bardziej szczegółowo

WSCAD. Wykład 5 Szafy sterownicze

WSCAD. Wykład 5 Szafy sterownicze WSCAD Wykład 5 Szafy sterownicze MenedŜer szaf sterowniczych MenedŜer szaf sterowniczych w wersji Professional oferuje pomoc przy tworzeniu zabudowy szafy sterowniczej. Pokazuje wszystkie uŝyte w schematach

Bardziej szczegółowo

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski Wprowadzenie do multimedialnych baz danych Opracował: dr inż. Piotr Suchomski Wprowadzenie bazy danych Multimedialne bazy danych to takie bazy danych, w których danymi mogą być tekst, zdjęcia, grafika,

Bardziej szczegółowo

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH

PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH InŜynieria Rolnicza 14/2005 Sławomir Francik Katedra InŜynierii Mechanicznej i Agrofizyki Akademia Rolnicza w Krakowie PROGNOZOWANIE CENY OGÓRKA SZKLARNIOWEGO ZA POMOCĄ SIECI NEURONOWYCH Streszczenie W

Bardziej szczegółowo

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak

Wyszukiwanie boolowskie i strukturalne. Adam Srebniak Wyszukiwanie boolowskie i strukturalne Adam Srebniak Wyszukiwanie boolowskie W wyszukiwaniu boolowskim zapytanie traktowane jest jako zdanie logiczne. Zwracane są dokumenty, dla których to zdanie jest

Bardziej szczegółowo

Pojęcia to. porównanie trzech sposobów ujmowania pojęć. Monika Marczak IP, UAM

Pojęcia to. porównanie trzech sposobów ujmowania pojęć. Monika Marczak IP, UAM Pojęcia to. porównanie trzech sposobów ujmowania pojęć Monika Marczak IP, UAM Takiego zwierzęcia nie ma?????????? Jeśli brakuje umysłowej reprezentacji pewnego fragmentu rzeczywistości, fragment ten dla

Bardziej szczegółowo

AiSD zadanie trzecie

AiSD zadanie trzecie AiSD zadanie trzecie Gliwiński Jarosław Marek Kruczyński Konrad Marek Grupa dziekańska I5 5 czerwca 2008 1 Wstęp Celem postawionym przez zadanie trzecie było tzw. sortowanie topologiczne. Jest to typ sortowania

Bardziej szczegółowo

Algorytmy grafowe. Wykład 1 Podstawy teorii grafów Reprezentacje grafów. Tomasz Tyksiński CDV

Algorytmy grafowe. Wykład 1 Podstawy teorii grafów Reprezentacje grafów. Tomasz Tyksiński CDV Algorytmy grafowe Wykład 1 Podstawy teorii grafów Reprezentacje grafów Tomasz Tyksiński CDV Rozkład materiału 1. Podstawowe pojęcia teorii grafów, reprezentacje komputerowe grafów 2. Przeszukiwanie grafów

Bardziej szczegółowo

Podobieństwo semantyczne w ontologiach biomedycznych

Podobieństwo semantyczne w ontologiach biomedycznych Podobieństwo semantyczne w ontologiach biomedycznych Bogumił Konopka Politechnika Wrocławska Wydział Podstawowych Problemów Techniki Instytut Inżynierii Biomedycznej i Pomiarowej KN Bio Nanopor Plan prezentacji

Bardziej szczegółowo

Wyszukiwanie tekstów

Wyszukiwanie tekstów Wyszukiwanie tekstów Dziedzina zastosowań Elektroniczne encyklopedie Wyszukiwanie aktów prawnych i patentów Automatyzacja bibliotek Szukanie informacji w Internecie Elektroniczne teksy Ksiązki e-book Artykuły

Bardziej szczegółowo

Józef Myrczek, Justyna Partyka Bank Spółdzielczy w Katowicach, Akademia Techniczno-Humanistyczna w Bielsku-Białej

Józef Myrczek, Justyna Partyka Bank Spółdzielczy w Katowicach, Akademia Techniczno-Humanistyczna w Bielsku-Białej Józef Myrczek, Justyna Partyka Bank Spółdzielczy w Katowicach, Akademia Techniczno-Humanistyczna w Bielsku-Białej Analiza wraŝliwości Banków Spółdzielczych na dokapitalizowanie w kontekście wzrostu akcji

Bardziej szczegółowo

Full Text Search. Study Group Tomasz Libera

Full Text Search. Study Group Tomasz Libera Full Text Search Study Group 70-461 Tomasz Libera BIO SQL Server Developer Członek Zarządu Stowarzyszenia PLSSUG Założyciel i lider krakowskiego oddziału Organizator i prelegent konferencji SQLDay, SQL

Bardziej szczegółowo

Anna Fabijańska. Algorytmy segmentacji w systemach analizy ilościowej obrazów

Anna Fabijańska. Algorytmy segmentacji w systemach analizy ilościowej obrazów POLITECHNIKA ŁÓDZKA Wydział Elektrotechniki Elektroniki Informatyki i Automatyki Katedra Informatyki Stosowanej Anna Fabijańska Nr albumu: 109647 Streszczenie pracy magisterskiej nt.: Algorytmy segmentacji

Bardziej szczegółowo

Michał Kozielski Łukasz Warchał. Instytut Informatyki, Politechnika Śląska

Michał Kozielski Łukasz Warchał. Instytut Informatyki, Politechnika Śląska Michał Kozielski Łukasz Warchał Instytut Informatyki, Politechnika Śląska Algorytm DBSCAN Algorytm OPTICS Analiza gęstego sąsiedztwa w grafie Wstępne eksperymenty Podsumowanie Algorytm DBSCAN Analiza gęstości

Bardziej szczegółowo

Wykład I. Wprowadzenie do baz danych

Wykład I. Wprowadzenie do baz danych Wykład I Wprowadzenie do baz danych Trochę historii Pierwsze znane użycie terminu baza danych miało miejsce w listopadzie w 1963 roku. W latach sześcdziesątych XX wieku został opracowany przez Charles

Bardziej szczegółowo

Bydgoskie Centrum Archiwizacji Cyfrowej sp. z o.o.

Bydgoskie Centrum Archiwizacji Cyfrowej sp. z o.o. STRONA GŁÓWNA ` Usługa earchiwizacja.pl przeznaczona jest zarówno dla osób indywidualnych, jak i firm. Wykorzystuje zasadę przetwarzania danych w chmurze. Pozwala to na dostęp do własnej bazy dokumentów

Bardziej szczegółowo

Kodowanie informacji. Kody liczbowe

Kodowanie informacji. Kody liczbowe Wykład 2 2-1 Kodowanie informacji PoniewaŜ komputer jest urządzeniem zbudowanym z układów cyfrowych, informacja przetwarzana przez niego musi być reprezentowana przy pomocy dwóch stanów - wysokiego i niskiego,

Bardziej szczegółowo

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie. SCENARIUSZ LEKCJI OPRACOWANY W RAMACH PROJEKTU: INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA. PROGRAM NAUCZANIA INFORMATYKI Z ELEMENTAMI PRZEDMIOTÓW MATEMATYCZNO-PRZYRODNICZYCH Autorzy scenariusza:

Bardziej szczegółowo

Wstęp do przetwarzania języka naturalnego. Wykład 10 Zaawansowana wektoryzacja i klasyfikacja

Wstęp do przetwarzania języka naturalnego. Wykład 10 Zaawansowana wektoryzacja i klasyfikacja Wstęp do przetwarzania języka naturalnego Wykład 10 Zaawansowana wektoryzacja i klasyfikacja Wojciech Czarnecki 8 stycznia 2014 Section 1 Wektoryzacja tfidf document x y z Antony and Cleopatra 5.25 1.21

Bardziej szczegółowo

KURS ACCESS 2003 Wiadomości wstępne

KURS ACCESS 2003 Wiadomości wstępne KURS ACCESS 2003 Wiadomości wstępne Biorąc c udział w kursie uczestnik zapozna się z tematyką baz danych i systemu zarządzania bazami danych jakim jest program Microsoft Access 2003. W trakcie kursu naleŝy

Bardziej szczegółowo

KaŜdy z formularzy naleŝy podpiąć do usługi. Nazwa usługi moŝe pokrywać się z nazwą formularza, nie jest to jednak konieczne.

KaŜdy z formularzy naleŝy podpiąć do usługi. Nazwa usługi moŝe pokrywać się z nazwą formularza, nie jest to jednak konieczne. Dodawanie i poprawa wzorców formularza i wydruku moŝliwa jest przez osoby mające nadane odpowiednie uprawnienia w module Amin (Bazy/ Wzorce formularzy i Bazy/ Wzorce wydruków). Wzorce formularzy i wydruków

Bardziej szczegółowo

Systemy ekspertowe - wiedza niepewna

Systemy ekspertowe - wiedza niepewna Instytut Informatyki Uniwersytetu Śląskiego lab 8 Rozpatrzmy następujący przykład: Miażdżyca powoduje często zwężenie tętnic wieńcowych. Prowadzi to zazwyczaj do zmniejszenia przepływu krwi w tych naczyniach,

Bardziej szczegółowo

Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji

Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji Konkurs z przedmiotu eksploracja i analiza danych: problem regresji i klasyfikacji Michał Witczak Data Mining 20 maja 2012 r. 1. Wstęp Dostarczone zostały nam 4 pliki, z których dwa stanowiły zbiory uczące

Bardziej szczegółowo

elektroniczna Platforma Usług Administracji Publicznej

elektroniczna Platforma Usług Administracji Publicznej elektroniczna Platforma Usług Administracji Publicznej Instrukcja użytkownika Katalog Usług Publicznych wersja 1.0 wersja 1.0. 1. WPROWADZENIE...3 1.1. CEL DOKUMENTU...3 1.2. SŁOWNIK POJĘĆ...3 1.3. ELEMENTY

Bardziej szczegółowo

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej.

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej. Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej. Dział Zagadnienia Wymagania podstawowe Wymagania ponadpodstawowe Arkusz kalkulacyjny (Microsoft Excel i OpenOffice) Uruchomienie

Bardziej szczegółowo

INSTRUKCJA OBSŁUGI PORTAL B2B

INSTRUKCJA OBSŁUGI PORTAL B2B INSTRUKCJA OBSŁUGI PORTAL BB SPIS TREŚCI 1. LOGIN.. POWITANIE...3 3. KATALOG ARTYKUŁÓW...4 4. KOSZYK 6 5. LOGIN 1 Aby zamawiać on-line konieczna jest nazwa (USER) oraz hasło (Password) uŝytkownika, by

Bardziej szczegółowo

Elementy kognitywistyki II: Sztuczna inteligencja

Elementy kognitywistyki II: Sztuczna inteligencja Elementy kognitywistyki II: Sztuczna inteligencja Piotr Konderak Zakład Logiki i Filozofii Nauki p.203b, Collegium Humanicum konsultacje: wtorki, 16:00-17:00 kondorp@bacon.umcs.lublin.pl http://konderak.eu

Bardziej szczegółowo

Kierunek: ETI Przedmiot: Programowanie w środowisku RAD - Delphi Rok III Semestr 5. Ćwiczenie 5 Aplikacja wielo-okienkowa

Kierunek: ETI Przedmiot: Programowanie w środowisku RAD - Delphi Rok III Semestr 5. Ćwiczenie 5 Aplikacja wielo-okienkowa Kierunek: ETI Przedmiot: Programowanie w środowisku RAD - Delphi Rok III Semestr 5 Ćwiczenie 5 Aplikacja wielo-okienkowa 1. Opracuj aplikację realizującą obliczenia na podstawie danych wpisywanych w komponencie

Bardziej szczegółowo

Interpretacja krzywych sondowania elektrooporowego; zagadnienie niejednoznaczności interpretacji (program IX1D Interpex) Etapy wykonania:

Interpretacja krzywych sondowania elektrooporowego; zagadnienie niejednoznaczności interpretacji (program IX1D Interpex) Etapy wykonania: Interpretacja krzywych sondowania elektrooporowego; zagadnienie niejednoznaczności interpretacji (program IX1D Interpex) Etapy wykonania: 1. Opisać problem geologiczny, który naleŝy rozwiązać (rozpoznanie

Bardziej szczegółowo

program dla opracowujących wnioski o dotacje

program dla opracowujących wnioski o dotacje EKOEFEKT program dla opracowujących wnioski o dotacje 1. Podstawowe informacje EKOEFEKT to program komputerowy do wykonywania obliczeń efektu ekologicznego dla działań w zakresie: modernizacji źródła ciepła,

Bardziej szczegółowo

Formularz MS Word. 1. Projektowanie formularza. 2. Formularze do wypełniania w programie Word

Formularz MS Word. 1. Projektowanie formularza. 2. Formularze do wypełniania w programie Word Formularz MS Word Formularz to dokument o określonej strukturze, zawierający puste pola do wypełnienia, czyli pola formularza, w których wprowadza się informacje. Uzyskane informacje moŝna następnie zebrać

Bardziej szczegółowo

Współpraca Integry z programami zewnętrznymi

Współpraca Integry z programami zewnętrznymi Współpraca Integry z programami zewnętrznymi Uwaga! Do współpracy Integry z programami zewnętrznymi potrzebne są dodatkowe pliki. MoŜna je pobrać z sekcji Download -> Pozostałe po zalogowaniu do Strefy

Bardziej szczegółowo

Opis ćwiczeń zrealizowanych podczas szkolenia

Opis ćwiczeń zrealizowanych podczas szkolenia Opis ćwiczeń zrealizowanych podczas szkolenia Szkolenie dedykowane dla pracowników JST I. Weryfikacja zapisów dokumentów planistycznych Wykorzystana funkcjonalność oprogramowania QGIS: Wizualizacja zasobów

Bardziej szczegółowo

POMOC. 1. Wybór Katalogu

POMOC. 1. Wybór Katalogu Bibliografia Regionalna obejmuje książki i czasopisma lokalne zawierające wszelkie wiadomości na temat Woli. Gromadzone informacje dotyczą najczęściej takich zagadnień jak życie społeczne, inwestycje,

Bardziej szczegółowo

Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB

Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB Aplikacja testowej wersji tezaurusa w systemie komputerowym ALEPH w Bibliotece CIOP-PIB IX Krajowe Forum Informacji Naukowej i Technicznej Zakopane wrzesień 2007 Biblioteka CIOP-PIB Biblioteka CIOP-PIB

Bardziej szczegółowo

Bazy dokumentów tekstowych

Bazy dokumentów tekstowych Bazy dokumentów tekstowych Bazy dokumentów tekstowych Dziedzina zastosowań Automatyzacja bibliotek Elektroniczne encyklopedie Bazy aktów prawnych i patentów Szukanie informacji w Internecie Dokumenty tekstowe

Bardziej szczegółowo

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie

1.7. Eksploracja danych: pogłębianie, przeszukiwanie i wyławianie Wykaz tabel Wykaz rysunków Przedmowa 1. Wprowadzenie 1.1. Wprowadzenie do eksploracji danych 1.2. Natura zbiorów danych 1.3. Rodzaje struktur: modele i wzorce 1.4. Zadania eksploracji danych 1.5. Komponenty

Bardziej szczegółowo

Podstawowe pojęcia Sieci komputerowe Sieć komputerowa - system umoŝliwiający wymianę danych między 2 lub więcej komputerami. Składają się na nią komputery środki słuŝące realizacji połączenia. Komputery

Bardziej szczegółowo

Grafika komputerowa. Zajęcia IX

Grafika komputerowa. Zajęcia IX Grafika komputerowa Zajęcia IX Ćwiczenie 1 Usuwanie efektu czerwonych oczu Celem ćwiczenia jest usunięcie efektu czerwonych oczu u osób występujących na zdjęciu tak, aby plik wynikowy wyglądał jak wzor_1.jpg

Bardziej szczegółowo

Aby pobrać program FotoSender naleŝy na stronę www.fotokoda.pl lub www.kodakwgalerii.astral.pl i kliknąć na link Program do wysyłki zdjęć Internetem.

Aby pobrać program FotoSender naleŝy na stronę www.fotokoda.pl lub www.kodakwgalerii.astral.pl i kliknąć na link Program do wysyłki zdjęć Internetem. FotoSender 1. Pobranie i instalacja programu Aby pobrać program FotoSender naleŝy na stronę www.fotokoda.pl lub www.kodakwgalerii.astral.pl i kliknąć na link Program do wysyłki zdjęć Internetem. Rozpocznie

Bardziej szczegółowo