Narzędzia do automatycznej analizy odniesień w tekstach
|
|
- Paweł Pawłowski
- 7 lat temu
- Przeglądów:
Transkrypt
1 CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl jan.kocon@pwr.edu.pl
2 Czym są odniesienia Odniesienia to fragmenty tekstu reprezentujące pojęcia określonych kategorii. Rozważane kategorie odniesień: Jednostki identyfikacyjne, Wyrażenia temporalne. 2
3 Jednostki identyfikacyjne Jednostki identyfikacyjne to fragmenty tekstu odnoszące się do pewnych obiektów lub grup obiektów określonych kategorii. Do jednostek identyfikacyjnych zaliczamy: nazwy (nazwy własne i nazwy ogólne, generalne), przymiotniki pochodzące od nazw własnych, określone wyrażenia liczbowe. 3
4 Schemat jednostek identyfikacyjnych (1/2) Wśród jednostek identyfikacyjnych wyróżniamy dziewięć głównych grup: nam_adj przymiotniki pochodzące od nazw własnych, nam_eve wydarzenia organizowane lub ustalone przez ludzi oraz klęski żywiołowe, nam_fac konstrukcje (budowle, budynki, pomniki) stworzone przez ludzi. nam_liv istoty żywe (ludzie, postacie, zwierzęta), nam_loc toponimy (lokalizacje, jednostki geopolityczne i geograficzne), nam_num wyrażenia liczbowe, nam_org organizacje, instytucje, zespoły, zorganizowane grupy itd. nam_oth nazwy technologii, walut, adres , strony www, itd. nam_pro chrematonimy (wytwory ludzkie). 4
5 Schemat jednostek identyfikacyjnych (2/2) W obrębie każdej grupy wyszczególnione są kategorie szczegółowe ułożone w strukturę hierarchiczną. Pełna lista kategorii znajduje się w pliku Kategorie szczegółowe dla nam_loc: nam_loc_astronomical naturalne ciała niebieskie, nam_loc_country_region regiony geograficzne w obrębie kraju, nam_loc_gpe jednostki geopolityczne. nam_loc_gpe_admin podział administracyjny,, nam_loc_gpe_city miasta I 4 pozostałe podkategorie nam_loc_gpe_* nam_loc_hydronym naturalne obiekty wodne, nam_loc_hydronym_river rzeki, nam_loc_hydronym_lake jeziora, i 4 pozostałe podkategorie nam_loc_hydronym_* nam_loc_land ziemne obiekty geograficzne, nam_loc_land_cape przylądki. nam_loc_land_continent kontynenty. I 8 pozostałych podkategorii nam_loc_land_* 5
6 Wyrażenia temporalne Wyrażenia temporalne to fragmenty tekstu odnoszące się do czasu. Wyrażenia te mówią nam kiedy coś się stało, jak długo coś trwało albo jak często coś się wydarza. Wyróżniamy trzy rodzaje wyrażeń temporalnych jasne precyzyjne, jasne nieprecyzyjne i niejasne. Wyróżniamy cztery główne (na bazie wytycznych TimeML): kategorie wyrażeń temporalnych Kategoria Anotacja Opis Data t3_date Wyrażenie opisujące termin zgodnie z kalendarzem. Jest to jednostka czasu większa lub równa jednemu dniowi (rozumianemu jako doba). Odpowiada na kluczowe pytanie: kiedy. Pora t3_time Typ wyrażenia lokalizującego. Określenie to odnosi się do pory dnia (nocy). Nie musi ono być bardzo precyzyjne. Odpowiada na kluczowe pytanie: kiedy. Trwanie t3_duration Wyrażenie opisujące czas trwania jakiejś sytuacji, wyodrębniony przedział czasowy, w którym coś się dzieje. Odpowiada na kluczowe pytanie: jak długo. Seria t3_set Wyrażenie opisujące serię zdarzeń. Odpowiada na kluczowe pytanie: jak często. 6
7 Liner2 Cechy narzędzia do automatycznego rozpoznawania odniesień: wykorzystuje model statystyczny, dedykowane metody regułowo-słownikowe, klasyfikacja w oparciu o cechy z lokalnego kontekstu. Procedura konstrukcji modelu: 1) Opracowanie wytycznych. 2) Oznakowanie korpusu treningowo-testowego. 3) Definicja potencjalnych cech do opisu tokenów w tekście. 4) Eksperymentalna selekcja cech istotnych i optymalizacja parametrów modelu statystycznego. 5) Uczenie modelu statystycznego. 6) Uzupełnienie modelu statystycznego regułami i metodami słownikowymi. 7
8 Korpus KPWr 171 Modele statystyczne do rozpoznawania jednostek identyfikacyjnych i wyrażeń temporalnych zostały skonstruowane na korpusie KPWr Charakterystyka KPWr: Kolekcja dokumentów na licencji Creative Commons, Fragmenty długości do 200 słów, Teksty zróżnicowane tematycznie i gatunkowo Liczba dokumentów w Kpwr: Kategoria Uczący Pomocniczy Testowy Razem Wyrażenia temporalne Jednostki identyfikacyjne blogi dap dialog kap nauka popularno-naukowe i podręczniki proza dawna proza współczesna religijne stenogramy techniczne urzędowe ustawy wikinews wikipedia 8
9 Modele danych Dostępne modele danych: 1) Jednostki identyfikacyjne granice jednostek Named Entities (nam) główne kategorie Named Entities (top9) szczegółowe kategorie Named Entities (n82) 2) Wyrażenia temporalne granice wyrażeń Temporal Expressions (1class) cztery kategorie Temporal Expressions (4classes) 9
10 Jednostki identyfikacyjne» jakość rozpoznawania (1/3) Model top9 Precyzja Kategoria Precyzja Kompletność nam_adj 74% 61% nam_adj nam_eve 55% 28% nam_eve nam_fac 69% 37% nam_fac nam_liv 79% 78% nam_liv nam_loc 82% 87% nam_loc nam_num 100% 64% nam_num nam_org 65% 68% nam_org nam_oth 75% 48% nam_oth nam_pro 57% 50% nam_pro Łącznie 73% 69% Łącznie Granice 85% 80% Granice Kompletność
11 Jednostki identyfikacyjne» jakość rozpoznawania (2/3) Model n82 (wybrane kategorie) Precyzja Precyzja Kompletność nam_adj_country 73% 66% nam_adj_country nam_fac_road 74% 61% nam_fac_road nam_liv_person 71% 79% nam_liv_person nam_loc_gpe_admin1 79% 65% nam_loc_gpe_admin1 nam_loc_gpe_admin2 86% 72% nam_loc_gpe_admin2 nam_loc_gpe_city 69% 81% nam_loc_gpe_city nam_loc_gpe_country 91% 94% nam_loc_gpe_country nam_loc_hydronym_river 89% 50% nam_loc_hydronym_river nam_loc_land_continent 92% 78% nam_loc_land_continent nam_org_group_team 78% 68% nam_org_group_team nam_org_nation 81% 59% nam_org_nation nam_org_political_party 89% 74% nam_org_political_party nam_oth_currency 100% 74% nam_oth_currency Łącznie 67% 59% Łącznie Granice 86% 75% Granice Kategoria 0 10 Kompletność
12 Jednostki identyfikacyjne» jakość rozpoznawania (3/3) Model nam Kategoria Precyzja Precyzja Kompletność nam 85% 83% Granice (top9) 85% 80% Granice (top9) Granice (n82) 86% 75% Granice (n82) Kompletność nam
13 Wyrażenia temporalne» jakość rozpoznawania Modele 1class i 4classes Precyzja Kompletność t3_date 90% 86% t3_date t3_time 77% 54% t3_time t3_duration 72% 70% t3_duration t3_set 68% 34% t3_set Łącznie 86% 79% Łącznie timex 86% 83% timex Kategoria Precyzja Kompletność
14 Automatyczne rozpoznawanie odniesień (Dspace, Inforex) 14
15 Inforex Demo Liner2 15
16 Automatyczne rozpoznawanie odniesień Dokumenty użytkownika D-Space any2txt wcrft2 Liner2 WoSeD on 1) Jednostki identyfikacyjne (nam) 2) Jednostki identyfikacyjne (top9) 3) Jednostki identyfikacyjne (n82) 4) Wyrażenia temporalne (timex1) 5) Wyrażenia temporalne (timex4) Przeglądanie anotacji w dokumencie (Preview) Weryfikacja anotacji (Bootstrapping) Przeglądanie anotacji po kategoriach (Annotation browser ) Eskport listy anotacji do plikucsv (Annotation browser ) 16
17 Weryfikacja i przeglądanie odniesień (Inforex) 17
18 Inforex Preview 18
19 Inforex Bootstrapping 19
20 Inforex Annotations 20
21 Inforex Annotation browser 21
22 Eksport do pliku CSV 22
23 CLARIN-PL Pytania i odpowiedzi
24 CLARIN-PL Dziękuję bardzo za uwagę
Narzędzia do automatycznej analizy odniesień w tekstach
CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Narzędzia do automatycznej analizy odniesień w tekstach
CLARIN-PL Narzędzia do automatycznej analizy odniesień w tekstach Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Wykorzystanie narzędzi do automatycznego przetwarzania języka w badaniach onomastycznych
Wykorzystanie narzędzi do automatycznego przetwarzania języka w badaniach onomastycznych Marcin Oleksy marcin.oleksy@pwr.edu.pl Jan Wieczorek jan.wieczorek@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji
KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów)
KPWr (otwarty korpus języka polskiego o wielowarstwowej anotacji) Inforex (system do budowania, anotowania i przeszukiwania korpusów) Marcin Oleksy Michał Marcińczuk Politechnika ska Instytut Informatyki
Inforex - zarządzanie korpusami i ich anotacja
Inforex - zarządzanie korpusami i ich anotacja Marcin Oleksy marcin.oleksy@pwr.edu.pl Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii
Inforex - zarządzanie korpusami i ich anotacja. Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Technologii Językowych G4.
Inforex - zarządzanie korpusami i ich anotacja Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl jan.kocon@pwr.edu.pl
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy Jan Wieczorek Jan Kocoń marcin.oleksy@pwr.edu.pl jan.wieczorek@pwr.edu.pl
Publikacja w repozytorium i przetwarzanie w systemie DSpace
Publikacja w repozytorium i przetwarzanie w systemie DSpace Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex
Zarządzanie i anotowanie korpusów tekstowych w systemie Inforex Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji Obliczeniowej
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud
Publikacja w repozytorium i przetwarzanie w systemach DSpace i NextCloud Michał Marcińczuk michal.marcinczuk@pwr.edu.pl Marcin Oleksy marcin.oleksy@pwr.edu.pl Politechnika Wrocławska Katedra Inteligencji
Mapa Literacka analiza odniesień geograficznych w tekstach literackich
CLARIN-PL Mapa Literacka analiza odniesień geograficznych w tekstach literackich Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Zaawansowane narzędzie do analizy korpusu w oparciu o reguły
CLARIN-PL Zaawansowane narzędzie do analizy korpusu w oparciu o reguły Michał Marcińczuk Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl 2015-04-13
Instrukcja. opracował Marcin Oleksy
Instrukcja opracował Marcin Oleksy Wstęp Zarządzanie korpusem Flagi Flagowanie korpusu Usuwanie i edytowanie flag Użytkownicy Przypisywanie użytkowników Role użytkowników Cofnięcie dostępu Podkorpusy Tworzenie
Program warsztatów CLARIN-PL
W ramach Letniej Szkoły Humanistyki Cyfrowej odbędzie się III cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Narzędzia cyfrowe do analizy języka w naukach humanistycznych i społecznych 17-19
Wytyczne KPWr. Wyrażenia temporalne. Marcin Oleksy (od 2013 do teraz) Michał Marcińczuk (od 2013 do teraz), Tomasz Bernaś (od 2013 do teraz)
Wytyczne KPWr Wyrażenia temporalne Osoba odpowiedzialna Udział Jan Kocoń Marcin Oleksy (od 2013 do teraz) Michał Marcińczuk (od 2013 do teraz), Tomasz Bernaś (od 2013 do teraz) 1.1. - wyrażenia
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur
Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur Maciej Piasecki, Paweł Kędzia Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 Plan prezentacji
Instrukcja użytkownika
Instrukcja użytkownika Podstawowe informacje Miejsce dostępu Do czego służy Inforex? Podstawowe funkcje Dla kogo przeznaczone jest narzędzie Przykłady zastosowań Instrukcja obsługi Rejestracja w repozytorium
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2
Ekstrakcja informacji oraz stylometria na usługach psychologii Część 2 ws.clarin-pl.eu/websty.shtml Tomasz Walkowiak, Maciej Piasecki Politechnika Wrocławska Grupa Naukowa G4.19 Katedra Inteligencji Obliczeniowej
Open Access w technologii językowej dla języka polskiego
Open Access w technologii językowej dla języka polskiego Marek Maziarz, Maciej Piasecki Grupa Naukowa Technologii Językowych G4.19 Zakład Sztucznej Inteligencji, Instytut Informatyki, W-8, Politechnika
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych
Narzędzia do automatycznego wydobywania słowników kolokacji i do oceny leksykalności połączeń wyrazowych Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra
Narzędzia do ekstrakcji informacji z tekstu
CLARIN-PL Narzędzia do ekstrakcji informacji z tekstu Politechnika Wrocławska, 2016-04-26 Michał Marcińczuk Jan Kocoń Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 michal.marcinczuk@pwr.edu.pl
Narzędzia do automatycznego wydobywania kolokacji
Narzędzia do automatycznego wydobywania kolokacji Jan Kocoń, Agnieszka Dziob, Marek Maziarz, Maciej Piasecki, Michał Wendelberger Politechnika Wrocławska Katedra Inteligencji Obliczeniowej marek.maziarz@pwr.edu.pl
WebSty otwarty webowy system do analiz stylometrycznych
WebSty otwarty webowy system do analiz stylometrycznych Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl
Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego
Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego Dorota Adamiec Instytut Języka Polskiego PAN Elektroniczny
SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY. Autorzy: M. Lewicka, K. Stańczyk
SYSTEM BIOMETRYCZNY IDENTYFIKUJĄCY OSOBY NA PODSTAWIE CECH OSOBNICZYCH TWARZY Autorzy: M. Lewicka, K. Stańczyk Kraków 2008 Cel pracy projekt i implementacja systemu rozpoznawania twarzy, który na podstawie
Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego
Centrum Technologii Językowych CLARIN- PL: deponowanie i upowszechnianie zasobów oraz narzędzi językowych dla języka polskiego Maciej Piasecki, Tomasz Walkowiak Politechnika ska Katedra Inteligencji Obliczeniowej
DSpace. Co to jest DSpace? Dostęp do danych. 1.Podstawowe informacje: Co to jest DSpace? Dostęp do danych
DSpace 1.Podstawowe informacje: Co to jest DSpace? Dostęp do danych 2. Sposoby wykorzystania: Po co umieszczać dane w repozytorium? Pobieranie i eksportowanie danych Jakie są możliwości dostępu do archiwum
Centrum Technologii Językowych: repozytorium zasobów językowych i podstawowe usługi
CLARIN-PL Centrum Technologii Językowych: repozytorium zasobów językowych i podstawowe usługi Marcin Pol, Tomasz Walkowiak Politechnika Wrocławska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19
KorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk
KorBa Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk ALLPPT.com _ Free PowerPoint Templates, Diagrams and Charts PODSTAWOWE
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska
Metody tworzenia efektywnych komitetów klasyfikatorów jednoklasowych Bartosz Krawczyk Katedra Systemów i Sieci Komputerowych Politechnika Wrocławska e-mail: bartosz.krawczyk@pwr.wroc.pl Czym jest klasyfikacja
CLARIN rozproszony system technologii językowych dla różnych języków europejskich
CLARIN rozproszony system technologii językowych dla różnych języków europejskich Maciej Piasecki Politechnika Wrocławska Instytut Informatyki G4.19 Research Group maciej.piasecki@pwr.wroc.pl Projekt CLARIN
Wrota Parsęty II o bazie danych przestrzennych - wprowadzenie
Wrota Parsęty II o bazie danych przestrzennych - wprowadzenie Czym jest baza danych? zbiór powiązanych danych z pewnej dziedziny, zorganizowanych w sposób dogodny do korzystania z nich, a zwłaszcza do
P.2.1 WSTĘPNA METODA OPISU I
1 S t r o n a P.2.1 WSTĘPNA METODA OPISU I ZNAKOWANIA DOKUMENTACJI MEDYCZNEJ W POSTACI ELEKTRONICZNEJ P.2. REKOMENDACJA OPISU I OZNAKOWANIA DOKUMENTACJI MEDYCZNEJ W POSTACI ELEKTRONICZNEJ 2 S t r o n a
Repozytorium Centrum Technologii Językowych: deponowanie i upowszechnianie zasobów i narzędzi językowych, gromadzenie korpusów tekstowych
CLARIN-PL Repozytorium Centrum Technologii Językowych: deponowanie i upowszechnianie zasobów i narzędzi językowych, gromadzenie korpusów tekstowych Marcin Pol, Tomasz Walkowiak, Marcin Oleksy Politechnika
CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy
Cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w pracy humanistów i tłumaczy 13 15 kwietnia 2015 roku Warszawa, Pałac Staszica, ul. Nowy Świat 72, sala 144
Prof. Stanisław Jankowski
Prof. Stanisław Jankowski Zakład Sztucznej Inteligencji Zespół Statystycznych Systemów Uczących się p. 228 sjank@ise.pw.edu.pl Zakres badań: Sztuczne sieci neuronowe Maszyny wektorów nośnych SVM Maszyny
Wymagania edukacyjne niezbędne do uzyskania śródrocznych ocen klasyfikacyjnych z języka niemieckiego w klasie VII-ej w roku szkolnym 2017/2018
Wymagania edukacyjne niezbędne do uzyskania śródrocznych ocen klasyfikacyjnych z języka niemieckiego w klasie VII-ej w roku szkolnym 2017/2018 OCENA NIEDOSTATECZNA wystawiana jest wtedy, kiedy uczeń mimo
CLARIN infrastruktura naukowa technologii językowych
CLARIN infrastruktura naukowa technologii językowych Maciej Piasecki Politechnika ska Katedra Inteligencji Obliczeniowej Grupa Naukowa G4.19 maciej.piasecki@pwr.edu.pl Przykład: analiza pojęcia Problem:
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika Wrocławska Katedra Inteligencji
Rynek finansowy wobec starzejącego się społeczeństwa
Rynek finansowy wobec starzejącego się społeczeństwa Dr Michał Buszko, Dr Dorota Krupa, Dr Damian Walczak Uniwersytet Mikołaja Kopernika w Toruniu Wydział Nauk Ekonomicznych i Zarządzania Katedra Zarządzania
Wymagania edukacyjne niezbędne do uzyskania śródrocznych i rocznych ocen klasyfikacyjnych z języka niemieckiego w klasie I.
Wymagania edukacyjne niezbędne do uzyskania śródrocznych i rocznych ocen klasyfikacyjnych z języka niemieckiego w klasie I Pierwszy OCENA NIEDOSTATECZNA wystawiana jest wtedy, kiedy uczeń mimo pomocy ze
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe.
Lingwistyczny system definicyjny wykorzystujący korpusy tekstów oraz zasoby internetowe. Autor: Mariusz Sasko Promotor: dr Adrian Horzyk Plan prezentacji 1. Wstęp 2. Cele pracy 3. Rozwiązanie 3.1. Robot
PLAN ZARZĄDZANIA KONFIGURACJĄ OPROGRAMOWANIA PROJEKT <NAZWA PROJEKTU> WERSJA <NUMER WERSJI DOKUMENTU>
Załącznik nr 4.6 do Umowy nr 35-ILGW-253-.../20.. z dnia... MINISTERSTWO FINANSÓW DEPARTAMENT INFORMATYKI PLAN ZARZĄDZANIA KONFIGURACJĄ OPROGRAMOWANIA PROJEKT WERSJA
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego
Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego Witold Kieraś Łukasz Kobyliński Maciej Ogrodniczuk Instytut Podstaw Informatyki PAN III Konferencja DARIAH-PL Poznań 9.11.2016
Kolekcja prac KOMPUTEROWE PRZETWARZANIE WIEDZY
Kolekcja prac KOMPUTEROWE PRZETWARZANIE WIEDZY Politechnika Wrocławska, 2011 Spis treści R O Z D Z I A Ł 1 ODNAJDOWANIE TEKSTU NA MAPACH (NAZWY GEOGRAFICZNE NA SKANACH MAP) Z. Pietrowska, M. Puchalska,
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl
Text mining w programie RapidMiner Michał Bereta www.michalbereta.pl 1. Wstęp Aby skorzystać z możliwości RapidMinera w zakresie analizy tekstu, należy zainstalować Text Mining Extension. Wybierz: 1 Po
Ontologie, czyli o inteligentnych danych
1 Ontologie, czyli o inteligentnych danych Bożena Deka Andrzej Tolarczyk PLAN 2 1. Korzenie filozoficzne 2. Ontologia w informatyce Ontologie a bazy danych Sieć Semantyczna Inteligentne dane 3. Zastosowania
MODELOWANIE OBCIĄŻEŃ ZIAREN AKTYWNYCH I SIŁ W PROCESIE SZLIFOWANIA
Modelowanie obciążeń ziaren ściernych prof. dr hab. inż. Wojciech Kacalak, mgr inż. Filip Szafraniec Politechnika Koszalińska MODELOWANIE OBCIĄŻEŃ ZIAREN AKTYWNYCH I SIŁ W PROCESIE SZLIFOWANIA XXXVI NAUKOWA
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów
Analiza listów pożegnalnych w oparciu o metody lingwistyki informatycznej i klasyfikacji semantycznej tekstów Maciej Piasecki, Jan Kocoń Politechnika Wrocławska Katedra InteligencjiObliczeniowej Grupa
Zagadnienia: wprowadzenie podstawowe pojęcia. Doświadczalnictwo. Anna Rajfura
Zagadnienia: wprowadzenie podstawowe pojęcia Doświadczalnictwo 1 Termin doświadczalnictwo Doświadczalnictwo planowanie doświadczeń oraz analiza danych doświadczalnych z użyciem metod statystycznych. Doświadczalnictwo
WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów
IJP PAN / UP Kraków maciejeder@gmail.com WebSty - otwarty sieciowy system do analizy stylometrycznej i semantycznej tekstów ws.clarin-pl.eu/websty.shtml Maciej Piasecki, Tomasz Walkowiak, Maciej Eder Politechnika
P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H
W O J S K O W A A K A D E M I A T E C H N I C Z N A W Y D Z I A Ł E L E K T R O N I K I Drukować dwustronnie P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H Grupa... Data wykonania
Multi-wyszukiwarki. Mediacyjne Systemy Zapytań wprowadzenie. Architektury i technologie integracji danych Systemy Mediacyjne
Architektury i technologie integracji danych Systemy Mediacyjne Multi-wyszukiwarki Wprowadzenie do Mediacyjnych Systemów Zapytań (MQS) Architektura MQS Cechy funkcjonalne MQS Cechy implementacyjne MQS
OTWARTY SYSTEM ARCHIWIZACJI narzędzie dla archiwów społecznych
OTWARTY SYSTEM ARCHIWIZACJI narzędzie dla archiwów społecznych OTWARTY SYSTEM ARCHIWIZACJI OSA TO DARMOWY PROGRAM DO OPRACOWANIA ZBIORÓW ARCHIWALNYCH dla organizacji pozarządowych, bibliotek, muzeów, instytucji,
Kodowanie produktów - cz. 1
Kodowanie produktów - cz. 1 25.07.2005 r. Wstęp Do identyfikacji wyrobów od dawna używa się różnego rodzaju kodów i klasyfikacji. Obecnie stosuje się m.in. natowską kodyfikację wyrobów, kodowanie wyrobów
Składowanie i dostęp do danych w rozproszonym systemie ochrony własności intelektualnej ANDRZEJ SOBECKI, POLITECHNIKA GDAŃSKA INFOBAZY 2014
Składowanie i dostęp do danych w rozproszonym systemie ochrony własności intelektualnej ANDRZEJ SOBECKI, POLITECHNIKA GDAŃSKA INFOBAZY 2014 Podstawowy proces gromadzenia Trudności: Weryfikacja dokumentu
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH
RÓWNOWAŻNOŚĆ METOD BADAWCZYCH Piotr Konieczka Katedra Chemii Analitycznej Wydział Chemiczny Politechnika Gdańska Równoważność metod??? 2 Zgodność wyników analitycznych otrzymanych z wykorzystaniem porównywanych
Uwagi Ewaluatora. Prof. Teresa Zielińska Politechnika Warszawska Wydział Mechaniczny Energetyki i Lotnictwa
Uwagi Ewaluatora Prof. Teresa Zielińska Politechnika Warszawska Wydział Mechaniczny Energetyki i Lotnictwa 1 Wskazówki ogólne Wniosek powinien odnosić się do: Do celów ogólnych danego obszaru tematycznego
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp
WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp Natalia Kotsyba, IBI AL UW 24 marca 2010 Plan zajęć Praca domowa na zapytania do Korpusu IPI PAN za pomocą
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa
Słowosiec 3.0 - leksykalna siec semantyczna je zyka polskiego i jej zastosowanie w analizie znaczen. Cześc c wiczeniowa Paweł Ke dzia, Marek Maziarz, Maciej Piasecki Politechnika ska Katedra Inteligencji
Pytania i wyjaśnienia treści Specyfikacji Istotnych Warunków Zamówienia
Warszawa, 11 kwietnia 2013 r. Dotyczy: postępowania prowadzonego w trybie przetargu nieograniczonego na Usługi wsparcia technicznego, utrzymania oraz rozwoju systemu Soprano, Phoenix oraz Register Plus
Realizacja koncepcji nowej generacji map topograficznych w Polsce
Realizacja koncepcji nowej generacji map topograficznych w Polsce Anna RADOMYSKA, Katarzyna SAWICKA, Jerzy ZIELIŃSKI Główny Urząd Geodezji i Kartografii Artur WIOSNA OPEGIEKA Sp. z o.o. Wrocław, 13 maja
SZTUCZNA INTELIGENCJA
SZTUCZNA INTELIGENCJA SYSTEMY ROZMYTE Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i Inżynierii Biomedycznej Laboratorium
Wielowymiarowa analiza regionalnego zróżnicowania rolnictwa w Polsce
Wielowymiarowa analiza regionalnego zróżnicowania rolnictwa w Polsce Mgr inż. Agata Binderman Dzienne Studia Doktoranckie przy Wydziale Ekonomiczno-Rolniczym Katedra Ekonometrii i Informatyki SGGW Opiekun
Prezentacja Wniosek o dofinansowanie projektu.
Prezentacja Wniosek o dofinansowanie projektu. Urząd Marszałkowski Województwa Lubuskiego Departament Europejskiego Funduszu Społecznego Wydział Nowoczesnej Edukacji EFS Zielona Góra, 12 lipca 2017 r.
Rowerowa sieć partycypacji społecznej w polityce transportowej. Polityka rowerowa w polskich miastach Wnioski i rekomendacje
Rowerowa sieć partycypacji społecznej w polityce transportowej Polityka rowerowa w polskich miastach Wnioski i rekomendacje Cezary Grochowski Wrocławska Inicjatywa Rowerowa Miasta dla Rowerów Obszar badania
OFERTA SZKOLEŃ DLA BIBLIOTEKARZY
OFERTA SZKOLEŃ DLA BIBLIOTEKARZY 2019 KOMIKS JAKO NARZĘDZIE DYDAKTYCZNE Wprowadzenie nauczycieli w świat komiksu i zachęcenie ich do wykorzystywania go jako narzędzia dydaktycznego na lekcjach. wie czym
Zastosowanie teorii detekcji sygnałów do analizy rzetelności systemu obserwacyjnego ARGOS Michał Modzelewski Jolanta Pisarek
Zastosowanie teorii detekcji sygnałów do analizy rzetelności systemu obserwacyjnego ARGOS Michał Modzelewski Jolanta Pisarek Instytut Badań Edukacyjnych Aplikacja komputerowa ARGOS przygotowana w oparciu
Wspomaganie zarządzania zbiornikami zaporowymi
Konferencja Wspomaganie zarządzania zbiornikami zaporowymi Uniwersytet Śląski w Katowicach 12 lutego 2014 Projekt współfinansowany ze środków Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu
Emapa GeoMarketing. Opis produktu
Emapa GeoMarketing Opis produktu Spis treści: 1. Opis produktu... 3 1.1 Korzyści związane z posiadaniem aplikacji... 3 2. Zastosowania... 3 3. Moduły funkcjonalne... 4 4. Zasoby mapowe... 5 5. Przykładowe
Dziennik Urzędowy Unii Europejskiej L 274/9
20.10.2009 Dziennik Urzędowy Unii Europejskiej L 274/9 ROZPORZĄDZENIE KOMISJI (WE) NR 976/2009 z dnia 19 października 2009 r. w sprawie wykonania dyrektywy 2007/2/WE Parlamentu Europejskiego i Rady w zakresie
Ćwiczenia technik efektywnego uczenia się Spotkanie 4
Ćwiczenia technik efektywnego uczenia się Spotkanie 4 Sprawdź sam siebie Na kolejne zajęcia niezbędne będą Trzy zakreślacze tekstu w różnych kolorach, np. żółty, niebieski, zielony Pudełko pamięci/ MemoBox.
Przegląd platform systemowych typu OpenSource dla wspomagania kształcenia na odległość
Politechnika Wrocławska Przegląd platform systemowych typu OpenSource dla wspomagania kształcenia na odległość Lesław Sieniawski 2004 Wprowadzenie Definicja kształcenia na odległość [wg: Mirosław J. Kubiak,
O badaniach nad SZTUCZNĄ INTELIGENCJĄ
O badaniach nad SZTUCZNĄ INTELIGENCJĄ SZTUCZNA INTELIGENCJA dwa podstawowe znaczenia Co nazywamy sztuczną inteligencją? zaawansowane systemy informatyczne (np. uczące się), pewną dyscyplinę badawczą (dział
Gdzieś w bibliotece jeleniogórskiej, 14 grudnia Wirtualna biblioteka e-pogranicze
Gdzieś w bibliotece jeleniogórskiej, 14 grudnia 19... Wirtualna biblioteka e-pogranicze Jelenia Góra, 14.12.2012, Joanna Broniarczyk Związane tradycyjnie z bibliotekami media i procesy powstają już tylko
II cykl wykładów i warsztatów. CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych
II cykl wykładów i warsztatów CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych 18-20 maja 2015 roku Politechnika Wrocławska, Centrum Kongresowe,
Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu
Rola polskich bibliotek cyfrowych w zapewnianiu otwartego dostępu Marcin Werla (mwerla@man.poznan.pl) Poznańskie Centrum Superkomputerowo-Sieciowe, Dział Bibliotek Cyfrowych i Platform Wiedzy Prezentacja
Wstęp do Informatyki. Klasyfikacja oprogramowania
Wstęp do Informatyki Klasyfikacja oprogramowania Oprogramowanie komputerowe Funkcjonalność komputera jest wynikiem zarówno jego budowy, jak i zainstalowanego oprogramowania Komputer danej klasy znajduje
BADANIE I OCENA ZGODNOŚCI Z INSPIRE
BADANIE I OCENA ZGODNOŚCI Z INSPIRE Agnieszka Chojka Uniwersytet Warmińsko-Mazurski w Olsztynie XXIII Konferencja PTIP, 6-8 listopada 2013 r., Warszawa INSPIRE w Polsce ustawa o infrastrukturze informacji
Malware: złośliwe oprogramowanie. Marek Zachara. http://marek.zachara.name 1/18
: złośliwe oprogramowanie Marek Zachara http://marek.zachara.name 1/18 Czym jest : Malicious Software 'Wirusy' komputerowe Analogia biologiczna Tradycyjnie rozpowszechniane przez doklejanie do plików oraz
Ziemia we Wszechświecie lekcja powtórzeniowa
Scenariusz lekcji Scenariusz lekcji powtórzeniowej do podręczników PULS ZIEMI 1 i PLANETA NOWA 1 45 min Ziemia we Wszechświecie lekcja powtórzeniowa t Hasło programowe: Ziemia we Wszechświecie/Ruchy Ziemi.
Analiza statystyczna trudności tekstu
Analiza statystyczna trudności tekstu Łukasz Dębowski ldebowsk@ipipan.waw.pl Problem badawczy Chcielibyśmy mieć wzór matematyczny,...... który dla dowolnego tekstu...... na podstawie pewnych statystyk......
Realizacja zobowiązań wynikających z ustawy o infrastrukturze informacji przestrzennej w statystyce publicznej
Realizacja zobowiązań wynikających z ustawy o infrastrukturze informacji przestrzennej w statystyce publicznej Agnieszka Nowakowska Janusz Dygaszewicz Departament Programowania i Koordynacji Badań Główny
Automatyczna ocena uszkodzeń nawierzchni z wykorzystaniem technologii LCMS
Automatyczna ocena uszkodzeń nawierzchni z wykorzystaniem technologii LCMS III WARMIŃSKO-MAZURSKIE FORUM DROGOWE 25-27 września 2016 Michał Maciołek Kierownik Działu Technologii Lehmann+Partner Polska
Europejska Baza Produktów (European Shared Treasure)
Europejska Baza Produktów (European Shared Treasure) Szkolenie dla Beneficjentów Programu Leonardo da Vinci (Projekty partnerskie) KONKURS 2011 Warszawa, 13 czerwca 2013 roku Artykuł 8 Umowy Finansowej
Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2)
Zastosowanie sztucznych sieci neuronowych w prognozowaniu szeregów czasowych (prezentacja 2) Ewa Wołoszko Praca pisana pod kierunkiem Pani dr hab. Małgorzaty Doman Plan tego wystąpienia Teoria Narzędzia
Modelowanie interakcji helis transmembranowych
Modelowanie interakcji helis transmembranowych Witold Dyrka, Jean-Christophe Nebel, Małgorzata Kotulska Instytut Inżynierii Biomedycznej i Pomiarowej, Politechnika Wrocławska Faculty of Computing, Information
Geoportal monitoringu środowiska województwa lubelskiego, jako forma informowania społeczeństwa o stanie środowiska w województwie
Geoportal monitoringu środowiska województwa lubelskiego, jako forma informowania społeczeństwa o stanie środowiska w województwie WIOŚ LUBLIN Joanna Śluz Łukasz Prażmo Państwowy Monitoring Środowiska
Rodzaje badań statystycznych
Rodzaje badań statystycznych Zbieranie danych, które zostaną poddane analizie statystycznej nazywamy obserwacją statystyczną. Dane uzyskuje się na podstawie badania jednostek statystycznych. Badania statystyczne
System SINUS otwarte narzędzie do budowy bibliograficznych baz danych
System SINUS otwarte narzędzie do budowy bibliograficznych baz danych Marzena Błaszczyńska, Michał Kozak, Cezary Mazurek, Marcin Szymczak, Marcin Werla Wyzwania dla Instytucji Naukowej Parametryzacja i
Szkolenie: Dobry Przypadek Testowy
Szkolenie: Dobry Przypadek Testowy Przypadek testowy jest najważniejszą, formalną częścią testowania oprogramowania. Szkolenie uczy, jakie są typy notacji testów, jakie testy dobierać do jakich projektów
PORTAL GEOSTATYSTYCZNY - GIS jako źródło informacji o terytorium i społeczeństwie
PORTAL GEOSTATYSTYCZNY - GIS jako źródło informacji o terytorium i społeczeństwie Janusz Dygaszewicz Dyrektor Departamentu Programowania i Koordynacji Badań GUS Statystyka publiczna od zawsze lokalizowała
Zalecenia dotyczące kształtowania polityki wynagrodzeń w urzędach z uwzględnieniem wyników wartościowania stanowisk pracy w służbie cywilnej
Zalecenia dotyczące kształtowania polityki wynagrodzeń w urzędach z uwzględnieniem wyników wartościowania stanowisk pracy w służbie cywilnej Wymóg opisywania i wartościowania stanowisk pracy został przewidziany
Wzrost przychodów i optymalne koszty sprzedaży. Zarządzanie terytorium sprzedaży z iq GIS
Wzrost przychodów i optymalne koszty sprzedaży Zarządzanie terytorium sprzedaży z iq GIS AGENDA Korzyści dla Twojej organizacji Kilka słów o nas AGENDA Korzyści dla Twojej organizacji Kilka słów o nas
BANK DANYCH LOKALNYCH
BANK DANYCH LOKALNYCH Podstawowe informacje dotyczące Banku Danych Lokalnych Jest największym w Polsce uporządkowanym zbiorem informacji o sytuacji społecznogospodarczej, demograficznej, oraz stanie środowiska,