Technologie Informacyjne

Podobne dokumenty
Systemy Wspomagania Decyzji

Systemy Wspomagania Decyzji

Systemy Wspomagania Decyzji

ANALIZA WYBYCHU GAZU I POŻARU. w mieszkaniu przy ul. Santockiej 27 w Szczecinie

Wydział Elektrotechniki, Informatyki i Telekomunikacji. Instytut Informatyki i Elektroniki. Instrukcja do zajęć laboratoryjnych

Eksploracja danych - wykład II

Wyszukiwanie dokumentów/informacji

Warszawa Praga-Południe Saska Kępa, ul. Paryska

Analiza zawartości dokumentów za pomocą probabilistycznych modeli graficznych

Text mining w programie RapidMiner Michał Bereta

SCENARIUSZE EWAKUACJI LUDZI Z BUDYNKÓW W WARUNKACH ZADYMIENIA DRÓG EWAKUACYJNYCH

MIESZKANIE NA SPRZEDAŻ liczba pokoi: 3, pow. całkowita: 72 m 2, Chorzów, Śródmieście

Systemy Wspomagania Decyzji

Kraków Bieńczyce, ul. Kornela Makuszyńskiego

MIESZKANIE NA SPRZEDAŻ liczba pokoi: 1, pow. całkowita: 28 m2, Siemianowice Śląskie, CENTRUM. 000 zł

Metody wykrywania odchyleo w danych. Metody wykrywania braków w danych. Korelacja. PED lab 4

Na miejsce zdarzenia niezwłocznie zadysponowano siły i środki służb ratowniczych.

Wstęp do przetwarzania języka naturalnego

Gdynia Obłuże, ul. Eugeniusza Kwiatkowskiego

Wilanów Wilanów zł zł/m². Opis. Łukasz Hodura REAL ESTATE ADVISOR. Na sprzedaż. Wilanów, Warszawa

MIESZKANIE NA SPRZEDAŻ liczba pokoi: 2, pow. całkowita: 49 m2, Siemianowice Śląskie, Michałkowice

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

Gdynia Obłuże, ul. Turkusowa

Ćwiczenie 5 PROGNOZOWANIE

MIESZKANIE NA WYNAJEM liczba pokoi: 2, pow. całkowita: 49 m 2, Piekary Śląskie, Powstańców. Cena zł

Gdynia Grabówek, ul. Morska

Warszawa Białołęka, ul. Ostródzka

Wyszukiwanie dokumentów WWW bazujące na słowach kluczowych

Oferta sprzedaży mieszkania : tel

Informacja. Informacja (łac. informatio przedstawienie, wizerunek; informare kształtować, przedstawiać) zespół wiadomości przyswajanych przez odbiorcę

Gdynia Obłuże, ul. Białowieska

Zastosowanie metod statystycznych do ekstrakcji słów kluczowych w kontekście projektu LT4eL. Łukasz Degórski

Wejherowo, ul. Jana Kochanowskiego

Informatyka Ćwiczenie 10. Bazy danych. Strukturę bazy danych można określić w formie jak na rysunku 1. atrybuty

Ożarów Mazowiecki, ul. Robotnicza

,00 PLN 609,00 m ,45 PLN/m2 Liczba pokoi: 7

Technologie Informacyjne

Bazy danych. wprowadzenie teoretyczne. Piotr Prekurat 1

Łódź Chojny, ul. Budowlana

Nowy Dwór Gdański, ul. Morska

Oferta Reklamowa K O N T A K T. info@remontomat.pl tel: (+48)

Wyszukiwanie informacji w internecie. Nguyen Hung Son

Adres: ulica...numer domu...numer mieszkania...dzielnica... Imię i nazwisko sprzedającego... telefon...

STATYSTYKA OD PODSTAW Z SYSTEMEM SAS. wersja 9.2 i 9.3. Szkoła Główna Handlowa w Warszawie

Egzamin zawodowy: Technik Informatyk 312[01] Oprogramowanie biurowe pytania i odpowiedzi

Gdynia Dąbrowa, ul. Nagietkowa


SYSTEMY UCZĄCE SIĘ WYKŁAD 10. PRZEKSZTAŁCANIE ATRYBUTÓW. Dr hab. inż. Grzegorz Dudek Wydział Elektryczny Politechnika Częstochowska.

Gdynia Dąbrowa, ul. Nagietkowa

Kryteria oceniania uczniów z informatyki w klasie II gimnazjum

Gdynia Chylonia, ul. Kartuska

Synteza i eksploracja danych sekwencyjnych

Gdańsk Przymorze, ul. Pucka

Estymacja punktowa i przedziałowa

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

MIESZKANIE NA SPRZEDAŻ liczba pokoi: 4, pow. całkowita: 73 m2, Siemianowice Śląskie, Michałkowice

OBIEKT NA SPRZEDAŻ pow. całkowita: 842,00 m 2, pow. działki: 1 257,00 m 2, Złocieniec, Centrum. Cena zł

Zadania. Przygotowanie zbiorów danych. 1. Sposób 1: 2. Sposób 2:

BAŁUTY. Ilość pom. Urządzenia techniczne. Położenie lokalu. parter, front 167, inst. elektryczna (brak licznika) wod.-kan., w.c.c.o.

INSTRUKCJA POSTĘPOWANIA W PRZYPADKU POWSTANIA POŻARU LUB INNEGO MIEJSCOWEGO ZAGROŻENIA W MIEJSCU I W CZASIE IMPREZY MASOWEJ

OpenOffice.org Writer

Podziękowania Marszałka Województwa Zachodniopomorskiego przerwane wyjazdem...

Nr oferty: MG137233, Mieszkanie - sprzedaż. Kontakt do agenta: projekty pierwotny, tel.:,

GALERIA HANDLOWA ABITA! TRZCIANKA, PLAC POCZTOWY 24b!

Spis treści. Rozdział 1. Wprowadzenie, czyli kilka słów o komputerze / 11

OFERTA SPRZEDAŻY NIERUCHOMOŚCI

PROWADZENIE DZIAŁAŃ W JRG3. Podział zadań między ratownikami podczas zdarzeń

A8 Architektura PIOTR LEWANDOWSKI

Murowana Goślina, ul. Chabrowa

Spis treści. Od autorów / 9

SPOTKANIE 2: Wprowadzenie cz. I

Warszawa Targówek Bródno, Głębocka

Wyszukiwanie tekstów

PROJEKT WYKONAWCZY TOM III

Dom i biuro w Swarzędzu z dużymi pomieszczeniami produkcyjno magazynowymi.

MIESZKANIE NA SPRZEDAŻ liczba pokoi: 2, pow. całkowita: 40 m2, Siemianowice Śląskie, CENTRUM. 800 zł

Wprowadzenie do multimedialnych baz danych. Opracował: dr inż. Piotr Suchomski

Narzędzia do automatycznej analizy semantycznej tekstu na poziomach: leksykalnym i struktur

INFORMACJE O LOKALACH UŻYTKOWYCH PRZEZNACZONYCH DO NAJMU W DRODZE KONKURSU OFERT NR 19/2018. ul. F. Chopina 5B

Lokalizacja Oprogramowania

Analiza głównych składowych- redukcja wymiaru, wykł. 12

Rozkład materiału realizacji informatyki w szkole podstawowej w wymiarze 2 godzin w cyklu trzyletnim

Gdynia Wzgórze Św. Maksymiliana, ul. Legionów

Kraków Prądnik Czerwony, ul. Na Barciach

DRZEWA REGRESYJNE I LASY LOSOWE JAKO

Wymagania na poszczególne oceny w klasach I gimnazjum

PRZEDMIOTOWY SYSTEM OCENIANIA

POWIERZCHNIE PRZEZNACZONE NA WYNAJEM

ZADANIE EGZAMINACYJNE dla osób ubiegających się o uprawnienia do sporządzania świadectw energetycznych budynków i lokali

MIESZKANIE NA WYNAJEM liczba pokoi: 2, pow. całkowita: 37 m 2, Gdynia, Śródmieście. Cena 199 zł

Wykład 3. Rozkład normalny

Materiały do ćwiczeń z ogrzewnictwa 4. PRZYKŁAD OBLICZANIA ZAPOTRZEBOWANIA NA MOC CIEPLNĄ. Pokój. Pokój t i = +20 o C Kub = m 3

KARTA INFORMACYJNA Z INFORMATYKI DO KLASY 6. Imię i nazwisko ucznia:

Rozkład materiału realizacji informatyki w szkole podstawowej w wymiarze 1;1;2 godziny w cyklu trzyletnim

Zgierz, ul. Powstańców Śląskich

/ E max

Zaglądamy pod maskę: podstawy działania silnika wyszukiwawczego na przykładzie Lucene

Reklama na portalu Świata Przemysłu Farmaceutycznego specyfikacja techniczna

TP1 - TABELE PRZESTAWNE od A do Z

Metody Statystyczne. Metody Statystyczne.

Transkrypt:

Przygotowanie danych Szkoła Główna Służby Pożarniczej Zakład Informatyki i Łączności December 5, 2016

1 Dane tabelaryczne 2 Dane tekstowe 3 Dane sensoryczne 4 Dane multimedialne

Dane tabelaryczne ID data # GBA pożar obiekt piętro powierzchnia 1 10.02.2012 3 tak blok IV 40 2 12.12.2012 1 tak dom I 120 3 12.10.2010 1 nie samochód - 4 4 15.02.2011 5 tak fabryka 0 1200 5 13.12.2013 2 nie śmietnik - 0,4 6 12.11.2012 4 tak mieszkanie VII 38 7 17.12.2002 1 tak hala 0 1210 8 21.02.2001 5 tak garaż 0 1250

Data i czas Różne formaty reprezentacji danych: 14.12.2012 14.12.12 12.12.14 14 grudnia 2012 14 grudnia 2012 20:30 Porównanie pomiędzy poszczególnymi składowymi: 14.12.2012 01.12.1990 grudzień 14.10.2012 20:30 01.12.1990 20:12 godzina 20-sta

Data i czas 0.07 Prawdopodobieństwo przejścia 0.06 0.05 Częstość 0.04 0.03 0.02 0.01 0.00 0 2 4 6 8 10 12 14 16 18 20 22 24 Godzina zgłoszenia

Atrybuty numeryczne ID # GBA obiekt pow. 1 5 fabryka 1200 2 1 hala 1210 3 5 garaż 1250 d(2,3) d(1,3) d(1,2) d(1, 2) = (x 1 x 2 ) 2 + (y 1 y 2 ) 2 = 10 d(1, 3) = (x 1 x 3 ) 2 + (y 1 y 3 ) 2 = 50 d(2, 3) = (x 2 x 3 ) 2 + (y 2 y 3 ) 2 = 40

Normalizacja Wszystkie atrybuty opisujące obiekt mają taką samą wartość minimalną jak i maksymalną opisane są na tej samej skali. Przykład: dzielenie przez wartość maksymalną danego atrybutu. ID # GBA # GBA norm. obiekt pow. pow. norm. 1 5 1 fabryka 1200 0,96 2 1 0,2 hala 1210 0,97 3 5 1 garaż 1250 1 d norm(1, 2) = 0, 8 d norm(1, 3) = 0, 04 d norm(2, 3) = 0, 8

y Standaryzacja z = x µ σ 0 10 20 30 40 50 60 ID # GBA # GBA stand. obiekt pow. pow. stand. 1 5 0,58 fabryka 1200-0,76 2 1-1,15 hala 1210-0,38 3 5 0,58 garaż 1250 1.13 d stand(1, 2) = 1, 78 d stand(1, 3) = 0, 89 d stand(2, 3) = 2, 29 0 1 2 3 4 x

Dyskretyzacja ID # GBA # GBA dyskr. obiekt pow. pow. dyskr. 1 3 średnia blok 40 średnia 2 1 mała dom 120 duża 3 1 mała samochód 4 średnia 4 5 duża fabryka 1200 b. duża 5 2 małą śmietnik 0,4 mała 6 4 średnia mieszkanie 38 średnia 7 1 mała hala 1210 b. duża 8 5 duża garaż 1250 b. duża # GBA: [1, 2] mała; [3, 4] średnia; [5, ) duża; # powierzchnia: [0, 2] mała; [3, 40] średnia; [41,150] duża; [151, ) bardzo duża;

Dyskretyzacja I II III 0 5 10 15 0 5 10 15 20

Atrybuty nominalne i porządkowe ID pożar obiekt piętro 1 tak mieszkanie IV 2 tak dom I 3 nie samochód - 4 tak fabryka 0 5 nie śmietnik - 6 tak mieszkanie VII 7 tak hala 0 8 tak garaż 0 ID pożar o mieszkanie o dom o samochód o fabryka o śmietnik o hala o garaż piętro 1 1 1 0 0 0 0 0 0 4 2 1 0 1 0 0 0 0 0 1 3 0 0 0 1 0 0 0 0-4 1 0 0 0 1 0 0 0 0 5 0 0 0 0 0 1 0 0-6 1 1 0 0 0 0 0 0 7 7 1 0 0 0 0 0 1 0 0 8 1 0 0 0 0 0 0 1 0

Atrybuty nominalne i porządkowe piętro 4 3 (1,4,1) 2 1 (1,1,0) 1 pożar o_mieszkanie 1

Puste i błędne wartości ID pożar obiekt piętro 1 tak mieszkanie IV 2 tak dom I 3 nie samochód 4 tak fabryka 0 5 nie śmietnik brak 6 nie wiem mieszkanie VII 7 tak hala 0 8 tak garaż 0 - zastąpienie średnią lub najczęściej występującą wartością - zbudowanie modelu wpisywania wartości - wartość losowa - usunięcie wiersza

Dane tekstowe Przykład: Po dojechaniu na miejsce zdarzenia stwierdzono że w mieszkaniu na I piętrze doszło do wybuchu wskutek którego wypadło okno wraz z futryną. Po dokładnym rozpoznaniu stwierdzono że w pomieszczeniu łazienki doszło do pozaru pralki automatycznej z bliżej nieokreślonych przyczyn.pralkę ugaszono przy pomocy wody po uprzednim odłączeniu napięcia.w obrębie pralki znaleziono rozerwane opakowanie po dezodorancie które mogło spowodować wybuch i powstanie fali uderzeniowej.ze względu na niemożliwość jednoznacznego określenia przyczynu powstania eksplozji na miejsce zadysponowano ekipę policji z KP Białołęka której przekazano pomieszczenie wraz z pralką.żadna z osób znajdujących się w lokalu nie odniosła obrażeń. Po zakończeniu działan oddymiono klatkę schodową.spaleniu uległa pralka automatyczna okopceniu ściany mieszkania.

Reprezentacja dokument-słowo Term-document-matrix (TDM) słowo/raport Raport 1 Raport 2 Raport 3 Raport n afrykański 1 0 0 0 agresywnie 1 0 0 0 akademik 1 0 0 1 akumulator 0 1 0 0 albert 0 0 1 0 alkoholowy 1 0 0 1 alkomat 1 0 0 0 altanka 0 0 1 0 antywłamaniowy 0 0 1 0 asfalt 0 1 0 0... 0 0 0 0

Częstość słów Miary częstości słów: TF (term frequency) częstość słowa liczba powtórzeń słowa w dokumencie do liczby wszystkich słów w dokumencie. IDF (inverse document frequency) odwrotna częstość dokumentu liczba dokumentów w korpusie (zbiorze) do liczby dokumentów, w którym dane słowo wystąpiło. TF-IDF = TF x IDF

TDM słowo/raport Raport 1 Raport 2 Raport 3 Raport n afrykański 0.01 0.00 0.04 0.00 agresywnie 0.30 0.03 0.00 0.00 akademik 0.20 0.40 0.00 0.30 akumulator 0.00 0.00 0.00 0.00 albert 0.07 0.00 0.00 0.70 alkoholowy 0.20 0.50 0.00 0.00 alkomat 0.10 0.00 0.00 0.00 altanka 0.00 0.00 0.02 0.01 antywłamaniowy 0.00 0.00 0.00 0.00 asfalt 0.00 0.00 0.05 0.00

Odmiana wyrazów oraz stop lista Po dojechaniu na miejsce zdarzenia stwierdzono że w mieszkaniu na I piętrze doszło do wybuchu wskutek którego wypadło okno wraz z futryną. Po dokładnym rozpoznaniu stwierdzono że w pomieszczeniu łazienki doszło do pożaru pralki automatycznej z bliżej nieokreślonych przyczyn. Pralkę ugaszono przy pomocy wody po uprzednim odłączeniu napięcia.w obrębie pralki znaleziono rozerwane opakowanie po dezodorancie które mogło spowodować wybuch i powstanie fali uderzeniowej. Ze względu na niemożliwość jednoznacznego określenia przyczyn powstania eksplozji na miejsce zadysponowano ekipę policji z KP Białołęka której przekazano pomieszczenie wraz z pralką. Żadna z osób znajdujących się w lokalu nie odniosła obrażeń. Po zakończeniu działań oddymiono klatkę schodową.spaleniu uległa pralka automatyczna okopceniu ściany mieszkania.

Lematyzacja dojechać miejsce zdarzyć stwierdzić mieszkać piętro dojść wybuch wskutek wypaść okno futryna. dokładny rozpoznać stwierdzić łazienka dojść pożar pralka automatyczny blisko nieokreślony przyczyna. pralka ugasić pomoc woda uprzedni odłączyć napiąć. obrąb pralka znaleźć rozerwać opakować dezodorant móc spowodować wybuch powstać fala uderzeniowy. wzgląd niemożliwość jednoznaczny określić powstać eksplozja miejsce zadysponować ekipa policja kp przekazać pomieścić pralka. osoba znajdywać siebie lokal odnieść obrazić. zakończyć oddymić klatka schodowy. spalić ulec pralka automatyczny okopcieć ściana mieszkać.

Lematyzacja cd. Lematyzacja - pojęcie to oznacza sprowadzenie grupy wyrazów stanowiących odmianę danego zwrotu do wspólnej postaci, umożliwiającej traktowanie ich wszystkich jako te samo słowo.

Podobieństwo semantyczne dojechać miejsce zdarzyć stwierdzić mieszkać piętro dojść wybuch wskutek wypaść okno futryna. dokładny rozpoznać stwierdzić łazienka dojść pożar pralka automatyczny blisko nieokreślony przyczyna. pralka ugasić pomoc woda uprzedni odłączyć napiąć. obrąb pralka znaleźć rozerwać opakować dezodorant móc spowodować wybuch powstać fala uderzeniowy. wzgląd niemożliwość jednoznaczny określić powstać eksplozja miejsce zadysponować ekipa policja kp przekazać pomieścić pralka.

Analiza ukrytych grup semantycznych słowo/raport Raport 1 Raport 2 Raport 3 Raport 4 wybuch 1 0 0 1 samochód 0 1 0 0 eksplozja 1 0 0 0 GBA 0 1 0 0 wyrzut 0 0 1 1 pożar 1 0 1 0 gaśniczy 0 1 0 0

Analiza ukrytych grup semantycznych Latent Semantic Analysis: słowo/raport pojęcie 1 pojęcie 2 pojęcie 3 wybuch 0,25-0,12 0,03 samochód -0,11 0,19-0,05 eksplozja 0,13-0,70-0.02 GBA -0,77 0,22 0,01 wyrzut 0,02-0,51 0,07 pożar 0,00 0,01-0.12 gaśniczy -0,07 0,32 0.01 7,11 0 0 0 2,31 0 0 0,00 0 pojęcie/raport Raport 1 Raport 2 Raport 3 Raport 4 pojęcie 1 0,31-0,43 0,44 0,21 pojęcie 2-0,70 0,61-0,24-0,33 pojęcie 3-0,01 0,02 0,02 0,02

Dane sensoryczne Film

Dane sensoryczne

Dane sensoryczne analiza y 4 6 8 10 12 14 16 0 20 40 60 80 100 x

Średnia y 4 6 8 10 12 14 16 0 20 40 60 80 100 x

Trend 0 20 40 60 80 100 4 6 8 10 12 14 16 x y

Trend czas trwania akcji 10 20 30 40 5 10 15 powierzchnia pożaru

Trend 0 20 40 60 80 100 4 6 8 10 12 14 16 x y

Wartości odstające y 4 2 0 2 4 0 20 40 60 80 100 x

Wartości odstające y 4 2 0 2 4 0 20 40 60 80 100 x

Wahania sezonowe y 0.5 0.0 0.5 2010 2011 2012 2013 2014 2015 2016 2017 x

Szum y 2 1 0 1 2 3 2010 2011 2012 2013 2014 2015 2016 2017 x

Decomposition of additive time series random 2 1 0 1 2 3 seasonal 0.5 0.0 0.5 trend 6.0 6.5 7.0 7.5 observed 5 6 7 8 9 10 2010 2011 2012 2013 2014 2015 2016 2017 Time

Dane multimedialne Multimedia (łac. multum + medium) media, stanowiące połączenie kilku różnych form przekazu informacji np. tekstu, dźwięku, grafiki, animacji, wideo.

Histogramy

Dopasowanie do wzorca

Dopasowanie do wzorca

Dopasowanie do wzorca

źródło: Y. Fang, K. Wang, J. Cheng, H. Lu: A Real-Time Hand Gesture Recognition Method. 2007.

Analiza z użyciem ontologii Źródło: dzięki uprzejmości Hiranmay Gosh

Analiza z użyciem ontologii cd. Źródło: dzięki uprzejmości Hiranmay Gosh