temat prelekcji.. Dynamiczne bazy danych platforma szkoleniowa Warszawskiej Wyższej Szkoły Informatyki prowadzący Andrzej Ptasznik

Podobne dokumenty
Koncepcja szkoleniowej bazy danych Dynamiczna populacja projekt realizowany przez koło naukowe. Warszawska Wyższa Szkoła Informatyki.

KRAJOWY REJESTR NOWOTWORÓW ZINTEGROWANY SYSTEM REJESTRACJI NOWOTWORÓW ZŁOŚLIWYCH W POLSCE

1a Jeśli tak Karta danych pacjenta zawiera wszystkie TAK. 1b Jeśli tak Umożliwia wygenerowanie pliku xml

Program dla praktyki lekarskiej. Instrukcja tworzenia statystyk

Mechanizm generowania edeklaracji

Bazy danych. Zenon Gniazdowski WWSI, ITE Andrzej Ptasznik WWSI

Uniwersytet Wirtualny VU2012

Statystyka w pracy badawczej nauczyciela

ATLASUMIERALNOŚCI LUDNOŚCI POLSKI

Ćwiczenie: "Rezonans w obwodach elektrycznych"

METODY AUTORYZACJI PIELĘGNIAREK I POŁOŻNYCH W SYSTEMACH WSPOMAGAJĄCYCH WYKONYWANIE ZAWODU ARKADIUSZ SZCZEŚNIAK

Cyfrowi obywatele W Polsce jest ponad 22 mln Internautów, ok. 60 proc. populacji Kiedy dzieci są w domu: 93,6%!!! 99,3% w grupie wiekowej 16-24,

Statystyka publiczna źródłem wiedzy w programowaniu krajowym i regionalnym

Opis wymagań i program szkoleń dla użytkowników i administratorów

Zagadnienia: wprowadzenie podstawowe pojęcia. Doświadczalnictwo. Anna Rajfura

S YLABUS MODUŁU (PRZEDMIOTU) I nformacje ogólne. Nie dotyczy

Dokumentacja programu. Wykonywanie sprawozdawczości indywidulanej z badań laboratoryjnych i diagnostycznych w POZ. Zielona Góra

Elementy statystyki opisowej, podstawowe pojęcia statystyki matematycznej

Wykorzystanie danych ze spisów powszechnych do analiz geoprzestrzennych

AKTUALNA OFERTA ORAZ MOŻLIWOŚĆ ZAKUPU LICENCJI:

Metody badań w naukach ekonomicznych

LABORATORIUM WIRTUALNE W DYDAKTYCE I BADANIACH NAUKOWYCH

Od Expert Data Scientist do Citizen Data Scientist, czyli jak w praktyce korzystać z zaawansowanej analizy danych

Wykorzystanie danych publicznych przez biegłego

Instrukcja obsługi DHL KONWERTER 1.6

Kierunek studiów: EKONOMIA Specjalność: Analityka gospodarcza

Lp. Parametry Wymagane Warunek Opisać 1 Serwer 1.1 Producent oprogramowania Podać 1.2 Kraj pochodzenia Podać 1.3. Wymóg.

Rozliczanie raportów statystycznych w 2006 roku

Projekt: Współpraca i Rozwój wzrost potencjału firm klastra INTERIZON

INFORMATYKA Pytania ogólne na egzamin dyplomowy

Koszty ekonomiczne zanieczyszczeń powietrza na wybranych przykładach

Instrukcja do programu DoKEX 1.0

Specjalizacja magisterska Bazy danych

ARCHICAD 21 podstawy wykorzystania standardu IFC

Wykaz tematów prac dyplomowych w roku akademickim 2011/2012 kierunek: informatyka, studia niestacjonarne

REFERAT PRACY DYPLOMOWEJ Temat pracy: SUDOKU - Algorytmy tworzenia i rozwiązywania

Przewodnik korzystania z Biblioteki kursów na platformach e-learningowych RON

EFEKTYWNE NARZĘDZIE E-LEARNINGOWE

PROGRAM NAUCZANIA PRZEDMIOTU OBOWIĄZKOWEGO NA WYDZIALE LEKARSKIM I ROK AKADEMICKI 2014/2015 PRZEWODNIK DYDAKTYCZNY dla STUDENTÓW IV ROKU STUDIÓW

Jak powstają programy profilaktyki zdrowotnej regionu łódzkiego

ALGORYTMY GENETYCZNE ćwiczenia

System ZSIN wyzwanie dla systemów do prowadzenia EGiB

Nowy sposób rozliczania VAT w transakcjach z AstraZeneca UK

Sylabus. Zaawansowana analiza danych eksperymentalnych Advanced analysis of experimental data

Zadania zdrowia publicznego w strukturze systemu opieki zdrowotnej

WYMAGANIA WSTĘPNE W ZAKRESIE WIEDZY UMIEJĘTNOŚCI I INNYCHY KOMPETENCJI

Instrukcja do programu DoDPD 1.0

Instrukcja do programu DoDHL 1.5

Instrukcja obsługi Multiconverter 2.0

Propozycja standaryzacji usługi lokalizacji adresu

Statystyka opisowa. Wykład I. Elementy statystyki opisowej

MOJA FIRMA PLUS. bankowość elektroniczna dla małych i średnich firm

Laboratorium Komputerowych Systemów Rozpoznawania Projekt 2. Lingwistyczne podsumowania baz danych

Zadanie nr 4.5: Oprogramowanie bazodanowe. Lp. Zwartość karty Opis 1 Specyfikacja techniczna / funkcjonalna przedmiotu zamówienia

KARTA KURSU. (do zastosowania w roku akademickim 2015/16) Kod Punktacja ECTS* 3. Dr hab. Tadeusz Sozański

Prawdopodobieństwo i statystyka

Cel szkolenia. Konspekt. Opis kursu

Podstawowe pojęcia statystyczne

Wykład ze statystyki. Maciej Wolny

Firma: MEDIPORTA SP. Z O.O. Nazwa Produktu: MEDIPORTA

Posiada (TAK / NIE. Zrzut ekranu. Opis funkcji

METADANE GEOINFORMACYJNE PODLASIA

przestrzenna, wielowymiarowa prezentacja danych gromadzonych w Analitycznej Bazie Mikrodanych,

SI-Consulting Sp. z o. o.

Instrukcja do programu DoUPS 1.0

Szkolenie: Testowanie wydajności (Performance Testing)

Część I Tworzenie baz danych SQL Server na potrzeby przechowywania danych

Przewodnik użytkownika (instrukcja) AutoMagicTest

Raporty systemowe. Omówienie funkcjonalności. Spis treści

Programowanie sieciowe Network programming PRZEWODNIK PO PRZEDMIOCIE

Załącznik nr 1 do Zapytania ofertowego: Opis przedmiotu zamówienia

NIEZAWODNE ROZWIĄZANIA SYSTEMÓW AUTOMATYKI. asix. Aktualizacja pakietu asix 4 do wersji 5 lub 6. Pomoc techniczna

Rola dimeru lizozymu (Lydium-KLP ) we współczesnej profilaktyce i terapii chorób zwierząt

Wykonawca systemu: Dr inż. Andrzej Łysko

I. ZAGADNIENIA OGÓLNE Pytania Wielkopolskiej Izby Lekarskiej Odpowiedź Uwagi TAK. Odp. 1c

Analiza i częściowa implementacja systemu elektronicznej wymiany danych na przykładzie e-faktury

PODSTAWY BAZ DANYCH. 19. Perspektywy baz danych. 2009/2010 Notatki do wykładu "Podstawy baz danych"

Zajęcia edukacyjne dla uczestników XXIX Olimpiady Wiedzy Ekonomicznej

Składowanie i dostęp do danych w rozproszonym systemie ochrony własności intelektualnej ANDRZEJ SOBECKI, POLITECHNIKA GDAŃSKA INFOBAZY 2014

Krajowy Rejestr Nowotworów 16 rejestrów wojewódzkich

Program budowy infrastruktury informacji przestrzennej (IIP) w Ministerstwie Zdrowia (MZ)

Analiza zgodności z wymogami dotyczącymi elektronicznej dokumentacji medycznej oraz gotowości na w

Zintegrowana platforma zarządzania miastem w kontekście bezpieczeństwa publicznego. (Centrum Bezpieczeństwa Miasta)

Komunikaty statystyczne medyczne

Program szkolenia KURS SPD i PD Administrator szkolnej pracowni internetowej Kurs MD1 Kurs MD2 Kurs MD3 (dla szkół ponadgimnazjalnych)

Projekt: MS i CISCO dla Śląska

QualitySpy moduł reports

Model symulacyjny robota Explorer 6WD z uwzględnieniem uszkodzeń

O2Symfonia by CTI. Instrukcja i opis programu

Strategia informatyzacji sektora ochrony zdrowia

finiownia loginów. W zależności od ustawionej opcji użytkownik login:

Zanieczyszczenia powietrza a przedwczesne zgony i hospitalizacje z powodu chorób układu sercowo-naczyniowego

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Ankieta. Informacje o uczestniku. Imię i nazwisko: Stanowisko : Warsztat Innowacyjne metody dydaktyczne (np. learning by doing, design thinking)

MATEMATYKA Z ELEMENTAMI STATYSTYKI LABORATORIUM KOMPUTEROWE DLA II ROKU KIERUNKU ZARZĄDZANIE I INŻYNIERIA PRODUKCJI ZESTAWY ZADAŃ

PLAN REALIZACJI MATERIAŁU NAUCZANIA Z INFORMATYKI II. Uczeń umie: Świadomie stosować się do zasad regulaminów (P).

SCENARIUSZ LEKCJI. TEMAT LEKCJI: Zastosowanie średnich w statystyce i matematyce. Podstawowe pojęcia statystyczne. Streszczenie.

Szpieg 2.0 Instrukcja użytkownika

METODY STATYSTYCZNE W BIOLOGII

Ekspert MS SQL Server Oferta nr 00/08

Transkrypt:

temat prelekcji.. Dynamiczne bazy danych platforma szkoleniowa Warszawskiej Wyższej Szkoły Informatyki prowadzący Andrzej Ptasznik

Geneza projektu Dynamiczna populacja Poszukiwanie inspiracji AeroSym symulacja ruchu w przestrzeni powietrznej Via Salus (e-recepta) model działania służby zdrowia e- NFZ Pro symulacja działania komunikacji w Warszawie

Geneza projektu Dynamiczna populacja Specjalizacja w WWSI Brak szkoleniowych baz danych Ciekawe wyzwanie Zapewnienie ciągłości prac w kole naukowym

Co, po co i dlaczego? Utworzenie bazy danych będącej obraz populacji ludności w Polsce Opracowanie symulatora zmian populacji i wybranych zdarzeń zachodzących w Polsce Opracowanie scenariuszy wykorzystania systemu

Prace przygotowawcze Podstawą jest system Teryt udostępniony przez GUS, który musiał zostać odpowiednio przygotowany Do każdej lokalizacji zostały dowiązane współrzędne geograficzne(ok. 300 000 lokalizacji) Każda osoba populacji Herkules jest dowiązana do lokalizacji Dane będą wykorzystywane do zobrazowań przestrzennych

Prace przygotowawcze Przykładowy fragment danych systemu TERYT

Prace przygotowawcze Klasyfikacja chorób wg WHO - kod ICD10 Przykładowy fragment danych systemu ICD10 Wykorzystywane do określenia przyczyn zgonów i diagnoz lekarskich

Prace przygotowawcze Statystyki, statystyki, statystyki.. Bardzo dużo pracy polegało na wyszukiwaniu odpowiednich statystyk i przygotowaniu ich do postaci możliwej do zaimportowania do bazy danych

Efekty Wygenerowany obraz populacji na 31.12.2011 ( według spisu GUS)

Efekty Opracowany został mechanizm losowania i przypisywania cech Opracowano postaci komunikatów, które ma otrzymywać system Opracowano procedury generowania informacji o zgonach, urodzeniach i zmianach stanu cywilnego Opracowano procedurę generowania komunikatów USC Dynamiczna Populacja SYSTEM JUŻ ŻYJE ale teraz trwa przebudowa

Efekty Schemat XSD USC Przykładowy komunikat XML

Efekty Tabela pomocnicza 100 mln liczb losowych z przedziału 0.. 2 mld. Mechanizm losowej wymiany liczb

Losowanie Imię Nazwisko Prawdopodobieństwo Liczba losowa Jan Maliniak 0,6 1 200 000 000 Piotr Nowak 0,7 1 400 000 000 Szymon Kowalski 0,3 600 000 000

Losowanie IdOsoby Prob liczba losowa 3458 13755550 234576 3459 22187654 1112343456 3460 503560345 567334658 3461 111765456 987576354 3462 4565687 23525

Losowanie Osoba Liczba losowa Wartość od Wartość do Jan Nowak 16578 1 300 Przyczyna zgonu Przyczyny zewnętrzne Jan Nowak 16578 301 1000000 Nowotwory Jan Nowak 16578 1000001 1240000 Choroby krążenia Choroby Jan Nowak 16578 1240001 3000000 zakaźne

Wyniki

Wyniki

Co dalej Uruchomienie testowego generowania danych zaczęliśmy od zgonów Przeprowadzenie analizy statystycznej wyników symulacji Uruchomienie pełnej wersji komunikatu USC Uruchomienie pełnej symulacji Budowa systemów analitycznych Tworzenie alertów i scenariuszy wykorzystania

Ale było mało. W ciągu ostatniego roku powstały trzy nowe dynamiczne bazy danych : Kursy waluty od 2002 roku Wygenerowano ok..3 mln faktur Plik konfiguracji generatora w XML Codziennie generowane są zdarzenia i ich obsługa

Ale było mało. Aktualnie trwają prace nad kolejnymi dynamicznymi bazami danych : Depesze SYNOP z ok. 50 stacji pomiarowych aktualne + historia Dane ze stacji pomiarowych Dane o filmach + repertuar + symulacja

Problemy. Ograniczone zasoby serwera Ucieczka zaawansowanych uczestników projektu Bariery czasowe dla uczestników więcej grzechów nie pamiętamy

Podsumowanie. Co z tego wyniknie nie wiemy Dla studentów jest to doskonała platforma zapoznania się z problemami dużych ilości danych Tworzenie hurtowni danych Wykorzystanie systemu do zadań Data Mining Wykorzystanie do prac badawczych Kopalnia tematów do prac dyplomowych NIE ZNALEŹLIŚMY INFORMACJI O PODOBNYM SYSTEMIE