Technologie efektywnego zarządzania danymi w systemach rejestrowych na przykładzie IRS

Podobne dokumenty
Wprowadzenie do technologii Business Intelligence i hurtowni danych

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Odkryj Sekrety Efektywnego Business Intelligence

Co to jest Business Intelligence?

Organizacyjnie. Prowadzący: dr Mariusz Rafało (hasło: BIG)

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Hurtownie danych - przegląd technologii Robert Wrembel Politechnika Poznańska Instytut Informatyki Robert.Wrembel@cs.put.poznan.pl

Hurtownie danych - przegląd technologii

AUREA BPM Oracle. TECNA Sp. z o.o. Strona 1 z 7

Budowa systemu wspomagającego podejmowanie decyzji. Metodyka projektowo wdrożeniowa

Hurtownie danych i business intelligence - wykład II. Zagadnienia do omówienia. Miejsce i rola HD w firmie

Rola analityki danych w transformacji cyfrowej firmy

bo od managera wymaga się perfekcji

Analityka danych w środowisku Hadoop. Piotr Czarnas, 27 czerwca 2017

Instalacja SQL Server Konfiguracja SQL Server Logowanie - opcje SQL Server Management Studio. Microsoft Access Oracle Sybase DB2 MySQL

VII Kongres BOUG 03 października 2012

Instalacja SQL Server Express. Logowanie na stronie Microsoftu

Analityka danych w środowisku Hadoop. Piotr Czarnas, 5 czerwca 2017

Rozwiązania wspomagające przetwarzanie wielkich zbiorów danych (VLDB) we współczesnych systemach zarządzania bazami danych

Usługa archiwizacji danych w systemie Eureca. Marek Jelenik CONTROLLING SYSTEMS sp. z o.o.

Ramowy plan kursu. Lp. Moduły Wyk. Lab. Przekazywane treści

OPIS PRZEDMIOTU ZAMÓWIENIA

DB2 with BLU acceleration rozwiązanie in-memory szybsze niż pamięć operacyjna&

Pierwsze wdrożenie SAP BW w firmie

Migracja do PostgreSQL za pomocą narzędzi Enterprise DB

CZY TWOJE ŚRODOWISKO PLIKOWE RÓWNIEŻ ROŚNIE SZYBCIEJ NIŻ BAZODANOWE?

Szybkość instynktu i rozsądek rozumu$

PLAN ZARZĄDZANIA KONFIGURACJĄ OPROGRAMOWANIA PROJEKT <NAZWA PROJEKTU> WERSJA <NUMER WERSJI DOKUMENTU>

COMARCH DATA WAREHOUSE MANAGER 6.2

Opis wymagań i program szkoleń dla użytkowników i administratorów

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

HP Service Anywhere Uproszczenie zarządzania usługami IT

Migracja Business Intelligence do wersji

Specjalizacja magisterska Bazy danych

Zajęcia prowadzone przez MCT, auditora wiodącego systemów bezpieczeństwa informacji.

Referat pracy dyplomowej

Zadanie nr 4.5: Oprogramowanie bazodanowe. Lp. Zwartość karty Opis 1 Specyfikacja techniczna / funkcjonalna przedmiotu zamówienia

Narzędzia PMR do analizy sektora transportu drogowego

Koniec problemów z zarządzaniem stacjami roboczymi BigFix. Włodzimierz Dymaczewski, IBM

VI Kongres BOUG Praktyczne aspekty wykorzystania Business Intelligence w przemyśle wydobywczym węgla kamiennego

Hurtownie danych. Wstęp. Architektura hurtowni danych. CO TO JEST HURTOWNIA DANYCH

Migracja XL Business Intelligence do wersji

Szkolenia SAS Cennik i kalendarz 2017

IBM DATASTAGE COMPETENCE CENTER

Digitize Your Business

Spis treści. O autorach... 12

Migracja Business Intelligence do wersji

Hurtownie danych. 31 stycznia 2017

Migracja Business Intelligence do wersji

Ewolucja technik modelowania hurtowni danych

Migracja Business Intelligence do wersji 11.0

Wprowadzenie do Hurtowni Danych

Platforma Cognos. Agata Tyma CMMS Department Marketing & Sales Specialist atyma@aiut.com.pl AIUT Sp. z o. o.

Ekspert MS SQL Server Oferta nr 00/08

ZAŁĄCZNIK NR 5 - GRUPA PRODUKTÓW 5: OPROGRAMOWANIE BAZODANOWE

Pomagamy firmom podejmować trafne decyzje biznesowe. Dostarczamy korzystne i nowoczesne rozwiązania IT. HURO Sp. z o.o.

Szczegółowy opis przedmiotu umowy. 1. Środowisko SharePoint UWMD (wewnętrzne) składa się z następujących grup serwerów:

Migracja Comarch ERP Altum Business Intelligence do wersji

ZAPYTANIE OFERTOWE. Zamawiający. Przedmiot zapytania ofertowego. Wrocław, dnia r.

Hurtownie danych. Wprowadzenie do systemów typu Business Intelligence

PureSystems zautomatyzowane środowisko aplikacyjne. Emilia Smółko Software IT Architect

Migracja Comarch ERP Altum Business Intelligence do wersji 2019

Bezpieczeństwo dla wszystkich środowisk wirtualnych

Hurtownie danych. Hurtownie danych. dr hab. Maciej Zakrzewicz Politechnika Poznańska Instytut Informatyki. Maciej Zakrzewicz (1)

Systemy OLAP I. Krzysztof Dembczyński. Instytut Informatyki Zakład Inteligentnych Systemów Wspomagania Decyzji Politechnika Poznańska

Przetwarzanie i zabezpieczenie danych w zewnętrznym DATA CENTER

WDROŻENIE RSA NETWITNESS SUITE W BRANŻY E-COMMERCE

Opis przedmiotu zamówienia

Proaktywny i automatyczny monitoring infrastruktury IT w świetle Rekomendacji D

Baza danych to zbiór wzajemnie powiązanych ze sobą i zintegrowanych danych z pewnej dziedziny.

Problemy optymalizacji, rozbudowy i integracji systemu Edu wspomagającego e-nauczanie i e-uczenie się w PJWSTK

Część I Istota analizy biznesowej a Analysis Services

Xopero Backup Appliance

Migracja Business Intelligence do wersji Aktualizacja dokumentu:

Indeksy w bazach danych. Motywacje. Techniki indeksowania w eksploracji danych. Plan prezentacji. Dotychczasowe prace badawcze skupiały się na

ZAŁĄCZNIK NR 3 OPIS PRZEDMIOTU ZAMÓWIENIA DOTYCZĄCY WDROŻENIA PLATFORMY ZAKUPOWEJ

Nowoczesne bazy danych, czyli przetwarzanie in-memory

Spis tre±ci. Przedmowa... Cz ± I

Linki sponsorowane. Docieraj do milionów nowych klientów! Grzegorz Kordeczka WebDoctor.pl

Comarch BI Point Standalone ulotka. Wersja: 6.2

STRATEGICZNE ZARZĄDZANIE KOSZTAMI

Tematy projektów Edycja 2014

Klient Medousa sp. z o.o. (Grupa Digital Avenue S.A.) Branża IT serwis społecznościowy. Okres realizacji Stale od początków istnienia Fotosik.

Szkolenie autoryzowane. MS 6232 Wdrażanie bazy danych Microsoft SQL Server 2008 R2

Zbuduj prywatną chmurę backupu w firmie. Xopero Backup. Centralnie zarządzane rozwiązanie do backupu serwerów i stacji roboczych

Wprowadzenie do Hurtowni Danych. Mariusz Rafało

Maciej Kiewra Quality Business Intelligence Consulting

ActiveXperts SMS Messaging Server

Katalog handlowy e-production

Konsolidacja wysokowydajnych systemów IT. Macierze IBM DS8870 Serwery IBM Power Przykładowe wdrożenia

Nieustanny rozwój. Tomasz Leśniewski

Opis systemu CitectFacilities. (nadrzędny system sterowania i kontroli procesu technologicznego)

Login_R Software. Korzyści jakie może przynieść wdrożenie systemu Microsoft Business Solutions NAVISION są następujące:

Systemy GIS Systemy baz danych

Integracja danych ubezpieczeniowych w czasie rzeczywistym. Łukasz Szewczyk Solution Architect

Włodzimierz Dąbrowski, Przemysław Kowalczuk, Konrad Markowski. Bazy danych ITA-101. Wersja 1

HURTOWNIE DANYCH I BUSINESS INTELLIGENCE

Wyzwania Biznesu. Co jest ważne dla Ciebie?

Technologia informacyjna (IT - Information Technology) dziedzina wiedzy obejmująca:

FORMULARZ OFERTOWY. Termin dostarczenia dokumentu 1

Transkrypt:

Technologie efektywnego zarządzania danymi w systemach rejestrowych na przykładzie IRS Jacek Barańczuk, Dyrektor ds. Technologii i Usług Tomasz Piętka, Business Development Manager General Business & Public Sector Miedzeszyn, 24 września 2009

Agenda Misja IRS Skąd pomysł na budowę hurtowni danych? Cele jakie postawiono przed hurtownią danych Wymagania odnośnie Hurtowni Danych Architektura Hurtowni Danych Działanie Hurtowni Danych ROI- mierzalny sukces Wyniesiona lekcja 2

IRS -wprowadzenie Co to jest IRS? IRS to Urząd Podatkowy USA, jest biurem Departamentu Skarbu USA i jedną z najbardziej efektywnych instytucji jeśli chodzi o administrowanie podatkami W 2004, IRS zebrał ponad 2 tryliony USD dochodu i rozliczył ponad 224 milliony podatków od dochodów IRS wydał tylko 44 centy za kaŝde zebrane 100 USD w 2005r. Działa od 1913 na mocy 16 poprawki do Konstytucji USA Inicjalna stopa podatkowa? 1% ale w przypadku gdy dochód wynosił ponad 3 tys. USD 6% - dodatkowa opłata przy zarobkach większych niŝ 500 tys. USD

Misja organizacji Misja IRS: Świadczyć amerykańskim podatnikom usługi na najwyŝszym poziomie poprzez pomoc w zrozumieniu i przestrzeganiu prawa podatkowego oraz stosowaniu spójnego i sprawiedliwego prawa dla wszystkich obywateli Rolą IRS jest pomoc podatnikom, którzy w większości są uczciwi w przestrzeganiu prawa podatkowego, oraz wpłynąć na mniejszość, która uchyla się od płacenia podatków Cele: IRS Research, Analysis, and Statistics Organization Dostarczać IRS aktualnych i kompletnych informacji na temat kaŝdego płatnika.

Budowa hurtowni danych skąd pomysł? Zrozumienie problemu klienta: Istniejący zbiór danych był bardzo ograniczony Zapytania umoŝliwiały limitowaną analizę danych Brak moŝliwości raportowania ad-hoc Czas odpowiedzi na zapytania był mierzony w tygodniach a niekiedy w miesiącach! KaŜde zaangaŝowane zapytanie wymaga i transportuje nowy zestaw danych z jednego lub więcej zdalnych systemów baz danych Aplikacje OLAP firm trzecich nie mogły bezpośrednio dostać się do istniejących systemów (zarówno polityczne jak i techniczne problemy)

Cele hurtowni danych Zdefiniowanie celów nowej hurtowni danych: Jeden, skonsolidowany projekt bazy danych (3-cia postać normalna) zarówno dla płatników osób fizycznych jak i firm KaŜda informacja o podatku dochodowym od osoby fizycznej czy prawnej przechowywana i gotowa do natychmiastowej analizy 10 letnia informacja o podatniku Czas odpowiedzi na zapytania w godzinach, minutach, sekundach. MoŜliwość wykorzystania narzędzi Olap firm trzecich bezpośrednio na hurtowni danych Widoczne korzyści: Miliardy dolarów zebrane w nieściągalnych podatków dochodowych Wiele nagród i wyróŝnień ze strony rządu i przemysłu:tdwi, GCN, ComputerWorld, Excellence.gov, etc.

Wymagania odnośnie hurtowni danych PrzełoŜenie celów na wymagania projektowe: Kierownicy wyŝszego szczebla w roli wsparcia i sponsora Platforma Unix dla serwerów produkcyjnych i deweloperskich Zdefiniowanie modelu danych Rozwiązanie ETL Serwer analityczny (nie, tradycyjny serwer bazodanowy) Całkowita przestrzeń na dane: 20 TB, wielkość bazy danych: 2-3 TB Wsparcie dla 20-50 niezaleŝnych uŝytkowników Procesy walidacji oraz zapewniania jakości danych Najlepsze z moŝliwych wsparcie dla aplikacji SAS

Serwer dla hurtowni danych Wybór najlepszych rozwiązań Sybase IQ wybrany jako serwer analityczny Lepszy niŝ konkurencyjne rozwiązania w wielu kluczowych w tym projekcie obszarach, m.in. ładowania danych, wydajności zapytań, wymagań sprzętowych zweryfikowano podczas testów PoC MoŜliwość efektywnego wykorzystania modelu w 3 rd postaci normalnej Standardowa platforma Unix owa, sieci, pamięci masowe zostały rozbudowane i odpowiednio zaktualizowane SAS, BRIO (Hyperion), oraz SPSS Clementine były wiodącymi rozwiązaniami rynkowymi dla celów analitycznych - wymagane przez uŝytkowników

NajwaŜniejsze cechy Sybase IQ Sybase IQ co go charakteryzuje Kolumnowy zapis danych Sybase IQ SQL Standardowe narzędzia Zaawansowany optymalizator Bezpieczeństwo Zasilanie w czasie rzeczywistym (24x7) Efektywne wykorzystanie sprzętu Łatwa administracja, niski koszt

Operacje hurtowni danych ETL: Ekstrakcja danych z systemów organizacji, mapowanie zbiorów danych, transformacja do 3-ciej postaci normalnej oraz przygotowanie do ładowania SystemA SystemB SystemC Sybase IQ operacyjne ETL raportowania I wspierania decyzji Aplikacje raportujące

Operacje hurtowni danych Ładowanie danych: Dane ładowane w cyklu miesięcznym, kwartalnym i rocznym SystemA SystemB SystemC Sybase IQ operacyjne ETL raportowania I wspierania decyzji Aplikacje raportujące

Operacje hurtowni danych Walidacja danych: Weryfikacja i walidacja poprawności danych w chwili ich przechwytywania z systemów produkcyjnych + Informowanie źródłowego systemu o nieprawidłowości SystemA SystemB SystemC Sybase IQ operacyjne ETL raportowania I wspierania decyzji Aplikacje raportujące

Operacje hurtowni danych Dostępność: Utrzymanie stałej synchronizacji danych pomiędzy serwerem produkcyjnym oraz zapasowym Sybase IQ Środowisko zapasowe SystemA SystemB SystemC Sybase IQ operacyjne ETL raportowania I wspierania decyzji Aplikacje raportujące

Operacje hurtowni danych Programowanie: Modelowanie i analiza nowych zbiorów danych oraz zmian w istniejących zbiorach danych gdy zmieniane jest prawo podatkowe oraz formularze, implementacja zmian + Marketing SystemA SystemB SystemC Sybase IQ operacyjne ETL raportowania I wspierania decyzji Aplikacje raportujące

Jak środowisko działa dzisiaj* CDW zarządza ponad 150 terabajtami (TB) przestrzeni, dzięki czemu jest największą hurtownią danych dla sektora federalnego BieŜący przyrost hurtowni danych na poziomie ponad: 20 TB/rok Liczba tabel w CDW: około 700 Liczba kolumn: około 30 000, indeksów: około 45 000 PrzybliŜona liczba uŝytkowników: ponad 400 Średni roczny przyrost uŝytkowników: 100 Średnia liczba równocześnie pracujących uŝytkowników systemu: około 60 z maksymalną liczbą ponad 100 PrzybliŜona liczba zapytań/miesiąc: ponad 4 000 * Stan na lipiec 2008

Czynniki kluczowe dla sukcesu Wydajność zapytań 10-100x szybsze niŝ tradycyjny RDBMS Zasilanie bazy danych Jeden krok, Wysoka wydajność, Jednoczesne przetwarzanie Ładowania/Indeksowania Wydajność dyskowych operacji We/Wy DuŜe blokowe operacje We/Wy znacząco szybsze niŝ w tradycyjnych DBMS Łatwość administrowania Koszt administratora jest ułamkiem kosztu przy tradycyjnym DBMS Dowolny schemat (3NF, wielowymiarowy, etc.) Wydajność składowania Typowo konsumuje 30-70% przestrzeni, w porównaniu do danych surowych porównując do 300-900% przy tradycyjnych podejściach

Zwrot z inwestycji dla CDW (ROI) Produkcyjność badaczy wzrasta 25% przyrost rocznej produktywności w oparciu o poprawę wydajności dzięki zastosowaniu Sybase IQ oraz jej sposobu indeksowania MoŜliwość wykonywania skomplikowanych zapytań, zapytań ad-hoc oraz szybkiego wykonywania analiz predykcyjnych np. zapytanie na bazie konkurencyjnej trwało 14 godzin na Sybase IQ 40 sekund ObniŜenie kosztów utrzymania w IT Sybase IQ nie wymaga specjalizowanej optymalizacji Prostszy w utrzymaniu i zarządzaniu Wymaga mniejszej liczby pracowników zaangaŝowanych w zarządzanie bazą danych, przetwarzanie, ładowanie, konfigurację, strojenie oraz optymalizacje Niskie koszty szkoleń Wiele rozwiązań wymaga wielu szkoleń w tym przypadku tylko jedno rozwiązanie zaangaŝowane Redukcja kosztów sprzętu oraz pamięci Działa na mniej wymagającym sprzęcie: wymagane mniej CPU, serwery średniej klasy Kompresja IQ: Około 70% mniej przestrzeni dyskowej w stosunku do surowych danych przy w pełni poindeksowanych danych

Czego się nauczono Biznes Uzyskaj pełne wsparcie ze strony menedŝerów średniego szczebla Upewnij się, Ŝe uŝytkownicy końcowi są w zespole Wybierz najlepsze rozwiązania rynkowe (nawet jeŝeli jeszcze nie są Ci znane) ale proś o Proof of Concept!!! Utwórz odpowiedni zespół Twórz rozwiązanie dla Twoich uŝytkowników Mierz swój ROI oraz rzeczywiste korzyści dla organizacji Strona techniczna Zrozum swoje wymagania Upewnij się, Ŝe aplikacje są w pełni wspierane Zainwestuj w swoja infrastrukturę Stwórz partnerstwo z wiarygodnymi dostawcami, z którymi moŝesz mieć długotrwałe relacje Upewnij się, Ŝe Twoje rozwiązanie jest w pełni skalowalne Mierz swój ROI