Zbigniew Swoczyna, Asseco Repozytorium danych medycznych: skala, metoda, rozwiązanie
1 GB (giga bajt) 1 TB (tera bajt) = 1000 GB 1 PB (peta bajt) = 1.000.000 GB
1 GB (giga bajt) 1 TB (tera bajt) = 1000 GB 1 PB (peta bajt) = 1.000.000 GB = 17 min filmu (Blu-Ray) = 112 filmów (Blu-Ray) = 112 000 filmów (Blu-Ray)
1 GB (giga bajt) 1 TB (tera bajt) = 1000 GB 1 PB (peta bajt) = 1.000.000 GB = 17 min filmu (Blu-Ray) = 112 filmów (Blu-Ray) = 112 000 filmów (Blu-Ray) 1,2 m 1,2 km 4
Skąd się biorą dane
Skąd się biorą dane Obliczenia dla dużego szpitala wojewódzkiego. Dane gromadzone: TB/ rok Zdjęcia rentgenowskie: 2 Tomograf komputerowy 6 Rezonans magnetyczny 3 USG 3 Badania histopatologiczne 50 Badania laparoskopowe 5 Wideo rejestracja zabiegów 7 Elektroniczna dokumentacja medyczna??? 76 TB/rok
Skąd się biorą dane Szpital A : 76 TB/ rok Archiwum po 10 latach: 0,7 PB Archiwum po 15 latach: 1,1 PB Archiwum po 20 latach: 1,5 PB Archiwum po 25 latach: 1,9 PB. (jedna paleta dysków 8TB) Szpital B : 0,7 PB/rok Archiwum po 10 latach: 7 PB Archiwum po 15 latach: 10,5 PB Archiwum po 20 latach: 14 PB Archiwum po 25 latach: 17,5 PB (10 palet dysków 8TB)
Dlaczego składujemy dane: Potrzeby bieżącej diagnostyki Dane innych ośrodków (przesyłane / odbierane) (dane z ostatnich miesięcy / roku / 2 lat ) Praca badawcza / naukowa Regulacje wewnętrzne Wymogi prawne co do składowania danych
Najczęściej spotykane rozwiązania techniczne : Brak archiwum Osobne, podręczne dyski w ramach urządzeń Przekazywanie danych pacjentom na dyskach CD Nadpisywanie starych danych nowymi Przywiązanie danych do ośrodka diagnostycznego Zakup sprzętu diagnostycznego (gromadzącego dane) nie jest projektem informatycznym
Dlaczego? Koszt nabycia systemów IT Koszt utrzymania systemów IT Koszt odnawiania systemów IT Koszt i dostępność personelu IT Zatrudnienie, wykształcenie, utrzymanie w czasie Miejsce / Serwerownia / Klimatyzacja / Prąd / Sieć Budżet: Źródło finansowania systemów IT Programy Unii Europejskiej
Współczesne archiwum danych powinno być: Tanie i automatyczne Wspierać otwarte standardy Odporne na włamania Odporne na błędy obsługi Odporne na awarie systemów uszkodzenia danych propagację błędów Dostępne Zabezpieczone przed niepowołanym dostępem Tanie i automatyczne
Przykładowa architektura archiwum
Co tworzy koszt archiwum:
Co tworzy koszt archiwum? 14
15
16
Parę liczb: przypadek NERSC National Energy Research Scientific Computing Center (NERSC) 13PB danych na taśmach Dane przenoszono z 23.820 nośników 13 taśm z uszkodzonymi pojedynczymi 14 plikami Odczytano: 14.805.823, m taśmy 14 plików z błędami odpowiada 108 m taśmy lub 0.0007% całej długości taśmy 99,945% - poziom dostępności danych po 12+ latach składowania
Parę liczb: przypadek NERSC National Energy Research Scientific Computing Center (NERSC) 13 PB danych na taśmach = 1450 filmów (Blu-Ray) 16,5 km / 5316 godzin 30 godzin
Technologie przyszłości Max. uzyskana pojemność jednej taśmy: - Fuji: 154 TB - Sony: 185 TB
Przykładowe pomieszczenie archiwum
Kupujemy archiwum. Czas życia archiwum Roczny przyrost danych Budżet roczny na utrzymanie Kto i na jakich prawach ma dostęp do danych Lokalizacja archiwów Łącza z ośrodkami
eksploatujemy archiwum. Do końca życia pierwszych zapisanych danych (25 lat) zmienimy: Wszystkie dyski: 5-6 razy Wszystkie serwery: 6 7 razy Infrastrukturę sieciową: 2 3 razy Systemy diagnostyczne: 1-2 razy System archiwum: 1 2 razy Biblioteki taśmowe: 1 raz (upłynie 6 kadencji sejmu) 25 lat mogą przetrwać bez zmiany: Nośniki taśmowe Personel
Gdzie budować współczesne archiwum danych? Dwa oddalone geograficznie archiwa na region lub Wskazane dwa centra IT w województwie lub Dwa wiodące szpitale / centra diagnostyczne lub Archiwum jako usługa
Archiwum w szerszym kontekście: Structured Data Mixed Workgroup Unstructured Data Primary Database Universal Storage SAP UCM/URM/ OSB DB Primary Disk NFS HSM (Tiered Storage) Email Email Archiver Unified Storage Tape Libraries and Virtual Tape Video HSM Storage Buffer Images Capacity SATA/FC Modular Disk Universal Storage Off-Site Tape
10, 15, 20, 25,30,35, 40, 45, 50, 60 CENTRUM USŁUG WSPÓLNYCH W ADMINISTRACJI PUBLICZNEJ Współczesne archiwum projektowane na: LAT powinno być: Tanie i automatyczne Zaprojektowane jako proces Wspierać otwarte standardy Odporne na awarie, włamania i błędy obsługi Dostępne Zabezpieczone przed niepowołanym dostępem Tanie i automatyczne
Dziękuję za uwagę!