Anonimizacja danych osobowych użytkowników serwisów Jak wybrać 45 najlepszych internetowych prezentacji na FORUM? Joanna Komuda, Ewa Kurowska-Tober IAB Polska DLA Piper
Konkurs Netflix Prize, październik 2006 Cel konkursu Narzędzia pracy Uczestnicy stworzenie systemu rekomendacji lepszego o 10% od tego zbudowanego przez Netflix (Cinematch) zbiór zanonimizowanych danych zawierający ponad 1 mln ocen na temat prawie 18 tys. filmów, które w serwisie Netflix umieściło prezentacji na na ok. 0,5 miliona FORUM? użytkowników, a więc nazwa użytkownika, tytuł filmu, data oceny, ocena filmu (w skali od 1 do 5) każdy, z wyjątkiem osób powiązanych z Netflix Nagroda 1.000.000 $
Wygrani i przegrani 5.169 drużyn zgłosiło 44.014 "prac konkursowych" 2007 r. dwójka naukowców z University of Texas - ArvindNarayanan i VitalyShmatikov ogłasza, że dane udostępnione uczestnikom konkursu można zde-anonimizować wg. naukowców prawdopodobieństwo identyfikacji konkretnej osoby sięgało 96 %!
Anonimizacja danych co to takiego? brak definicji ustawowej pozbawienie danych wystarczającej liczby elementów, tak aby za pomocą wszystkich sposobów, jakimi może posłużyć się administrator danych lub osoba trzecia nie było już możliwości prezentacji na na (motyw 26 Dyrektywy FORUM? 95/46/WE) zidentyfikowania osoby, której dane dotyczą proces, w którym informacje umożliwiające identyfikację osoby są nieodwracalnie zmienione w taki sposób, aby nie istniała już możliwość bezpośredniego lub pośredniego zidentyfikowania (ISO 29100:2011)
Po co w ogóle anonimizować dane? większe bezpieczeństwo informacji obowiązek prawny czerpanie korzyści "dla dobra ogółu" dalsze wykorzystywanie zanonimizowanych danych, np. profilowanie, analizy big data obrót bazami danych
Techniki anonimizacji danych i najczęstsze błędy prawo skupia się wyłącznie na wyniku samego procesu, a nie na jego przebiegu Jak Jak wybrać 45 45 wybrane techniki anonimizacji: najlepszych o randomizacja prezentacji (dodawanie zakłóceń, na na FORUM? permutacja, prywatność różnicowa) o uogólnianie (agregacja i k-anonimizacja, l-dywersyfikacja / t- bliskość) anonimizacja a pseudonimizacja
Kiedy anonimizacja danych będzie zgodna z prawem? czy anonimizacja stanowi przetwarzanie danych osobowych? konieczność a użyteczność anonimizacji Jak Jak wybrać 45 45 anonimizacja danych a prawa osób, których najlepszych dane dotyczą wykorzystanie zanonimizowanych prezentacji na danych na FORUM? dobre praktyki anonimizacji danych (elementy kontekstowe i techniczne)
Możliwość de-anonimizacji czy w dzisiejszych czasach jest w ogóle możliwa bezpieczna "anonimizacja" danych? możliwość potencjalnej identyfikacji zanonimizowanych danych aktualny stan technologii i czynniki ryzyka: wyodrębnienie możliwość tworzenia powiązań wnioskowanie Ryzyka związane z wykorzystaniem zanonimizowanych danych!
A co jeśli anonimizacja się nie powiedzie? sankcje przewidziane w ustawie o ochronie danych osobowych odpowiedzialność karna odpowiedzialność administracyjna kodeks cywilny naruszenie dóbr osobistych
RODO a anonimizacja brak definicji wyłączenie stosowania RODO do danych zanonimizowanych (motyw 26 Rozporządzenia) istotny nacisk położono na pseudonimizację oraz szyfrowanie danych nowe zasady privacy by design oraz privacy by deafult a anonimizacja wysokie sankcje za nieprzestrzeganie przepisów Rozporządzenia
Dziękuję za uwagę Ewa Kurowska-Tober Partner kierująca praktyką IPT Jak Jak wybrać 45 DLA Piper 45 najlepszych T: +48 22 540 7412 F: +48 22 540 7474 ewa.kurowska-tober@dlapiper.com