Ile w ilości jest jakości? Pięćlat inwentaryzacji usług Czyli dlaczego dążymy do 100%

Wielkość: px
Rozpocząć pokaz od strony:

Download "Ile w ilości jest jakości? Pięćlat inwentaryzacji usług Czyli dlaczego dążymy do 100%"

Transkrypt

1 Ile w ilości jest jakości? Pięćlat inwentaryzacji usług Czyli dlaczego dążymy do 100% Departament Strategii i Analiz Rynku Telekomunikacyjnego Zespół Wydziału Analiz Hurtowych KFS

2 Agenda Zakres danych Spojrzenie wstecz czyli skąd wyszliśmy i gdzie jesteśmy Fakty i mity o inwentaryzacji Referencyjne zbiory danych geoadresowych Jakość danych wejściowych Proces kontroli, poprawy i wzbogacania danych Zastosowanie danych

3 Zakres danych Dane o ZAKOŃCZENIACH SIECI I USŁUGACH w ramach inwentaryzacji pokrycia istniejącąinfrastrukturątelekomunikacyjnąi publicznymi sieciami telekomunikacyjnymi zapewniającymi lub umożliwiającymi zapewnienie szerokopasmowego dostępu do Internetu oraz budynkami umożliwiającymi kolokację Kluczowe dane Adresy i współrzędne geograficzne Oferowane usługi na zakończeniu sieci Maksymalna oferowana przepustowość Liczba klientów z pakietem usług Technologia dostępowa Zakończenia i usługi w 2014 w liczbach Podmioty Zakończenia sieci Usługi - liczba rekordów Usługi - liczba klientów

4 Czyli od TXT poprzez XLS i XML i z powrotem do CSV Spojrzenie wstecz czyli skąd wyszliśmy i gdzie jesteśmy 2010 Dane o usługach z nieobowiązkowym TERYT (pliki TXT, UTF-8 z ) Problemy z przekazywaniem danych: Wykorzystywanie kilku kanałów równolegle i wysyłanie wielokrotnie różnych plików Nietrzymanie standardów nazewnictwa plików Błędna struktura: Błędna struktura plików : zamiany kolumn, wstawianie dodatkowych kolumn, usuwanie wymaganych kolumn, stosowanie różnych rozdzielaczy kolumn niezgodnych ze specyfikacją lub brak rozdziału kolumn, Zmienna liczba kolumn lub ich kolejności dla poszczególnych wierszy. Błędy struktury wewnętrznej zostały poprawione w przypadku ponad 2000 plików

5 Czyli od TXT poprzez XLS i XML i z powrotem do CSV Spojrzenie wstecz czyli skąd wyszliśmy i gdzie jesteśmy 2010 Dane o usługach z nieobowiązkowym TERYT (pliki TXT, UTF-8 z ) Nieprawidłowe strony kodowe Stosowanie innych kodowań niż UTF-8. Stosowanie różnych stron kodowych w ramach tego samego pliku. Błędy w konwersji stron kodowych w trakcie przygotowywania danych, w efekcie polskie znaki diakrytyczne były zamieniane na: inne znaki lub litery łacińskie. Łódź = d Nieprawidłowe przypisanie identyfikatorów Teryt Błędne kody TERC Błędne kody SIMC Błędne kody ULIC Wyniki zgodności danych PT z TERYT po czyszczeniu 99,71% dla SIMC 98,21% dla SIMC + ULIC

6 Czyli od TXT poprzez XLS i XML i z powrotem do CSV Spojrzenie wstecz czyli skąd wyszliśmy i gdzie jesteśmy 2010 Dane o usługach z nieobowiązkowym TERYT (pliki TXT, UTF-8 z ) Błędy wykryte przez reguły poprawności Brak własności infrastruktury Brak technologii dostępu Brak pakietu usług Brak informacji o przepustowości łącza Nieprawidłowe prędkości Brak liczby klientów w budynku Nieprawdziwe liczby klientów w budynku Doświadczenia przeniesione do SIIS Wprowadzenie obowiązkowych identyfikatorów Teryt TERC dla gmin, SIMC dla miejscowości, ULIC dla ulic, Wprowadzenie wymogu uzupełniania obowiązkowych pól Sprawdzanie zgodności pól słownikowych

7 Czyli od TXT poprzez XLS i XML i z powrotem do CSV Spojrzenie wstecz czyli skąd wyszliśmy i gdzie jesteśmy 2010 Dane o usługach z nieobowiązkowym TERYT (pliki TXT, UTF-8 z ) 2011 SIIS 1.0 Problemy z generacjąi przetwarzaniem XML Awaryjne przetwarzanie plików XLS Dane czyszczone w systemie SDQ 2011 SIIS 1.0 Problemy z XML Duże problemy z wydajnością Dane w SIIS wprowadzane manualnie Wiele kanałów dostarczenia danych powoduje niejednoznaczności (różne daty, różne zawartości) Dane czyszczone offline w SDQ systemie do czyszczenia danych

8 Czyli od TXT poprzez XLS i XML i z powrotem do CSV Spojrzenie wstecz czyli skąd wyszliśmy i gdzie jesteśmy 2010 Dane o usługach z nieobowiązkowym TERYT (pliki TXT, UTF-8 z ) 2011 SIIS 1.0 Problemy z generacjąi przetwarzaniem XML Awaryjne przetwarzanie plików XLS Dane czyszczone w systemie SDQ 2012 Generator XML Dopuszczenie plików CSV 2012 SIIS 2.0 Czyszczenie danych w UKE Zamiast nazw miejscowości podawane były nazwy miejscowości z placówką pocztową Nadużywanie 99998

9 Czyli od TXT poprzez XLS i XML i z powrotem do CSV Spojrzenie wstecz czyli skąd wyszliśmy i gdzie jesteśmy 2010 Dane o usługach z nieobowiązkowym TERYT (pliki TXT, UTF-8 z ) 2011 SIIS 1.0 Problemy z generacjąi przetwarzaniem XML Awaryjne przetwarzanie plików XLS Dane czyszczone w systemie SDQ 2012 Generator XML Dopuszczenie plików CSV 2013 Moduł reguł poprawności Problemy z duplikacją danych Implementacja systemu do czyszczenia danych w UKE DART 2013 SIIS 3.0 Wprowadzenie modułu reguł poprawności danych w trakcie inwentaryzacji powoduje generację dużej liczby ostrzeżeń o błędach Dogrywanie kolejnych wersji plików z danymi w efekcie duplikacja danych w SIIS Dane z poprzedniej inwentaryzacji nieaktualizowane przez przedsiębiorców UKE wdraża system czyszczenia danych pozyskanych w trakcie inwentaryzacji Problemy z danymi referencyjnymi punktów adresowych GUS NOBC GUGIK PESEL

10 Czyli od TXT poprzez XLS i XML i z powrotem do CSV Spojrzenie wstecz czyli skąd wyszliśmy i gdzie jesteśmy 2010 Dane o usługach z nieobowiązkowym TERYT (pliki TXT, UTF-8 z ) 2011 SIIS 1.0 Problemy z generacjąi przetwarzaniem XML Awaryjne przetwarzanie plików XLS Dane czyszczone w systemie SDQ 2012 Generator XML Dopuszczenie plików CSV 2013 Moduł reguł poprawności Problemy z duplikacja danych Implementacja systemu do czyszczenia danych w DART UKE 2014 Nowe rozporządzenie Ograniczenia kanałów komunikacji Informacja podsumowująca Wyraźne efekty reguł poprawności 2014 SIIS 4.0 Ograniczenie kanałów komunikacji wyłącznie do SIIS znacząco niweluje poziom błędów Wprowadzenie informacji podsumowującej Atomowość ładowania danych Reguły poprawności dająefekt w postaci lepszej jakości danych adresowych od PT Nadal problem z wiarygodnościąinformacji od małych PT Nadal zdarzają się duże błędy kluczowym PT Znaczne błędy pomiędzy adresami a współrzędnymi geograficznymi

11 Fakty i mity o inwentaryzacji Czyli informacja z trzepaka bardziej wiarygodna niż instrukcja i rozporządzenie MIT Można agregować wiele różnych elementów do jednego węzła Można agregować klientów do serwerowni, a stacje bazowe WIFI wskazać jako zakończenia sieci Nie trzeba wykazywać infrastruktury dla sieci ETH i WiFi Nie trzeba wykazywać punktów adresowych w których świadczone są usługi z wykorzystaniem sieci WiFi lub ETH UKE żąda przekazywania danych z dokładnością do lokalu mieszkalnego FAKT Do jednego węzła można agregować elementy sieci aktywnej w jednej wspólnej lokalizacji Klienci i ich usługi musząbyćwykazani na zakończeniach sieci, a więc w konkretnych punktach adresowych Dla sieci ETH zbudowanej na kablach miedzianych gdy w domu klienta jest zainstalowane urządzenie operatora (np. switch) taki budynek musi być wykazany jako zasięg sieci ETH o ile pomiędzy routerem a switchem nie następuje zmiana medium np., z FO na Cu Inwentaryzacji podlegają wszystkie zakończenia sieci niezależnie od technologii dostępowej. W przypadku technologii mobilnej może być to adres korespondencyjny Nigdy nie było takiego oczekiwania. Dane o zakończeniach sieci przekazujemy z dokładnością do punktu adresowego, a więc numeru porządkowego budynku

12 Czyli jest nieźle choć mogłoby być jeszcze lepiej TERYT (GUS) Jednoznaczny podział administracyjny RP Jednoznaczna identyfikacja miejscowości w Polsce Jednoznaczna identyfikacja ulicy Nazwa miejscowości lub jej części Liczba wystąpień na terenie RP Stara Wieś 437 Podlesie 341 Nowa Wieś 317 Piaski 275 Góra 268 Kolonia 264 Dół 231 Dąbrowa 214 Krotność występowani a nazwy w RP Referencyjne dane o punktach adresowych Liczba miejscowości podstawowych Liczba miejscowości podstawowych i części miejscowości powyżej SIMC MIEJSCOWOŚĆ ULIC CECHA NAZWA_1 NAZWA_ Wieliczka pl. Kościuszki Wieliczka os. Kościuszki Tadeusza Wieliczka ul. Kościuszki Tadeusza Łódź-Górna pl. Reymonta Władysława Stanisława Łódź-Górna ul. Reymonta Władysława Łódź-Górna park Reymonta im. Władysława Sulechów park Powstańców Wielkopolskich Sulechów rondo Powstańców Wielkopolskich Sulechów ul. Powstańców Wielkopolskich

13 Czyli jest nieźle choć mogłoby być jeszcze lepiej TERYT (GUS) Jednoznaczny podział administracyjny RP Jednoznaczna identyfikacja miejscowości w Polsce Jednoznaczna identyfikacja ulicy Problemy Problemy z jakością danych Brak efektywnego śledzenia zmian nazw ulic (tylko dodaj usuń dla ulic) Referencyjne dane o punktach adresowych MIEJSCOWOŚ SIMC ULIC Cecha Nazwa_1 Nazwa_2 Ć Żary ul. Baczyńskiego K. K Żary ul. Baczyńskiego K Gołdap os. Młodych Gołdap os. Osiedle Młodych ULIC CECHA NAZWA_ pl lecia pl. Plac 1000-lecia al. Aleje Jerozolimskie al. Jerozolimskie al. Jana Pawła II al. Aleje Jana Pawła II al. Aleja Jana Pawła II ul. Aleja Jana Pawła II SIMC MIEJSCOWOŚĆ ULIC ULICA Praga-Północ al. "Solidarności" Praga-Północ ul. Aleja "Solidarności" Praga-Północ Aleja "Solidarności"

14 Referencyjne dane o punktach adresowych Czyli jest nieźle choć mogłoby być jeszcze lepiej PESEL (WSW) Lista punktów adresowych dla budynków mieszkalnych wraz z informacjąo wiekowaniu mieszkańców NOBC (GUS) Lista punktów adresowych dla budynków mieszkalnych wraz z informacjąo liczbie lokali mieszkalnych Brak współrzędnych geograficznych LP. Nazwa pola Opis pola 0 ID_Tech_Budynku numer techniczny budynku wspólny dla zbiorów danych ze stanami na dzień 1 WOJ symbol województwa 2 POW symbol powiatu 3 GMI symbol gminy 4 RODZ symbol rodzaju gminy 5 REJON numer rejonu statystycznego 6 OBWOD numer obwodu spisowego w rejonie 7 SYM_MIEJ identyfikator miejscowości 8 NAZWA_MIEJ nazwa miejscowości 9 SYM_UL identyfikator ulicy 10 NAZWA_UL nazwa ulicy w pełnym brzmieniu 11 CECHA określenie ulicy 12 NAZWA_1 częśćnazwy ulicy począwszy od słowa, które decyduje o pozycji nazwy ulicy w układzie alfabetycznym, aż do końca nazwy 13 NAZWA_2 pozostała część nazwy ulicy lub pole puste 14 DOD_A dodatkowa informacja ułatwiająca identyfikację budynku w terenie 15 NR_DOMU numer porządkowy nieruchomości (nr domu) 16 NRB_NIER numer budynku na nieruchomości 17 ID_NRB_NIER 18 NR_BUD_WA pole wypełnione tylko dla budynków na tej samej nieruchomości, jest to ID nieruchomości (z bazy NOBC) to samo dla wszystkich budynków na tej nieruchomości pole wypełnione tylko dla budynków wieloadresowych, jest to ID budynku wieloadresowego (z bazy NOBC) to samo dla wszystkich adresów tego samego budynku 19 RODZ_B rodzaj budynku (1 mieszkalny, 2 niemieszkalny, 3 z obiektem zbiorowego zakwaterowania, 0 obiekt prowizoryczny) 20 L_MIESZK liczba mieszkań znajdujących się pod danym adresem budynku 21 L_MIESZK_ZAM liczba mieszkań zamieszkanych znajdujących się pod danym adresem budynku 22 L_MIESZK_NIEZAM 23 STAN_NA liczba mieszkańniezamieszkanych, znajdujących siępod danym adresem budynku

15 Referencyjne dane o punktach adresowych i GEO Czyli było bardzo źle, jest źle ale kiedyś będzie lepiej GUGIK TBD GUGIK PRG

16 Referencyjne dane o punktach adresowych i GEO Czyli jak bardzo jest źle z geokodwaniem adresów i dlaczego GUS NOBC GUGIK PRG % PUNKTÓW % ADRESOWYCH Z NOBC Z NOBC MIEJSCOWOŚĆ SIMC MIEJSC W SYM_UL ROZPIĘTOŚC NAZWA_UL W NR WOJEWÓDZTWO GMINA SIMCPOSIADAJĄCYCH LICZBA LICZBA BEZPOŚREDNI PUNKTÓW DANYCH % GUGIK KM OpoleLICZBA PUNKTÓW ODPOWIEDNIK Ulica Budowlanych W ADRESOWYCH PRG W PRG GUGIK GUGIK15 DOPASOWANIA 02 Horodło DOLNOŚLĄSKIE Opole OpoleGMIN ADRESOWYCH Ulica Major 0% DOPASOWANYCH a 62% 902 ""Hubala"" 16D Z NOBC DO PRG 04 KUJAWSKO-POMORSKIE Konin W NOBC Ulica Kazimierza 0% 82% PRG Kąkolewnica Kędzierzyn-Koźle LUBELSKIEOpole 0% 90% 9 Wierzyńskiego 08 Świdnik LUBUSKIE 0% Przemyśl -10% % 82% Mińsk ŁÓDZKIE Opole Ulica Grudzicka Mazowiecki 0% 88% 33 Pięćmorgi % -20% Dobrzeń MAŁOPOLSKIE Wielki Konin % 71% 8 Podzamcze % MAZOWIECKIE Istebna -30% Konin % 72% Łódź OPOLSKIE Dzierżoniów Konin % 25% % -40% Bełchatów PODKARPACKIE Komprachcice 0% 79% Konin PODLASKIE 40%- Lipowa 50% % 88% Kamieńsk POMORSKIE Konin Łubniany 0% 74% % - 60% Brodno ŚLĄSKIE Kłodzko Konin % 60% % - 70% ŚWIĘTOKRZYSKIE Turawa Konin 0% 67% 45 Sułkowice % WARMIŃSKO-MAZURSKIE Dąbrowa -80% Konin % 81% % WIELKOPOLSKIE Nowa -90% Ruda Konin % 74% ZACHODNIOPOMORSKIE Garwolin 0% 85% % Konin 20 RAZEM -100% % Konin 43

17 Proces kontroli, poprawy i wzbogacania danych Czyli co robimy aby za ilością szła również jakość Przygotowan ie danych Przedsiębiorca SIIS UKE Systemy PT Generator Wstępna walidacja danych NDDO Walidacja formalna Zgodnośćz rozporządze -niem Raport z ładowania Wstępna walidacja poprawności Reguły poprawności Raport reguł poprawności Proces kontroli, poprawy i wzbogacania danych w UKE Standaryzacja Mapowanie Analiza poprawności Oznaczanie danych niepoprawnych Wzbogacani e Wezwania do PT Wniosek o kontrolę PT Import do bazy raportowej

18 Moduł Reguł Poprawności Wywołania regułzaraz po załadowaniu plików i na żądanie użytkownika zamiast raz na dobę Poprawa wydajności reguł Eliminacja nadmiarowości raportowania ostrzeżeń Usunięcie niektórych regułpo analizie wyników Dodanie nowych reguł Zgrupowanie podobnych regułdo jednej o ile było to możliwe Ponad 30 regułpoprawności w 4 grupach Wprowadzamy bardziej aktywny model komunikacji w trakcie inwentaryzacji

19 Jakośćdanych wejściowych Największym problemem jakościowym jest poprawność adresów

20 Nazwy ulic operatorów pojedynek marszałek kontra noblistka Przykłady oryginalnej pisowni nazw ulic z danych operatorów Al. Marszalka Pilsudzkiego Józefa Piłsudzskiego c. sklodowskiej N:MARIICURIE SKŁODOWSKIEJ al. marszala pilsudskiego Józefa Piłsuskiego Curie Sdkłodowskiej N:MC SKŁODOWSKIEJ al. marszalka pilsudskiego Maeszalka Pilsudskiego Curie Sklodowska N:M-C Skłodowskiej Al.Józefa Pilusdskiego Maraszalka Pilsudskkiego Curie Sklodowskiej Marii Plac N:SKLODOWSKIEJ-CURIE Al.M.J. Pilsudskiego Marsz. Pilsudskiego M C Skłodwskiej N:SKŁODOWSKIEHJ Al.Marsz.Józefa Pilsudskego Marsz J Piłsudzkiego M Skłodowskiej - Curre NN-OSIEDLE M.C.SKŁODOWSKIEJ Al.Marszalka J.Pilsudskiego Marsz Piłsudkiego M.C., Sklodowskiej NN-OSIEDLE SKŁODOWSKIEJ Al.Marszalka Józefa Marszalka Jozefa Marii Curii Sklodowskiej sklodowskiej Pilsudskiego Al.Marszalka Pilsudskiego Marszalka Poilsudskiego Marii Cury Sklodowskiej Sklodowskiej Curie Marii Al.Pilduskiego Marszałka Józefa Piłsudskiego Marii Skladowskiej Curie Składowskiej aleja józefa pilsudskieg Marszałka Piłsudkiego marii sklowskiej curie Skłodowska Aleja Józefa Pilsudzkiego Marszałka Piłsudskiego N:C.SKŁODOWSKIEJ Skłodowskiej Aleja Józefa Piłsudskiego Marszałka Piłsudzkiego N:CURI SKŁODOWSKIEJ Skłodowskiej - Curkie Aleja Marszalka J. Pilsudskiego N:Al. J. PIŁSUDSKIEGO N:CURIE - SKŁODOWSKIEJ Skłodowskiej Cirie Brzeziny Ul. Marsz.J.Pilsudzkiego Bulwary Marszalka Pilsudskieg N:AL.M.PIŁSUDSKIEGO267 N:CURIE SKŁODOWSKA Skłodowskiej-Curie N:MARSZAŁKA PIŁSUDSKIEGO, AL N:M C SKŁODOWSKIEJ Mapowanie ulic z kodami na TERYT Ul.C.Sklodowskiej Bulwary Marszalka Pilsudskiego N:PIŁSODSKIEGO 22 N:M. SKŁODOWSKIEJ CURIE Ul.Marii Curie-Sklodoeskiej duzy im.j.pilsudskiego N:PIŁSUCKIEGO N:M. SKŁODOWSKIEJ-CURIE Ul.Sklodowdkiej Curie im. marsz. Józefa Piłsudskiego N:PIŁSUDDKIEGO N:MARI SKŁODOWSKIEJ CURIE Ul.Sklodowskiej józefa pilssudskiego N:PIŁSUDKIEGO N:MARII C.SKŁODOWSKIEJ Ul.Sklodowskiej Curie

21 Proces Jakości Danych wyniki końcowe 26 algorytmów standaryzacji i dopasowania nazw ulic operatorów do nazw ulic słownikowych Kontekstowa poprawa nazw ulic i miejscowości Uwzględnienie zmian nazw ulic z lat poprzednich Zastosowanie algorytmów odległości edycyjnej Levenshteina i Jaro-Winklera wyniki przybliżeńweryfikowane manualnie 17 algorytmów standaryzacji i dopasowania numerów porządkowych Ponad 1500 mapowańwartości inne na wartości słownikowe bazy raportowej Kontekstowe dopasowanie pakietów usług w obrębie technologii 99,84% zgodności na poziomie ulic 90,43% zgodności na poziomie budynków Nazwa po standaryzacji Liczba unikalnych nazw ulic PIŁSUDSKIEGO 437 CURIE-SKŁODOWSKIEJ 415 WYSZYŃSKIEGO 269 WOJSKA POLSKIEGO 216 KOŚCIUSZKI 206 JANA PAWŁA II 188 SIKORSKIEGO 171 DĄBROWSKIEGO 164 GROTA ROWECKIEGO 147 MICKIEWICZA 146 SŁOWACKIEGO 133 SOBIESKIEGO 128 SIENKIEWICZA 126 WESTERPLATTE 117 ARMII KRAJOWEJ 113 HALLERA 112 KONSTYTUCJI 3 MAJA 107 JAGIEŁŁY 107 CHROBREGO 105 KONOPNICKIEJ 99 Nazwa ulicy Dąbkowskiego Dąbkowskiego Nazwa Teryt ul. Jarosława Dąbrowskiego ul. Gen. Mieczysława Dąbkowskiego Jaro- Winkler Levens htein

22 Dane Orange znacząco wpływają na jakość wszystkich danych Zgodnośćpunktów adresowych zakończeńsieci z rejestrami państwowymi

23 Zgodnośćzakończeńsieci z referencyjnąbaząpunktów adresowych dla województw Zgodnośćpunktów adresowych zakończeńsieci z rejestrami państwowymi TERC Obszar % Przed % Po Polska 79% 90% 02 dolnośląskie 82% 92% 04 kujawsko-pomorskie 83% 92% 06 lubelskie 83% 92% 08 lubuskie 81% 90% 10 łódzkie 80% 90% 12 małopolskie 79% 93% 14 mazowieckie 78% 91% 16 opolskie 72% 85% 18 podkarpackie 67% 92% 20 podlaskie 85% 93% 22 pomorskie 81% 91% 24 śląskie 77% 88% 26 świętokrzyskie 81% 91% 28 warmińsko-mazurskie 81% 93% 30 wielkopolskie 79% 86% 32 zachodniopomorskie 81% 93%

24 Wypełnienie pól INNE nie niesie niejednokrotnie żadnej użytecznej informacji Mapowanie na wartości z bazy raportowej Wypełnienie pól INNE nie niesie niejednokrotnie żadnej użytecznej informacji Weryfikacja kontekstowa poprawności i mapowanie Medium + technologia Technologia + pakiet usług Technologia + przepustowość.. Kategoria Liczba unikalnych wartości PRZED czyszczeniem Liczba unikalnych wartości PO do raportowania Własność 39 9 Technologia Pakiet usług Przepustowość Popularne wartości dla pola INNE dla pakietów INNY inne -jakie? INNY Inne usługi INNY 1 INNY 0 PRZYKŁADY BŁĘDÓW MEDIUM TECHNOLOGIA RADIOWE ADSL2+ RADIOWE KABEL TAK -DLA MEDIUM RADIOWE ŚWIATŁOWODOWEGO, MIEDZIANEGO LUB RADIOWEGO WSPÓŁOSIOWE MIEDZIANE EURODOSIS - WIFI WSPÓŁOSIOWE MIEDZIANE WIFI - 2,4 GHZ PAROWE MIEDZIANE ZALEZNIE OD POTRZEB KLIENTA PAROWE MIEDZIANE NIE ŚWIATŁOWODOWE WIFI 5 GHZ ŚWIATŁOWODOWE ŚWIATŁOWODOWA I MIEDZIANA INNE - JAKIE? INNA UZUPEŁNIĆ INNA ETHERNET, WLAN, FO INNA MIEDZANE INNA TECHNOLOGIA WIFI 2,4 GHZ WIFI 5 GHZ WIFI 5 GHZ WIFI 2,4 GHZ WIFI 2,4 GHZ WIFI Standaryzacja i mapowania na wartości raportowe PAKIET ATV DTV_ATV WIFI DZIERŻAWA WŁÓKNA DOSTĘP DO SIECI SZKOLNEJ I INTERNETU INTERNET BEZPRZEWODOWY

25 Przykłady zidentyfikowanych nieprawidłowości Czyli błędne id miejscowości i nieprawdziwe dane o liczbie klientów na zakończeniu Punkty adresowe Nieprawidłowe przypisanie ulicy z kodem do miejscowości, w której taka ulica nie istnieje. Ulica taka istnieje w miejscowościach przyległych na terenie tej samej gminy Błędne przypisanie SIMC miejscowości o identycznej nazwie (PNA, ulica, węzeł dostępowy) Kod w miastach Nr porządkowe = 1,3,5,7,9, Nieprawidłowa liczba klientów w punkcie adresowym Operatorzy Widok stworzony z wykorzystaniem Google Maps podlega warunkom korzystania z usług Google. Widok stworzony z wykorzystaniem Google Maps podlega warunkom korzystania z usług Google.

26 Przykłady zidentyfikowanych nieprawidłowości Czyli rozbieżności pomiędzy adresami a podanymi współrzędnymi Geo Światowe metropolie według Geo Punkty skupienia Geo operatorów np. : Punkt G1 8 województw 15 powiatów 18 gmin i miejscowości Punkt G2 863 adresy z 27 miejscowości i 6 powiatów w jednym miejscu Odległości pomiędzy adresami a danymi Geo Województwo Powiat Gmina SIMC Miejscowość Województwo Powiat Gmina SIMC Miejscowość małopolskie Top 10 światowych wadowicki Andrychów metropolii według Andrychów zachodniopomo danych Geo PT goleniowski oświęcimsk Nowogard Nowogard rskie śląskie Kęty Inwałd i wielkopolskie kępiński Kępno Rozpiętość Kępno w km wg małopolskie Miejscowość nowotarski Nowy krakowski Skawina SIMC Targ Roczyny suski Osiek Skawina danych Sułkowice geo PT śląskie Kraków Sucha Kraków Kraków żywiecki Święciecho Bulowice podkarpackie leszczyński Beskidzka Trzebiny Świnoujście bielski Wadowice wa Kęty 556 Łaziska podlaskie mikołowski Wieprz Łaziska Malec Górne Darłowo Czernichów Górne Nowa Wieś 521 ropczycko- Sędziszów mazowieckie Kozy Sędziszów Witkowice Małopolski Szczecin sędziszowski Porąbka Małopolski Nowy Targ 517 dolnośląskie sławieński Wilamowice Sławno Rzyszczewo Głębowice Suwałki Sławno Tychowo Osiek Szczecin Darłowo Darłowo Sucha Beskidzka Sławno Jeden Świnoujście z tajemniczych Sławno Punktów Sławno Wadowice wodzisławski skupienia Szczecin Geo Szczecin Gierałtowiczki 863 adresy na Rzyszczewo Tychy Suwałki identycznych Suwałki Gierałtowice 505 Tychowo współrzędnych wołomiński Świnoujście Świnoujście Wieprz 501 Wrocław Tychy Tychy Widok Nowogard stworzony z Wodzisław wykorzystaniem Kozy Google Maps Wodzisław Śląski 499 Śląski Bujaków podlega warunkom korzystania z usług CzaniecGoogle. Suwałki Zielonka Zielonka 491 Wrocław Międzybrodzie Bialskie Kobiernice Wrocław Porąbka Hecznarowice Pisarzowice Mieroszyno Kraków Wilamowice Zasole Bielańskie

27 Wykorzystanie danych Do czego służą zebrane dane? 1. Wyznaczenie obszarów dla działania Analizy dostępności infrastruktury szerokopasmowej 3. Analizy udziałów różnych technologii dostępowych 4. Analizy konkurencyjności 5. Informacja publiczna 6. Analizy świadczenia usług dostępu do Internetu bez pobierania opłat dla gmin

28 Wykorzystanie danych Do czego służą zebrane dane? 1. Osiągniecie celów POPC 2. Informacja publiczna 3. Decyzje regulacyjne 4. Model interwencji w nowej perspektywie 5. Uzupełnienie i poprawa baz GUGIK/GUS 6. W planach realizacja portalu o dostępności usług szerokopasmowych

29 Wykorzystanie danych Dostępność 30Mbps

30 Podsumowanie 90% poprawności dla Polski może oznaczaćblisko 0% poprawności na terenie wielu powiatów i setek gmin Wysiłek wkładany przez PT w zakresie podnoszenia jakości danych z roku na rok jest widoczny, ale widzimy dalej miejsce na poprawę Dane są coraz lepsze choć niektórzy duzi operatorzy się pogorszyli Będziemy dążyć do ściślejszej kontroli danych wejściowych Będziemy dążyć do eliminacji przypadków przekazywania nieprawdziwych danych