Problem jakości danych

Wielkość: px
Rozpocząć pokaz od strony:

Download "Problem jakości danych"

Transkrypt

1 Problem jakości danych Żyjemy w epoce informacji, w której dane są jednym z najcenniejszych towarów. Korporacje, urzędy, szkoły, praktycznie każdy rodzaj działalności człowieka zależy w jakiś sposób od systemów informatycznych i danych przez nie gromadzonych. Koszty związane z posiadaniem danych niskiej jakości są ogromne, a zapobieganie temu zjawisku wydaje się zasadne. Potwierdzeniem może być przypadek firmy naftowej Amec, która szacuje oszczędności poczynione dzięki poprawie jakości swoich danych, na około milion funtów. Zastanawia fakt niewielkiego zainteresowania przedsiębiorstw tego rodzaju oszczędnościami, w szczególności wśród międzynarodowych korporacji. Dodatkowo, na rynku praktycznie brak jest ofert rozwiązań służących do zarządzania jakością danych skierowanych do firm średniej wielkości.

2 Problem jakości danych Wirusy komputerowe spowodowały w 2003 roku straty na kwotę 55 miliardów dolarów[1] Roczne straty wynikające z posiadania danych słabej jakości są szacowane na 611 miliardów dolarów dla przedsiębiorstw z samych Stanów Zjednoczonych [2]. Mimo to inwestycje w bezpieczeństwo ukierunkowane są przede wszystkim na zabezpieczenia przed atakami zewnętrznymi. Potrzeba ochrony posiadanych danych przed erozją wewnętrzną jest postrzegana jako marginalna.

3 Wg Redmana [3]. Definicje jakości danych Dane są wysokiej jakości jeżeli nadają się do użycia zgodnie z przeznaczeniem w zakresie działania, podejmowania decyzji i planowania. Dane nadają się do użycia zgodnie z przeznaczeniem, jeżeli nie zawierają defektów i posiadają pożądane cechy. Data are of high quality if they are fit for their intended uses in operations, decision-making, and planning. Data are fit for use if they are free of defects and possess desired features.

4 Cechy danych dobrej jakości dostępność możliwość wykorzystania; fakt występowania danych w postaci łatwej do przetworzenia, do których użytkownik ma dostęp oraz które są gotowe do wykorzystania nie później, niż z maksymalnie tolerowanym opóźnieniem, zrozumiałość możliwość łatwej interpretacji; czytelna charakterystyka danych w celu ich prawidłowego użycia, spójność i poprawność prawidłowość; przystawanie do rzeczywistych faktów, brak błędów i wzajemnych sprzeczności, kompletność występowanie wszystkich elementów, które w rzeczywistym świecie odpowiadają występującemu zakresowi faktów, użyteczność zgodność z oczekiwaniami; dopasowanie do potrzeb użytkownika i/lub realizowanego procesu biznesowego

5 Definicje jakości danych Tayi i Ballou [4] zauważają, że dane o wystarczającej jakości pewnych cech dla jednego zadania, mogą się okazać niedostatecznie dobre do innego celu. Jest to sygnał do tego, by podejść do zagadnienia jakości danych jako do problemu wielowymiarowego i wielowątkowego. Skoro te same dane mogą być jednocześnie dobrej i złej jakości z różnych punktów widzenia, to należałoby ustalić pewne kryteria bardziej dokładnej oceny jakości danych pod kątem różnych ich cech.

6 Definicje jakości danych Wang i Strong [5] opracowali 15 wymiarów jakości danych z perspektywy użytkownika danych. Podzielili je na cztery kategorie: wewnętrzną, dostępu, kontekstu reprezentacji. Taki podział został przyjęty i zastosowany w wielu firmach i agendach rządowych a jego przydatność potwierdzona została w licznych badaniach. Zmierzenie jakości danych pod kątem wszystkich 15 wymiarów jest jednak przydatne jedynie w teorii. Z praktycznego punktu widzenia nie ma sensu używać wszystkich wymiarów do oceny danych, a jedynie tych, które mają dla nas faktyczne jakieś znaczenie.

7 Kategorie i wymiary jakości danych Kategoria Wewnętrzna Dostępu Kontekstu Reprezentacji Wymiar dokładność, obiektywność, wiarygodność, reputacja dostępność, bezpieczeństwo dostępu relewancja, wartość dodana, aktualność, kompletność, ilość danych interpretowalność, łatwość zrozumienia, zwięzłość, spójna reprezentacja Tabela. Kategorie i wymiary jakości danych [6]

8 Kategorie i wymiary jakości danych Tabela. Kategorie i wymiary jakości danych w oryginale

9 Kategorie i wymiary jakości danych Dokładność zakres w jakim dane są poprawne i odpowiadają rzeczywistości Obiektywność zakres w jakim dane są bezstronne i pozbawione tendencyjności Wiarygodność zakres w jakim dane postrzegane są jako prawdziwe i poprawne Reputacja zakres w jakim dane posiadają wysokie uznanie pod względem źródła lub zawartości Dostępność zakres w jakim dane są dostępne lub łatwe do uzyskania Bezpieczeństwo dostępu zakres w jakim dostęp do danych został ograniczony aby zapewnić ich bezpieczeństwo Relewantność zakres w jakim informacje zawarte w danych nadają się do stawianych im zadań Wartość dodana zakres w jakim wykorzystanie danych przyniesie wymierne korzyści

10 Kategorie i wymiary jakości danych Aktualność zakres w jakim dane są aktualne ze względu na potrzeby stawianych im celów Kompletność zakres w jakim dane zawierają wszystkie wymagane informacje, zarówno ilościowo jak i jakościowo, potrzebne do stawianych im celów Ilość danych zakres w jakim ilość danych wpływa na utrudnienie wykonania operacji na nich Interpretowalność zakres w jakim dane są zapisane w odpowiednim języku, przy użyciu odpowiedniej symboliki i z zachowaniem odpowiednich jednostek Łatwość zrozumienia zakres w jakim typowy użytkownik jest w stanie zrozumieć informacje zawarte w danych Zwięzłość zakres w jakim dane nie zawierają nadmiarowych i zbędnych informacji oraz nie zajmują w sposób nieuzasadniony dużo miejsca Spójna reprezentacja zakres w jakim dane przestawiane są w jednolity sposób

11 Problemy wewnętrznej jakości danych Rys. Model problemów związanych z wewnętrzną jakością danych [6]

12 Problemy wewnętrznej jakości danych Załóżmy, że nasze dane pochodzą z wielu źródeł. Każde z nich dostarcza niezależnie od siebie dane, w wyniku czego, powstają różnego rodzaju niezgodności. Odbiorca danych na samym początku nie bardzo jeszcze wie, z czego wynikają te niezgodności, wie tylko że one występują, co obniża w jego oczach wiarygodność danych. Ponadto, część wprowadzonych danych zależała od uznania operatorów mogły być to dane z zakresu dobry, średni, zły lub też inne, zalenie jedynie od uznania jednej osoby. Takie dane posiadają wątpliwą obiektywność, gdyż przyjmuje się, że dane nieinterpretowane posiadają z reguły wyższą jakość niż dane po interpretacji lub zakodowaniu. Z biegiem czasu, następuje weryfikacja dokładności danych, czego wynikiem jest zebranie informacji o przyczynach powstawania niezgodności w danych. Akumulacja negatywnych wyników badania dokładności owocuje złą reputacją dla mniej dokładnych źródeł danych. Dane o złej reputacji i niskiej dokładności nie posiadają prawie żadnej wartości dla ich odbiorcy i w związku z tym, dane przestają być używane

13 Problemy dostępności do danych Rys. Model problemów związanych z dostępnością do danych [6]

14 Problemy dostępności do danych Typ problemów (1) można łatwo zobrazować sytuacją pozbawienia dostępności do danych. Za przykład może posłużyć praca zdalna, gdzie użytkownik pracuje na danych znajdujących się na innym komputerze, które musi pobierać i przetwarzać u siebie, w sytuacji, gdy z powodów technicznych uszkodzeniu uległo łącze internetowe lub działające łącze jest obciążone w stopniu uniemożliwiającym pracę. Typ problemów (2) występuje w sytuacji, kiedy przechowywane dane mają charakter poufny. Wymagane jest wtedy zapewnienie bezpieczeństwa dostępu do nich. Jednak w sytuacji, w której każdorazowy dostęp do danych wymaga czasochłonnego uzyskania odpowiedniej autoryzacji, przestają być one traktowane jako dostępne. Problemy (3) mają miejsce, gdy przetworzone dane nabierają charakteru danych specjalistycznych, posługujących się specjalistycznym słownictwem, specyficznym sposobem zapisu bądź kodowania. W momencie, kiedy do interpretacji i zrozumienia danych potrzeba zaciągać opinii jednego lub więcej ekspertów, dane, podobnie jak w poprzednich przypadkach, tracą na dostępności.

15 Problemy dostępności do danych Typ (4) dotyczy przypadków, w których dane zawierają oprócz tekstu również wykresy, diagramy, skany itp. Ze względu na brak zwięzłości i konsystencji w reprezentacji danych nie można ich łatwo podsumować (np.: dysponując tysiącem zeskanowanych zdjęć rentgenowskich, nie można łatwo uzyskać odpowiedzi na pytanie ilu pacjentów ma zapalenie płuc). Typ (5) odnosi się do stanu rzeczy, w którym posiadamy ogromne ilości danych (np. hurtownia danych) i w momencie uaktualnienia ich nowymi danymi uzyskanie aktualnych wyników musi zostać poprzedzone długotrwałym procesem przetworzenia.

16 Problemy jakości danych wg Beckera Becker [6] odrzucił on wirtualne wymiary zaproponowane przez Wanga i Stronga i założył, że za jakość danych odpowiadają zjawiska odpowiedzialne za tworzenie błędów. Wymienił siedem typowych problemów jakości danych: Problemy powstałe w wyniku niepoprawnej konwersji danych Rozbieżności znaczeniowe pomiędzy bieżącymi i historycznymi danymi Te same dane posiadają wiele funkcji lub znaczeń Braki w danych Ukryte dane Niedostateczna dokładność Naruszenie zasad integralności danych

17 Błędy danych przestrzennych Kategoria Definicja Przykład Dokładność położenia Dokładność atrybutów Poziom dokładności położenia poziomego i pionowego w układzie współrzędnych Poziom błędów merytorycznych w danych Precyzja z jaką podawane są koordynaty Prawdopodobieństwo z którym jakość gleby w danym miejscu będzie się zgadzać z zapisem w danych Kompletność Poziom w jakim dane zawierają braki Ocena rozmieszczenia przestrzennego pewnych zjawisk może okazać się niemożliwa, jeśli nie dysponujemy danymi z jakiegoś obszaru Spójność logiczna Pochodzenie danych Poziom pojawiania się sprzecznych relacji w danych Poziom w jakim wszystkie dane posiadają chronologiczną zgodność Spójność logiczna nie będzie zachowana, jeżeli na przykład dla jednego obszaru badamy liczbę dokonanych przestępstw a dla drugiego liczbę zgłoszonych Problemem może się okazać fakt, że gdy chcemy zbadać jakieś zjawisko na przestrzeni lat, to okazuje się, że pomiary dla poszczególnych lat dokonywane były w różnych porach roku. Tabela. Pięć kategorii błędów dla Standardu Wymiany Danych Przestrzennych w USA [8 ]

18 Podsumowanie podejść do jakości danych Nie można zastosować jednego kryterium oceny do wszystkich możliwych sytuacji. W każdej sytuacji, gdy chcemy zbadać jakość danych potrzebna jest przede wszystkim głęboka analiza i poznanie charakteru danych oraz zapoznanie się z przeznaczeniem danych i procesów, jakim są one poddawane. Dopiero wtedy można dobrać odpowiednie do danej sytuacji wymiary, w jakich będziemy rozważać jakość danych. Zazwyczaj należy połączyć wybrane elementy kilku różnych podejść oraz zaproponować własne i stworzyć z nich nową koncepcję oceny jakości danych, tak aby jak najlepiej pasowała do danej sytuacji. Ponieważ nie istnieje jak na razie jedno uniwersalne kryterium ani jeden ustalony zbiór wymiarów, można śmiało eksperymentować.

19 Wymiary jakości danych (inny pogląd) W celu umożliwienia (bardziej) obiektywnej oceny jakościowej, wyróżniono cechy danych, które nie są zależne od procesu w którym są wykorzystywane, ani od oczekiwań konkretnego użytkownika, ale tkwią w nich samych : zgodność z definicją zgodność z intencją twórcy (np. naruszeniem tej własności jest występowanie uwag dotyczących sposobu spedycji towaru w polu klienta), zgodność ze źródłami rzeczywistymi i zastępczymi przystawanie do pośrednich (np. zgromadzonych na ręcznie prowadzonych dokumentach) oraz faktycznych (istniejących w rzeczywistym świecie) stanów (np. dane z inwentaryzacji magazynu w systemie odpowiadać powinny formie zastępczej, jaką są notatki osób weryfikujących bieżące stany towarowe, a przez to ilościom faktycznym), dokładność szczegółowość na ustalonym poziomie (np. sam rok urodzenia nie jest, w ogólności, wystarczający do ustalenia możliwości nabywania wyrobów alkoholowych),

20 Wymiary jakości danych (inny pogląd) kompletność ujęcie wszystkich obiektów rzeczywistych, których dotyczy ewidencja (np. złamaniem tej zasady jest brak ewidencji w systemie przeprowadzonej transakcji bankowej), brak duplikatów reprezentacja każdego obiektu świata rzeczywistego wyłącznie za pomocą jednego elementu (np. każdy obywatel powinien być zarejestrowany wyłącznie raz w bazie urzędu skarbowego, inaczej mógłby zostać poproszony o składanie kilku zeznań podatkowych rocznie), spełnianie reguł biznesowych poprawne względem ogólnie przyjętych norm i szczegółowych ustaleń właściciela i/lub twórcy systemu dotyczących ewidencji określonych faktów rzeczywistych (np. data przyjęcia do pracy nie może być wcześniejsza od momentu narodzin pracownika).

21 Klasyfikacja danych w kontekście występujących w nich problemów Analizując dane w aspekcie ich jakości, można podzielić je według rodzaju problemów w nich występujących [2]: dane prawidłowe (np. mieszkaniec Wrocławia wskazał Wrocław jako miejsce zamieszkania), dane poprawne ale nieprawdziwe (np. mieszkaniec Wrocławia wskazał Poznań jako miejsce zamieszkania), dane niepoprawne (np. mieszkaniec Wrocławia wskazał Jakościolandie II jako miejsce zamieszkania).

22 Klasyfikacja danych w kontekście występujących w nich problemów

23 Klasyfikacja defektów według analitycznych technik detekcji analiza wartości wykrywa błędy pojedynczych wartości, które nie należą do zadanej dziedziny, analiza strukturalna pozwala na wykrycie błędów wynikających ze struktury bazy danych w relacjach, w danych redundantnych i zdenormalizowanych, analiza reguł operujących na zależnościach danych pozwala na wykrycie złych kombinacji poprawnych danych poprzez zastosowanie stosownych reguł, które muszą być zawsze spełnione, analiza reguł operująca na wartościach danych pozwala wykryć błędy opierając się na agregacjach i rozkładach występujących wartości (np. zbyt częste występowanie różnych studentów przedstawiających się jako Józef Stalin na liście obecności, w stosunku do pozostałych). Oczywistym jest fakt, iż nie każdy defekt da się wykryć za pomocą technik analitycznych, stąd też możliwa jest klasyfikacja określona jako brak możliwości analitycznych wykrycia błędu.

24 Klasyfikacja defektów według budowy relacyjnych baz danych błąd wartości atrybutu gdy problem dotyczy wartości pojedynczego pola (np. zły format daty), błąd encji kiedy problem dotyczy zestawu atrybutów pojedynczego rekordu, ale niemożliwe jest wskazanie jednego atrybutu odpowiedzialnego za błąd (np. kwota brutto pozycji faktury nie jest sumą wartości netto i należnego podatku VAT), błąd tabeli kiedy problem dotyczy szeregu wierszy jednej tabeli, ale niemożliwe jest wskazanie jednego błędnego wiersza (np. naruszenie unikalności klucza, duplikaty rekordów, itd.), błąd bazy danych gdy problem wiąże się z danymi znajdującymi się w wielu tabelach (np. występowanie zagubionych pod-rekordów, bez rekordu nadrzędnego).

25 Rodzaje defektów występujących w systemach informatycznych Defekt Opis szczegółowy Przykład Klasyfikacja Powtórzona wartość domeny (synonimy) Różne sposoby określania tej samej cechy obiektów Płeć osoby określana literą K/M lub cyfrą 1,2. Powoduje to brak możliwości zestawienia wg płci. Dane prawidłowe (zła reprezentacja), analiza wartości, zakres atrybutu Brakujące wartości (puste) Brak określenia wymaganego atrybutu Brak informacji o roku studiów w podaniu o praktyki zagraniczne. Powoduje brak możliwości automatycznego kojarzenia dostępnych praktyk z sytuacją studenta. Dane nieprawidłowe (brakujące), analiza wartości, zakres atrybutu

26 Rodzaje defektów występujących w systemach informatycznych Defekt Opis szczegółowy Przykład Klasyfikacja Kontekstowe wykorzystanie atrybutu Wykorzystywanie jednego pola do przechowywania zamiennie różnych cech obiektu rzeczywistego Katalog klientów zawierać może zarówno firmy jak i osoby prywatne. Jeżeli jedno pole przechowywać będzie zależnie formę prawną lub drugie imię kłopotliwe będzie zestawienie obrotów klientów wg formy prawnej. Defekt ten występuje przede wszystkim w starszych systemach ze względów oszczędnościowych. Dane prawidłowe, analiza reguł operująca na wartościach danych, zakres atrybutu

27 Rodzaje defektów występujących w systemach informatycznych Defekt Opis szczegółowy Przykład Klasyfikacja Nieatomowe wykorzystanie atrybutu Wykorzystanie atrybutu niezgodne z założeniami pierwszej postaci normalnej przechowywanie wielu cech w jednym polu Przechowywanie listy numerów telefonów jako wartość pojedynczego pola uniemożliwia funkcje automatycznego wybierania lub identyfikacji rozmówcy (CLIP) Dane prawidłowe (zła reprezentacja),, analiza wartości, zakres atrybutu Wartości atrybutu spoza domeny Przypisanie nieprawidłowej wartości atrybutu, naruszając dopuszczalny zakres Podanie ujemnego wieku lub wieku w postaci słownej kiedy oczekiwano liczbowej uniemożliwia zagregowane przetwarzanie zbioru danych Dane nieprawidłowe, analiza wartości, zakres atrybutu

28 Rodzaje defektów występujących w systemach informatycznych Defekt Opis szczegółowy Przykład Klasyfikacja Nieprawdziwe wartości atrybutu Przypisanie wartości możliwej do wystąpienia (zgodnej z domeną) ale niezgodnej z rzeczywistością Podanie zmyślonego adresu , podczas rejestracji na formularzu internetowym konkursu uniemożliwi kontakt w przypadku wygranej. Dane nieprawdziwe, analiza reguł oparta na zależnościach i wartościach czasem brak możliwości analizy, zakres atrybutu Nieprecyzyjna wartość atrybutu Przypisanie prawidłowej, ale niewystarczająco szczegółowej informacji Podanie jedynie pierwszej litery imienia mającego więcej niż jedno rozwiązanie (P. może oznaczać Piotra, Pawła, Patryka, itd.) Dane prawdziwe, (zła reprezentacja), analiza reguł oparta na zależnościach i wartościach, zakres atrybutu

29 Rodzaje defektów występujących w systemach informatycznych Defekt Opis szczegółowy Przykład Klasyfikacja Wartość atrybutu naruszająca reguły Wartości atrybutów wzajemnie sprzeczne (naruszenie zależności funkcyjnej) Istnienie atrybutu z wartością nieprawidłową dla reprezentowanych obiektów rzeczywistych Współwystępowanie w kontekście jednego faktu rzeczywistego wzajemnie wykluczających się wartości atrybutów Jeżeli pole reprezentuje osobę, jeżeli imię i nazwisko nie będzie reprezentowane przez przynajmniej dwa wyrazy wartość jest nieprawidłowa Karta chorobowa pacjenta mężczyzny, dla którego kod diagnozy wskazuje na chorobę związaną z narządami płciowymi kobiet. Brak wiarygodności statystycznych analiz zachorowalności w regionie. Dane nieprawidłowe, analiza wartości, zakres atrybutu Dane nieprawidłowe, analiza reguł oparta na zależnościach, zakres wiersza, tabeli lub bazy

30 Rodzaje defektów występujących w systemach informatycznych Defekt Opis szczegółowy Przykład Klasyfikacja Brakujące elementy Duplikaty Niekompletność reprezentacji rzeczywistych obiektów Reprezentacja obiektu rzeczywistego przez więcej niż jeden element danych Elektroniczny rozkład jazdy pociągów zawiera jedynie część faktycznie kursujących pociągów. Brak możliwości odnalezienia faktycznych połączeń, a w szczególności utrudnione planowanie podróży z przesiadkami. Powtórzone wpisy w katalogu dostawców, nie pozwolą firmie na prawidłowe określenie średniego poziomu miesięcznych zamówień od każdego z nich w celu renegocjacji warunków. Dane nieprawidłowe (brakujące), mieszane techniki analityczne lub brak możliwości wykrycia, zakres tabeli Dane prawidłowe, analiza reguł operująca na wartościach danych, zakres tabeli

31 Rodzaje defektów występujących w systemach informatycznych Defekt Opis szczegółowy Przykład Klasyfikacja Naruszenie reguł zadanego zbioru danych Brak spójności bazy danych Istnienie zbioru rekordów, który nie jest prawidłowy z punktu widzenia reprezentowanego obiektu rzeczywistego Brak zgodności w przypadku reprezentowania cechy lub obiektu rzeczywistego równocześnie w więcej niż jednym atrybucie lub encji (denormalizacja). Jest to związane z niestosowaniem się do zasad drugiej i trzeciej postaci normalnej. Jeżeli przechowujemy zbiór transakcji bankowych opatrzonych kolejnym numerem oraz datą wprowadzenia do systemu to nieprawidłowa jest sytuacja kiedy wpis o większym numerze posiada mniejszą datę Jeżeli wartość faktury przechowywana jest zarówno w poszczególnych jej pozycjach jak i łącznie (suma) w nagłówku dokumentu, to w przypadku defektu tego rodzaju otrzymamy różne kwoty łącznej sprzedaży firmy w zależności od wykorzystanego źródła. Dane nieprawidłowe, analiza reguł oparta na wartościach, zakres tabeli Dane nieprawidłowe, analiza strukturalna, zakres bazy

32 Rodzaje defektów występujących w systemach informatycznych Defekt Opis szczegółowy Przykład Klasyfikacja Naruszenie więzów relacyjnych Wskazanie klucza obcego w tabeli powiązanej na nieistniejący rekord w tabeli nadrzędnej Jeżeli fizycznie usunięcie pojazdu z bazy danych ASO nie spowoduje usunięcia historii jego napraw, w systemie mogą pozostać zagubione rekordy, które spowodować niespójne działanie systemu (różne wyniki zestawień w zależności od opcji) Dane nieprawidłowe (brakujące lub nadmiarowe), analiza strukturalna, zakres bazy danych Cykle w relacji samdo-siebie Wykrycie cykli dłuższych niż jeden w relacji hierarchicznej (drzewiastej) samdo-siebie. Jeżeli pracownik ma szefa, który jest podwładnym tegoż pracownika to sytuacja nie jest prawidłowa. Dane nieprawidłowe, analiza wartości, zakres tabeli

33 Rodzaje defektów występujących w systemach informatycznych Defekt Opis szczegółowy Przykład Klasyfikacja Naruszenie unikalności klucza głównego Powtórzenie w kolumnie (kolumnach) klucza głównego w obrębie jednej tabeli. Przydzielenie jednakowego unikalnego identyfikatora (klucza) prowadzi do katastrofalnych w skutkach błędów typu przelewanie składek ubezpieczeniowych pracowników jednej firmy na rzecz innej. Dane nieprawidłowe, analiza strukturalna, zakres tabeli

34 Rodzaje defektów występujących w systemach informatycznych (Przykład) Przykład defektu danych duplikaty w słowniku miejscowości

35 Źródła defektów w danych Przyczyny problemów w danych, można podzielić na: spowodowane czynnikiem ludzkim błędy użytkowników, wady aplikacji wielokrotne migracje i integracje danych, powstałe wskutek czynników zewnętrznych. awarie sprzętowe samoistne starzenie się danych

36 Źródła defektów w danych Błędy użytkowników: Błędy nieświadome to przede wszystkim: Pomyłki wszelkiego rodzaju: literówki, błędy ortograficzne, skróty i skrótowce, zanieczyszczenia przypadkowymi znakami; powstają przede wszystkim z pośpiechu i małej staranności, Nie znane oczekiwania co od wprowadzanych danych, ich znaczenia, poprawnego sposobu reprezentacji, akceptowalnej dziedziny; powodem tej kategorii są najczęściej wady aplikacji lub niedostateczne przeszkolenie użytkowników.

37 Źródła defektów w danych Błędy użytkowników: Błędy świadome zostały podzielone następująco [2]: Brak wymaganej informacji dla przeprowadzenia procesu biznesowego. Operator nie ma możliwości zasygnalizowania braku swojej wiedzy, co do określonego faktu rzeczywistego lub cechy, więc aby kontynuować proces wprowadza świadomie nieprawdziwą, lecz akceptowalną wartość. Przykładem mogą być tu kwestionariusze internetowe, które dla pobrania wersji demo produktu, wymagają podania nazwy pracodawcy. W sytuacji kiedy osoba nie jest aktualnie zatrudniona (np. student) musi ona wypełnić wymagane pole czymkolwiek co nie prowadzi do gromadzenia przez dystrybutora wysokiej jakości danych o potencjalnych nabywcach.

38 Źródła defektów w danych Błędy użytkowników: Błędy świadome (cd.): Brak chęci ujawnienia prawdziwej informacji. Dzieje się tak w przypadku kiedy osoba wprowadzająca (udostępniająca) swoje dane nie jest zainteresowana przekazaniem informacji prawidłowych. Nie wspominając o kobietach, które nie lubią ujawniać swojego wieku, przykładem mogą być ponownie formularze internetowe, na których w celu założenia konta , wymagane jest podanie danych osobowych. Duża część wprowadzonych informacji jest w całości lub w części fikcyjna, ponieważ internauci lubią pozostawać anonimowi.

39 Źródła defektów w danych Błędy użytkowników: Błędy świadome (cd.): Korzyści z podania nieprawdziwej informacji. Sytuacja ta występuje w przypadkach kiedy istnieją procedury promujące wpisywanie złych danych. Przykładem z literatury może być tu producent samochodów, który w zależności od kodu skargi zwracał koszty napraw serwisowych natychmiast lub dopiero po 60 dniach. Dilerzy znający funkcjonujące reguły podawali nieprawdziwe fakty w celu szybszego uzyskania pieniędzy.

40 Źródła defektów w danych Wady aplikacji: Błędy logiki i zachowania aplikacji stanowią: błędy programistyczne powodujące wadliwe działanie lub złą obsługę sytuacji wyjątkowych. Oprócz typowych niedoróbek można tu przytoczyć skomplikowane zagadnienie zarządzania transakcyjnością w systemach rozproszonych (np. obsługa kart płatniczych), niedopasowanie merytoryczne aplikacji do potrzeb użytkowników, co zmusza ich do niezamierzonego przez twórców wykorzystania elementów systemu. (np. przeciążanie znaczenia pól danych).

41 Źródła defektów w danych Wady aplikacji: Źle zaprojektowane mechanizmy interakcji z użytkownikiem powodują najczęściej, wspomniane wcześniej, nieświadome błędy użytkowników. Nie rozumieją oni wprowadzanej informacji, a sposób komunikacji z aplikacją jest mało intuicyjny lub wręcz denerwujący. Z badań wynika, iż dobre przystosowanie interfejsu mogłoby znacząco ograniczyć liczbę powstających defektów na styku człowiek-komputer.

42 Źródła defektów w danych Procesy migracji i integracji danych: W przedsiębiorstwach następują ciągłe zmiany. Zmienia się profil działalności, właściciele, systemy produkcyjne, ich technologia, a za tym wszystkim podążają ciągłe przekształcenia posiadanych danych. Te ostatnie są integrowane z nowo pojawiającymi się rozwiązaniami lub migrowane do nowych wersji istniejących systemów. Z doświadczenia wynika, iż powoduje to nie tylko przenoszenie starych błędów do nowej struktury, ale także powstanie wielu nowych problemów [7].

43 Źródła defektów w danych Awarie sprzętowe: W obecnych czasach, awarie sprzętowe są jednym z rzadszych powodów występowania jakościowych problemów w danych. Wynika to z faktu znaczącego podwyższenia stopnia bezawaryjności serwerów, wprowadzenia rozwiązań klastrowych, ale także zastosowania przemyślanych rozwiązań architektonicznych w systemach informatycznych, które mają zabezpieczać przed potencjalnymi skutkami takiej awarii (np. mechanizm transakcyjności)

44 Źródła defektów w danych Starzenie się danych: Ostatnim źródłem błędów w bazach danych są zmiany zachodzące w rzeczywistym świecie, które nie są odnotowywane (aktualizowane). Jest to czynnik całkowicie zewnętrzny, ale ma on bezpośrednio wpływ na jakość i wartość zgromadzonych danych. Jedną z najbardziej zmiennych ewidencji jest ewidencja osób. Ich cechy zmieniają się samoczynnie, stosunkowo często i praktycznie w pełnym zakresie od wady wzroku, poprzez stan cywilny, adres do nazwiska włącznie. Brak stałej i konsekwentnej aktualizacji bazy danych prowadzi do szybkiej deprecjacji jej wartości.

45 Straty powodowane niską jakością danych Koszty bezpośrednie stanowią wydatki, które wprost wynikają z niskiej jakości zgromadzonych danych. Straty tej grupy to przede wszystkim: praca ludzka, związaną z usuwanie powstałych defektów w danych lub usuwaniu skutków błędnych procesów biznesowych z nich wynikających, utrata produktywności pracowników (np. kiedy w systemie faktury numerowane są według różnych formatów, odnalezienie konkretnego dokumentu może zająć znacznie więcej czasu), utrata produktywności przedsiębiorstwa poprzez utrudnienia w łańcuchu dostaw (kiedy stany magazynowe wskazują na obecność dużej ilości potrzebnego w produkcji surowca, którego faktycznie brak może to spowodować nieoczekiwane zatrzymanie procesu produkcji),

46 Straty powodowane niską jakością danych Koszty bezpośrednie (cd.): wycofywanie zamówień klientów (klient może wybrać innego dostawcę, jeżeli zamówienie realizowane jest zbyt długo, a w systemie brak informacji o nim), inwestycja w nieskuteczną kampanie promocyjną, zbudowaną w oparciu o niewiarygodne analizy, zły wybór adresatów lub błędne ich adresowane.

47 Straty powodowane niską jakością danych Utracone korzyści to wszystkie potencjalne konsekwencje finansowe wynikające z bieżącego użytkowania niskiej jakości danych oraz utracone szanse na przyszłe zyski. Są to między innymi: utrata obecnych i potencjalnych klientów (pośrednio więc zysków) niezadowolonych niską jakością usług, którzy nie tylko rezygnują ze współpracy, ale także zniechęcają innych do jej podjęcia, koszty błędnych decyzji biznesowych podjętych na podstawie nieprawdziwych lub niekompletnych danych (zdarzają się rzeczywiste sytuacje [7], w których brakuje 70% danych - na podstawie takiego zbioru trudno trafnie wnioskować).

48 Zapotrzebowanie na jakość danych W tabeli pokazano wymagany poziom jakości danych w zależności od ich przeznaczenia. Różne zapotrzebowanie na jakość najlepiej zobrazować przykładem kodów medycznych wybieranych przy realizacji usługi medycznej. Do wystawienia rachunku za usługę nie jest potrzebne określenie właściwego kodu, a jedynie właściwej kwoty z punktu widzenia pracownika operacyjnego wybranie kodu pierwszego z listy nie stanowi żadnego utrudnienia. Do analizy zdrowotnej sytuacji w kraju dane, bez właściwego wskazania na rodzaj schorzenia, są jednak bezużyteczne. Przeznaczenie danych Wymagany poziom jakości Sprawozdawczość biznesowa 95-97% Analiza danych (hurtownie danych, wzorce, związki, segmentacje) >80% Praca operacyjna (systemy transakcyjne) 40-80%

49 Total Quality data Managment Na podstawie tradycyjnego zarządzania przez jakość (TQM) powstała metodologia dedykowana zapewnieniu danych wysokiej jakości Total Quality data Managment. Twórcy jej zwracają uwagę, iż najważniejsze jest, aby: wszyscy pracownicy firmy wiedzieli, iż współzależą od siebie informacyjnie, wszyscy wierzyli, iż dobra jakość danych jest cenna dla przedsiębiorstwa, istniał system wartości, który łączy satysfakcję klienta z dobra jakością danych, istniała kultura organizacyjna, w której wszyscy biorą odpowiedzialność za ciągłe udoskonalanie procesów [5]:

50 Total Quality data Managment Powyższe wytyczne dają nam obraz tego, iż kluczowe czynniki sukcesu leżą po stronie działań organizacyjnych, sam TQdM ma być zwyczajem doskonalenia następujących procesów: procesów wytwarzania aplikacji, ich architektur i baz danych, procesów biznesowych, podczas których są tworzone, aktualizowane, kasowane, przetwarzane lub prezentowane dane,

51 Total Quality data Managment Sposób doskonalenia procesów powinien być zgodny z przedstawionym na rysunku ogólnym spojrzeniem na metodologię TQdM:

52 Uogólniony proces zapewnienia jakości danych Istnieje wiele różnych podejść koncepcyjnych do zapewnienia jakości danych, pozornie odmiennych. Okazuje się jednak, iż mają one cechy wspólne wszystkie one są cykliczne, i wszystkie zawierają w sobie trzy podstawowe kroki: identyfikacja problemu, naprawa problemu, kontrola problemu [8].

53 Uogólniony proces zapewnienia jakości danych Na tej podstawie powstała uogólniona metoda, pozwalająca na rozwiązywanie skomplikowanych problemów z jakością danych, zwaną Analyze-Improve- Control (Analiza-Usprawnienie-Kontrola) przedstawiona na rysunku.

54 Analiza problemu jakości danych Identyfikacja problemu jakości danych Metoda od wewnątrz (ang. Inside-Out) koncentruje się na monitorowaniu danych, poszukiwaniu w nich defektów za pomocą dokładnej weryfikacji. Następnie bada się wpływ odnalezionych problemów na funkcjonowanie biznesu. Przykładem takiego działania może być wykrycie ogromnej liczby duplikatów w tabeli kontrahentów, a następnie badanie skutków tego zjawiska dla działania przedsiębiorstwa. Mogą nimi być: czas pracowników tracony na poszukiwanie, rozstrzyganie i wprowadzanie powtórzonych informacji, koszty przechowywania redundantnych danych, brak możliwości analizy historii współpracy z klientem, irytacja klienta proszonego o powtórne podawanie swoich danych, itd.

55 Analiza problemu jakości danych Identyfikacja problemu jakości danych (cd.) Metoda od zewnątrz (ang. Outside-In) skupia się na poszukiwaniu problemów w świecie biznesowym, których przyczyną może być potencjalnie niska jakość posiadanych danych. Zgromadzone przesłanki są następnie zamieniane na reguły poprawności dla danych, a proces monitorowania może potwierdzić lub odrzucić postawioną tezę. Jednym ze sposobów na przeprowadzenie tej metody identyfikacji problemu jest przegląd zwrotów od klienta, reklamacji oraz dokumentów korygujących. Analiza przyczyn fiaska, może wskazać nam na błędne adresowanie, niestaranne wypełnianie zamówień co do ilości lub produktów lub też błędy w procesie produkcyjnym, który także może być sterowany danymi.

56 Analiza problemu jakości danych Monitorowanie danych w systemach informatycznych Monitorowanie danych, nazywane także audytowaniem lub profilowaniem, jest czynnością pozwalającą na wyspecyfikowanie niezgodności występujących w systemie (ich grup lub konkretnych defektów) oraz wskazanie syntetycznego obrazu jakości posiadanych danych (lub ich aspektu) w postaci metryk Istnieje kilka metod sprawdzania jakości danych w zgromadzonych bazach danych Ankiety, listy kontrolne Metody analityczne Wizualna inspekcja

57 Analiza problemu jakości danych Ankieta weryfikującą jakość meta-danych i wartość danych dla użytkownika

58 Analiza problemu jakości danych Rys. Grupy technik analitycznych

59 Techniki analityczne wykrywające defekty w danych Grupa technik Opis techniki analitycznej Przykład Analiza wartości Nieakceptowanie pustych wartości Wartość musi odpowiadać jednemu z elementów określonej dziedziny. Wartość musi należeć do wskazanego zakresu Wartość nie może być zadanego rodzaju. (wyłączenia z dziedziny) Nazwa klienta nie może być pusta Jeżeli cechą K określa się kontrahenta krajowego a Z zagranicznego, wartości inne nie są dopuszczalne Wiek człowiek musi być liczbą naturalną z przedziału Data zatrudnienia pracownika nie może przypadać na niedzielę lub święto Wartość musi mieć zadany format (maskę) zgodną z świecie rzeczywistym Kod pocztowy w Polsce zawsze ma postać xx-xxx Wartość tekstowa musi spełniać zadane cechy (długość, występujące znaki) Nazwa miejscowości nie powinna być 1 literowa i zawierać znaków &*$@! itd. Wartość musi być poprawna względem wbudowanego kodu kontrolnego. Numer NIP posiada cyfrę kontrolną, która pozwala na określenie poprawności

60 Techniki analityczne wykrywające defekty w danych Grupa technik Opis techniki analitycznej Przykład Analiza strukturalna Wartość atrybutu musi być unikalna w obrębie całej tabeli Element nadrzędny, wskazanych kluczem obcym, musi wystąpić Hierarchia w relacji sam-do-siebie musi prowadzić do korzenia Numer PESEL dla każdego obywatela musi być unikalny Transakcja sprzedaży towaru musi wskazywać na towar występujący w kartotece towarowej Nieakceptowalne są cykle w podległości służbowej przedsiębiorstwa Element nadrzędny musi zawierać określoną (minimalną, maksymalną, dokładną) liczbę elementów podrzędnych Prawidłowa faktura zawiera przynajmniej jedną pozycję Dane redundantne muszą być zgodne. Jeżeli odniesienie do klienta występuje w każdej pozycji zamówienia a nie tylko w nagłówku to w każdej pozycji musi być takie samo

61 Techniki analityczne wykrywające defekty w danych Grupa technik Opis techniki analitycznej Przykład Analiza reguł operujących na zależnościach danych Wartość jednego atrybutu musi być większa / mniejsza / niewiększa / niemniejsza niż wartość innego atrybutu W bazie postaci historycznych data urodzin musi być niemniejsza od daty śmierci. Musi być zachowana zależność funkcyjna pomiędzy atrybutami (lub niektórymi wartościami atrybutów). Jeżeli pole kwota brutto zależy od pola kwota VAT i kwota netto, to zależność ta powinna być zawsze prawdziwa. Musi być zachowana formuła pomiędzy wartościami Weryfikacja prawidłowości wartości atrybutów przez współwystępowanie ze sobą Bilansowanie się danych określonych typów. Data zatrudnienia Data urodzin > 18 lat Kod pocztowy i miasto powinno być zgodne. W księgowości dekrety księgowe umieszczone po stronie winien muszą dokładnie równoważyć te ze strony ma.

62 Techniki analityczne wykrywające defekty w danych Grupa technik Opis techniki analitycznej Przykład analiza reguł operująca na wartościach danych Wykrywanie powtórzeń w danych na podstawie ich podobieństwa. Częstotliwość występowanie jednego atrybutu nie może być znacząco większa niż innych lub musi być zgodna z określonym rozkładem. Każdy klient powinien posiadać tylko jeden opisujący go rekord. Kolor oczu powinien występować w większej populacji zgodnie z zasadami natury. Dane transakcji nie powinny odbiegać od normy ustanowionej przez historię. (wykrywanie anomalii) Zakupy małego klienta, którego rachunki były na około tysiąc złotych nie powinny wynosić nagle milion złotych. Spełnianie kryteriów dla określonych agregacji danych (suma, minimum, maksimum, mediana, ilość) Baza rejestrująca ilość przejeżdżających pociągów przez dany punkt powinna zawierać mniej więcej określoną ilość rekordów z każdego dnia.

63 Metryki stanowią dobre podsumowanie procesu monitorowania. Obrazują one syntetycznie jakość testowanych danych, stanowiąc podstawę do podejmowania decyzji o działaniach naprawczych przez kierownictwo. Wyróżniamy metryki: Miary jakości danych lokalne (liczone dla fragmentu danych) [9] globalne (oceniające łącznie cały zbiór danych), celowe [10] (nastawione na mierzenie określonego rezultatu) ogólne (ich zadaniem jest określenie obiektywnego stanu jakościowego danych).

64 Miary jakości danych Niezależnie od wyboru rodzaju, określone zostały cechy, które musi spełniać dobra metryka [11]. Najważniejsze z nich to: czytelność osoba która nie jest specjalistą zrozumie sposób jej obliczania, mierzalność i łatwość uzyskania możliwość fizycznego zmierzenia w rozsądnym czasie, porównywalność wyników możliwość zestawienia rezultatów w czasie i między różnymi zbiorami danych, mobilizacja do działań naprawczych wysokie wyniki metryki powinny mobilizować do podjęcia działań naprawczych.

65 Miary jakości danych (GQM) Bobrowski [12] sugeruje podejście typu Cel-Pytanie-Miara (ang. GQM: Goal-Question-Metric), czyli tradycyjne podejście do jakości z zakresu inżynierii oprogramowania. Dla każdego z wymiarów: wiarygodność, relewantność, przydatność, aktualność i spójność, przyjmuje ona cel składający się z przedmiotu, celu faktycznego, typu mierzonej jakości oraz środowiska. Każdemu celowi przyporządkowane jest jedno lub kilka pytań a każdemu pytaniu odpowiednia metryka. Większość z nich to proste miary typu procentowego lub liczby rekordów (nie)spełniających kryteria. Jedną z ciekawszych miar, jest miara przydatności danych wyrażona w ilości dolarów, jakie udało się zarobić dzięki informacjom z danych w jednostce czasu.

66 Miary jakości danych (Piattini) Piattini [13] podchodzi do kwestii miar jakości od strony struktury a nie celów. Zajmuje się on zagadnieniem jakości w relacyjnej bazie danych. Przyjmuje dwustopniowy podział na miary jakości dla poziomu tabel i całego schematu. Dla poziomu tabel proponuje szereg metryk wyznaczających złożoność struktury, takich jak: maksymalna długość ścieżki referencyjnej wychodzącej z tabeli liczba kluczy obcych użytych w tabeli procentowy udział kompleksowych kolumn w tabeli liczba użytych klas obiektów użytych do reprezentacji kolumn tabeli

67 Miary jakości danych (Piattini) Dla poziomu schematu bazy relacyjnej stosuje podobne miary: maksymalna długość ścieżki referencyjnej pomiędzy tabelami w bazie liczba kluczy obcych użytych w całej bazie procentowy udział kompleksowych kolumn w bazie liczba użytych klas obiektów do reprezentacji kolumn w bazie Ponadto każdej kolumnie przyznawana jest pewna waga, określająca jej rozmiar. Wagi wykorzystywane są następnie do określenia złożoności tabel i docelowo również całej bazy. Podane miary mają na celu wykrycie problemów nie tyle w samych danych, co w strukturze, w jakiej są przechowywane. Problemy związane ze strukturą danych mogą bowiem zaowocować problemami w dostępie do danych lub stanowić ułatwienie dla niepożądanych zjawisk takich jak powielanie w bazie tej samej informacji itp.

68 Badania jakości danych katastralnych (Siarkowski) Kataster nieruchomości (Ewidencja gruntów i budynków) Przedmioty Podmioty Grunty Budynki Lokale Właściciele Władający Mapa katastralna Mapa taksacyjna

69 Jednostki rej. gruntów Jedn. rej. budynków Jednostki rej. lokali Badania jakości danych katastralnych (Siarkowski) Podmioty gruntów Podmioty budynków Podmioty lokali Działki Budynki Lokale

70 Badania jakości danych katastralnych (Siarkowski) Tabele systemu katastralnego: JednostkiRejestroweB (JRB) JednostkiRejestroweG (JRG) JednostkiRejestroweL (JRL) PodmiotyG (PB) PodmiotyG (PG) PodmiotyL (PL) RejestrBudynkow (RB) RejestrGruntow (RG) RejestrLokali (RL) OsobyFizPrawne (OFP)

71 Badania jakości danych katastralnych (Siarkowski) JednostkiRejestroweG (JRG) PodmiotyG (PG) RejestrGruntow (RG) DzialkiBudynki JednostkiRejestroweB (JRB) BudynkiLokale PodmiotyB (PB) RejestrBudynkow (RB) Osoby- FizPrawne (OFP) JednostkiRejestroweL (JRL) RejestrLokali (RL) PodmiotyL (PL)

72 Badania jakości danych katastralnych (Siarkowski) Do kategorii błędów dziedzinowych zaliczane są wszelkiego rodzaju błędy na poziomie pojedynczych pól rekordów ale nie tylko. Błędy dziedzinowe odnoszą się również do merytorycznego poziomu jakości obiektów logicznych. Kontrole sprawdzają na przykład czy dwie osoby zarejestrowane jako małżeństwo są różnych płci lub czy suma udziałów do danego przedmiotu wynosi 100% itp. Na koniec, do błędów dziedzinowych zaliczane są wszelkie niezgodności wpisów z istniejącymi słownikami. Z błędów dziedzinowych możemy wyróżniono trzy podkategorie: Błędne lub niezgodne z przepisami wpisy (BNPW) Brakujące wpisy (BW) Wpisy niezgodne ze słownikami (NSW)

73 Do kategorii błędów relacyjnych zaliczono sytuacje, w których: następuje odwołanie się do nieistniejącego rekordu następuje odwołanie się do rekordu, który wzbudza podejrzenia następuje odwołanie się do rekordu w momencie, kiedy nie powinno występować istnieje rekord, na który nie powołuje się żaden z rekordów, które powinny się do niego odwoływać w relacji M:N nie istnieje któryś z obiektów w relacji M:N korespondujące ze sobą rekordy wzbudzają podejrzenia Błędy relacyjne podzielono na trzy podkategorie: Błędy kluczy obcych (BKO) Badania jakości danych katastralnych (Siarkowski) Błędy rekordów w wiązaniach M:N (MN) Żadnych odwołań do rekordu (ZO)

74 Badania jakości danych katastralnych (Siarkowski) Moduł kontroli błędów w bazie katastralnej.

75 Zaproponowano 3 kategorie miar: Badania jakości danych katastralnych (Siarkowski) 1. Miary proste. Zostały one wyznaczone bezpośrednio w oparciu o liczbę wykrytych nieprawidłowości w bazie. Ich zaletą jest łatwa mierzalność i dość duża obiektywność, jednak oferują one tak naprawdę bardzo płytkie spojrzenie na jakość danych traktując wszystkie błędy jednakowo. 2. Miary oceniające wykryte błędy pod względem istotności oraz kosztu ich naprawy. Ich wyznaczenie jest o wiele trudniejsze, gdyż wymagało przede wszystkim ustalenia kosztu i istotności każdego błędu, ale za to oferują one znacznie bliższy prawdzie obraz jakości danych. 3. Specyficzne miary jakości dla danych katastralnych zawarto w grupie trzeciej. Uwzględnia ona jakość logicznych obiektów systemu katastralnego jakimi są jednostki rejestrowe.

76 Wszystkie miary uwzględniają w swoim zapisie wynik pojedynczej kontroli z tym jednak zastrzeżeniem, że pojedyncza kontrola odwołuje się do gminy, natomiast w badaniach całej bazy, uznajemy że wynikiem kontroli jest suma wyników ze wszystkich gmin. Czyli wynikiem kontroli jest liczba błędów danego typu występujących w całej bazie. Oznaczenia: Badania jakości danych katastralnych (Siarkowski) d dom i oznacza ilość błędów dziedzinowych typu i w bazie, d ref j oznacza ilość błędów referencyjnych typu j w bazie. REK oznacza liczbę przebadanych rekordów a krek oznacza tę liczbę podzieloną przez JR oznacza jednostkę rejestrową.

77 Badania jakości danych katastralnych (Siarkowski) 1. Liczba błędów dziedzinowych wykrytych w bazie LD dom d dom i m i 1 2. Liczba błędów referencyjnych wykrytych w bazie LD ref d ref n j 1 j 3. Całkowita liczba błędów w bazie jako suma błędów dziedzinowych i referencyjnych LD calk LD dom LD ref m i 1 d domi n j 1 d ref j

78 Badania jakości danych katastralnych (Siarkowski) 4. Liczba błędów dziedzinowych przypadających na 1000 rekordów LDT dom m i 1 d domi krek 5. Liczba błędów referencyjnych przypadających na 1000 rekordów LDT ref n j 1 d ref krek 6. Całkowita liczba błędów przypadających na 1000 rekordów jako suma błędów dziedzinowych i referencyjnych na 1000 rekordów j LDT calk LDT dom LDT ref m i 1 d domi n j 1 krek d ref j

79 Badania jakości danych katastralnych (Siarkowski) 7. Procentowy udział błędnych rekordów (LBR liczba błędnych rekordów) w bazie PUBR LBR 100% REK

80 Badania jakości danych katastralnych (Siarkowski) 8. Koszt usunięcia błędów dziedzinowych z bazy K dom m k d domi domi i 1 k 1 o ( t domk ) k domk Pierwsza część tego równania przedstawia sytuację błędów wymagających osobnego rozpatrzenia dla każdorazowego ich wystąpienia. d dom i oznacza tu ilość wystąpień błędów rodzaju i k dom i koszt usunięcia jednego błędu rodzaju i. funkcja zwraca wartość 0 lub 1, odpowiednio: 0 gdy błąd typu k nie występuje w bazie ani razu, 1 gdy występuje przynajmniej raz.

81 Badania jakości danych katastralnych (Siarkowski) 9. Koszt usunięcia błędów referencyjnych z bazy K ref n j 1 k ref j d ref j p l 1 ( t ref l ) * k ref l Pierwsza część tego równania przedstawia sytuację błędów wymagających osobnego rozpatrzenia dla każdorazowego ich wystąpienia. d ref j oznacza tu ilość wystąpień błędów rodzaju j k ref j koszt usunięcia jednego błędu rodzaju j. funkcja zwraca wartość 0 lub 1, odpowiednio: 0 gdy błąd typu k nie występuje w bazie ani razu, 1 gdy występuje przynajmniej raz.

82 Badania jakości danych katastralnych (Siarkowski) 10. Całkowity koszt usunięcia błędów z bazy K calk K dom K ref 11. Średni koszt naprawy 1000 rekordów KT K dom K krek ref

83 Badania jakości danych katastralnych (Siarkowski) 12. Liczba błędnych jednostek rejestrowych (w których przynajmniej jeden element zawiera błąd) LBJR 13. Procentowy udział bezbłędnych jednostek rejestrowych PUBJR errf LBBJR JR 100% Stosunek jednostek, których żaden obiekt nie zawiera błędu (LBBJR) do wszystkich jednostek (JR) 14. Procentowy udział jednostek rejestrowych bez błędów krytycznych PUJRBBK LJRBBK JR 100% Stosunek jednostek, których żaden obiekt nie zawiera błędów krytycznych (LJRBBK) do wszystkich jednostek (JR).

84 Liczba rekordów w tysiącach Badania jakości danych katastralnych (Siarkowski) 1400 Ośr1 Ośr2 Ośr3 Ośr I/03 II/03 I/04 II/04 I/05 II/05 I/06 Czas Rysunek 5.1 Liczba rekordów w poszczególnych ośrodkach na przestrzeni czasu

85 Badania jakości danych katastralnych (Siarkowski) Pierwsze badanie dotyczyło zmiany liczby aktualnych rekordów w bazach w czasie (rysunek 5.1). Jak widać na wykresie, liczba aktualnych rekordów w badanych ośrodkach różniła się miedzy sobą znacznie i wynosiła w skrajnych przypadkach raz 200 tysięcy a raz prawie półtora miliona rekordów. Dla wszystkich baz możemy zaobserwować tendencję wzrostową ilości danych. Dzieje się tak ponieważ od roku 2004 ośrodki zostały zobowiązane o systematycznie uzupełnianie swoich baz danymi dotyczącymi budynków i lokali (początkowo obowiązkowa była jedynie ewidencja gruntów).

86 Metrics value Badania jakości danych katastralnych (Siarkowski) Cen1 Cen2 Cen3 Cen4 40% 30% 20% 10% 0% I/03 II/03 I/04 II/04 I/05 II/05 I/06 Period Rysunek 5.2 Procent błędnych rekordów

87 Liczba błędów w tysiącach Liczba błędów na tysiąc rekordów Badania jakości danych katastralnych (Siarkowski) dziedzinow e referencyjne dziedzinow e referencyjne I/03 II/03 I/04 II/04 I/05 II/05 I/06 0 I/03 II/03 I/04 II/04 I/05 II/05 I/06 Czas Czas Rysunek 5.3 Rozkład błędów na błędy dziedzinowe i referencyjne w ośrodku 2

88 Cost units Cost units Badania jakości danych katastralnych (Siarkowski) Cen1 Cen2 Cen3 Cen I/03 II/03 I/04 II/04 I/05 II/05 I/06 Period Cen1 Cen2 Cen3 Cen I/03 II/03 I/04 II/04 I/05 II/05 I/06 Period Rysunek 5.4 Koszt naprawy poszczególnych baz w czasie

89 Liczba błędów Koszt naprawy Badania jakości danych katastralnych (Siarkowski) krytyczne istotne mało istotne krytyczne istotne mało istotne Ośr1 Ośr2 Ośr3 Ośr4 1 Ośr1 Ośr2 Ośr3 Ośr4 Rysunek 5.5 Poziom błędów krytycznych, istotnych i mało istotnych oraz koszty ich usunięcia (Uwaga skala osi Y jest logarytmiczna)

90 Liczba błędnych jednostek rejestrowych. Procentowy udział dobrych jednostek Badania jakości danych katastralnych (Siarkowski) JRG JRB JRL I/03 II/03 I/04 II/04 I/05 II/05 I/06 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% dobre dopuszczalne dobre bez d.o. dop. bez d.o. Ośr1 Ośr2 Ośr3 Ośr4 Rysunek 5.6 Liczba poprawnych jednostek rejestrowych

91 Literatura 1. Bates R., Guess F., Wan I.: FedEx & Information Quality, International Conference on Information Quality, Olsen J. E.: Data Quality: The Accuracy Dimension. Morgan Kaufmann Publishers, Redman, T.C., Data Quality. The Field Guide. 2001, Boston: Digital Press. 4. Tayi, G.K. and D.P. Ballou, Examining data quality. Communications of the ACM, (2): s Wang R., Strong D. "Beyond Accuracy: What Data Quality Means to Data Consumers," Journal of Management Information Systems, wiosna 1996, tom 12, Nr. 4. s Becker S. "A Practical Perspective on Data Quality Issues," Journal of Database Management, 1998, s ComputerWorld Raport: Jakość Danych, IDG Poland, Luty Data Monitoring: Taking Control of Your Information Assets, DataFlux Corp., 2004

92 Literatura 9. Kovac R., Lee Y. W., Pipino L. L.: Total Data Quality Management: The Case of IRI. Conference on Information Quality, Cambridge Lee Y. W., Pipino L. L., Wang R. Y.: Data Quality Assessment. Communications of the ACM, Kwiecień 2002, s Loshin D.: Developing Information Quality Metrics. DM Review Magazine, Maj Bobrowski M., Marré M., Yankelevich D., Measuring Data Quality, Universidad de Buenos Aires, Piattini1 M., Calero1 C., Sahraoui H., Lounis H., Objectrelational database metrics.

RELACYJNE BAZY DANYCH

RELACYJNE BAZY DANYCH RELACYJNE BAZY DANYCH Aleksander Łuczyk Bielsko-Biała, 15 kwiecień 2015 r. Ludzie używają baz danych każdego dnia. Książka telefoniczna, zbiór wizytówek przypiętych nad biurkiem, encyklopedia czy chociażby

Bardziej szczegółowo

Technologia informacyjna

Technologia informacyjna Technologia informacyjna Pracownia nr 9 (studia stacjonarne) - 05.12.2008 - Rok akademicki 2008/2009 2/16 Bazy danych - Plan zajęć Podstawowe pojęcia: baza danych, system zarządzania bazą danych tabela,

Bardziej szczegółowo

III. Dane podstawowe definiowanie organizacji

III. Dane podstawowe definiowanie organizacji Ćwiczenia z użytkowania systemu MFG/PRO 1 III. Dane podstawowe definiowanie organizacji 1.1.1 Kartoteka kodów statusów zapasów Kod statusu zapasów określa parametry statusu zapasów w zakresie: Dostępne

Bardziej szczegółowo

Faza Określania Wymagań

Faza Określania Wymagań Faza Określania Wymagań Celem tej fazy jest dokładne określenie wymagań klienta wobec tworzonego systemu. W tej fazie dokonywana jest zamiana celów klienta na konkretne wymagania zapewniające osiągnięcie

Bardziej szczegółowo

Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi

Systemy baz danych w zarządzaniu przedsiębiorstwem. W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi Systemy baz danych w zarządzaniu przedsiębiorstwem W poszukiwaniu rozwiązania problemu, najbardziej pomocna jest znajomość odpowiedzi Proces zarządzania danymi Zarządzanie danymi obejmuje czynności: gromadzenie

Bardziej szczegółowo

Pojęcie systemu informacyjnego i informatycznego

Pojęcie systemu informacyjnego i informatycznego BAZY DANYCH Pojęcie systemu informacyjnego i informatycznego DANE wszelkie liczby, fakty, pojęcia zarejestrowane w celu uzyskania wiedzy o realnym świecie. INFORMACJA - znaczenie przypisywane danym. SYSTEM

Bardziej szczegółowo

WPROWADZENIE DO BAZ DANYCH

WPROWADZENIE DO BAZ DANYCH WPROWADZENIE DO BAZ DANYCH Pojęcie danych i baz danych Dane to wszystkie informacje jakie przechowujemy, aby w każdej chwili mieć do nich dostęp. Baza danych (data base) to uporządkowany zbiór danych z

Bardziej szczegółowo

Krzysztof Kadowski. PL-E3579, PL-EA0312,

Krzysztof Kadowski. PL-E3579, PL-EA0312, Krzysztof Kadowski PL-E3579, PL-EA0312, kadowski@jkk.edu.pl Bazą danych nazywamy zbiór informacji w postaci tabel oraz narzędzi stosowanych do gromadzenia, przekształcania oraz wyszukiwania danych. Baza

Bardziej szczegółowo

Normalizacja baz danych

Normalizacja baz danych Normalizacja baz danych Definicja 1 1 Normalizacja to proces organizowania danych w bazie danych. Obejmuje to tworzenie tabel i ustanawianie relacji między tymi tabelami zgodnie z regułami zaprojektowanymi

Bardziej szczegółowo

Nowoczesne aplikacje mobilne i ich rola w podnoszeniu jakości danych

Nowoczesne aplikacje mobilne i ich rola w podnoszeniu jakości danych Nowoczesne aplikacje mobilne i ich rola w podnoszeniu jakości danych www.ascen.pl 1 Agenda O firmie Zarządzanie jakością danych Aplikacje mobilne i ich rola w zarządzaniu jakością danych 2 O firmie Data

Bardziej szczegółowo

I. Interfejs użytkownika.

I. Interfejs użytkownika. Ćwiczenia z użytkowania systemu MFG/PRO 1 I. Interfejs użytkownika. MFG/PRO w wersji eb2 umożliwia wybór użytkownikowi jednego z trzech dostępnych interfejsów graficznych: a) tekstowego (wybór z menu:

Bardziej szczegółowo

Projektowanie bazy danych przykład

Projektowanie bazy danych przykład Projektowanie bazy danych przykład Pierwszą fazą tworzenia projektu bazy danych jest postawienie definicji celu, założeń wstępnych i określenie podstawowych funkcji aplikacji. Każda baza danych jest projektowana

Bardziej szczegółowo

Ogranicz listę klasyfikacji budżetowych do powiązanych z danym kontem księgowym

Ogranicz listę klasyfikacji budżetowych do powiązanych z danym kontem księgowym Zależności i kontrola danych budżetowych w systemie Sz@rk FK 1. Wstęp Począwszy od wersji Sz@rk FK 2011 (11.03.30) wprowadzono do programu finansowoksięgowego nowe możliwości dotyczące kontrolowania poprawności

Bardziej szczegółowo

Wykład 2. Relacyjny model danych

Wykład 2. Relacyjny model danych Wykład 2 Relacyjny model danych Wymagania stawiane modelowi danych Unikanie nadmiarowości danych (redundancji) jedna informacja powinna być wpisana do bazy danych tylko jeden raz Problem powtarzających

Bardziej szczegółowo

Systemy baz danych. mgr inż. Sylwia Glińska

Systemy baz danych. mgr inż. Sylwia Glińska Systemy baz danych Wykład 1 mgr inż. Sylwia Glińska Baza danych Baza danych to uporządkowany zbiór danych z określonej dziedziny tematycznej, zorganizowany w sposób ułatwiający do nich dostęp. System zarządzania

Bardziej szczegółowo

Projekt dotyczy stworzenia zintegrowanego, modularnego systemu informatycznego wspomagającego zarządzanie pracownikami i projektami w firmie

Projekt dotyczy stworzenia zintegrowanego, modularnego systemu informatycznego wspomagającego zarządzanie pracownikami i projektami w firmie Projekt dotyczy stworzenia zintegrowanego, modularnego systemu informatycznego wspomagającego zarządzanie pracownikami i projektami w firmie informatycznej. Zadaniem systemu jest rejestracja i przechowywanie

Bardziej szczegółowo

Baza danych. Modele danych

Baza danych. Modele danych Rola baz danych Systemy informatyczne stosowane w obsłudze działalności gospodarczej pełnią funkcję polegającą na gromadzeniu i przetwarzaniu danych. Typowe operacje wykonywane na danych w systemach ewidencyjno-sprawozdawczych

Bardziej szczegółowo

System zarządzania zleceniami

System zarządzania zleceniami Verlogic Systemy Komputerowe 2013 Wstęp Jednym z ważniejszych procesów występujących w większości przedsiębiorstw jest sprawna obsługa zamówień klientów. Na wspomniany kontekst składa się: przyjęcie zlecenia,

Bardziej szczegółowo

030 PROJEKTOWANIE BAZ DANYCH. Prof. dr hab. Marek Wisła

030 PROJEKTOWANIE BAZ DANYCH. Prof. dr hab. Marek Wisła 030 PROJEKTOWANIE BAZ DANYCH Prof. dr hab. Marek Wisła Elementy procesu projektowania bazy danych Badanie zależności funkcyjnych Normalizacja Projektowanie bazy danych Model ER, diagramy ERD Encje, atrybuty,

Bardziej szczegółowo

Analiza i projektowanie oprogramowania. Analiza i projektowanie oprogramowania 1/32

Analiza i projektowanie oprogramowania. Analiza i projektowanie oprogramowania 1/32 Analiza i projektowanie oprogramowania Analiza i projektowanie oprogramowania 1/32 Analiza i projektowanie oprogramowania 2/32 Cel analizy Celem fazy określania wymagań jest udzielenie odpowiedzi na pytanie:

Bardziej szczegółowo

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38 Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem zajęcia 1 dr Jakub Boratyński pok. A38 Program zajęć Bazy danych jako podstawowy element systemów informatycznych wykorzystywanych

Bardziej szczegółowo

CEPiK 2.0 - co się zmieni w stacjach kontroli pojazdów

CEPiK 2.0 - co się zmieni w stacjach kontroli pojazdów Departament Ewidencji Państwowych CEPiK 2.0 - co się zmieni w stacjach kontroli pojazdów Data publikacji 20.11.2015 wersja 1.0 msw.gov.pl 1/10 Spis treści Zmiany od nowego roku... 3 Założenia nowelizacji...

Bardziej szczegółowo

Diagramy związków encji. Laboratorium. Akademia Morska w Gdyni

Diagramy związków encji. Laboratorium. Akademia Morska w Gdyni Akademia Morska w Gdyni Gdynia 2004 1. Podstawowe definicje Baza danych to uporządkowany zbiór danych umożliwiający łatwe przeszukiwanie i aktualizację. System zarządzania bazą danych (DBMS) to oprogramowanie

Bardziej szczegółowo

Word. Korespondencja seryjna

Word. Korespondencja seryjna 1 (Pobrane z slow7.pl) Korespondencja seryjnajestto taki sposób utworzenia jednolitego dokumentu, który będzie różnił się jedynie zawartością wybranych pól. Pola te będą automatycznie wypełniane przez

Bardziej szczegółowo

Zarządzanie Zapasami System informatyczny do monitorowania i planowania zapasów. Dawid Doliński

Zarządzanie Zapasami System informatyczny do monitorowania i planowania zapasów. Dawid Doliński Zarządzanie Zapasami System informatyczny do monitorowania i planowania zapasów Dawid Doliński Dlaczego MonZa? Korzyści z wdrożenia» zmniejszenie wartości zapasów o 40 %*» podniesienie poziomu obsługi

Bardziej szczegółowo

STATYSTYKA EKONOMICZNA

STATYSTYKA EKONOMICZNA STATYSTYKA EKONOMICZNA Analiza statystyczna w ocenie działalności przedsiębiorstwa Opracowano na podstawie : E. Nowak, Metody statystyczne w analizie działalności przedsiębiorstwa, PWN, Warszawa 2001 Dr

Bardziej szczegółowo

ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 6.0

ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 6.0 ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 6.0 Przeznaczenie Sylabusa Dokument ten zawiera szczegółowy Sylabus dla modułu ECDL/ICDL Użytkowanie baz danych. Sylabus opisuje zakres wiedzy

Bardziej szczegółowo

2017/2018 WGGiOS AGH. LibreOffice Base

2017/2018 WGGiOS AGH. LibreOffice Base 1. Baza danych LibreOffice Base Jest to zbiór danych zapisanych zgodnie z określonymi regułami. W węższym znaczeniu obejmuje dane cyfrowe gromadzone zgodnie z zasadami przyjętymi dla danego programu komputerowego,

Bardziej szczegółowo

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d.

Definicja bazy danych TECHNOLOGIE BAZ DANYCH. System zarządzania bazą danych (SZBD) Oczekiwania wobec SZBD. Oczekiwania wobec SZBD c.d. TECHNOLOGIE BAZ DANYCH WYKŁAD 1 Wprowadzenie do baz danych. Normalizacja. (Wybrane materiały) Dr inż. E. Busłowska Definicja bazy danych Uporządkowany zbiór informacji, posiadający własną strukturę i wartość.

Bardziej szczegółowo

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Elektroenergetyki Technologie informatyczne

Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Elektroenergetyki Technologie informatyczne Politechnika Gdańska Wydział Elektrotechniki i Automatyki Katedra Elektroenergetyki Technologie informatyczne Microsoft Excel Ćw. 4 1. Bazy danych w programie Excel - wprowadzenie Program MS Excel umożliwia

Bardziej szczegółowo

Pojęcie bazy danych. Funkcje i możliwości.

Pojęcie bazy danych. Funkcje i możliwości. Pojęcie bazy danych. Funkcje i możliwości. Pojęcie bazy danych Baza danych to: zbiór informacji zapisanych według ściśle określonych reguł, w strukturach odpowiadających założonemu modelowi danych, zbiór

Bardziej szczegółowo

Wykład I. Wprowadzenie do baz danych

Wykład I. Wprowadzenie do baz danych Wykład I Wprowadzenie do baz danych Trochę historii Pierwsze znane użycie terminu baza danych miało miejsce w listopadzie w 1963 roku. W latach sześcdziesątych XX wieku został opracowany przez Charles

Bardziej szczegółowo

BAZY DANYCH NORMALIZACJA BAZ DANYCH. Microsoft Access. Adrian Horzyk. Akademia Górniczo-Hutnicza

BAZY DANYCH NORMALIZACJA BAZ DANYCH. Microsoft Access. Adrian Horzyk. Akademia Górniczo-Hutnicza BAZY DANYCH Microsoft Access NORMALIZACJA BAZ DANYCH Adrian Horzyk Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i Inżynierii

Bardziej szczegółowo

Projektowanie systemów informatycznych. Roman Simiński siminskionline.pl. Modelowanie danych Diagramy ERD

Projektowanie systemów informatycznych. Roman Simiński siminskionline.pl. Modelowanie danych Diagramy ERD Projektowanie systemów informatycznych Roman Simiński roman.siminski@us.edu.pl siminskionline.pl Modelowanie danych Diagramy ERD Modelowanie danych dlaczego? Od biznesowego gadania do magazynu na biznesowe

Bardziej szczegółowo

CRM. moduł zarządzania relacjami z klientami. Poradnik dla użytkowników systemu FIRMA 1/1

CRM. moduł zarządzania relacjami z klientami. Poradnik dla użytkowników systemu FIRMA 1/1 CRM moduł zarządzania relacjami z klientami Poradnik dla użytkowników systemu FIRMA 1/1 1. Wprowadzenie CRM Zarządzanie relacjami z klientami to nowy produkt firmy SOFT EKSPERT. Prosty, intuicyjny i czytelny

Bardziej szczegółowo

Tworzenie bazy danych na przykładzie Access

Tworzenie bazy danych na przykładzie Access Tworzenie bazy danych na przykładzie Access Tworzenie tabeli Kwerendy (zapytania) Selekcja Projekcja Złączenie Relacja 1 Relacja 2 Tworzenie kwedend w widoku projektu Wybór tabeli (tabel) źródłowych Wybieramy

Bardziej szczegółowo

Baza danych. Baza danych to:

Baza danych. Baza danych to: Baza danych Baza danych to: zbiór danych o określonej strukturze, zapisany na zewnętrznym nośniku (najczęściej dysku twardym komputera), mogący zaspokoić potrzeby wielu użytkowników korzystających z niego

Bardziej szczegółowo

APIO. W4 ZDARZENIA BIZNESOWE. ZALEŻNOŚCI MIĘDZY FUNKCJAMI. ELEMENTY DEFINICJI PROCESU. DIAGRAM ZALEŻNOŚCI FUNKCJI.

APIO. W4 ZDARZENIA BIZNESOWE. ZALEŻNOŚCI MIĘDZY FUNKCJAMI. ELEMENTY DEFINICJI PROCESU. DIAGRAM ZALEŻNOŚCI FUNKCJI. APIO. W4 ZDARZENIA BIZNESOWE. ZALEŻNOŚCI MIĘDZY FUNKCJAMI. ELEMENTY DEFINICJI PROCESU. DIAGRAM ZALEŻNOŚCI FUNKCJI. dr inż. Grażyna Hołodnik-Janczura W8/K4 ZDARZENIA BIZNESOWE W otoczeniu badanego zakresu

Bardziej szczegółowo

JPK.guru Excel (podgląd JPK) Instrukcja Użytkownika

JPK.guru Excel (podgląd JPK) Instrukcja Użytkownika JPK.guru Excel (podgląd JPK) Instrukcja Użytkownika Wersja: 2016-06-22 Przygotował: Adam Adamowicz sp. z o.o. Ul. Wały Piastowskie 1/1104 80-855 Gdańsk, Poland www.logicsystems.com.pl 1 Wstęp Jednolity

Bardziej szczegółowo

Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH

Hurtownie danych. Wstęp. Architektura hurtowni danych. http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH Wstęp. Architektura hurtowni. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur CO TO JEST HURTOWNIA DANYCH B. Inmon, 1996: Hurtownia to zbiór zintegrowanych, nieulotnych, ukierunkowanych

Bardziej szczegółowo

Załącznik nr 1 do Instrukcji użytkownika minisiis, SIIS 5.x. Spis kodów błędów

Załącznik nr 1 do Instrukcji użytkownika minisiis, SIIS 5.x. Spis kodów błędów Załącznik nr 1 do Instrukcji użytkownika minisiis, SIIS 5.x Spis kodów błędów Stan na 9-02-2015 Numer GRUPA 100 Błędy ogólnego przetwarzania plików 101 Brak pliku do przetworzenia! 102 Wystąpiła awaria

Bardziej szczegółowo

2 Zarówno zanonimizowany zbiór danych ilościowych, jak i opis jego struktury powinny mieć format csv:

2 Zarówno zanonimizowany zbiór danych ilościowych, jak i opis jego struktury powinny mieć format csv: Zbiór danych ilościowych: 1 Na każdą "bazę danych" składa się zanonimizowany zbiór danych ilościowych zebranych w badaniu oraz opis jego struktury (codebook). 2 Zarówno zanonimizowany zbiór danych ilościowych,

Bardziej szczegółowo

...Gospodarka Materiałowa

...Gospodarka Materiałowa 1 Gospodarka Materiałowa 3 Obsługa dokumentów magazynowych 4 Ewidencja stanów magazynowych i ich wycena 4 Inwentaryzacja 4 Definiowanie indeksów i wyrobów 5 Zaopatrzenie magazynowe 5 Kontrola jakości 5

Bardziej szczegółowo

Zarządzanie jakością w logistyce ćw. Artur Olejniczak

Zarządzanie jakością w logistyce ćw. Artur Olejniczak ćw. artur.olejniczak@wsl.com.pl Plan spotkań Data Godziny Rodzaj 18.03.2012 4 godziny ćw. 14:30-15:30 dyżur 14.04.2012 4 godziny ćw. 28.04.2012 4 godziny ćw. 14:30-15:30 dyżur 19.05.2012 4 godziny ćw.

Bardziej szczegółowo

Bazy danych - wykład wstępny

Bazy danych - wykład wstępny Bazy danych - wykład wstępny Wykład: baza danych, modele, hierarchiczny, sieciowy, relacyjny, obiektowy, schemat logiczny, tabela, kwerenda, SQL, rekord, krotka, pole, atrybut, klucz podstawowy, relacja,

Bardziej szczegółowo

X SPOTKANIE EKSPERCKIE. System ocen pracowniczych metodą 360 stopni

X SPOTKANIE EKSPERCKIE. System ocen pracowniczych metodą 360 stopni X SPOTKANIE EKSPERCKIE System ocen pracowniczych metodą 360 stopni Warszawa, 16.09.2011 Ocena wieloźródłowa od koncepcji do rezultatów badania dr Anna Bugalska Najlepsze praktyki Instytutu Rozwoju Biznesu

Bardziej szczegółowo

ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 5.0

ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 5.0 ECDL/ICDL Użytkowanie baz danych Moduł S1 Sylabus - wersja 5.0 Przeznaczenie Sylabusa Dokument ten zawiera szczegółowy Sylabus dla modułu ECDL/ICDL Użytkowanie baz danych. Sylabus opisuje zakres wiedzy

Bardziej szczegółowo

FMEA. Tomasz Greber tomasz@greber.com.pl. Opracował: Tomasz Greber (www.greber.com.pl)

FMEA. Tomasz Greber tomasz@greber.com.pl. Opracował: Tomasz Greber (www.greber.com.pl) FMEA Tomasz Greber tomasz@greber.com.pl FMEA MYŚLEĆ ZAMIAST PŁACIĆ Dlaczego FMEA? Konkurencja Przepisy Normy (ISO 9000, TS 16949 ) Wymagania klientów Powstawanie i wykrywanie wad % 75% powstawania wad

Bardziej szczegółowo

Diagramy ERD. Model struktury danych jest najczęściej tworzony z wykorzystaniem diagramów pojęciowych (konceptualnych). Najpopularniejszym

Diagramy ERD. Model struktury danych jest najczęściej tworzony z wykorzystaniem diagramów pojęciowych (konceptualnych). Najpopularniejszym Diagramy ERD. Model struktury danych jest najczęściej tworzony z wykorzystaniem diagramów pojęciowych (konceptualnych). Najpopularniejszym konceptualnym modelem danych jest tzw. model związków encji (ERM

Bardziej szczegółowo

ISO 14000 w przedsiębiorstwie

ISO 14000 w przedsiębiorstwie ISO 14000 w przedsiębiorstwie Rodzina norm ISO 14000 TC 207 ZARZADZANIE ŚRODOWISKOWE SC1 System zarządzania środowiskowego SC2 Audity środowiskowe SC3 Ekoetykietowanie SC4 Ocena wyników ekologicznych SC5

Bardziej szczegółowo

Księgarnia PWN: Michael J. Hernandez Bazy danych dla zwykłych śmiertelników

Księgarnia PWN: Michael J. Hernandez Bazy danych dla zwykłych śmiertelników Księgarnia PWN: Michael J. Hernandez Bazy danych dla zwykłych śmiertelników Słowo wstępne (13) Przedmowa i podziękowania (drugie wydanie) (15) Podziękowania (15) Przedmowa i podziękowania (pierwsze wydanie)

Bardziej szczegółowo

Projektowanie Systemów Informacyjnych

Projektowanie Systemów Informacyjnych Projektowanie Systemów Informacyjnych Wykład II Encje, Związki, Diagramy związków encji, Opracowano na podstawie: Podstawowy Wykład z Systemów Baz Danych, J.D.Ullman, J.Widom Copyrights by Arkadiusz Rzucidło

Bardziej szczegółowo

Monitoring procesów z wykorzystaniem systemu ADONIS. Krok po kroku

Monitoring procesów z wykorzystaniem systemu ADONIS. Krok po kroku z wykorzystaniem systemu ADONIS Krok po kroku BOC Information Technologies Consulting Sp. z o.o. e-mail: boc@boc-pl.com Tel.: (+48 22) 628 00 15, 696 69 26 Fax: (+48 22) 621 66 88 BOC Management Office

Bardziej szczegółowo

Elektroniczny Case Report Form

Elektroniczny Case Report Form Elektroniczny Case Report Form NASI KLIENCI 2 O SYSTEMIE System ecrf.biz został opracowany z myślą o kompleksowym wsparciu projektów badawczych takich jak badania kliniczne, badania obserwacyjne, badania

Bardziej szczegółowo

Uzupełnij pola tabeli zgodnie z przykładem poniżej,

Uzupełnij pola tabeli zgodnie z przykładem poniżej, 1. Wykonaj bazę danych biblioteki szkolnej, Otwórz MS Access a następnie z menu plik wybierz przycisk nowy, w oknie nowy plik wybieramy pusta baza danych nadaj jej nazwę Biblioteka i wybierz miejsce w

Bardziej szczegółowo

Kryteria oceny Systemu Kontroli Zarządczej

Kryteria oceny Systemu Kontroli Zarządczej Załącznik nr 2 do Zasad kontroli zarządczej w gminnych jednostkach organizacyjnych oraz zobowiązania kierowników tych jednostek do ich stosowania Kryteria oceny Systemu Kontroli Zarządczej Ocena Środowisko

Bardziej szczegółowo

Dokumentacja programu. Zoz. Uzupełnianie kodów terytorialnych w danych osobowych związanych z deklaracjami POZ. Wersja

Dokumentacja programu. Zoz. Uzupełnianie kodów terytorialnych w danych osobowych związanych z deklaracjami POZ. Wersja Dokumentacja programu Zoz Uzupełnianie kodów terytorialnych w danych osobowych związanych z deklaracjami POZ Wersja 1.40.0.0 Zielona Góra 2012-02-29 Wstęp Nowelizacja Rozporządzenia Ministra Zdrowia z

Bardziej szczegółowo

Nowe funkcje w programie Forte Finanse i Księgowość

Nowe funkcje w programie Forte Finanse i Księgowość Forte Finanse i Księgowość 1 / 11 Nowe funkcje w programie Forte Finanse i Księgowość Spis treści : Korzyści z zakupu nowej wersji 2 Forte Finanse i Księgowość w wersji 2011.b 3 Nowe wzory deklaracji VAT

Bardziej szczegółowo

Nowe funkcje w programie Symfonia Finanse i Księgowość

Nowe funkcje w programie Symfonia Finanse i Księgowość Symfonia Finanse i Księgowość 1 / 11 Nowe funkcje w programie Symfonia Finanse i Księgowość Spis treści : Korzyści z zakupu nowej wersji 2 Symfonia Finanse i Księgowość w wersji 2011.1.b 3 Nowe wzory deklaracji

Bardziej szczegółowo

Podstawowe zagadnienia z zakresu baz danych

Podstawowe zagadnienia z zakresu baz danych Podstawowe zagadnienia z zakresu baz danych Jednym z najważniejszych współczesnych zastosowań komputerów we wszelkich dziedzinach życia jest gromadzenie, wyszukiwanie i udostępnianie informacji. Specjalizowane

Bardziej szczegółowo

BAZY DANYCH LABORATORIUM. Studia niestacjonarne I stopnia

BAZY DANYCH LABORATORIUM. Studia niestacjonarne I stopnia BAZY DANYCH LABORATORIUM Studia niestacjonarne I stopnia Gdańsk, 2011 1. Cel zajęć Celem zajęć laboratoryjnych jest wyrobienie praktycznej umiejętności tworzenia modelu logicznego danych a nastepnie implementacji

Bardziej szczegółowo

Relacyjny model baz danych, model związków encji, normalizacje

Relacyjny model baz danych, model związków encji, normalizacje Relacyjny model baz danych, model związków encji, normalizacje Wyklad 3 mgr inż. Maciej Lasota mgr inż. Karol Wieczorek Politechnika Świętokrzyska Katedra Informatyki Kielce, 2009 Definicje Operacje na

Bardziej szczegółowo

Adonis w Banku Spółdzielczym w Trzebnicy

Adonis w Banku Spółdzielczym w Trzebnicy Adonis w Banku Spółdzielczym w Trzebnicy J O A N N A M O R O Z PAW E Ł K O N I E C Z N Y AGENDA I. Charakterystyka Banku II. Wdrożenie systemu ADONIS III.Proces zarządzania ryzykiem operacyjnym w BS Trzebnica

Bardziej szczegółowo

Darmowy fragment www.bezkartek.pl

Darmowy fragment www.bezkartek.pl Wszelkie prawa zastrzeżone. Rozpowszechnianie całości lub fragmentów niniejszej publikacji w jakiejkolwiek postaci bez zgody wydawcy zabronione. Autor oraz wydawca dołożyli wszelkich starań aby zawarte

Bardziej szczegółowo

Bazy danych Wykład zerowy. P. F. Góra

Bazy danych Wykład zerowy. P. F. Góra Bazy danych Wykład zerowy P. F. Góra http://th-www.if.uj.edu.pl/zfs/gora/ 2012 Patron? Św. Izydor z Sewilli (VI wiek), biskup, patron Internetu (sic!), stworzył pierwszy katalog Copyright c 2011-12 P.

Bardziej szczegółowo

Informatyzacja Przedsiębiorstw

Informatyzacja Przedsiębiorstw Informatyzacja Przedsiębiorstw Microsoft Dynamics NAV 2016 Moduł finansowo-księgowy lab2 Izabela Szczęch Informatyzacja Przedsiębiorstw Strona 1 Plan zajęć 1 Bilans otwarcia... 3 1.1 Otwarcie raportu kasowego...

Bardziej szczegółowo

Plan. Formularz i jego typy. Tworzenie formularza. Co to jest formularz? Typy formularzy Tworzenie prostego formularza Budowa prostego formularza

Plan. Formularz i jego typy. Tworzenie formularza. Co to jest formularz? Typy formularzy Tworzenie prostego formularza Budowa prostego formularza 4 Budowa prostych formularzy, stany sesji, tworzenie przycisków Plan Co to jest formularz? Typy formularzy Tworzenie prostego formularza Budowa prostego formularza 2 Formularz i jego typy Tworzenie formularza

Bardziej szczegółowo

PRZESTRZENNE BAZY DANYCH WYKŁAD 2

PRZESTRZENNE BAZY DANYCH WYKŁAD 2 PRZESTRZENNE BAZY DANYCH WYKŁAD 2 Baza danych to zbiór plików, które fizycznie przechowują dane oraz system, który nimi zarządza (DBMS, ang. Database Management System). Zadaniem DBMS jest prawidłowe przechowywanie

Bardziej szczegółowo

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. http://zajecia.jakubw.pl/hur INTEGRACJA DANYCH ETL

Hurtownie danych. Ładowanie, integracja i aktualizacja danych. http://zajecia.jakubw.pl/hur INTEGRACJA DANYCH ETL Hurtownie danych Ładowanie, integracja i aktualizacja danych. Jakub Wróblewski jakubw@pjwstk.edu.pl http://zajecia.jakubw.pl/hur INTEGRACJA DANYCH Źródła danych ETL Centralna hurtownia danych Do hurtowni

Bardziej szczegółowo

Zarządzanie bezpieczeństwem informacji przegląd aktualnych standardów i metodyk

Zarządzanie bezpieczeństwem informacji przegląd aktualnych standardów i metodyk Zarządzanie bezpieczeństwem informacji przegląd aktualnych standardów i metodyk dr T Bartosz Kalinowski 17 19 września 2008, Wisła IV Sympozjum Klubu Paragraf 34 1 Informacja a system zarządzania Informacja

Bardziej szczegółowo

Dokumentacja użytkownika systemu bankowości internetowej def3000/ceb. UZUPEŁNIENIE: Mechanizm Podzielonej Płatności (MPP/Split Payment)

Dokumentacja użytkownika systemu bankowości internetowej def3000/ceb. UZUPEŁNIENIE: Mechanizm Podzielonej Płatności (MPP/Split Payment) Dokumentacja użytkownika systemu bankowości internetowej def3000/ceb UZUPEŁNIENIE: Mechanizm Podzielonej Płatności (MPP/Split Payment) Spis treści Spis treści 1. Wstęp...3 2. Rachunki...4 2.1. Wyświetlenie

Bardziej szczegółowo

Autor: Artur Lewandowski. Promotor: dr inż. Krzysztof Różanowski

Autor: Artur Lewandowski. Promotor: dr inż. Krzysztof Różanowski Autor: Artur Lewandowski Promotor: dr inż. Krzysztof Różanowski Przegląd oraz porównanie standardów bezpieczeństwa ISO 27001, COSO, COBIT, ITIL, ISO 20000 Przegląd normy ISO 27001 szczegółowy opis wraz

Bardziej szczegółowo

Monitoring procesów z wykorzystaniem systemu ADONIS

Monitoring procesów z wykorzystaniem systemu ADONIS Monitoring procesów z wykorzystaniem systemu ADONIS BOC Information Technologies Consulting Sp. z o.o. e-mail: boc@boc-pl.com Tel.: (+48 22) 628 00 15, 696 69 26 Fax: (+48 22) 621 66 88 BOC Management

Bardziej szczegółowo

Co to są relacyjne bazy danych?

Co to są relacyjne bazy danych? Co to są relacyjne bazy danych? Co to są relacyjne bazy danych? O Są to zbiory danych pogrupowane w tabele o strukturze: kolejne kolumny określają kolejne porcje informacji potrzebne dla każdego wystąpienia,

Bardziej szczegółowo

VENDIO SPRZEDAŻ kompleksowa obsługa sprzedaży. dcs.pl Sp. z o.o. vendio.dcs.pl E-mail: info@dcs.pl Warszawa, 16-10-2014

VENDIO SPRZEDAŻ kompleksowa obsługa sprzedaży. dcs.pl Sp. z o.o. vendio.dcs.pl E-mail: info@dcs.pl Warszawa, 16-10-2014 VENDIO SPRZEDAŻ kompleksowa obsługa sprzedaży dcs.pl Sp. z o.o. vendio.dcs.pl E-mail: info@dcs.pl Warszawa, 16-10-2014 Agenda Jak zwiększyć i utrzymać poziom sprzedaży? VENDIO Sprzedaż i zarządzanie firmą

Bardziej szczegółowo

Ocena dojrzałości jednostki. Kryteria oceny Systemu Kontroli Zarządczej.

Ocena dojrzałości jednostki. Kryteria oceny Systemu Kontroli Zarządczej. dojrzałości jednostki Kryteria oceny Systemu Kontroli Zarządczej. Zgodnie z zapisanym w Komunikacie Nr 23 Ministra Finansów z dnia 16 grudnia 2009r. standardem nr 20 1 : Zaleca się przeprowadzenie co najmniej

Bardziej szczegółowo

Zarządzanie jakością

Zarządzanie jakością Zarządzanie jakością Plan Wstęp do zarządzania jakością Planowanie jakości Przeprowadzenie zapewnienia jakości Przeprowadzenie kontroli jakości Jakość Jakość to ogół właściwości obiektu wiążących się z

Bardziej szczegółowo

Zespół Katedry Rachunkowości Menedżerskiej SGH 1

Zespół Katedry Rachunkowości Menedżerskiej SGH 1 RM Rachunek kosztów docelowych Zarządzający zastanawiają się nad redukcją kosztów w momencie kiedy klienci nie akceptują pożądanej ceny Dr Marcin Pielaszek 2 Target Costing całkowicie zmienia sposób zarządzania

Bardziej szczegółowo

Podstawowe pojęcia dotyczące relacyjnych baz danych. mgr inż. Krzysztof Szałajko

Podstawowe pojęcia dotyczące relacyjnych baz danych. mgr inż. Krzysztof Szałajko Podstawowe pojęcia dotyczące relacyjnych baz danych mgr inż. Krzysztof Szałajko Czym jest baza danych? Co rozumiemy przez dane? Czym jest system zarządzania bazą danych? 2 / 25 Baza danych Baza danych

Bardziej szczegółowo

CDN XL: Wdrożenie ERP

CDN XL: Wdrożenie ERP CDN XL: Wdrożenie ERP Przedmiot: Moduł: 1/2 Opracował: mgr inż. Paweł Wojakowski Instytut Technologii Maszyn i Automatyzacji Produkcji Zakład Projektowania Procesów Wytwarzania Pokój: 3/7 B, bud. 6B Tel.:

Bardziej szczegółowo

Zmiany w programie VinCent 1.28

Zmiany w programie VinCent 1.28 Zmiany w programie VinCent 1.28 Finanse i księgowość Kartoteka klienta Na kartotece klienta znajdują się dwa nowe pola: -ILN- dodano na indywidualne zamówienie klienta. Można je wykorzystać do zapisania

Bardziej szczegółowo

Alicja Marszałek Różne rodzaje baz danych

Alicja Marszałek Różne rodzaje baz danych Alicja Marszałek Różne rodzaje baz danych Rodzaje baz danych Bazy danych można podzielić wg struktur organizacji danych, których używają. Można podzielić je na: Bazy proste Bazy złożone Bazy proste Bazy

Bardziej szczegółowo

PROCES TWORZENIA DOKUMENTU

PROCES TWORZENIA DOKUMENTU PROCES TWORZENIA DOKUMENTU 1. PLANOWANIE 2. ANALIZA ASPEKTÓW PRAWNYCH I ETYCZNYCH 3. GROMADZENIE INFORMACJI 4. ORGANIZOWANIE (STRUKTURALIZOWANIE) INFORMACJI 5. TWORZENIE PLANU (STRUKTURY) DOKUMENTU 6.

Bardziej szczegółowo

Modelowanie danych, projektowanie systemu informatycznego

Modelowanie danych, projektowanie systemu informatycznego Modelowanie danych, projektowanie systemu informatycznego Modelowanie odwzorowanie rzeczywistych obiektów świata rzeczywistego w systemie informatycznym Modele - konceptualne reprezentacja obiektów w uniwersalnym

Bardziej szczegółowo

Jakość w procesie wytwarzania oprogramowania

Jakość w procesie wytwarzania oprogramowania Jarosław Kuchta Jakość Oprogramowania http://www.eti.pg.gda.pl/katedry/kask/pracownicy/jaroslaw.kuchta/jakosc/ J.Kuchta@eti.pg.gda.pl Względny koszt wprowadzania zmian w zależności od fazy realizacji projektu

Bardziej szczegółowo

OpenOfficePL. Zestaw szablonów magazynowych. Instrukcja obsługi

OpenOfficePL. Zestaw szablonów magazynowych. Instrukcja obsługi OpenOfficePL Zestaw szablonów magazynowych Instrukcja obsługi Spis treści : 1. Informacje ogólne 2. Instalacja zestawu a) konfiguracja połączenia z bazą danych b) import danych z poprzedniej wersji faktur

Bardziej szczegółowo

BAZY DANYCH. Co to jest baza danych. Przykłady baz danych. Z czego składa się baza danych. Rodzaje baz danych

BAZY DANYCH. Co to jest baza danych. Przykłady baz danych. Z czego składa się baza danych. Rodzaje baz danych BAZY DANYCH Co to jest baza danych Przykłady baz danych Z czego składa się baza danych Rodzaje baz danych CO TO JEST BAZA DANYCH Komputerowe bazy danych już od wielu lat ułatwiają człowiekowi pracę. Są

Bardziej szczegółowo

Wykład II Encja, atrybuty, klucze Związki encji. Opracowano na podstawie: Podstawowy Wykład z Systemów Baz Danych, J.D.Ullman, J.

Wykład II Encja, atrybuty, klucze Związki encji. Opracowano na podstawie: Podstawowy Wykład z Systemów Baz Danych, J.D.Ullman, J. Bazy Danych Wykład II Encja, atrybuty, klucze Związki encji Opracowano na podstawie: Podstawowy Wykład z Systemów Baz Danych, J.D.Ullman, J.Widom Copyrights by Arkadiusz Rzucidło 1 Encja Byt pojęciowy

Bardziej szczegółowo

Instrukcja importu przesyłek. z Menedżera Sprzedaży do aplikacji Webklient

Instrukcja importu przesyłek. z Menedżera Sprzedaży do aplikacji Webklient Instrukcja importu przesyłek z Menedżera Sprzedaży do aplikacji Webklient Instrukcja importu przesyłek z Menedżera Sprzedaży do aplikacji Webklient Wersja 1.0 Warszawa, Luty 2015 Strona 2 z 7 Instrukcja

Bardziej szczegółowo

Zadania semestralne. Programowanie obiektowe sem. II, lato 2014/2015

Zadania semestralne. Programowanie obiektowe sem. II, lato 2014/2015 Programowanie obiektowe sem. II, lato 2014/2015 Zadania semestralne Założenia wspólne dla wszystkich tematów W programie muszą być zastosowane następujące techniki i technologie obiektowe: 1. kapsułkowanie,

Bardziej szczegółowo

Świadomy Podatnik projekt Rady Podatkowej PKPP Lewiatan. www.radapodatkowa.pl

Świadomy Podatnik projekt Rady Podatkowej PKPP Lewiatan. www.radapodatkowa.pl Świadomy Podatnik projekt Rady Podatkowej PKPP Lewiatan www.radapodatkowa.pl RYZYKO PODATKOWE Marcin Kolmas Definicja pojęcia ryzyka podatkowego na cele naszego spotkania Co to jest ryzyko podatkowe Ryzyko

Bardziej szczegółowo

SKRÓCONY OPIS systemu lojalnościowego

SKRÓCONY OPIS systemu lojalnościowego SKRÓCONY OPIS systemu lojalnościowego na podstawie wersji 2.0 PRODUCENT: Basic-Soft Ostrów Wlkp. AKTUALNA WERSJA: Kontrahent GT wersja 2.0 Zabrania się powielania, publikowania i rozpowszechniania bez

Bardziej szczegółowo

OfficeObjects e-forms

OfficeObjects e-forms OfficeObjects e-forms Rodan Development Sp. z o.o. 02-820 Warszawa, ul. Wyczółki 89, tel.: (+48-22) 643 92 08, fax: (+48-22) 643 92 10, http://www.rodan.pl Spis treści Wstęp... 3 Łatwość tworzenia i publikacji

Bardziej szczegółowo

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Usługi analityczne budowa kostki analitycznej Część pierwsza. Usługi analityczne budowa kostki analitycznej Część pierwsza. Wprowadzenie W wielu dziedzinach działalności człowieka analiza zebranych danych jest jednym z najważniejszych mechanizmów podejmowania decyzji.

Bardziej szczegółowo

Informatyka Ćwiczenie 10. Bazy danych. Strukturę bazy danych można określić w formie jak na rysunku 1. atrybuty

Informatyka Ćwiczenie 10. Bazy danych. Strukturę bazy danych można określić w formie jak na rysunku 1. atrybuty Informatyka Ćwiczenie 10 Bazy danych Baza danych jest zbiór informacji (zbiór danych). Strukturę bazy danych można określić w formie jak na rysunku 1. Pracownik(ID pracownika, imie, nazwisko, pensja) Klient(ID

Bardziej szczegółowo

Normalizacja relacyjnych baz danych. Sebastian Ernst

Normalizacja relacyjnych baz danych. Sebastian Ernst Normalizacja relacyjnych baz danych Sebastian Ernst Zależności funkcyjne Zależność funkcyjna pomiędzy zbiorami atrybutów X oraz Y oznacza, że każdemu zestawowi wartości atrybutów X odpowiada dokładnie

Bardziej szczegółowo

Sage Symfonia Start Mała Księgowość Zakładanie nowej firmy

Sage Symfonia Start Mała Księgowość Zakładanie nowej firmy Sage Symfonia Start Mała Księgowość Zakładanie nowej firmy Pierwszym krokiem po zainstalowaniu programu powinno być utworzenie nowej firmy. W tym celu należy wybrać polecenie Nowa firma z menu Firma lub

Bardziej szczegółowo

Porównywanie populacji

Porównywanie populacji 3 Porównywanie populacji 2 Porównywanie populacji Tendencja centralna Jednostki (w grupie) według pewnej zmiennej porównuje się w ten sposób, że dokonuje się komparacji ich wartości, osiągniętych w tej

Bardziej szczegółowo