Wprowadzenie do projektowania i wykorzystania baz danych Projektowanie zasobów językowych

Podobne dokumenty
Wprowadzenie do projektowania i wykorzystania baz danych Projektowanie zasobów językowych

Bazy nagrań mowy. Katarzyna Klessa Eksploracja, interpretacja, analiza. Wykład otwarty, UAM, Wydział Neofilologii, dn

Językowe bazy danych. Katarzyna Klessa Eksploracja, interpretacja, analiza , Uniwersytet Warszawski, Wydział Polonistyki

Językowe bazy danych. Katarzyna Klessa Eksploracja, interpretacja, analiza , Uniwersytet Warszawski, Wydział Polonistyki

Wprowadzenie do projektowania i wykorzystania baz danych. Katarzyna Klessa

Wprowadzenie do projektowania i wykorzystania baz danych. Katarzyna Klessa

Podstawy tworzenia i redagowania tekstów specjalistycznych Dokumentacja techniczna

Wprowadzenie do projektowania i wykorzystania baz danych Relacje i elementy projektowania baz

Ankieta. Informacje o uczestniku. Imię i nazwisko: Stanowisko : Warsztat Innowacyjne metody dydaktyczne (np. learning by doing, design thinking)

LABORATORIUM 6: ARKUSZ MS EXCEL JAKO BAZA DANYCH

Kurs MATURA Z INFORMATYKI

3.1. Na dobry początek

Opis przykładu dobrej praktyki

Bazy danych TERMINOLOGIA

KARTA MONITOROWANIA PODSTAWY PROGRAMOWEJ KSZTAŁCENIA OGÓLNEGO

Badania marketingowe. Omówione zagadnienia. Społeczna Wyższa Szkoła Przedsiębiorczości i Zarządzania

4C. III MODUŁ. PROJEKT EWALUACJI PROGRAMU ROZWOJU SZKOŁY

Komputerowe Systemy Przemysłowe: Modelowanie - UML. Arkadiusz Banasik arkadiusz.banasik@polsl.pl

MODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 1

Wykład I. Wprowadzenie do baz danych

SPIS TREŚCI CZĘŚĆ I : PRZEZNACZENIE, PROCES I PODSTAWY METODOLOGICZNE BADAŃ MARKETINGOWYCH...17

Tabele przestawne jako narzędzie analizy biznesowej

Odkrywanie CAQDAS : wybrane bezpłatne programy komputerowe wspomagające analizę danych jakościowych / Jakub Niedbalski. Łódź, 2013.

Scenariusz projektu edukacyjnego dla uczniów gimnazjum:

Autoewaluacja,,ewaluacja wewnętrzna w Szkole Podstawowej nr 19 im. Mikołaja Kopernika w Olsztynie

ROZDZIAŁ I. BUDOWA I FUNKCJONOWANIE KOMPUTERA PC

MODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 4

ETAPY PROCESU BADAWCZEGO. wg Babińskiego

Proporcje podziału godzin na poszczególne bloki. Tematyka lekcji. Rok I. Liczba godzin. Blok

PROGRAM NAUCZANIA DLA I I II KLASY GIMNAZJUM

dokonać podziału zachowań klienta przeprowadzić rozmowę sprzedażową

Projektowanie systemów informatycznych. Roman Simiński siminskionline.pl. Modelowanie danych Diagramy ERD

Monitoring procesów z wykorzystaniem systemu ADONIS. Krok po kroku

i działanie urządzeń związanych równieŝ budowę i funkcje urządzeń

biegle i poprawnie posługuje się terminologią informatyczną,

Microsoft Excel 2003 profesjonalna analiza i raportowanie oraz prezentacja danych

Program szkolenia VBA (VISUAL BASIC FOR APPLICATIONS) W EXCELU PODSTAWOWY.

MODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 4

Bazy danych Wykład zerowy. P. F. Góra

NOWY PROGRAM PRAKTYK PEDAGOGICZNO-METODYCZNYCH REALIZOWANYCH PRZEZ STUDENTÓW LINGWISTYKI STOSOWANEJ UMCS W RAMACH PROJEKTU

zaprasza Państwa na szkolenie MS Excel -poziom średnio zaawansowany zgodne z: Intermediate Microsoft Excel 2016 (zgodne z MS 55166A)

Dobór tekstów do Elektronicznego korpusu tekstów polskich z XVII i XVIII w. (do 1772 r.) możliwości i ograniczenia budowanego warsztatu badawczego

Przygotowanie uczniów do egzaminu GCSE z języka polskiego (lato 2014) Paulina Zaleśny

KARTA ZGŁOSZENIA NAZWA SZKOŁY: Imię i nazwisko uczestnika. uczestnika Opiekun Kontakt do opiekuna (tel. lub )

PLAN REALIZACJI MATERIAŁU NAUCZANIA Z INFORMATYKI II. Uczeń umie: Świadomie stosować się do zasad regulaminów (P).

Dziecko z SLI w szkole - diagnoza i postępowanie Agnieszka Maryniak

Hurtownia danych praktyczne zastosowania

Badania marketingowe

- 1 - Liczba godzin. Nr lekcji. Nr punktu w podręczniku. Zagadnienia do realizacji według podstawy programowej (treści nauczania)

SZKOLENIE: Administrator baz danych. Cel szkolenia

Informatyka klasa III Gimnazjum wymagania na poszczególne oceny

uczniowie powinni mieć przekonanie o odpowiedzialności indywidualnej i zbiorowej za stan środowiska.

WYNIKI EGZAMINU GIMNAZJALNEGO Z JĘZYKA ANGIELSKIEGO ROK SZKOLNY 2016/2017

Zaawansowany Excel w Dziale Personalnym

Nowoczesne metody nauczania przedmiotów ścisłych

Annotation Pro: anotacja cech językowych i emocji w mowie. Kurs wprowadzający. Katarzyna Klessa

1. Ogólne informacje o platformie edukacyjnej

Systemy GIS Systemy baz danych

Z nowym bitem. Informatyka dla gimnazjum. Część II

Wymogi edukacyjne na poszczególne oceny z języka hiszpańskiego w klasie 7A, 7B- w klasach dwujęzycznych z językiem hiszpańskim

EXSO-CORE - specyfikacja

Samoocena wydziałowa

LABORATORIUM 8,9: BAZA DANYCH MS-ACCESS

WYMAGANIA EDUKACYJNE Z INFORMATYKI dla klasy III gimnazjalnej, Szkoły Podstawowej w Rychtalu

Sprawozdanie z projektu edukacyjnego zrealizowanego w Szkole Podstawowej w Raszówce w roku szkolnym 2005/2006 pod hasłem "ŻYJMY ZDROWO!

Diagramy związków encji. Laboratorium. Akademia Morska w Gdyni

Usługi analityczne budowa kostki analitycznej Część pierwsza.

Podstawowe pakiety komputerowe wykorzystywane w zarządzaniu przedsiębiorstwem. dr Jakub Boratyński. pok. A38

LITERATURA. C. J. Date; Wprowadzenie do systemów baz danych WNT Warszawa 2000 ( seria Klasyka Informatyki )

DOBÓR PRÓBY. Czyli kogo badać?

ZAJĘCIA KOMPUTEROWE rok szkolny 2016/17 Wymagania i kryteria ocen w kl. IV

RELACYJNE BAZY DANYCH

Wymagania z informatyki na poszczególne oceny przy realizacji programu i podręcznika Informatyka wyd. Operon dla klasy II.

Rozkład materiału nauczania z przedmiotu INFORMATYKA. dla gimnazjum

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Wykład 1: O statystyce i analizie danych

Bazy danych - wykład wstępny

Jerzy Berdychowski. Informatyka. w turystyce i rekreacji. Materiały do zajęć z wykorzystaniem programu. Microsoft Excel

PRZEDMIOTOWY SYSTEM OCENIANIA Z JĘZYKA HISZPAŃSKIEGO

Spis treści. Od autorów / 9

Sposoby prezentacji problemów w statystyce

Przedmiotowe Zasady Oceniania z języka niemieckiego dla klas IV VI

Baza danych. Modele danych

WYMAGANIA EDUKACYJNE. Informatyka Szkoła Podstawowa Klasa 4 NA ŚRÓDROCZNĄ I ROCZNĄ OCENĘ KLASYFIKACYJNĄ

W otwartej Europie wszystkie języki są ważne

MODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 1

Badania ewaluacyjne WYWIAD 6 ZAJĘCIA

Rozkład materiału nauczania. Informatyka. Po prostu zakres podstawowy

Instrukcja użytkownika

Konspekt do lekcji informatyki dla klasy II gimnazjum. TEMAT(1): Baza danych w programie Microsoft Access.

WYMAGANIA EDUKACYJNE NA POSZCZEGÓLNE OCENY Z JĘZYKA ANGIELSKIEGO W KLASACH IV-VIII w Szkole Podstawowej im. Jana Pawła II

Zaawansowany system automatycznego rozpoznawania i przetwarzania mowy polskiej na tekst

Szwedzki dla imigrantów

Wymagania edukacyjne z informatyki dla klasy szóstej szkoły podstawowej.

INFORMATYKA W SELEKCJI

Wymagania edukacyjne z zajęć komputerowych w klasie 5

Moduł, dział, temat. Zakres treści. Osiągnięcia na poziomie ponadpodstawowym. Osiągnięcia ucznia na poziomie podstawowym

KARTA PRZEDMIOTU. Programowanie aplikacji internetowych

Transkrypt:

Wprowadzenie do projektowania i wykorzystania baz danych Projektowanie zasobów językowych Katarzyna Klessa

Zasoby językowe: projektowanie, eksploracja, analiza zagadnienia Podstawowe pojęcia Co to są dane i metadane? Jakie czynniki warto uwzględnić na etapie projektowania baz danych? W jaki sposób narzędzia komputerowe mogą wspomóc opracowanie danych językowych? Jak efektywnie opisywać nagrania mowy? Jak przyspieszyć swoją pracę z danymi? Jak przeszukiwać i analizować zebrane informacje? 2

Podstawowe pojęcia Terminologiczne dyskusje Językoznawstwo/lingwistyka korpusowa Językoznawstwo/lingwistyka komputerowa 3

Podstawowe pojęcia Dane surowe (raw/primary data) dane bez obróbki, systematyzacji, zebrane lecz w zasadzie nieprzetworzone Korpus (ang. corpus, corpora; z łac. ciało, określona całość) dane zebrane zwykle wg założonego z góry klucza, w określonym celu różne sposoby systematyzacji korpusów językowych: np. bazy plikowe, arkusze kalkulacyjne, relacyjne bazy danych» Relacyjna baza danych zbiór danych zorganizowanych w postaci tabel powiązanych różnego rodzaju relacjami 4

Dane surowe Zdjęcia: languagesindanger.eu 5

Korpusy językowe Przykładowa definicja: Uporządkowana kolekcja tekstów pisanych, transkrypcji wypowiedzi i / lub powiązanych z nimi nagrań mowy Zwykle w trakcie projektowania korpusu planuje się określoną jego strukturę oraz sposób opisu danych 6

Korpusy językowe. Korpusy nagrań mowy Zdjęcia: languagesindanger.eu 7

Dane Metadane metadane dane o danych» dla nagrań mowy dane osobowe mówcy, wiek, płeć, jego stan psychiczny, dane środowiska nagraniowego, mikrofonów, osób nagrywających, innych osób obecnych przy nagraniu, innych czynników...» dla danych tekstowych dane jak np. w katalogu bibliotecznym, informacje o sposobach kolekcjonowania danych...» załączniki np. zgody na wykorzystanie danych» uwaga: rozróżnienie nie jest jednoznaczne, metadane mogą stać się danymi i na odwrót 8

Metadane i re-usability Rozbudowany system metadanych może przyczynić się do większej użyteczności korpusu, także w obszarach poza pierwotnym docelowym obszarem zastosowań np. w psychologii, socjologii, terapii języka i mowy, technologii informatycznej i in. Kluczowa rola opisu i dokumentacji zasobów. Aspekty współdzielenia danych i komercyjne. 9

Dane Metadane Kwestionariusz, ankieta -> arkusz kalkulacyjny» Wersje papierowe, elektroniczne on-line» Wady i zalety 10

Dane Metadane Ankieta on-line jako przykładowa metoda zbierania metadanych Ćwiczenie: zbiór informacji o uczestnikach tego kursu» Proszę wypełnić ankietę on-line tutaj» Dla osób, które podadzą adres mailowy zostanie udostępniony arkusz z wynikami 11

Dane Metadane Zgoda na nagrania - można jej udzielić w formie pisemnej (optymalnie) lub ustnej, jeśli zostanie ona zarejestrowana. Warto sprawdzić aktualne przepisy przed rozpoczęciem nagrań. 12

Dane Scenariusze nagraniowe Rejestracja zachowań językowych Wiedza o języku, świadomość języka Wypowiedzi: Spontaniczne Quasi-sponatniczne, wywoływane, zadaniowe Czytane (teksty ciągłe, jednostki izolowane) Dialogi, monologi 13

Autentyczność danych w korpusie Paradoks obserwatora - Observer's Paradox Celem badań językoznawczych prowadzonych w danej społeczności ma być ustalenie, jak ludzie rozmawiają ze sobą wtedy, gdy nikt ich systematycznie nie obserwuje. Ale takie dane możemy pozyskać tylko przez systematyczną obserwację. Labov (1972) Sociolinguistic Patterns. 14

Mowa spontaniczna: baza JST / CREST Baza mowy spontanicznej i ekspresywnej JST/CREST. Baza złożona z szeregu podzestawów, z których jeden zebrano tak, że ochotnikom zamontowano małe przenośne urządzenia do nagrywania. Urządzenia rejestrowały spontaniczną mowę tych osób podczas codziennych czynności (w pracy, domu czy szkole) przez stosunkowo długi okres czasu (np. kilka miesięcy). 15

Mowa spontaniczna: język opiekuńczy mikrokorpus UAM 4 matki mówiące do swoich dzieci, niemowląt <1 r.ż Okoliczności: karmienie, przewijanie, kładzenie do snu i in. codzienne czynności Zarządzanie? Metadane? Zdjęcie: poster Design, structure, and preliminary analyses of a speech corpus of infant directed speech (IDS) and adult directed speech (ADS). SLE 2015, dzięki uprzejmości M.Oleśkowicz-Popiel 16

Mowa spontaniczna Zarządzanie? Metadane? Kwestie etyczne Ochrona danych osobowych 17

Dialogi zadaniowe: DiaGest Zadania dialogowe zaprojektowane w celu wywołania gestykulacji tzw. origami task Zdjęcie: languagesindanger.eu, dzięki uprzejmości M. Karpińskiego 18

Dialogi zadaniowe: Paralingua Dial Kilka etapów sesji nagraniowej różne zadania: czytanie tekstu, 4 zadania dialogowe, ponowne czytanie tekstu Rozmowa przez telefon komórkowy, brak kontaktu wzrokowego Nagrania za pomocą kamer, mikrofonów i telefonów 19

Portrety emocjonalne: Paralingua Emo 1 Emotion portrayals, por. GEMEP Geneva corpus (Scherer et al.) Wypowiedzi neutralne leksykalnie, co najmniej jedna fraza, wyrazy o wysokiej częstości występowania w codziennym użyciu, wszyscy mówcy te same teksty wypowiedzi Emocje podstawowe i emocje o zróżnicowanym nacechowaniu i stopniu pobudzenia (valence, activation) 20

Portrety emocjonalne: Paralingua Emo 1 z: Głowacka, K. (2016), praca mgr UAM 21

Naśladowanie, imitacja: Paralingua Emo 2 Imitacje aktorskie 20 wypowiedzi z bazy nagrań policyjnego telefonu alarmowego 22

Naśladowanie, imitacja: Paralingua Emo 2 prawdopodobieństwo kontrola wiarygodność 23

Dialogi zadaniowe: Are you talking to Mike? Kilka etapów sesji nagraniowej zmiany mikrofonów, stopniowanie informacje o rozpoczęciu nagrywania Element emocjonalny fałszywa ocena negatywna z: Karpiński, Klessa (w przygotowaniu) 24

Dialogi zadaniowe: Are you talking to Mike? z: Karpiński, Klessa (w przygotowaniu) oraz Klessa et al. 2015, ICPhS 25

Korpusy ogólnego przeznaczenia vs. specjalizowane Specjalizowane selekcja materiału dostosowana do określonych potrzeb a zatem łatwiejsza wnioski wyciągane na podstawie danych mogą tylko dotyczyć tego wybranego wycinka języka, którego dotyczy specjalizacja korpusu Ogólnego przeznaczenia z założenia dotyczą większości zjawisk w języku, powinny zakładać szczegółowy plan struktury korpusu, aby umożliwić jego późniejsze zrównoważenie, różne typy tekstów, stylów wypowiedzi, zróżnicowani mówcy Możliwość większego uogólnienia wniosków wysnuwanych na podstawie danych 26

Korpusy statyczne vs. dynamiczne Statyczne zbiór danych językowych dający informację na temat elementów systemu językowego w określonym momencie łatwiej kontrolować zrównoważenie zawartości korpusu użyteczność może być bardziej ograniczona (dezaktualizacja) Dynamiczne umożliwiają obserwację zmienności zjawisk językowych w czasie trudniejsze w utrzymaniu, droższe trudniejsza kontrola zrównoważenia i jakości danych 27

Zrównoważenie korpusów Zrównoważenie korpusów może przebiegać na jednej lub wielu płaszczyznach, zależnie od typu korpusu. Język pisany czy mówiony Style wypowiedzi (genres, speaking styles) (czytane, spontaniczne, dialogi, monologi, polilogi...) Zróżnicowanie pod względem produkcji mowy (płeć, wiek, pochodzenie regionalne, wykształcenie...) Czynniki związane z czasem pozyskania danych (różne okresy, jeden okres...) 28

Reprezentatywność korpusów Reprezentatywność zakres w jakim korpus informuje o zjawiskach zachodzących w całej populacji; w przypadku korpusów językowych w języku lub jego specjalizowanym podzbiorze Odróżnia korpusy od archiwów językowych, ale por. korpusy mowy spontanicznej Możliwość generalizacji, wyciągania uogólnionych wniosków 29

Archiwa językowe, dokumentacja języków Cele gromadzenia danych na potrzeby archiwizacji i dokumentacji oraz badań naukowych (fonetycznych, psycholingwistycznych, socjologicznych ) mogą być różne, ale wiele metod i technik pokrywa się http://languagesindanger.eu/lets-revise/pl/rev-documenta tion.php 30

Użytkownicy korpusu Jedna lub więcej grup docelowych Specjaliści, językoznawcy, informatycy... vs. np. użytkownicy rodzimi Grupa docelowa w sposób oczywisty warunkuje sposób prezentacji danych Zob. JURISDICT SLDR vs. inne-jezyki.amu.edu.pl vs. languagesindanger.eu (specjaliści z dziedziny technologii mowy, vs. językoznawcy specjalizujący się dokumentacji języków i osoby zainteresowane rewitalizacją języków vs. naukowcy, uczniowie i studenci) 31

Wybór danych do korpusu Losowy (random) losowo wybrane reprezentacje danych z wszystkich dostępnych próbek Wg kategorii (stratified) wybór danych poprzedzony wstępną kategoryzacją próbek, w niektórych przypadkach nadanie wag kategoriom danych Zwykle ten wybór daje bardziej reprezentatywne dane końcowe, ponieważ wariancja pomiędzy grupami będzie większa niż wewnątrz grup i dlatego dobrze jest, aby wszystkie grupy/kategorie miały swoje reprezentacje w korpusie 32

Dobór danych wg kategorii Kanał komunikacyjny pisane, mówione, transkrybowane (Nie)publikowane Prywatne/instytucjonalne/mieszane kwestie prawne Adresat (adresaci) (liczba, obecność, interaktywność, rodzaj komunikowanego tekstu: ogólny, specjalizowany, osobisty) Nadawca Moderator(zy) Cele wypowiedzi: preswacja, rozrywka Tematy Środowisko wypowiedzi I warunki techniczne (wyp. mówione) 33

Bazy danych Wybór technologii Różne możliwości porządkowania danych w korpusie oraz umożliwiania dostępu do danych, zależnie od wyboru technologii. Wybór technologii zależny od rozmiaru i rodzaju korpusu oraz celu późniejszych analiz. 34

Czy zbiór plików umieszczonych w folderze to baza danych? Jeśli pojęcie danych' to dla naspo po prostu prostu jakikolwiek Jeśli pojęcie 'baza'baza danych' to dla nas jakikolwiek zbiór danych, to pytanie na powyższe pytanie zbiór danych, to na powyższe możemy możemy odpowiedzieć - 'tak' odpowiedzieć - 'tak' - Ograniczenia - brak powiązań między poszczególnymi Ograniczenia brak powiązań między poszczególnymi plikami, -trudności w sortowaniu ze względu na różne plikami,kryteria, trudności w sortowaniu ze względu trudności we współpracy, gdy dane na są różne osoby (kto edytuje, plik, kryteria,edytowane trudnościprzez we różne współpracy, gdy danektóry są edytowane kiedy, osoby co zostało zmienione?) przez różne (kto edytuje, który plik, kiedy, co zostało zmienione?) Systemy wspomagające pracę na zbiorach plików, np. Git http://git-scm.com/ - darmowy hosting dla Git, np. https://github.com/, https://bitbucket.org/ 35

Czy zbiór plików umieszczonych w folderze to baza danych? - Systemy wspomagające na zbiorach plików, np. Git, Jeśli pojęcie 'baza danych' topracę dla nas po prostu jakikolwiek http://git-scm.com/; darmowy hosting możemy dla Git: zbiór danych, to na powyższe pytanie https://bitbucket.org/ albo https://github.com/ odpowiedzieć - 'tak' Ograniczenia - brak powiązań między poszczególnymi - Opcje wbudowane w programy pracujące na zbiorach plików plikami,- Annotation trudności Pro w sortowaniu ze względu na(.antw) różne - opcje dotyczące workspace pracę zbiorach plików i operacje zbiorowe na kryteria,ułatwiają trudności wenawspółpracy, gdy dane są edytowane nich, aosoby także - (kto w ograniczony - połączeń/relacji między przez różne edytuje, sposób który plik, kiedy, co zostało nimi zmienione?) Systemy wspomagające pracę na zbiorach plików, np. Git http://git-scm.com/ - darmowy hosting dla Git, np. https://github.com/, https://bitbucket.org/ 36

Czy arkusz kalkulacyjny to baza danych? 37

Czy zbiór plików umieszczonych w folderze to baza danych? Jeśli pojęcie 'baza danych' to dla nas po prostu jakikolwiek zbiór danych, to na powyższe pytanie możemy odpowiedzieć - 'tak' Ograniczenia - brak powiązań między poszczególnymi plikami, trudności w sortowaniu ze względu na różne kryteria, trudności we współpracy, gdy dane są edytowane przez różne osoby (kto edytuje, który plik, kiedy, co zostało zmienione?) Systemy wspomagające pracę na zbiorach plików, np. Git http://git-scm.com/ - darmowy hosting dla Git, np. https://github.com/, https://bitbucket.org/ 38

Czy arkusz kalkulacyjny to baza danych? Podobnie jak zbiór plików w folderze, arkusz kalkulacyjny może pełnić funkcję dość prostej bazy danych W arkuszach kalkulacyjnych możemy do pewnego stopnia i stosunkowo łatwo kontrolować dane (w tym przypadku zawartość komórek), możemy m.in.: napisać formuły, stworzyć makro przetwarzające dane, tworzyć tabele przestawne itp. Nadal jednak ta forma przechowywania danych nie daje możliwości pełnego wykorzystania powiązań między danymi, ani jednoczesnej pracy wielu osób na tych samych danych itp. 39

Warto - nie warto - trzeba? Czy / kiedy warto szukać czegoś więcej niż zwykły zbiór plików czy arkusz kalkulacyjny? - kiedy mamy 1 osobę pracującą nad 1 tekstem? - kiedy mamy 1 osobę i wiele danych? - kiedy mamy dużo osób i średnią ilość danych? - kiedy mamy dużo osób i bardzo dużo danych? - kiedy różne osoby pracują z różnych miejsc, zdalnie? 40

Warto - nie warto - trzeba? Czy / kiedy warto szukać czegoś więcej niż zwykły zbiór plików czy arkusz kalkulacyjny? - kiedy mamy 1 osobę pracującą nad 1 tekstem - nie warto - kiedy mamy 1 osobę i wiele danych - warto - kiedy mamy dużo osób i średnią ilość danych - warto - kiedy mamy dużo osób i bardzo dużo danych - trzeba - kiedy różne osoby pracują z różnych miejsc, zdalnie warto czasem trzeba - zależnie od ilości danych (np. za stroną internetową z danymi stoi zwykle baza danych) 41

Relacyjna baza danych - i relacyjny model rzeczywistości Relacyjna baza danych oparta jest na tzw relacyjnym modelu rzeczywistości: ma odzwierciedlać pewien fragment rzeczywistości, jej elementów oraz powiązań między nimi - zob. np. strukturę bazy słownika obok. 42

Relacyjna baza danych - i relacyjny model rzeczywistości Bazy relacyjne składają się z wielu powiązanych ze sobą tabel. 43

Jak to działa? - architektura klient - serwer 44

Jak to działa? - przykład z praktyki Leksykalna baza danych Speechlabs.ASR - SSMS - Lexicon Editor 45

Linki http://pl.languagesindanger.eu/book-of-knowledge/lang uage-documentation/ http://sldr.org/voir_depot.php?id=868&version=1&lang=fr &prefix=sldr&creer_toc=oui#toc http://nkjp.pl/ http://www.natcorp.ox.ac.uk/corpus/index.xml?id=intro http://phoible.org/ http://wals.info/ http://glottolog.org/ http://www.buckeyecorpus.osu.edu/ 46

Dziękuję za uwagę!