KORPUSY TEKSTOWE A TWORZENIE MATERIAŁÓW NA ZAJĘCIA Z JĘZYKÓW OBCYCH



Podobne dokumenty
PLATFORMA MOODLE NA LEKTORACIE JĘZYKA OBCEGO

Dla Wielkopolskiego Związku Pracodawców

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

Projekt: Współpraca i dialog. Opis szkoleń językowych planowanych do realizacji w ramach projektu

Wikispaces materiały szkoleniowe

Podstawowe informacje o obsłudze pliku z uprawnieniami licencja.txt

KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Lektorat języka angielskiego. 2. KIERUNEK: Turystyka i rekreacja. 3. POZIOM STUDIÓW: I stopnia

Instrukcja UŜytkownika bazy ECAS

A LIO COMBIVIS. Program KEB dla falowników F4 i F5 proste podłączenie, programowanie i obsługa

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 1 Wprowadzenie do narzędzia CASE. Materiały dla nauczyciela

Laboratorium z Grafiki InŜynierskiej CAD. Rozpoczęcie pracy z AutoCAD-em. Uruchomienie programu

Załącznik nr 5 KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Praktyczna Nauka Języka Angielskiego - Czytanie z leksyką

Współpraca Integry z programami zewnętrznymi

TRZECIA CZĘŚĆ EGZAMINU GIMNAZJALNEGO. JĘZYKI OBCE NOWOśYTNE

CRM VISION Instalacja i uŝytkowanie rozszerzenia do programu Mozilla Thunderbird

Empowerment in ICT Skills. Making Use of Technology Tools wykorzystywanie aplikacji ICT w nauczaniu

Instrukcja uŝytkownika aplikacji modernizowanego Systemu Informacji Oświatowej

PRZEWODNIK PO PRZEDMIOCIE RODZAJ ZAJĘĆ LICZBA GODZIN W SEMESTRZE WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM 30

MODUŁ KSZTAŁCENIA: Praktyczna nauka języka angielskiego: moduł 4

X.4.a. Potrafisz tworzyć projekt multimedialny za pomocą kreatora

Omówienie procesu zakupowego w sklepie internetowym Papyrus Sp. z o. o. Spis treści

Biblioteka Wirtualnej Nauki

Generowanie tabel na podstawie pliku, utworzonego podczas poprzedniej aktualizacji baz danych oświatowych

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 2 Ćwiczenia w narzędziu CASE diagram klas. Materiały dla nauczyciela

Dlaczego warto inwestować w naukę języków obcych?

Projekt ZSWS. Instrukcja uŝytkowania narzędzia SAP Business Explorer Analyzer. 1 Uruchamianie programu i raportu. Tytuł: Strona: 1 z 31

Opis obsługi programu KALKULACJA

CRM VISION INSTALACJA I UśYTKOWANIE ROZSZERZENIA DO PROGRAMU MOZILLA THUNDERBIRD

Instrukcja uŝytkowania

UNIWERSYTET WARSZAWSKI WYDZIAŁ NEOFILOLOGII

stworzenie podstaw dla dalszej nauki języka na poziomie B2 do C1

Krok po kroku... (czyli jak stworzyć i wydrukować krzyżówkę)

Zasoby internetowe do darmowej nauki języka angielskiego. Alicja Wojgienica

InŜynieria Rolnicza 14/2005. Streszczenie

Praca w programie Power Draft

Oferta na samochód nowy Oferta na samochód nowy spis kroków

Tworzenie książeczek w Storybird

Załącznik nr 4 do Zarządzenia Nr.. KARTA KURSU. Nazwa. Język angielski B2-3s. Kod Punktacja ECTS* 4

SZKOLENIE: METODYKA E-LEARNINGU (50h) Tematyka zajęć: PROGRAM EXE NARZĘDZIE DO TWORZENIA ELEKTRONICZNYCH MATERIAŁÓW DYDAKTYCZNYCH (10h)

KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Praktyczna Nauka Języka Angielskiego gramatyka praktyczna

Spis treści. I. Czym jest Indeks Haseł 3 II. Wyszukiwanie hasła 4. 1) Alfabetyczna lista haseł 4 2) Wyszukiwarka haseł 4 3) Grupy haseł 6

PLAN PRACY ZAJĘĆ DYDAKTYCZNO- WYRÓWNAWCZYCH PROWADZĄCY: MGR INŻ. ANNA BLOK. TERMIN ZAJĘĆ: PIĄTEK GODZINA 13:30 Sala nr. 16

coffee Instrukcja do systemu Warszawa, wrzesień 2008

SYLABUS/KARTA PRZEDMIOTU

KARTA KURSU. Jezyk angielski B2-2s. English B2-2s. Kod Punktacja ECTS* 3. mgr Anna Fertner

KARTA PRZEDMIOTU. 11. ZAŁOŻENIA I CELE PRZEDMIOTU: 1. Wypracowanie przez studenta umiejętności budowania poprawnych struktur

PRZEWODNIK PO PRZEDMIOCIE RODZAJ ZAJĘĆ LICZBA GODZIN W SEMESTRZE WYKŁAD ĆWICZENIA LABORATORIUM PROJEKT SEMINARIUM 30

OGÓLNOPOLSKI SYSTEM OCHRONY ZDROWIA OSOZ STRONA INTERNETOWA APTEKI

Poszczególne pozycje górnego menu umoŝliwiają wyświetlenie: strony tytułowej. spisu treści. spisu notatek. spisu zakładek

Obsługa komputera. Paweł Kruk

KARTA PRZEDMIOTU. 1. NAZWA PRZEDMIOTU: Lektorat języka angielskiego. 2. KIERUNEK: Politologia. 3. POZIOM STUDIÓW: I stopnia

KARTA PRZEDMIOTU. 12. PRZEDMIOTOWE EFEKTY KSZTAŁCENIA Odniesienie do kierunkowych efektów kształcenia (symbol) WIEDZA

Wykorzystanie protokołu SCEP do zarządzania certyfikatami cyfrowymi w systemie zabezpieczeń Check Point NGX

Załącznik nr 4 do Zarządzenia Nr RD/Z /2017 KARTA KURSU. JĘZYK ANGIELSKI B2-3s

ToonDoo Maker tworzenie pojedynczej sceny komiksowej

Wykorzystanie szkolnych pracowni komputerowych w nauczaniu przedmiotów ogólnokształcących i zawodowych

Kierunek i poziom studiów: Filologia, specjalność: język rosyjski, program: język biznesu, studia pierwszego stopnia

z :14

Załącznik nr 4 do Zarządzenia Nr.. KARTA KURSU. Nazwa. Język angielski B2-2s. Kod Punktacja ECTS* 3

Paczki przelewów w ING BankOnLine

Jak zapisać wersję elektroniczną pracy dyplomowej? - INSTRUKCJA (krok po kroku)

Instrukcja obsługi programu Creative Fotos

Indywidualizacja w e-learningu jako sposób podniesienia jakości nauczania

Macmillan Practice Online przewodnik dla uczniów

USOSweb wypełnianie protokołów

SERTUM moduł Oferty. Spis treści

SYLLABUS. Gramatyka kontrastywna

Wirtualna tablica. Padlet: Padlet nazywany jest wirtualną tablicą, ścianą lub kartką strony internetowej.

Bezpłatne programy i usługi edukacyjne w pracy nauczyciela bibliotekarza

SYLLABUS. Gramatyka kontrastywna 1 i 2

Laboratorium modelowania oprogramowania w języku UML. Ćwiczenie 5 Ćwiczenia w narzędziu CASE diagram przypadków uŝycia. Materiały dla nauczyciela

Przewodnik po platformie

Materiały szkoleniowe WSB-NLU

Systemy liczenia. 333= 3*100+3*10+3*1

Tworzenie zespołu. Ustalenie aktualnego projektu. Laboratorium Technik Komputerowych I, Inventor, ćw. 4

WyŜsza Szkoła Zarządzania Ochroną Pracy MS EXCEL CZ.2

Jak zapisać wersje elektroniczną pracy dyplomowej? - INSTRUKCJA (krok po kroku)

"Tell Me More Campus" w Politechnice Rzeszowskiej

Instrukcja tworzenia strony WWW w oparciu o szablon CMSimple

1. Ogólne ćwiczenia przygotowawcze

Polsko-Niemiecka Współpraca MłodzieŜy Podręcznik uŝytkownika Oprogramowania do opracowywania wniosków PNWM

Praktyczna nauka języka angielskiego - Use of English kształcenia

Platforma e-learning Beyond45. Przewodnik użytkownika

Elementy planowania zajęć akademickich w Internecie

HYUNDAI Magic Scan Nr produktu

Praca w programie Power Draft

KARTA PRZEDMIOTU. 11. ZAŁOŻENIA I CELE PRZEDMIOTU: 1. Wypracowanie przez studenta umiejętności budowania poprawnych struktur

INFORMATYKA MÓJ SPOSÓB NA POZNANIE I OPISANIE ŚWIATA.

Dostęp do poczty przez www czyli Kerio Webmail Poradnik

Praca w programie Power Draft

Podstawy tworzenie prezentacji multimedialnej w programie. MS Power Point

Konfiguracja programu pocztowego Outlook Express i toŝsamości.

SYSTEM ZARZĄDZANIA TREŚCIĄ (CMS) STRONY INTERNETOWEJ SZKOŁY PRZEWODNIK

Storybird tworzenie e-książeczek

Uczy się odpowiednio uŝywać języka hiszpańskiego w róŝnych sytuacjach.

Instrukcja zmian w wersji Vincent Office

Nauczanie informatyki przez Internet w Polsko-Japońskiej WyŜszej Szkole Technik Komputerowych

Politechnika Częstochowska, Wydział Zarządzania PRZEWODNIK PO PRZEDMIOCIE

E-LEARNING JAKO NARZĘDZIE WSPOMAGAJĄCE DYDAKTYKĘ STUDIÓW STACJONARNYCH. E-learning as a tool to aid stationary studies teaching. 1.

INFORMATYKA SZKOŁA PODSTAWOWA W PRZEŹMIEROWIE

Transkrypt:

Sylwia TWARDO Szkoła Języków Obcych, Uniwersytet Warszawski, Warszawa KORPUSY TEKSTOWE A TWORZENIE MATERIAŁÓW NA ZAJĘCIA Z JĘZYKÓW OBCYCH Streszczenie. Korpusy tekstowe to zbiory tekstów zapisane w postaci cyfrowej. Przykładem korpusu języka angielskiego, dostępnego w Internecie jest BNC (British National Corpus). Jest on uŝywany do tworzenia materiałów do nauczania gramatyki i słownictwa (kolokacje). Techniki korpusowe moŝna wykorzystywać równieŝ przy uŝyciu programów do analizy korpusów tekstowych. Jednym z nich jest program AntConc. Przy jego uŝyciu moŝna tworzyć materiały dydaktyczne do nauczania słownictwa (zwłaszcza specjalistycznego) z wykorzystaniem wybranych przez siebie tekstów lub teŝ tworzyć ćwiczenia do umieszczenia na platformie internetowej. Ponadto w pracy z tekstem przydatne są programy oznaczające części mowy. Jednym z nich jest dostępny on-line program Tree Tagger. 1. WSTĘP Korpusy tekstowe to zbiory tekstów zapisanych w postaci cyfrowej. W nauczaniu języków obcych wykorzystywane są ich dwa rodzaje: korpusy tekstów tworzonych przez rodzimych uŝytkowników języka oraz korpusy tekstów tworzonych przez osoby uczące się języka. Przykładem dostępnego w Internecie korpusu pierwszego typu dla języka angielskiego jest British National Corpus (BNC). Korpus ten składa się z tekstów róŝnych rodzajów (np. reprezentujących język literacki lub naukowy, a takŝe transkrypcji nagrań tekstów mówionych). Drugi rodzaj, to korpusy uczniowskie, tzn. zbiory tekstów pisanych przez studentów. Dla języka angielskiego przykładem moŝe być International Corpus of Learner English ( ICLE), tworzony przez Centrum Studiów nad Językiem Angielskim Katolickiego Uniwersytetu Louvain w Belgii, we współpracy z jednostkami róŝnych krajów (w tym Instytutem Filologii Angielskiej w Poznaniu - PICLE). Korpus ten składa się z tekstów pisanych. Ponadto tworzone są korpusy języka mówionego (uczniowski - nagrania audio - LINDSEI - Louvain) oraz korpusy multimodalne (nagrania wideo). W nauczaniu języków obcych korpusy tworzone przez rodzimych uŝytkowników języka wykorzystywane są na dwa sposoby: do przygotowywania materiałów dydaktycznych (podręczników) oraz do samodzielnej analizy materiałów zawartych w korpusie przez uczniów. Przykładem pierwszego zastosowania są np. ćwiczenia na kolokacje, zawarte w podręczniku języka angielskiego Landmark Advanced. TakŜe nauczyciele mogą korzystać z korpusu do przygotowywania własnych materiałów na zajęcia. Drugi sposób uŝywania korpusów w nauczaniu zwany jest Data Driven Learning (DDL). Polega on na tym, Ŝe uczniowie otrzymują od nauczyciela zadanie, polegające na analizie wyników zapytania korpusu, dotyczących jakiegoś wyrazu lub struktury gramatycznej (w wersji cyfrowej lub na wydruku przygotowanym przez nauczyciela). Pionierem tej metody jest Tim Jones. Niniejszy artykuł przedstawia propozycje wykorzystania darmowych narzędzi do analizy korpusów do tworzenia materiałów do nauczania języków obcych do wykorzystania na zajęciach w sali lub do umieszczania na platformie internetowej. Analizowanym 'korpusem' są pojedyncze teksty (lub zestawy kilku tekstów z tej samej dziedziny), a rezultatem pracy są ćwiczenia leksykalne lub gramatyczne, dotyczące tych tekstów (lub ich fragmentów). Metoda ta wydaje się szczególnie interesująca dla lektorów, którzy prowadzą kursy języka

Języki obce w kontekście współczesnych wyzwań i perspektyw technicznego lub specjalistycznego i waŝne jest dla nich tworzenie zadań dotyczących terminologii z dziedzin, dla których nie istnieją odpowiednie podręczniki. Drugą grupą osób, mogących korzystać z omawianej metody, są nauczyciele tworzący kursy internetowe lub komplementarne, na które naleŝy przygotować własne materiały dydaktyczne. 2. NARZĘDZIA DO ANALIZY KORPUSU Istnieje kilka programów, które moŝna wykorzystać do analizy tekstu. Bardziej znane to WordSmith Tools (do nabycia) oraz AntConc (darmowy). Pozwalają one oglądać tzw. konkordancje, wybranego słowa, czyli konteksty, w jakim występuje. Ponadto moŝna dzięki nim uzyskiwać listy wszystkich typów słów w analizowanym korpusie, listy słów pomniejszone o tzw. stoplisty, listy słów kluczowych, wyrazy, które występują obok interesującego nas słowa, oraz listy tzw. n-gramów, tj. par, trójek, itd., słów analizowanego korpusu. Po oznaczeniu wyrazów korpusu ze względu na to, jakie części mowy reprezentują (krótkie teksty moŝna oznaczać przy pomocy programu dostępnego on-line, a następnie zapisywać na własnym komputerze), moŝna równieŝ uzyskać listę interesujących nas par części mowy (np. wszystkie pary przymiotnik + rzeczownik). W niniejszym artykule szczegółowo zaprezentowany zostanie program AntConc, którego zaletą jest intuicyjna obsługa oraz fakt, Ŝe moŝna go za darmo ściągnąć z Interenetu. Jako narzędzie do oznaczania części mowy (POS-tagging) zaproponowany jest program Tree Tagger udostępniony w Internecie przez Learning Team Uniwersytetu w Nottingham. 2.1. AntConc Jest to program autorstwa Laurence Anthony ego z Uniwersytetu Washeda w Japonii. PoniŜsze zrzuty ekranu przedstawiają poszczególne opcje tego programu (wersja 3.2.2w), przydatne do tworzenia materiałów dydaktycznych. W celu wykorzystania programu naleŝy zapisać interesujący nas dokument jako plik tekstowy (txt). Rys. 1. Otwieranie pliku 245

V Międzynarodowa Konferencja Edukacyjna Rys. 2. Konkordancje słowa art Rys. 3. Konkordancje słowa art posortowane według pierwszego słowa po lewej stronie 246

Języki obce w kontekście współczesnych wyzwań i perspektyw Rys. 3. Lista słów Rys. 4. Lista par słów 247

V Międzynarodowa Konferencja Edukacyjna 2.2. Tree Tagger Programu tego uŝywa się on-line. MoŜna go wykorzystywać do oznaczania części mowy w językach: angielskim, francuskim, hiszpańskim, niemieckim, portugalskim, rosyjskim i włoskim (autorka artykułu uŝywała go tylko do języka angielskiego). Program został stworzony przez Institut für Maschinelle Sprachverarbeitung z Uniwersytetu w Stuttgarcie, zaś interfejs internetowy udostępnił wyŝej wspomniany Learning Team Uniwersytetu w Nottingham. Aby oznaczyć części mowy w wybranym tekście, naleŝy ustawić język, wkleić tekst do okna na górze strony (kasując istniejący tekst i pamiętając, Ŝe wybrany przez nas tekst nie moŝe mieć więcej niŝ tysiąc słów), a następnie wybrać przycisk submit. Po krótkim czasie program umieści oznaczony tekst w okienku w dolnym lewym rogu, który moŝemy skopiować do pliku tekstowego, a następnie otworzyć w programie AntConc. Rys. 5. Interfejs programu Tree Tagger 248

Języki obce w kontekście współczesnych wyzwań i perspektyw Rys. 6. Tree Tagger. Wstawiony (górne okienko po lewej stronie) i oznaczony tekst (dolne okienka) Oznaczony tekst wstawiamy do programu AntConc i oglądamy konkordancje wybranego słowa. Dzięki oznaczeniu moŝemy sortować konkordancje ze względu na części mowy. Rys. 7. Konkordancje słowa works uporządkowane ze względu na części mowy po lewej stronie 249

V Międzynarodowa Konferencja Edukacyjna 2.1. PRZYKŁADOWE ĆWICZENIE Jako przykład zastosowania metod analizy korpusowej do tworzenia materiałów dydaktycznych moŝna zaprezentować ćwiczenie do dwóch stron z portalu Europass (europejski portal pomagający tworzyć niezbędne do znalezienia pracy, np. CV). Przedstawia ono listę grup rzeczowników (z dwóch tekstów: Europas CV i Europass Language Passport), a zadaniem studenta jest wybór przymiotników z zamieszczonej powyŝej listy, które w tekście występują z określonymi rzeczownikami. Zadanie to jednym z trzech ćwiczeń na słownictwo. Rys. 8. Ćwiczenie na kolokacje 3. PODSUMOWANIE Narzędzia do analizy korpusów mogą być wykorzystywane do pracy z pojedynczymi tekstami i tworzenia materiałów dydaktycznych. UŜycie róŝnych opcji programu AntConc pozwala na dokładniejszą analizę zawartego w analizowanym tekście słownictwa oraz wydobycie jego specyfiki (np. powtarzających się par przymiotników i rzeczowników). Daje moŝliwość szybszego stworzenia rozbudowanych ćwiczeń, które moŝna wykorzystać w pracy w sali oraz na platformie internetowej. 250

STRONY INTERNETOWE Języki obce w kontekście współczesnych wyzwań i perspektyw AntConc (strona Lawrence Anthony): http://www.antlab.sci.waseda.ac.jp/software.html BNC (Konsorcjum BNC): http://www.natcorp.ox.ac.uk/ BNC (strona Marka Daviesa, Uniwersytet Brigham Young) http://corpus.byu.edu/bnc/ LINDSEI (Universytet w Louvain): http://cecl.fltr.ucl.ac.be/cecl-projects/lindsei/lindsei.htm PICLE (Uniwersytet w Louvain): http://ifa.amu.edu.pl/~ifaconc/main.php Tim Jones (Uniwersytet w Birmingham): http://www.eisu2.bham.ac.uk/johnstf/timconc.htm Tree Tagger (strona uniwersytetu w Stuttgarcie): http://www.cele.nottingham.ac.uk/~ccztk/treetagger.php WordSmith Tools (strona Mike Scotta): http://www.lexically.net/wordsmith/ TEXT CORPORA FOR MAKING TEACHING MATERIALS FOR LANGUAGE COURSES Summary. Text corpora are sets of texts saved in digital form. An example of a corpus of the English language is the British National Corpus. It can be used for making exercises for teaching grammar and vocabulary (collocations). Programmes for analysing text corpora may be also used. One of them is AntConc. It can be used to create teaching materials from chosen texts. This is especially useful if specialist terminology is to be taught or tasks for an e-learning platform are to be made. The work is made more efficient is the text is POS tagged. This can be done on-line with the use of the programme Tree Tagger. 251