DEVELOPING APPROPRIATE MONOLINGUAL

Podobne dokumenty
EGZAMIN MATURALNY Z JĘZYKA ANGIELSKIEGO POZIOM ROZSZERZONY MAJ 2010 CZĘŚĆ I. Czas pracy: 120 minut. Liczba punktów do uzyskania: 23 WPISUJE ZDAJĄCY

Marzec: food, advertising, shopping and services, verb patterns, adjectives and prepositions, complaints - writing

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

EGZAMIN MATURALNY 2012 JĘZYK ANGIELSKI

Życie za granicą Studia

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

EGZAMIN MATURALNY 2012 JĘZYK ANGIELSKI

JĘZYK ANGIELSKI POZIOM PODSTAWOWY

Katowice, plan miasta: Skala 1: = City map = Stadtplan (Polish Edition)

EGZAMIN MATURALNY 2012 JĘZYK ANGIELSKI

JĘZYK ANGIELSKI DLA ABSOLWENTÓW KLAS DWUJĘZYCZNYCH

EGZAMIN MATURALNY 2011 JĘZYK ANGIELSKI

Effective Governance of Education at the Local Level

MaPlan Sp. z O.O. Click here if your download doesn"t start automatically

Egzamin maturalny z języka angielskiego na poziomie dwujęzycznym Rozmowa wstępna (wyłącznie dla egzaminującego)

EGZAMIN MATURALNY 2012 JĘZYK ANGIELSKI

Zakopane, plan miasta: Skala ok. 1: = City map (Polish Edition)

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 8: Structured PredicCon 2

EGZAMIN MATURALNY Z JĘZYKA ANGIELSKIEGO POZIOM ROZSZERZONY MAJ 2010 CZĘŚĆ I. Czas pracy: 120 minut. Liczba punktów do uzyskania: 23 WPISUJE ZDAJĄCY

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

EGZAMIN MATURALNY Z JĘZYKA ANGIELSKIEGO

EGZAMIN MATURALNY 2012 JĘZYK ANGIELSKI

CES Polish language courses

General Certificate of Education Ordinary Level ADDITIONAL MATHEMATICS 4037/12

European Crime Prevention Award (ECPA) Annex I - new version 2014

Rozpoznawanie twarzy metodą PCA Michał Bereta 1. Testowanie statystycznej istotności różnic między jakością klasyfikatorów

KLUCZ PUNKTOWANIA ODPOWIEDZI

Immigration Studying. Studying - University. Stating that you want to enroll. Stating that you want to apply for a course.

WYDZIAŁ NAUK EKONOMICZNYCH


Proposal of thesis topic for mgr in. (MSE) programme in Telecommunications and Computer Science

Analysis of Movie Profitability STAT 469 IN CLASS ANALYSIS #2

Karpacz, plan miasta 1:10 000: Panorama Karkonoszy, mapa szlakow turystycznych (Polish Edition)

Tychy, plan miasta: Skala 1: (Polish Edition)

EGZAMIN MATURALNY 2011 JĘZYK ANGIELSKI

Wojewodztwo Koszalinskie: Obiekty i walory krajoznawcze (Inwentaryzacja krajoznawcza Polski) (Polish Edition)

Życie za granicą Studia

Pielgrzymka do Ojczyzny: Przemowienia i homilie Ojca Swietego Jana Pawla II (Jan Pawel II-- pierwszy Polak na Stolicy Piotrowej) (Polish Edition)

Ankiety Nowe funkcje! Pomoc Twoje konto Wyloguj. BIODIVERSITY OF RIVERS: Survey to students


KLUCZ PUNKTOWANIA ODPOWIEDZI

Leba, Rowy, Ustka, Slowinski Park Narodowy, plany miast, mapa turystyczna =: Tourist map = Touristenkarte (Polish Edition)

Version 1.0: 0606 abc. General Certificate of Education examination June series

Emilka szuka swojej gwiazdy / Emily Climbs (Emily, #2)

No matter how much you have, it matters how much you need

Język angielski. Poziom rozszerzony Próbna Matura z OPERONEM i Gazetą Wyborczą CZĘŚĆ I KRYTERIA OCENIANIA ODPOWIEDZI POZIOM ROZSZERZONY CZĘŚĆ I

Opis Przedmiotu Zamówienia oraz kryteria oceny ofert. Części nr 10

Formularz dla osób planujących ubiegać się o przyjęcie na studia undergraduate (I stopnia) w USA na rok akademicki

list formalny wysyłamy do osób na oficjalnym stanowisku i osób, których dobrze nie znamy i nie utrzymujemy z nimi kontaktów

Machine Learning for Data Science (CS4786) Lecture11. Random Projections & Canonical Correlation Analysis

Osoby 50+ na rynku pracy PL1-GRU

Struktura egzaminu ustnego z języków obcych (bez określania poziomu)

KLUCZ PUNKTOWANIA ZADAŃ

EuroWeek Szkoła Liderów 2015

TTIC 31210: Advanced Natural Language Processing. Kevin Gimpel Spring Lecture 9: Inference in Structured Prediction

ITIL 4 Certification

What our clients think about us? A summary od survey results

Machine Learning for Data Science (CS4786) Lecture 11. Spectral Embedding + Clustering

Extraclass. Football Men. Season 2009/10 - Autumn round

Kryteria oceniana z języka angielskiego klasa 4

Hard-Margin Support Vector Machines

The Overview of Civilian Applications of Airborne SAR Systems

ERASMUS + : Trail of extinct and active volcanoes, earthquakes through Europe. SURVEY TO STUDENTS.


JĘZYK ANGIELSKI POZIOM ROZSZERZONY (A1)

Unit of Social Gerontology, Institute of Labour and Social Studies ageing and its consequences for society

Załącznik nr 2 do zarządzenia Rektora nr 20 z dnia 8 maja 2019 r. Zestawienie dokumentów potwierdzających znajomość języka angielskiego

Bardzo formalny, odbiorca posiada specjalny tytuł, który jest używany zamiast nazwiska

Sargent Opens Sonairte Farmers' Market

Change Notice/ Zmienić zawiadomienie BLS Instructor Manual / Podstawowe czynności resuscytacyjne Podrecznik Instruktora

Stargard Szczecinski i okolice (Polish Edition)

JĘZYK ANGIELSKI ĆWICZENIA ORAZ REPETYTORIUM GRAMATYCZNE

ARNOLD. EDUKACJA KULTURYSTY (POLSKA WERSJA JEZYKOWA) BY DOUGLAS KENT HALL

Helena Boguta, klasa 8W, rok szkolny 2018/2019

Evaluation of the main goal and specific objectives of the Human Capital Operational Programme

EGZAMIN MATURALNY Z JĘZYKA ANGIELSKIEGO MAJ 2012 POZIOM ROZSZERZONY CZĘŚĆ I. Czas pracy: 120 minut. Liczba punktów do uzyskania: 23 WPISUJE ZDAJĄCY

Program doradczy EducationUSA - formularz zgłoszeniowy

deep learning for NLP (5 lectures)

WYMAGANIA EDUKACYJNE

SZCZEGÓŁOWE WYMAGANIA EDUKACYJNE Z JĘZYKA ANGIELSKIEGO DLA KLASY 7 ROK SZKOLNY 2017/2018

EGZAMIN MATURALNY 2012 JĘZYK ANGIELSKI

Miedzy legenda a historia: Szlakiem piastowskim z Poznania do Gniezna (Biblioteka Kroniki Wielkopolski) (Polish Edition)

JĘZYK ANGIELSKI KARTA ROZWIĄZAŃ ZADAŃ 6., 7. i 8.

Previously on CSCI 4622

EGZAMIN MATURALNY Z JĘZYKA ANGIELSKIEGO POZIOM ROZSZERZONY CZĘŚĆ I 8 MAJA Godzina rozpoczęcia: 14:00. Czas pracy: 120 minut

LEARNING AGREEMENT FOR STUDIES

Uczniowie z Polskiej Szkoły Sobotniej z Liverpool mają możliwość otrzymania

Ankiety Nowe funkcje! Pomoc Twoje konto Wyloguj. BIODIVERSITY OF RIVERS: Survey to teachers

Na poszczególne oceny uczeń powinien wykazać się następującymi wiadomościami i umiejętnościami w zakresie słownictwa:

INSTYTUT EUROPEISTYKI WYDZIAŁ PRAWA, PRAWA KANONICZNEGO I ADMINISTRACJI Katolickiego Uniwersytetu Lubelskiego Jana Pawła II

ABOUT NEW EASTERN EUROPE BESTmQUARTERLYmJOURNAL

Typ VFR. Circular flow adjustment dampers for the adjustment of volume flow rates and pressures in supply air and extract air systems

Wymagania edukacyjne z języka angielskiego dla klasy IV - rok szkolny 2015/2016

Typ VFR. Circular flow adjustment dampers for the adjustment of volume flow rates and pressures in supply air and extract air systems

PROGRAM STAŻU. Nazwa podmiotu oferującego staż / Company name IBM Global Services Delivery Centre Sp z o.o.

Automatyczne generowanie testów z modeli. Bogdan Bereza Automatyczne generowanie testów z modeli

Please fill in the questionnaire below. Each person who was involved in (parts of) the project can respond.

Transkrypt:

DEVELOPING APPROPRIATE MONOLINGUAL ASSESSMENT CRITERIA FOR TESTS OF MANY LANGUAGES: ISSUES AND CHALLENGES Dr Jo Lewkowicz Advisor University of Warsaw, Language Certificate 1 Examinations

OUTLINE Aim of presentation Theory underpinning the development of the rating scales used for the Certificate Exams The Qualities of the rating scales used Issues, challenges and limitations of the rating scales used ********** Focus will be on writing scales but reference will be made to oral scales where relevant. 2

WHAT IS A RUBRIC? Qualitative description of language placed on a rating scale used to assess performance Raters match performance with relevant description to generate a score 3

IMPORTANCE OF RATING SCALES Acknowledging McNamara (1996), Weigle (2002: 109) notes: the scale that is used in assessing performance tasks represents, implicitly or explicitly, the theoretical basis upon which the test is founded; that is, it embodies the test (or scale) developer s notion of what skills of abilities are being measured by the test. Given that at each level performance of spoken & written language is assessed, ensuring the rubrics used embody the constructs being assessed is crucial 4

FUNCTIONS OF RATING SCALE Alderson (1991) distinguished between different functions of rating scales: User-oriented Assessor-oriented Constructor-oriented Pollitt & Murray (1996) added: Diagnosis-oriented Certificate Exams rubrics are assessor-oriented to guide assessors and facilitate scoring 5

EXTRACT OF B2 WRITING SCALE Treść wypowiedzi Wypowiedź jest w pełni zgodna z tematem; poprawnie dobrane, interesujące argumenty za i/lub przeciw, właściwie rozwinięte właściwa konkluzja Organizacja/styl/sp ójność Wypowiedź jest bardzo dobrze zorganizowana, tekst powiązany w akapity z użyciem właściwych podział na rozwinięte akapity; zastosowano różnorodne środki spójności tekstowej; właściwy styl i rejestr Poprawność językowa W pełni poprawne użycie struktur językowych odpowiedni ch do poziomu; poprawna ortografia Zasób słownictwa Słownictwo całkowicie odpowiednie do zadania, różnorodne, poprawne i liczne kolokacje, frazeologizm y 6

CHARACTERISTICS OF RATING SCALE Holistic: single score awarded for each piece of writing Multiple-trait: of focus are those aspects of writing that are specific to the writing task set and specific for the test 7

MATCHING TASK WITH RATING SCALE Task: Violent television programmes and video games make people more violent in real life. Sample task Representative of tasks for this level as described in test specifications: student potrafi napisać związany, spójny tekst, wyrżający jego poglądl ub opinię 8

MAPPING THE RATING SCALE ON CEFR B2 Vantage or upper intermediate Can understand the main ideas of complex text on both concrete and abstract topics, including technical discussions in his/her field of specialization. Can interact with a degree of fluency and spontaneity that makes regular interaction with native speakers quite possible without strain for either party. Can produce clear, detailed text on a wide range of subjects and explain a viewpoint on a topical issue giving the advantages and disadvantages of 9 various options.

OVERVIEW OF B2 RATING SCALE FOR WRITING Pkt. Treść wypowiedzi Organizacja/styl/spójność Poprawność językowa Wypowiedź jest w pełni zgodna z Wypowiedź jest bardzo dobrze W pełni poprawne tematem; zorganizowana, tekst powiązany w użycie struktur 33-40 poprawnie dobrane, interesujące akapity z użyciem właściwych językowych argumenty za i/lub przeciw, podział na rozwinięte akapity; odpowiednich do właściwie rozwinięte właściwa zastosowano różnorodne środki poziomu; konkluzja spójności tekstowej; właściwy styl i poprawna ortografia 25-32 17-24 9-16 0-8 Wypowiedź jest zgodna z tematem; argumenty są poprawnie dobrane wywód jest właściwie przeprowadzony Wypowiedź jest na ogół zgodna z tematem i zawiera większość poprawnych argumentów, jednak są one niepełne lub nie w pełni rozwinięte (zawierają nieistotne informacje);wywód nie jest całkowicie przejrzysty dla czytelnika; limit słów nie został w pełni wykorzystany Wypowiedź nie jest wystarczająco zgodna z tematem, nie zawiera wymaganych elementów lub są one niepoprawne, ponadto nie są one rozwinięte lub nieistotne dla tematu; limit słów nie został wykorzystany w znacznym stopniu Wypowiedź nie jest zgodna z zadaniem; brak argumentacji, opinii; limit słów nie został wykorzystany w rażącym stopniu rejestr Wypowiedź jest właściwie zorganizowana, akapity powiązane i rozwinięte; styl i rejestr języka są właściwe, zastosowano poprawne środki spójności tekstowej Wypowiedź jest w miarę poprawnie zorganizowana; styl i rejestr języka zawierają drobne uchybienia; zastosowano dość ubogie środki spójności tekstowej Wypowiedź jest mało poprawnie zorganizowana, akapity słabo rozwinięte; styl i rejestr języka często są nieodpowiednie; nie zastosowano środków spójności tekstowej Wypowiedź nie jest zorganizowana lub brakuje części tekstu; nieodpowiednie do odbiorcy styl i rejestr języka, brak środków spójności tekstowej Poprawne użycie struktur językowych; poprawna ortografia; nieliczne błędy nie zakłócają komunikacji Główne struktury językowe poprawnie stosowane; ortografia wystarczająco poprawna, aby nie zakłócać komunikacji; występują znaczne błędy gramatyczne Struktury językowe często błędnie używane lub zbyt proste; liczne błędy ortograficzne; utrudniony odbiór ze względu na ilość i charakter błędów Istotne i częste uchybienia w stosowaniu struktur językowych; liczne błędy ortograficzne blokują zrozumienie Zasób słownictwa Słownictwo całkowicie odpowiednie do zadania, różnorodne, poprawne i liczne kolokacje, frazeologizmy Słownictwo odpowiednie do zadania, w miarę różnorodne; obecność kolokacji i frazeologizmów Słownictwo podstawowe, ale właściwe dla zadania, nieliczne kolokacje i frazeologizmy Słownictwo nie zawsze odpowiednie do zadania, ograniczenie do najprostszych frazeologizmów Słownictwo nieodpowiednie, niezróżnicowane, powtórzenia, uproszczenia. 10

DEFINING FEATURES OF CERTIFICATE EXAM RATING SCALES Stepwise within each level Levels do not expect perfection/complete mastery but proficiency for that level No pass mark Range of marks within each band Allow for assessing jagged profiles Encourages raters to consider all traits being assessed 11

EVALUATION OF THE RATING SCALES The qualities of good rating scale are: Represent explicitly the skills it intends to measure Clear and explicit Useable and interpretable To what extent do the criteria match these qualities? 12

ISSUES AND CHALLENGES Scales are subject to individual interpretation To limit this, there are regular standardization sessions but these have several limitations Scales articulated in Polish may not reflect fully the complexities of the specific languages tested This could usefully be investigated Test scores are the product of the whole measurement process prompt, raters, scoring criteria and procedure: need to recognise this More needs to be done to validate the scales used Marking pressures may impact on the reliability of test scores awarded Calibration of raters would facilitate identifying those raters who consistently score high or low / identify wayward markers 13

CONCLUSION Developing rating scales for different performance skills and different levels of language proficiency and for a large cross-section of languages, is no mean feat. It is an iterative process which needs to be under constant scrutiny if we are to ensure valid, reliable, practical and fair criteria by which we judge our students. THANK YOU 14