O cyklach frekwencyjnych niektórych słów i wyrażeń w latach Piotr Pęzik, Uniwersytet Łódzki

Podobne dokumenty
Zmiany klimatu a zagrożenie suszą w Polsce

Ćwiczenia 13 WAHANIA SEZONOWE

Ewa Krajny, Leszek Ośródka, Marek Wojtylak

Analiza sezonowości. Sezonowość może mieć charakter addytywny lub multiplikatywny

DRZEWA REGRESYJNE I LASY LOSOWE JAKO

Zagadnienie 1: Prognozowanie za pomocą modeli liniowych i kwadratowych przy wykorzystaniu Analizy regresji wielorakiej w programie STATISTICA

5 lat funduszu Lyxor WIG20 UCITS ETF na GPW w Warszawie rynek wtórny

Susza meteorologiczna w 2015 roku na tle wielolecia

ZMIENNOŚĆI CENOWE NA RYNKACH ROLNYCH. Mariusz Hamulczuk SGGW

Prognozowanie cen surowców w rolnych na podstawie szeregów w czasowych

Analiza przyczyn wzrostu liczby zgonów w Polsce w 2017 roku

Krzysztof Krejtz, Piotr Toczyski, Marzena Cypryańska, Jarosław Milewski, Izabela Krejtz, Wojciech Ciemniewski

STYCZEŃ Mgławica Koński Łeb Barnard 33 wewnątrz IC 434 w Orionie Źródło: NASA

Nazwa Grupy: Warsztaty plastyczne Rok szkolny:2017/2018. Wrzesień 2017

Ekonometria. Modele dynamiczne. Paweł Cibis 27 kwietnia 2006

Dokumentacja techniczna IQ3 Sterownik z dostępem poprzez Internet IQ3 Sterownik z dostępem poprzez Internet Opis Charakterystyka

Budżetowanie elastyczne

Robert Lewandowski. Raport medialny Robert Lewandowski - Raport medialny

Narzędzia do automatycznego wydobywania kolokacji

Program warsztatów CLARIN-PL

Prognozowanie cen surowców w rolnych na podstawie szeregów w czasowych - uwarunkowania i metody. Sylwia Grudkowska NBP Mariusz Hamulczuk IERIGś-PIB

Wyniki w 3 kwartale r. Prezentacja dla inwestorów listopad 2007 r. Prezentacja dla inwestor

Budżetowanie elastyczne

W tym rozdziale książka opisuje kilka podejść do poszukiwania kolokacji.

Na poprzednim wykładzie omówiliśmy podstawowe zagadnienia. związane z badaniem dynami zjawisk. Dzisiaj dokładniej zagłębimy

Elżbieta Arłukowicz Streszczenie rozprawy doktorskiej

Statystyka. Wykład 13. Magdalena Alama-Bućko. 12 czerwca Magdalena Alama-Bućko Statystyka 12 czerwca / 30

Wzrost przychodów i optymalne koszty sprzedaży. Zarządzanie terytorium sprzedaży z iq GIS

PAWEŁ SZOŁTYSEK WYDZIAŁ NAUK EKONOMICZNYCH

W jakim wieku podjęła/ął Pani/ Pan pierwszą prace zarobkową?

Reklama w wyszukiwarce

Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) prezentacja znakowania morfosyntaktycznego i możliwości wyszukiwarki

WK, FN-1, semestr letni 2010 Tworzenie list frekwencyjnych za pomocą korpusów i programu Poliqarp

Ekonometryczna analiza popytu na wodę

3. Modele tendencji czasowej w prognozowaniu

Wykład 1. Statystyka międzynarodowa - wprowadzenie Rynek pracy w Unii Europejskiej

Projekt z języka niemieckiego przeznaczony do realizacji przez uczniów klasy V

Statystyka. Wykład 13. Magdalena Alama-Bućko. 18 czerwca Magdalena Alama-Bućko Statystyka 18 czerwca / 36

Wykład 6: Analiza danych czasowych Wykresy, indeksy dynamiki

3. Analiza własności szeregu czasowego i wybór typu modelu

Robert Lewandowski vs Łukasz Kubot

ZASTOSOWANIE TECHNIK CHEMOMETRYCZNYCH W BADANIACH ŚRODOWISKA. dr inż. Aleksander Astel

5. Model sezonowości i autoregresji zmiennej prognozowanej

WSTĘP DO REGRESJI LOGISTYCZNEJ. Dr Wioleta Drobik-Czwarno

ze skupem żywca wieprzowego w polsce w latach wstęp

RAPORT Stan finansów (budżetu) miasta Janów Lubelski

I. Wykaz wszystkich informacji opublikowanych przez Emitenta w trybie raportu bieżącego w okresie objętym raportem

Praca Magisterska. Automatyczna kontekstowa korekta tekstów na podstawie Grafu Przyzwyczajeń. internetowego dla języka polskiego

Wakacyjne kursy języka francuskiego:

Usługi społeczne a zrównoważony rozwój regionów

Zmienność i modele stochastyczne odpowiedzi wzrokowych neuronów wzgórka czworaczego górnego kota

Prognozowanie na podstawie modelu ekonometrycznego

Robert Lewandowski. Raport medialny I-VI Robert Lewandowski Raport medialny I-VI 2016

Ebay Inc. (EBAY) - spółka notowana na giełdzie nowojorskiej (NASDAQ).

Zmiany koniunktury w Polsce. Budownictwo na tle innych sektorów.

Odporność na zmęczenie

Prezentacja raportu. Slajd tytułowy

Analiza Zmian w czasie

RYNEK DOMEN W POLSCE. Dział Domen NASK. Szczegółowy raport NASK za trzeci kwartał 2008

Raport Adzuna Sierpień 2016

PRZEWODNIK PO PRZEDMIOCIE. Teoria przekładu i języków specjalistycznych Angielski Język Biznesu

opis funkcjonalności LogoMate

PODSUMOWANIE PIERWSZEGO PÓŁROCZA 2018 ROK

1. Pokaż, że estymator MNW parametru β ma postać β = nieobciążony. Znajdź estymator parametru σ 2.

Najnowsze migracje z i do Polski. Demografia,

Informacja na temat zatrudniania cudzoziemców w 2018 roku w województwie pomorskim

gazety bezpłatna gazeta w poniedziałki i czwartki wydania magazynowe wydania specjalne/dedykowane wydania sublokalne

Analiza trendów branżowych

KALENDARZ NOTOWANIA INSTRUMENTÓW TERMINOWYCH BASE I WYKONANIA UMÓW DLA KONTRAKTÓW TERMINOWYCH NA ENERGIĘ ELEKTRYCZNĄ NA ROK 2016

ODCZYT STANU WODY NA RZECE DRWĘCY mierzone dla posterunku Nowe Miasto Lubawskie

Wykład 4 Związki i zależności

Rola innowacji w ocenie ryzyka eksploatacji obiektów hydrotechnicznych

Wykład 5: Analiza dynamiki szeregów czasowych

Korpusomat narzędzie do tworzenia przeszukiwalnych korpusów języka polskiego

RAPORT MIESIĘCZNY ALEJASAMOCHODOWA.PL S.A. za miesiąc sierpień 2017 R.

ZAŁOŻENIA MODELU TARYFOWEGO IMPLEMENTACJA NC TAR

Optymizm na rynku pracy nieco zmalał obszerny raport

PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK PROGNOZOWANIE I SYMULACJE EXCEL 1 AUTOR: MARTYNA MALAK

NIEZALEŻNOŚĆ i ZALEŻNOŚĆ między cechami Test chi-kwadrat, OR, RR

Tabela oprocentowania dla konsumentów

Fundusze ETF w Polsce sierpień 2012 r. (Exchange-traded funds in Poland August 2012)

Lokalną Grupę Działania. Debata realizowana w ramach projektu. wdrażanego przez

RAPORT MIESIĘCZNY ALEJASAMOCHODOWA.PL S.A. za miesiąc wrzesień 2016 R.

Wytyczne do projektów

I. Uczestnictwo Polaków w wyjazdach turystycznych

Zbigniew Borowski & Jakub Borkowski Instytut Badawczy Leśnictwa

A.Światkowski. Wroclaw University of Economics. Working paper

S T Y C Z E Ń. Mgławica Kooski Łeb Barnard 33 wewnątrz IC 434 w Orionie Źródło: NASA

John Bollinger s Forex Letter

Wyszukiwanie informacji

FORECASTING THE DISTRIBUTION OF AMOUNT OF UNEMPLOYED BY THE REGIONS

R A P O R T BANKOWOŚD INTERNETOWA I PŁATNOŚCI BEZGOTÓWKOWE III KWARTAŁ 2014 R.

Wyznaczenie miarodajnych okresów przeprowadzania badań zachowań parkingowych użytkowników Strefy Płatnego Parkowania

Wyniki sprawdzianu szóstoklasisty z języka angielskiego 2015

KorBa. Elektroniczny korpus tekstów polskich XVII i XVIII w. (do 1772 r.) Renata Bronikowska Instytut Języka Polskiego Polska Akademia Nauk

Papier: biały/chamois. Druk: Kalendarium (PL, EN, DE, FR, RU) Registry: Ilość stron: 352 szaro - czerwony. 145x203 mm.

Wykład 3: Prezentacja danych statystycznych

Polski rynek pracy a imigracja. Analiza ekonomiczna

Szefowa MSW: Działamy solidarnie i odpowiedzialnie

Optymalizacja kryteriów selekcji dla rozpadu Λ+c pμ+μza pomocą wielowymiarowej analizy danych

Transkrypt:

O cyklach frekwencyjnych niektórych słów i wyrażeń w latach 2010 2015 Piotr Pęzik, Uniwersytet Łódzki

Słowa ważne, choć nie kluczowe Słowa sezonowe Słowa dnia, tygodnia, miesiąca, które zazwyczaj nie są słowami roku

Słowa o negatywnej kluczowości Słowa, których częstości w okresie badanym były znacząco niższe od ich częstości w okresie referencyjnym Słowa, których już tak często nie używamy

Dane Wyszukiwarka frazeo.pl. 3 7 tys. publikacji dziennie, głównie z kanałów RSS portali informacyjnych Ponad 10 milionów publikacji od 2010 do 2015 r. 5 miliardów segmentów słów Każda publikacja ma datę dzienną, co pozwala na badanie użycia języka w czasie

http://frazeo.pl

Dane Duży korpus Nie do końca zrównoważone próbki, sporadyczne braki danych Duplikacja, warianty depesz Ograniczam analizę sezonowości do intuicyjnych przypadków Uściślona analiza kluczowości frazeo.pl

Trendy

Sezonowość słów Przewidywalne maksimum częstości Kiedy w cyklu tygodniowym, miesięcznym lub rocznym używamy pewnych słów? Częstość słów a kalendarz Sezonowość punktowa (słowa ze stałym, dającym się zinterpretowań pozajęzykowo maksimum częstości) Sezonowość rozmyta (bez stałego maksimum) Sezonowość zmienna (z przewidywalnym maksimum)

Sezonowość punktowa poniedziałek Stałe maksimum w poniedziałek Źródło: http://frazeo.pl

Sylwester Źródło: http://frazeo.pl

Stałe maksimum 24 XII choinka

Perseidy

Inne roje Perseidy (maks. 12 sierpnia, ZHR=90) Geminidy (maks. 14 grudnia, ZHR=120)

wiosna Sezonowość rozmyta z punktowym, przewidywalnym, interpretowalnym maksimum ok. 20 marca Rozmycie wynika częściowo z powszechnego użycia w innych kontekstach

jajko Sezonowość ze zmiennym czasowo, ale przewidywalnym, możliwym do zinterpretowania maksimum Względnie niska częstość użycia zwiększa podatność na przypadkowe maksima, por. lipiec 2015

zaćmienie Inny rodzaj punktowej przewidywalności

Sezonowość rozmyta truskawka Częściowo przewidywalne maksimum

mróz Różna intensywność zjawisk, mnogie maksima

śnieg OR zima OR lód OR mróz Sezonowość pól semantycznych bywa trudniejsza do zinterpretowania

sezon ogórkowy Frazeologizm, brak dokładnej interpretacji kalendarzowej Mimo to, obserwujemy sezonowość tego częściowo kompozycyjnego wyrażenia

Słowa sezonowe Sezonowość to jeden z aspektów użycia słów Czy jest on wart uwzględnienia w słownikach? Sezonowość może mieć znaczenie przy określaniu częstości znaczeń, np. jajko w prasie to przede wszystkim jajko wielkanocne Różne typy sezonowości i przewidywalności ze względu na występowanie i charakter maksimów częstości użycia

Słowa o negatywnej kluczowości Słowa, których częstości w okresie badanym były znacząco niższe od ich częstości w okresie referencyjnym Słowa, których już tak często nie używamy Czasem są to słowa, których używamy znacząco rzadziej

uchodźca Słowo kluczowe w 2015 r W latach 2010 2014 rzecz. uchodźca wystąpił 521 razy w czterech badanych próbkach źródeł, tj. gazeta.pl, rp.pl, gazetaprawna.pl, polskatimes.pl o łącznej wielkości 998 556 segmentów słów W okresie od stycznia do października 2015 odnotowano już 2039 wystąpień

Tabela kontyngencji PB PR SUMA Słowo a b a + b Pozostałe c d c + d SUMA a + c b + d N = a + b + c + d Wartości tabeli są używane w miarach istotności różnic między wartościami oczekiwanymi na podstawie zbioru referencyjnego a wartościami zaobserwowanymi w zbiorze badanym Na przykład, kluczowość uchodźcy w 2015 r. wg miary loglikelihood ratio (Dunning 1991) wynosi 4295,27

uchodźca

łupkowy W latach 2010 2014 przym. łupkowy wystąpił 1434 razy w czterech badanych źródłach, tj. gazeta.pl, rp.pl, gazetaprawna.pl, polskatimes.pl o łącznej wielkości 998 556 segmentów słów W okresie od stycznia do października 2015 odnotowano tylko 31 wystąpień Kluczowość negatywna : 427,09

Częstości z kilkuset źródeł łupkowy

prezydencja Słowo roku 2011, prezydencja Polski w Radzie UE 15: 1479 wystąpień

gender

Ukraina Porównanie 2014 i 2015 Okres referencyjny ma fundamentalne znaczenie

referendum, PKW, separatysta Porównanie miesiąca z większym okresem referencyjnym Porównanie 2015/10 z 2014/10 2015/09

migrant, imigrant, uchodźca Październik a wrzesień 2015

Podsumowanie Dwa typy słów ważnych, choć nie kluczowych, o których warto pamiętać Słowa sezonowe, które są częste, ale ze względu na swoją przewidywalność nie są kluczowe Słowa niespodziewanie rzadkie, słowa, które czasy swej największej popularności mają już za sobą, np. prezydencja

Bibliografia Elena Tognini Bonelli, Theoretical overview of the evolution of corpus linguistic, Red. O Keeffe, Anne, and Michael McCarthy, eds. The Routledge Handbook of Corpus Linguistics. Routledge Handbooks in Applied Linguistics. Milton Park, Abingdon, Oxon ; New York: Routledge, 2012. Serwis frazeo.pl