Sprawozdanie z działalności Zarządu Głównego Polskiego Towarzystwa Fonetycznego za okres od września 2008 r. do września 2012 r. I. Informacja o prowadzonych w Polskim Towarzystwie Fonetycznym w sposób ciągły badaniach naukowych i pracach badawczo-rozwojowych. Polskie Towarzystwo Fonetyczne w latach 2008 2012 kontynuowało głównie prace z zakresu fonetyki lingwistycznej, technicznej i medycznej podejmowane przez różne podmioty badawcze rozproszone w kilkunastu ośrodkach naukowych w Polsce, których realizację rozpoczęto w ubiegłych latach. PTFon zaprasza każdego roku naukowców, członków Towarzystwa, reprezentujących różne dziedziny szeroko pojętej technologii mowy do tworzenia informacji naukowej z zakresu wyznaczonego w danym roku zadania badawczego. Zarząd Główny PTFonu rozpoczął starania o uzyskanie z Departamentu Studiów i Promocji Nauki KBN funduszy koniecznych na wszczęcie działań mających na celu wykorzystanie badań w dziedzinie fonetyki stosowanej w komputerowym tłumaczeniu oraz w syntezie i rozpoznawaniu mowy w zakresie języka polskiego. Wniosek złożono w 2010 r. Niestety z uwagi na zmiany w polityce Departamentu Studiów i Promocji Nauki KBN odnośnie dofinansowywania Towarzystw Naukowych, PTFon nie otrzymał dotacji. Jednakże zasoby finansowe zgromadzone w latach 2008-2012 oraz uczestnictwo PTFonu w zleceniach z kilku projektów badawczych pozwoliło na sfinansowanie wydania 4 tomów Technologii Mowy i Języka (Speech and Language Technology) w postaci 3 woluminów: tom 11, tom 12/13 oraz tom specjalny poświęcony prof. Wiktorowi Jassemowi. Lata 2008-2009 Nową kadencję Zarząd rozpoczął od złożenia raportu z wykorzystania przyznanego przez Departament Bazy Badawczej dofinansowania do organizacji konferencji SASR 2008 w Piechowicach i jego pozytywnego przyjęcia i ostatecznego rozliczenia. W końcu 2008 r. podpisano umowę z Fundacją Uniwersytetu im. Adama Mickiewicza na wykonanie nagrań różnych głosów oraz pozyskanie tekstów specjalistycznych do projektu badawczo rozwojowego pt. Technologie przetwarzania oraz rozpoznawania informacji słownych w systemach bezpieczeństwa wewnętrznego. Nagrania
prowadzono w Sądach, Prokuraturach oraz Kancelariach Prawnych w różnych polskich miastach, promując przy okazji działalność PTFonu. Nagrania wykonane z uwzględnieniem opracowanego przez Towarzystwo środowiska programistycznego do nagrań oraz metodologię ich testowania prowadzono do końca czerwca 2009 r. Umowa z Fundacją UAM opiewała na sumę 128 tys. zł. Nagrania te posłużyły do powstania największego w Europie korpusu słownego JURISDICT liczącego ponad 1000 mówców i ponad 1200 godzin poanotowanej mowy. PTFON koordynowało w tym zakresie pracę kilkudziesięciu studentów UAM. Prace badawcze oraz wdrożeniowe prowadzone w ramach działalności Towarzystwa skoncentrowały się wokół trzech obszarów problemowych: rozpoznawanie mowy i mówców, analiza i synteza mowy oraz przetwarzanie języka. Sprawozdanie z realizacji zadań związanych z tymi obszarami przedstawiono w tomie Technologia Mowy i Języka, vol. 11 wydanym w roku 2008 pod redakcją Grażyny Demenko, Krzysztofa Jassema i Stanisława Szpakowicza. Wyniki wspomnianych prac zostały zaprezentowane na konferencji Analiza, synteza i rozpoznawanie mowy zastosowania w systemach bezpieczeństwa publicznego zorganizowanej przez PTFon we wrześniu 2008 roku w Piechowicach. Część opracowań, które weszły w skład tomu przedstawiono również na warsztatach Computational Linguistics Applications, w ramach zorganizowanej przez PTI Multiconference on Computer Science and Information Technology (Wisła, październik 2008 r.). W pierwszej części tomu 11 ujęto wyniki badań nad rozpoznawaniem mowy polskiej, ekstrakcją indywidualnych cech głosu oraz korpusami słownymi koniecznymi do rozwoju interfejsów głosowych dla języka polskiego. W drugiej części znajdują się prace skoncentrowane wokół problematyki analizy i syntezy mowy, zaś ostatnia część tomu poświęcona jest zagadnieniom związanym z różnymi aspektami przetwarzania języka naturalnego. We wrześniu 2009 r. zostały podpisane 3 umowy o dzieło z Fundacja UAM w ramach projektu badawczo rozwojowego pt. Technologie przetwarzania oraz rozpoznawania informacji słownych w systemach bezpieczeństwa wewnętrznego. Towarzystwo zobowiązało się do przygotowania materiałów do wydawnictwa monografii kierownika ww. projektu z dziedziny technologii mowy, opracowania specyfikacji i klasyfikacji emocji z bazy danych dla języka angielskiego na podstawie kilkuset nagrań pochodzących od profesjonalnych spikerów radiowych (bazę tą opracował
wykonawca zewnętrzny (ekspert z Pacific Voice Foundation, USA), wydanie zbiorczej publikacji obejmującej wyniki prac przeprowadzonych w ramach projektu oraz przygotowanie 2 recenzji tego wydawnictwa. Łączna suma tych zleceń wyniosła 99 tys. zł. Do wszystkich zrealizowanych umów dołączono szczegółowe raporty, których kopie przechowywane są w siedzibie Towarzystwa. Wielu członków Towarzystwa znalazło dodatkową pracę przy realizacji tych umów. Rok 2010 Wydano kolejny tom Technologia Mowy i Języka, Tom 12/13 (za lata 2009-2010) pod redakcją Grażyny Demenko i Agnieszki Wagner. Tom ten zawiera publikacje i przegląd kilku projektów naukowych z różnych dziedziny ujęte w pięciu częściach: Foniatria, Przetwarzanie języka, Fonetyka, Synteza i rozpoznawanie mowy oraz sekcję poświęconą Pracom zorientowanym na zastosowania praktyczne oraz użytkowników (znajdują się tutaj raporty i opracowania techniczne). Na początku 2010 roku podjęto starania w kierunku umieszczenia rocznika Technologia Mowy i Języka w wykazie czasopism punktowanych Ministerstwa Nauki i Szkolnictwa Wyższego, w efekcie których czemu rocznikowi przyznano 6 punktów (pozycja 1380 na liście). Od roku 2010 w Komitecie Naukowym rocznika zasiadają też recenzenci zagraniczni: prof. Dafydd Gibbon (Universitaet Bielefeld, Niemcy) oraz prof. Elżbieta Thurgood (California State University, USA). W tym samym roku Towarzystwo wystąpiło z wnioskiem do Ministra Nauki i Szkolnictwa Wyższego, Departament Bazy Badawczej, Wydziału Działalności Wspomagającej Badania o dofinansowanie prac związanych z działalnością wspomagającą badania (DWB) z dziedziny technologii języka i mowy. Chcieliśmy zorganizować w Gliwicach międzynarodową konferencję pt. Analiza, Synteza i Rozpoznawanie Mowy Zastosowania w Systemach Bezpieczeństwa Publicznego. SASR 2010, która miała być forum do zaprezentowania wyników aktualnie prowadzonych prac badawczych nie tylko przez członków Towarzystwa Fonetycznego, ale także zaproszonych gości. Niestety te starania zakończyły się niepowodzeniem. W czerwcu 2010 r. podpisano umowę z Uniwersytetem im. Adama Mickiewicza w ramach projektu rozwojowego pt. System tłumaczenia automatycznego opracowany na potrzeby poprawy bezpieczeństwa publicznego, za realizację której PTFon otrzymał wynagrodzenie w wysokości 70 tys. zł. Przeprowadziliśmy testy
porównawcze jakości systemu syntezy mowy według technologii MOS (Mean Opinion Score), przeprowadziliśmy testy jakości i zrozumiałości tłumaczenia systemu tłumaczenia automatycznego. Analizy były wykonywane przez grupę kilkudziesięciu studentów UAM na zasadzie umów o zlecenie. Rok 2011 W roku 2011 kontynuowano prace z zakresu fonetyki, foniatrii, przetwarzania języka, syntezy i rozpoznawania mowy oraz działalność w projekcie Technologie Przetwarzania oraz Rozpoznawania Informacji Słownych w systemach bezpieczeństwa wewnętrznego. Rok 2012 Zaprezentowano działalność PTFonu na konferencji Speech Prosody w Szanghaju. W rezultacie PTFon otrzymał propozycję ubiegania się o organizację kolejnej edycji tej konferencji w roku 2014 (wspólnie z UAM). Obecnie trwa głosowanie w sprawie organizacji Speech Prosody (prezentacja PTFonu i UAM znajduje się na stronie http://sprosig.isle.illinois.edu/, poprzez którą odbywa się też głosowanie). W roku 2012 ukazało się wydanie specjalne Technologii Mowy i Języka poświęcony prof. Wiktorowi Jassemowi, wieloletniemu przewodniczącemu PTFonu oraz byłemu redaktorowi naczelnemu rocznika wydawanego przez PTFon. Znalazły się w nim prace poświęcone badaniom w dziedzinie rytmu, melodii i harmonii w mowie. Redaktorami gościnnymi tego wydania byli wybitni specjaliści w dziedzinie prozodii mowy: Dafydd Gibbon (Universitaet Bielefeld), Daniel Hirst (Aix Marseille Universite) oraz Nick Campbell (Trinity College, Dublin). Obecnie trwają prace nad wydaniem kolejnego (regularnego) tomu za lata 2011/2012 (tom 14/15). Niedawno 1-go sierpnia br. podpisano umowę z Instytutem Chemii Bioorganicznej Polskiej Akademii Nauk Poznańskim Centrum Superkomputerowo-Sieciowym. W ramach projektu badawczo - rozwojowego pt. Pozyskiwanie i przetwarzanie informacji słownych w militarnych systemach zapobiegania oraz zwalczania
przestępczości i terroryzmu. Towarzystwo zobowiązało się wykonać dla Zamawiającego następujące prace: a) Segmentację fonetyczną nagrań mowy spontanicznej z bazy Jurisdict (ok. 200 000 segmentów fonetycznych, 500 głosów żeńskich, 500 głosów męskich) b) Anotację percepcyjną cech melodycznych nagrań mowy spontanicznej z bazy Jurisdict (500 głosów żeńskich, 500 głosów męskich, tj. około 3 godziny nagrań) Wynagrodzenie za te prace wynosi 78 tys. zł. Aktywność PTFon w zakresie wydawniczym oraz organizacyjnym zaowocowała formalnym zaproszeniem Towarzystwa do prac w Komitecie Akustyki PAN. PTFON został afiliowany przy Komitecie Akustyki i po dyskusji odnośnie roli Towarzystw Naukowych afiliowanych przy Komitecie Akustyki w dniu 10 września 2012 w Boszkowie na posiedzeniu Komitetu ustalono wstępnie możliwości współpracy. Ta działalność PTFON wymaga jednakże szczegółowego przedyskutowania na Walnym Zjeździe. II. Zebrania Zarządu PTFon. Zarząd Główny koordynując wykonanie przedstawionych zadań badawczych spotykał się 7 razy na oficjalnych zebraniach. Miały miejsce również liczne dodatkowe spotkania członków Towarzystwa i Zarządu wspierające działania na rzecz Polskiego Towarzystwa Fonetycznego. W czasie zebrań omawiano bieżące sprawy Towarzystwa, sposoby ściągalności składek członkowskich, szczegóły finansowe i organizacyjne umów PTFon z Fundacją UAM i Uniwersytetem Adama Mickiewicza, rozliczenia i raporty z wykonania poszczególnych zleceń, publikacje w kolejnych tomach SLT, zmiany na prowadzonej stronie internetowej, formy promocji i pozyskiwania sponsorów, organizację konferencji w Poznaniu. III. Członkowie PTFon. Liczba członków PTFon w roku bieżącym wynosi 110 osób. Liczba ta może jednak ulec zmianie z powodu nie wnoszenia przez niektórych członków składek członkowskich w okresie dłuższym niż 3 lata.
Dla porównania w 2008 r. członkostwo w PTFon deklarowało 134 osoby, jednak na posiedzeniu w dniu 9 sierpnia 2008 roku 64 osoby decyzją Zarządu zostały skreślone z listy członkowskiej z powodu niepłacenia składek w okresie dłuższym niż 3 lata. Na początku kadencji rzeczywista liczba członków wynosiła 70 osób. Sekretarz ZG PTFon Przewodnicząca ZG PTFon mgr Mariusz Owsianny prof. dr hab. inż. Grażyna Demenko Poznań, dnia 30 sierpnia 2012 r.