INTELIGENTNY ALGORYTM KLASYFIKACJI NAGRAŃ ARCHIWALNYCH

Podobne dokumenty
WYKORZYSTANIE ZAKŁÓCEŃ QUASISTACJONARNYCH W CELU REDUKCJI NIERÓWNOMIERNOŚCI PRZESUWU TAŚMY W NAGRANIACH DŹWIĘKU NA NOŚNIKACH MAGNETYCZNYCH

ALGORYTM REDUKCJI ZAKŁÓCEŃ QUASISTACJONARNYCH W ZABYTKOWYCH NAGRANIACH DŹWIĘKU

Przygotowali: Bartosz Szatan IIa Paweł Tokarczyk IIa

Autorzy: Tomasz Sokół Patryk Pawlos Klasa: IIa

Algorytm redukcji szumów w nagraniach dźwiękowych z wykorzystaniem podziału sygnału na składowe harmoniczne i stochastyczne

Widmo akustyczne radia DAB i FM, porównanie okien czasowych Leszek Gorzelnik

Ćwiczenie 3,4. Analiza widmowa sygnałów czasowych: sinus, trójkąt, prostokąt, szum biały i szum różowy

Kompresja dźwięku w standardzie MPEG-1

Dźwięk podstawowe wiadomości technik informatyk

2. STRUKTURA RADIOFONICZNYCH SYGNAŁÓW CYFROWYCH

McCrypt Wielofunkcyjny mikser stereo SM 3090 Nr zam

PL B1. Sposób i układ pomiaru całkowitego współczynnika odkształcenia THD sygnałów elektrycznych w systemach zasilających

Podstawy Przetwarzania Sygnałów

ANALIZA WPŁYWU NIESYMETRII NAPIĘCIA SIECI NA OBCIĄŻALNOŚĆ TRÓJFAZOWYCH SILNIKÓW INDUKCYJNYCH

Demodulator FM. o~ ~ I I I I I~ V

Sprawdzian wiadomości z jednostki szkoleniowej M3.JM1.JS3 Użytkowanie kart dźwiękowych, głośników i mikrofonów

Podstawy transmisji sygnałów

08 Stereodekoder, korekcja barwy dźwięku.

ALGORYTM IDENTYFIKACJI SKŁADOWYCH SINUSOIDALNYCH ZŁOŻONEGO SYGNAŁU NA PODSTAWIE JEGO LOSOWO POBRANYCH PRÓBEK

IMPLEMENTATION OF THE SPECTRUM ANALYZER ON MICROCONTROLLER WITH ARM7 CORE IMPLEMENTACJA ANALIZATORA WIDMA NA MIKROKONTROLERZE Z RDZENIEM ARM7

Przekształcenia sygnałów losowych w układach

ZAŁĄCZNIK NR Cyfrowy mikser foniczny z wyposażeniem ilość 1 kpl.

WPŁYW ADDYTYWNYCH ZAKŁÓCEŃ TYPU SINUSOIDALNEGO SYGNAŁÓW WEJŚCIOWYCH REGULATORÓW PI W UKŁADZIE FOC Z SILNIKIEM INDUKCYJNYM NA PRĘDKOŚĆ OBROTOWĄ

06 Tor pośredniej częstotliwości, demodulatory AM i FM Pytania sprawdzające Wiadomości podstawowe Budowa wzmacniaczy pośredniej częstotliwości

APLIKACJA NAPISANA W ŚRODOWISKU LABVIEW SŁUŻĄCA DO WYZNACZANIA WSPÓŁCZYNNIKA UZWOJENIA MASZYNY INDUKCYJNEJ

ĆWICZENIE 5 EMC FILTRY AKTYWNE RC. 1. Wprowadzenie. f bez zakłóceń. Zasilanie FILTR Odbiornik. f zakłóceń

Badanie widma fali akustycznej

Laboratorium EAM. Instrukcja obsługi programu Dopp Meter ver. 1.0

OKREŚLENIE WPŁYWU WYŁĄCZANIA CYLINDRÓW SILNIKA ZI NA ZMIANY SYGNAŁU WIBROAKUSTYCZNEGO SILNIKA

Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki Katedra Elektroniki

PREZENTACJA MODULACJI AM W PROGRAMIE MATHCAD

ANALIZA ROZKŁADU POLA MAGNETYCZNEGO W KADŁUBIE OKRĘTU Z CEWKAMI UKŁADU DEMAGNETYZACYJNEGO

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

8. Analiza widmowa metodą szybkiej transformaty Fouriera (FFT)

Spis treści. 1. Cyfrowy zapis i synteza dźwięku Schemat blokowy i zadania karty dźwiękowej UTK. Karty dźwiękowe. 1

Technika analogowa. Problematyka ćwiczenia: Temat ćwiczenia:

Pomiary hałasu. Obiektami pomiarowymi są silniki indukcyjne Wiefama STK90 S-2 o następujących danych znamionowych:

Zjawisko aliasingu. Filtr antyaliasingowy. Przecieki widma - okna czasowe.

Politechnika Warszawska

I - Nagrywanie dźwięku

Instrukcja do laboratorium z Fizyki Budowli. Temat laboratorium: CZĘSTOTLIWOŚĆ

BADANIA SYMULACYJNE PROSTOWNIKA PÓŁSTEROWANEGO

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

Systemy i Sieci Telekomunikacyjne laboratorium. Modulacja amplitudy

KOMPUTEROWE SYSTEMY POMIAROWE

Politechnika Warszawska

Cechy karty dzwiękowej

Badanie widma fali akustycznej

Liniowe układy scalone. Filtry aktywne w oparciu o wzmacniacze operacyjne

Radio z odtwarzaczem CD Lenco

Systemy multimedialne. Instrukcja 5 Edytor audio Audacity

Raport z badań parametrów wzmacniaczy elektroakustycznych marki ITC Audio

Dr hab. inż. Przemysław Dymarski Warszawa, r. Instytut Telekomunikacji Politechnika Warszawska

NIEPEWNOŚĆ POMIARÓW POZIOMU MOCY AKUSTYCZNEJ WEDŁUG ZNOWELIZOWANEJ SERII NORM PN-EN ISO 3740

Aby zrozumieć, dlaczego korekcja błędów związana jest z zapisem cyfrowym, przyjrzyjmy się bliżej analogowym i cyfrowym zapisom dźwięku.

LABORATORIUM AKUSTYKI MUZYCZNEJ. Ćw. nr 12. Analiza falkowa dźwięków instrumentów muzycznych. 1. PODSTAWY TEORETYCZNE ANALIZY FALKOWEJ.

Tabela 3.2 Składowe widmowe drgań związane z występowaniem defektów w elementach maszyn w porównaniu z częstotliwością obrotów [7],

Synchronizacja dźwięku i obrazu

Klasyfikacja ze względu na konstrukcję

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

AUTO-STROJENIE REGULATORA TYPU PID Z WYKORZYSTANIEM LOGIKI ROZMYTEJ

P R Z E T W A R Z A N I E S Y G N A Ł Ó W B I O M E T R Y C Z N Y C H

Instrukcja obsługi spektrometru EPR

Gramofon z wyjściem USB, ION Quickplay LP, konwerter płyt winylowych => MP3

Ćwiczenie 4. Filtry o skończonej odpowiedzi impulsowej (SOI)

W celu obliczenia charakterystyki częstotliwościowej zastosujemy wzór 1. charakterystyka amplitudowa 0,

Struktura układu pomiarowego drgań mechanicznych

INSTRUKCJA OBSŁUGI WZMACNIACZY AKUSTYCZNYCH TYPU: MW-3 MW-5

METODY BADAŃ POMIAROWYCH W WIEJSKICH STACJACH TRANSFORMATOROWYCH

Architektura komputerów

POMIARY WYBRANYCH PARAMETRÓW TORU FONICZNEGO W PROCESORACH AUDIO

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

Modernizacja spektrometru EPR na pasmo X firmy Bruker model ESP-300 Autorzy: Jan Duchiewicz, Andrzej Francik, Andrzej L. Dobrucki, Andrzej Sadowski,

Cennik detaliczny AUDIO CENTER POLAND ul. Malborska 56, Kraków

KONCEPCJA BUDOWY MIKROFONU LASEROWEGO

BADANIA MOŻLIWOŚCI ROZPOZNAWANIA MOWY W AUTONOMICZNYCH SYSTEMACH STEROWANIA

REZYSTANCYJNY DZIELNIK NAPIĘCIA DO POMIARÓW WYŻSZYCH HARMONICZNYCH W SIECIACH 400 KV

Wykrywanie sygnałów DTMF za pomocą mikrokontrolera ATmega 328 z wykorzystaniem algorytmu Goertzela

Gdy wzmacniacz dostarcz do obciążenia znaczącą moc, mówimy o wzmacniaczu mocy. Takim obciążeniem mogą być na przykład...

MODEL SYMULACYJNY ENERGOELEKTRONICZNEGO ZASILACZA AWARYJNEGO UPS O STRUKTURZE TYPU VFI

Laboratorium Elektroniki

HARMONICZNE W PRĄDZIE ZASILAJĄCYM WYBRANE URZĄDZENIA MAŁEJ MOCY I ICH WPŁYW NA STRATY MOCY

System nagłośnieniowy "300M" dla wozu pogrzebowego z mikrofonem bezprzewodowym o zasięgu do 300m w terenie otwartym.

PL B1. Sposób i układ do modyfikacji widma sygnału ultraszerokopasmowego radia impulsowego. POLITECHNIKA GDAŃSKA, Gdańsk, PL

MODEL SYMULACYJNY ENERGOELEKTRONICZNEGO STEROWANEGO ŹRÓDŁA PRĄDOWEGO PRĄDU STAŁEGO BAZUJĄCEGO NA STRUKTURZE BUCK-BOOST CZĘŚĆ 2

Zaawansowane algorytmy DSP

LABORATORIUM POMIARY W AKUSTYCE. ĆWICZENIE NR 14 Pomiar zniekształceń nielinearnych głośnika

Rode Stereo VideoMic Pro Rycote mikrofon + deadcat

Metody Prognozowania

Laboratorium Techniki ultradźwiękowej w diagnostyce medycznej

Dziękujemy za zakup przetwornika cyfrowo analogowego irdac firmy Arcam

INSTRUKCJA OBSŁUGI WZMACNIACZA TYPU: PM-70

Układy i Systemy Elektromedyczne

Synchronizacja dźwięku i obrazu. Opracował: dr inż. Piotr Suchomski

Transformata Fouriera

Szanowni miłośnicy dobrego brzmienia!

Wydział Elektryczny Katedra Telekomunikacji i Aparatury Elektronicznej

Szumy układów elektronicznych, wzmacnianie małych sygnałów

WARTOŚCI CZASU TRWANIA ZWARCIA PODCZAS ZAKŁÓCEŃ W ROZDZIELNIACH NAJWYŻSZYCH NAPIĘĆ W ŚWIETLE BADAŃ SYMULACYJNYCH

WIDMOWA I FALKOWA ANALIZA PRĄDU SILNIKA LSPMSM Z WYKORZYSTANIEM OPENCL

Transkrypt:

POZNAN UNIVE RSITY OF TE CHNOLOGY ACADE MIC JOURNALS No 88 Electrical Engineering 2016 Piotr KARDASZ* INTELIGENTNY ALGORYTM KLASYFIKACJI NAGRAŃ ARCHIWALNYCH Proces rekonstrukcji archiwalnych nagrań składa się z szeregu procedur, których parametry wymagają precyzyjnego ustawienia. Dobór tych nastaw jest na ogół zadaniem eksperta, który znając podstawowe cechy nagrania, takie jak rodzaj nośnika i stopień jego zużycia, ustala je na podstawie swojej wiedzy i doświadczenia. W celu zautomatyzowania tego procesu niezbędny jest algorytm, który na podstawie analizy nagrania będzie mógł dostarczyć tego rodzaju informacji, pozwalając na automatyczny dobór algorytmów rekonstrukcji i określenie ich parametrów. Algorytm tego rodzaju powinien dokonywać analizy nagrania przy użyciu zarówno metod czasowych, jak i częstotliwościowych oraz czasowo-częstotliwościowych. Na podstawie wyników tej analizy powinien zostać określony rodzaj i stopień zużycia nośnika, na którym zapisane zostało nagranie. Algorytm tego rodzaju został opracowany i przetestowany przy użyciu fragmentów archiwalnych nagrań zapisanych na nośnikach magnetycznych i mechanicznych, o różnej jakości i stopniu zużycia. Artykuł przedstawia istotę działania opracowanego algorytmu, wyniki testów oraz kierunki dalszych badań SŁOWA KLUCZOWE: algorytm inteligentny, klasyfikacja, sygnał dźwiękowy, rekonstrukcja 1. WPROWADZENIE Zarówno w muzeach i archiwach, jak też w domowych bibliotekach, można znaleźć stare nagrania zapisane na nośnikach analogowych, takich jak taśmy magnetofonowe na szpulach i w kasetach oraz płyty analogowe, wykonane z materiału na bazie polichlorku winylu, lub (starsze) szelaku, czy też ebonitu. Jakość tych nagrań zależy od rodzaju nośnika, wieku nagrania, sprzętu, jakim nagrania dokonano oraz sposobu obchodzenia się z już zapisanymi nośnikami. Zawarte w nich zakłócenia i zniekształcenia powodują, że ich brzmienie często odbiega od pożądanego. W tej sytuacji istnieje potrzeba rekonstrukcji tego rodzaju nagrań. W tym celu należy rozpoznać rodzaje zakłóceń istniejące w danym nagraniu, wybrać odpowiednie metody ich redukcji, dobrać ich parametry a następnie zastosować. Dobór metod redukcji zakłóceń i ich parametrów dokonywany jest na ogół przez * Politechnika Białostocka.

200 Piotr Kardasz eksperta, który znając rodzaj, wiek i stopień zużycia nośnika dobiera je zgodnie ze swoja wiedzą i intuicją. Proces ten jest często iteracyjny: nagranie po poddaniu procesowi redukcji zakłóceń jest odsłuchiwane, a jeśli rezultat odbiega od zamierzonego, procedura jest powtarzana przy zastosowaniu innych algorytmów lub ich parametrów, do chwili uzyskania zadowalającego rezultatu. Wymaga to dużego nakładu pracy, a także wiedzy oraz doświadczenia operatora. 2. ZAKŁÓCENIA ARCHIWALNYCH NAGRAŃ DŹWIĘKU 2.1. Zakłócenia nagrań na płytach gramofonowych Nowe płyty gramofonowe charakteryzują się na ogół dobrą jakością dźwięku. Produkowane współcześnie płyty drobnorowkowe są w stanie przenieść pełne pasmo akustyczne przy dynamice sięgającej 75 db [1]. Płyty normalnorowkowe, z pierwszej połowy XX wieku, zapisywane przy prędkości obrotowej 78 obrotów na minutę, maja jednak znacznie gorsze parametry. W ich przypadku odstęp sygnału od szumu jest znacznie mniejszy, a pasmo przenoszenia, ze względu na ograniczenia technologiczne aparatury zapisującej dźwięk dostępnej w tamtych czasach, ograniczone (rys. 1). Rys. 1. Widmo nagrania na płycie normalnorowkowej, 78 obr./min, z lat pięćdziesiątych XX w. a) fragment nagrania; b) pusty rowek na końcu nagrania Gramofony klasy popularnej, powszechnie używane w latach sześćdziesiątych i siedemdziesiątych XX wieku, posiadały wkładki krystaliczne. Ich działanie opierało sie na zmianie odkształcenia kryształu o własnościach piezoelektrycznych na napięcie, podawane następnie na wejście wzmacniacza. Wadą tego rodzaju wkładek jest wymagany przez nie duży nacisk igły na powierzchnię płyty, rzędu 0,1 N (współczesne magnetyczne wkładki gramofonowe wymagają nacisku 0,01-0,025 N). Jednocześnie stosowane w nich igły szafirowe miały niewielką trwałość i ulegały szybkiemu zużyciu. Odtwarzanie płyt za pomocą tego rodzaju sprzętu powodowało ich szybkie zużycie poprzez ścieranie

Inteligentny algorytm klasyfikacji nagrań archiwalnych 201 i uszkadzanie ścianek rowka płyty. W rezultacie starcia najdrobniejszych szczegółów rowka zapis pozbawiony zostaje wysokich tonów, uszkodzenia zaś objawiają się w postaci trzasków (rys. 2). Rys. 2. Przebieg czasowy nagrania na płycie gramofonowej z zakłóceniami impulsowymi. a) dziesięciosekundowy fragment nagrania b) krótki fragment z zakłóceniem impulsowym Sytuacja jest jeszcze gorsza w przypadku starszych płyt odtwarzanych z prędkością 78 obrotów na minutę. Zanim rozpowszechniły się gramofony z wkładką krystaliczną i wzmacniaczem elektronicznym, do odtwarzania takich płyt stosowano gramofony ze stalową igłą o nacisku rzędu 1 N. Nie posiadały one wzmacniacza, źródłem dźwięku takiego gramofonu były drgania membrany wprawianej w ruch bezpośrednio przez igłę. Innym źródłem szumów i zakłóceń na płytach gramofonowych są zbierające się w rowku zanieczyszczenia, takie jak kurz lub zabrudzenia powstałe w wyniku nieostrożnego obchodzenia się z nośnikiem. W zależności od charakteru tych zanieczyszczeń ich obecność będzie objawiać się w postaci szumów lub trzasków. Większość tego rodzaju zanieczyszczeń może jednak zostać usunięta w procesie mycia płyt za pomocą odpowiednich urządzeń. Niecentrycznie wykonany otwór centralny w płycie będzie powodować zmiany chwilowej prędkości przesuwu nośnika, objawiające się zmienną w czasie wysokością odtwarzanych dźwięków. Zakłócenia tego rodzaju określane są jako zakłócenia typu wow [2] i są dość często spotykane na płytach produkcji polskiej z lat osiemdziesiątych XX wieku. Podstawowym rodzajem zakłóceń na płytach gramofonowych są więc zakłócenia impulsowe i zniekształcenia typu wow. Płyty wyprodukowane po 1960 roku rzadko będą wymagały redukcji szumów i innych zakłóceń. Nagrania wykonane wcześniej mogą jednak wymagać redukcji szumu oraz zastosowania innych metod poprawiających ich brzmienie [3].

202 Piotr Kardasz 2.2. Zakłócenia nagrań na taśmach magnetofonowych Nagrania na taśmach magnetofonowych charakteryzują się na ogół wysokim poziomem szumów i często ograniczonym pasmem przenoszenia [1, 4]. O ile zapis na płytach gramofonowych dokonywany jest w warunkach profesjonalnych, o tyle zapis na taśmach magnetofonowych wykonywany był na ogół za pomocą urządzeń klasy popularnej, często również o znacznym stopniu zużycia. Nagrania te pochodzą z różnorodnych źródeł: płyt gramofonowych, audycji radiowych, telewizyjnych, mikrofonu; częstą praktyką było również wielokrotne kopiowanie taśm. Nagrania na taśmach magnetofonowych kopiują zakłócenia ich źródeł. Nagranie z płyty gramofonowej będzie więc zawierać zakłócenia impulsowe i zniekształcenia wow przekopiowane z płyty. Gramofony niskiej jakości często charakteryzowały się występowaniem przydźwięku sieci zasilającej, który dostawał się do sygnału poprzez drgania mechaniczne wywoływane przez silnik gramofonu lub zakłócenia elektromagnetyczne powodujące indukowanie się napięć w przewodach połączeniowych lub układach elektronicznych. Przydźwięk taki jest zapisywany na taśmie razem z sygnałem użytecznym. Rys. 3. Widmo nagrania na taśmie magnetofonowej. Widoczne zakłócenie w okolicy częstotliwości 16 khz wskazuje na to, że źródłem nagrania była audycja telewizyjna Nagrania audycji radiowych, zwłaszcza dokonywane w latach osiemdziesiątych przy użyciu monofonicznych odbiorników radiowych, mogą zawierać częstotliwość pilota stereo 19 khz [5], nagrania z telewizji zaś częstotliwość odchylania poziomego (rys. 3), wynoszącą dla stosowanych w Polsce systemów telewizji 15625 Hz.

Inteligentny algorytm klasyfikacji nagrań archiwalnych 203 Nagrania dokonywane amatorskimi mikrofonami charakteryzują się wysokim poziomem szumów i ograniczonym pasmem przenoszenia; podobne cechy mają nagrania wielokrotnie kopiowane. Poza zakłóceniami, charakterystycznymi dla źródeł nagrań na taśmie, będą w nich występować również zakłócenia charakterystyczne dla magnetycznej metody zapisu. Amatorskie magnetofony i przeznaczone do nich taśmy ze względu na niewielką prędkość przesuwu i szerokość ścieżki charakteryzują się stosunkowo wysokim poziomem szumu [4]. Skończona długość szczeliny głowicy odczytującej, błędne jej ustawienie oraz niedokładności wykonania powodują ograniczenie pasma zapisywanego i odczytywanego sygnału od góry, zaś zjawisko różniczkowania sygnału podczas odczytu i związana z tym konieczność stosowania dużych wzmocnień dla niskich częstotliwości, ogranicza to pasmo od dołu. Obecne na powierzchni czynnej taśmy zanieczyszczenia powodują odsuniecie jej od głowic magnetofonu, co powoduje zjawisko krótkotrwałych zaników sygnału określanych jako drop-out. Zjawisko to występuje szczególnie dla górnej części pasma akustycznego. W przypadku wielokrotnie kopiowanych taśm z każdą kolejną generacją kopii wzrastać będzie liczba drop-outów. Jednocześnie będzie wzrastać intensywność szumu, a pasmo przenoszenia będzie coraz bardziej ograniczone na obu krańcach widma. 3. CEL I ZAKRES PRACY Na podstawie powyższych rozważań można wyciągnąć wniosek, że jednym z podstawowych zadań w procesie rekonstrukcji archiwalnych nagrań dźwięku jest określenie rodzajów zakłóceń występujących w nagraniu i dobór odpowiednich metod ich redukcji. Metody te zależą od źródła nagrania oraz rodzaju i stopnia zużycia nośnika, na którym jest ono zapisane. Zadanie to jest na ogół wykonywane przez operatora, posiadającego wiedzę zarówno o nośniku, na którym zapisane jest nagranie, jak i o rodzajach występujących na nim zakłóceń i metodach ich redukcji. W celu automatyzacji tego procesu, a co za tym idzie, obniżenia wymagań stawianych operatorowi, niezbędne jest opracowanie algorytmu, który mógłby go zastąpić w procesie rozpoznania rodzaju archiwalnego nagrania i określeniu jego podstawowych cech, a także doboru metod jego rekonstrukcji Celem pracy było w tej sytuacji opracowanie algorytmu, który na podstawie wyników analiz nagrania, wykonywanych za pomocą różnorodnych metod, czasowych, częstotliwościowych i czasowo-częstotliwościowych miałby za zadanie określenie rodzaju nagrania i występujących w nim zakłóceń. Wyniki jego działania mogłyby stanowić wtedy podstawę automatycznego doboru metod rekonstrukcji nagrania i ich parametrów.

204 Piotr Kardasz 4. ALGORYTM KLASYFIKACJI NAGRAŃ ARCHIWALNYCH 4.1. Klasy nagrań archiwalnych i ich podstawowe cechy Nagrania o wysokiej jakości, na płytach gramofonowych drobnorowkowych lub taśmach magnetycznych, na ogół nie wymagają rekonstrukcji. Nagrania na płytach o niższej jakości mogą zawierać zniekształcenia typu wow oraz pewną liczbę zakłóceń impulsowych, które należy usunąć. Rzadko wymagana jest w tym przypadku redukcja szumu, a jeśli już, ze względu na jego niską intensywność, może być ona dokonana przy pomocy prostych algorytmów. Nagrania na starych, zniszczonych płytach będą wymagały przede wszystkim redukcji zakłóceń impulsowych. W następnej kolejności należy zredukować zakłócenia typu wow i szum o dużej intensywności. Ze względu na występujące w tym procesie problemy [6] niezbędne jest zastosowanie w tym celu zaawansowanych algorytmów. Jeśli nagranie było zapisane na płycie normalnorowkowej, może być dodatkowo potrzebne zastosowanie algorytmów poprawiających brzmienie nagrania [3]. Nagrania na taśmach, niezależnie od jakości, zawierają na ogół przydźwięk sieciowy oraz zniekształcenia typu wow. Jeśli nagranie wykonywane było z gramofonu, należy dokonać również redukcji zakłóceń impulsowych. Nagrania audycji radiowych i telewizyjnych mogą zawierać zakłócenia quasistacjonarne [7] o częstotliwościach powyżej 10 khz. Zakłócenia takie należy usunąć. W przypadku nagrań niskiej jakości, do których zaliczają sie również nagrania wielokrotnie kopiowane oraz nagrania dokonywane amatorskimi mikrofonami, należy zastosować zawansowane metody redukcji szumu oraz algorytmy poprawiające brzmienie. Nagrania archiwalne mogą być monofoniczne lub, rzadziej, stereofoniczne. Liczba kanałów jest zadana z góry poprzez parametry pliku, w którym zapisany jest zdigitalizowany sygnał. W przypadku sygnału stereofonicznego algorytm klasyfikacji powinien dokonywać oceny jakości na podstawie cech sygnału monofonicznego otrzymanego poprzez zsumowanie obu kanałów stereo. Powinny być one bowiem rekonstruowane z zastosowaniem tych samych metod i ich parametrów, nawet jeśli z jakichś przyczyn ich jakość jest różna. Na podstawie powyższych rozważań wybrane zostały klasy nagrań archiwalnych, które mają być rozpoznawane przez prezentowany algorytm. Przedstawione są one w tabeli 1. 4.2 Działanie algorytmu Proponowany algorytm ma za zadanie, na podstawie wyników analizy archiwalnego nagrania, zakwalifikowanie go do jednej z klas, opisanych w tabeli 1. W tym celu wymagana jest znajomość podstawowych cech nagrania, takich jak

Inteligentny algorytm klasyfikacji nagrań archiwalnych 205 odstęp sygnału od szumu, pasmo przenoszonych częstotliwości, występowanie zakłóceń impulsowych i ich liczba, występowanie zakłóceń quasistacjonarnych i ich parametrów. Tabela 1. Podstawowe klasy archiwalnych nagrań rozpoznawane przez prezentowany algorytm i wymagane dla tych klas metody redukcji zakłóceń i zniekształceń Lp Klasa nagrania Podstawowe cechy nagrania 1 2 3 4 5 5 6 Nagranie o wysokiej jakości Nagranie na płycie gramofonowej drobnorowkowej, średniej jakości Nagranie na płycie drobnorowkowej, o niskiej jakości Nagranie na płycie normalnorowkowej Nagranie na taśmie magnetofonowej z gramofonu Nagranie na taśmie magnetofonowej audycji radiowej lub telewizyjnej Nagranie na taśmie magnetofonowej o niskiej jakości pasmo przenoszenia szersze niż 40..12000 Hz odstęp od szumu > 50 db pasmo przenoszenia szersze niż 40..12000 Hz odstęp od szumu < 50 db obecność zakłóceń impulsowych i ewentualnie zakłóceń wow obecność dużej liczby zakłóceń impulsowych, pasmo przenoszenia węższe niż 40..12000 Hz odstęp od szumu < 40 db obecność dużej liczby zakłóceń impulsowych, odstęp od szumu < 40 db brak sygnału użytecznego powyżej 4 khz pasmo przenoszenia rzędu niż 40..10000 Hz odstęp od szumu i zakłóceń > 40 db obecność przydźwięku i zakłóceń impulsowych obecność przydźwięku sieciowego i zakłóceń quasistacjonarnych o częstotliwościach > 10 khz pasmo przenoszenia ograniczone od góry do ok. 4 khz lub mniej występowanie zaników sygnału i wszelkiego rodzaju zakłóceń quasistacjonarnych Wymagane metody rekonstrukcji rekonstrukcja na ogół nie jest potrzebna redukcja zakłóceń wow redukcja zakłóceń impulsowych proste algorytmy redukcji szumu zaawansowane metody redukcji szumów i zakłóceń impulsowych, korekcja zniekształceń liniowych jak wyżej, dodatkowo zaawansowane algorytmy poprawy brzmienia redukcja szumu, przydźwięku sieciowego, zakłóceń impulsowych, wow, zniekształceń liniowych jak wyżej, dodatkowo redukcja zakłóceń quasistacjonarnych o częstotliwościach >10 khz zaawansowane metody redukcji szumu zaawansowane metody poprawy brzmienia redukcja innych odnalezionych zakłóceń i zniekształceń

206 Piotr Kardasz W celu określenia odstępu sygnału do szumu algorytm poszukuje fragmentów sygnału o długości 1/2 sekundy o najwyższej i najniższej mocy średniej dla danego fragmentu. Zakłada się, że nagranie, poddawane rekonstrukcji, zawiera również fragmenty reprezentujące wyłącznie szum nośnika. Warunek ten jest na ogół spełniony, ponieważ fragmenty takie występują w przerwach pomiędzy utworami. Aby zmniejszyć wpływ ewentualnych zakłóceń quasistacjonarnych, sygnał przed poddaniem go wspomnianej analizie jest filtrowany przez filtr pasmowoprzepustowy o paśmie przenoszenia od 150 do 12000 Hz. Wynikiem działania tej części algorytmu jest pojedyncza wartość, stanowiąca szacowany odstęp sygnału od szumu w skali logarytmicznej (db). W celu odnalezienia zakłóceń impulsowych dokonywana jest dekompozycja sygnału z zastosowaniem falek Haara [8]. Wystąpienie izolowanych współczynników o dużej wartości bezwzględnej dla najwyższych częstotliwości świadczy o możliwości wystąpienia zakłócenia impulsowego (rys. 4). Wynikiem działania tej części algorytmu jest pojedyncza wartość, będąca szacowaną liczbą zakłóceń impulsowych w jednej minucie nagrania. Rys. 4. Rozkład nagrania na zniszczonej płycie gramofonowej na falki Haara. Zakłócenia impulsowe widoczne w postaci jaśniejszych prążków w górnej części rysunku Dla oceny pasma przenoszenia nagrania dokonuje się jego analizy za pomocą krótkoczasowej transformaty Fouriera o 1024 próbkach przy zastosowaniu okna Hanna [8]. Wyniki tej transformaty są uśredniane dla całego nagrania. Jednocześnie dokonuje się analizy nagrania w jego wcześniej odnalezionych fragmentach zawierających wyłącznie szum. Wynikiem działania tego etapu są dwie wartości, określające najniższą i najwyższą częstotliwość, dla której odstęp od szumów przekracza określoną wartość. W celu wykrycia zakłóceń quasistacjonarnych dokonuje się analizy sygnału za pomocą transformaty Fouriera o 2 22 próbkach i sprawdza występowanie maksimów amplitudy w okolicach częstotliwości 50 Hz i 100 Hz, a także 15625 i 19000 Hz. Procedura zwraca trzy wartości logiczne (prawda/fałsz) odpowiadające wykryciu odpowiednio przydźwięku sieciowego, częstotliwości odchylania poziomego i częstotliwości pilota stereo. Wyniki pracy procedur analizy podawane są na wejście algorytmu wnioskującego, który na ich podstawie przyporządkowuje analizowane nagranie do

Inteligentny algorytm klasyfikacji nagrań archiwalnych 207 jednej z grup wymienionych w tabeli 1. Algorytm ten, złożony z sześciu bloków wnioskowania, po jednym dla każdej z klas, generuje sześć wartości wyjściowych. Uważa się, że nagranie należy do klasy, której blok wnioskowania zwrócił najwyższą wartość. Bloki wnioskowania zostały zaprojektowane na podstawie tabeli 1. Algorytm, zaimplementowany w systemie uruchomieniowym Lazarus, został poddany następnie dostrojeniu przy użyciu fragmentów archiwalnych nagrań o różnej jakości, zapisanych na różnorodnych nośnikach. Dostrojenie to zostało przeprowadzone ręcznie, poprzez poddanie tych nagrań działaniu algorytmu, a następnie dostrajaniu jego parametrów do chwili uzyskania poprawnego działania dla zestawu sygnałów testowych. 5. WNIOSKI KOŃCOWE I KIERUNKI DALSZYCH BADAŃ Przedstawiony algorytm został opracowany jako część systemu rekonstrukcji nagrań dźwięku. Celem tego systemu ma być uproszczenie i automatyzacja tego procesu. W tej sytuacji przedstawiony algorytm powinien zostać tak rozbudowany, aby uzyskane w wyniku jego działania dane mogły posłużyć nie tylko w celu doboru algorytmów rekonstrukcji, ale także ich parametrów. Wymaga to rozbudowy algrytmu wnioskowania i dostrojenia go przy użyciu większego zestawu archiwalnych nagrań. Zestaw taki został przygotowany w trakcie badań i zawiera dużą liczbę zdigitalizowanych nagrań o różnej jakości pochodzących z różnych nośników. Zasoby te powinny pozwolić na precyzyjne dostrojenie zarówno opisanego algorytmu klasyfikacji, jak i pozostałych algorytmów [3, 6, 7, 9, 10] zaprojektowanych dla tego systemu. Artykuł opracowano w ramach pracy MB/WE/4/2015. LITERATURA [1] Praca zbiorowa - Zapisywanie i odtwarzanie dźwięku. Wydawnictwa Naukowo- Techniczne, Warszawa, 1991. [2] Czyżewski A., Maziewski P., Some Techniques for Wow Effect Reduction. IEEE International Conference on Image Processing ICIP 2007, San Antonio. [3] Kardasz P., Algorytm poprawy jakości brzmienia archiwalnych nagrań dźwięku na nośnikach magnetycznych, Poznan University of Technology Academic Journals. Electrical Engineering, Nr 84 (2015), s. 231-236. [4] Iwanicka B., Koprowski E., Kasety magnetofonowe i magnetowidowe. Wydawnictwa Komunikacji i Łączności, Warszawa, 1988. [5] Chaciński H., Odbiorniki radiowe, Wydawnictwa Szkolne i Pedagogiczne, Warszawa, 1980.

208 Piotr Kardasz [6] Kardasz P., Algorytm redukcji szumów w nagraniach dźwiękowych z wykorzystaniem podziału sygnału na składowe harmoniczne i stochastyczne, Pomiary, Automatyka, Robotyka, R. 19, nr 1 (2015), s. 71-76. [7] Kardasz P., Algorytm detekcji zakłóceń impulsowych w archiwalnych nagraniach dźwięku na płytach analogowych, Poznan University of Technology Academic Journals. Electrical Engineering, Nr 84 (2015), s. 225-230. [8] Zieliński T. P., Cyfrowe przetwarzanie sygnałów, Wydawnictwa Komunikacji i Łączności, Warszawa 2005. [9] Kardasz P., Algorytm redukcji zakłóceń quasistacjonarnych w zabytkowych nagraniach dźwięku, Poznan University of Technology Academic Journals. Electrical Engineering, Nr 80 (2014), s. 101-108. [10] Kardasz P., Wykorzystanie zakłóceń quasistacjonarnych w celu redukcji nierównomierności przesuwu taśmy w nagraniach dźwięku na nośnikach magnetycznych. Poznan University of Technology Academic Journals. Electrical Engineering, Nr 80 (2014), s. 109-114. THE INTELLIGENT ALGORITGM FOR ARCHIVAL RECORDING CLASSIFICATION The reconstruction process of archival audio recordings consists of several procedures that require precise parameters settings. The selection of these procedures and settings is generally done by an expert who knows the basic characteristics of the recording, such as the media type and degree of wear. The expert can then choose reconstruction procedures and their parameters according to his knowledge and experience. To make this process automatic, an algorithm is necessary, which is able to provide information needed for reconstruction algorithms selection and parameters setting. Such algorithm should analyze the recording using time, frequency and time-frequency analysis methods and then determine the type of media and its wearing level. The paper presents the intelligent classification algorithm which has been developed and tested using fragments of archival recordings stored on magnetic and mechanic media of different quality and degree of wear. The test results and directions for further research are presented. (Received: 31. 01. 2016, revised: 4. 03. 2016)