Architektura systemów komputerowych dr Artur Bartoszewski
Parametry dźwięku pasmo przenoszenia Pasmo przenoszenia (w elektroakustyce) zakres częstotliwości, w którym tłumienie sygnału jest nie większe niż 3 db (spadek amplitudy o 3 db w stosunku do amplitudy maksymalnej amplituda osiąga wtedy nie mniej niż 70,7% amplitudy maksymalnej). Częstotliwość wiąże się z dźwiękiem i jest zmienna. Pasmo przenoszenia wyrażone jest jako częstotliwość, lecz zależy od sprzętu/formatu jest jego stałym parametrem. [mówiąc o sprzęcie/formatach mówimy o częstotliwościach a najczęściej myślimy o paśmie przenoszenia.
Konwersja analogowo-cyfrowa Sygnał analogowy (przesyłany np. przez mikrofon podłączony do karty dźwiękowej), który dociera do karty dźwiękowej, jest przekształcany na postać cyfrową. Określa się to mianem digitalizacji Proces ten przebiega w trzech etapach: próbkowanie, kwantowanie, kodowanie. W efekcie tego procesu otrzymujemy postać cyfrową sygnału analogowego (zapis w postaci zer i jedynek).
Cyfrowy zapis dźwięku - PCM
Próbkowanie dźwięku 100 110 110 101 100 010 000 000 010 100 110 110 110 100
Cyfrowy zapis dźwięku Definicja: Częstotliwością próbkowania nazywamy ilość odczytów wartości sygnału wykonanych w ciągu sekundy. Wyprażmy ją w hercach (Hz). Definicja: Rozdzielczością próbkowania (ilością poziomów kwantyzacji) nazywamy ilość stanów które przyjąć może próbkowany sygnał. Wyrażamy ją w bitach (ilość bitów potrzebnych do zapisania jednej próbki).
Cyfrowy zapis dźwięku 100 110 110 101 100 010 000 000 010 100 110 110 110 100
Formaty zapisu dźwięku - PCM PCM Waveform (Pulse Code Modulation - modulacja kodowo-impulsowa) - jest metodą przechowywania nieskompresowanego dźwięku w postaci cyfrowej. Zalety formatu PCM: - nie powoduje dużego obciążenia sprzętu podczas odtwarzania; - umożliwia pracę z dużą liczbą strumieni danych; -jest formatem bezstratnym (jakościowo najbliższym oryginalnemu dźwiękowi); Wadą PCM jest duża objętość plików - 74 minuty nagrania stereo to 670 MB WAVE (.wav) format specyficzny dla systemów Microsoftu wykorzystuje kodowanie PCM.
Próbkowanie dźwięku Jaka jest optymalna częstotliwość próbkowania?
Próbkowanie dźwięku Zjawisko to opisuje kryterium Nyquista (z l pół. XX w.). Wg. niego do poprawnego odwzorowania sygnału wystarczy poddać go próbkowaniu z dwa razy większą częstotliwością. Oznacza to, że jeśli najwyższą częstotliwością, jaką możemy usłyszeć, jest 20 khz (teoretyczny zakres ludzkiego słuchu to 16 Hz - 20 khz), to wystarczy, że sygnał zostanie spróbkowany z czę stotliwością 40 khz. W praktyce jednak stosowany jest standard 44.1 khz (w przy padku płyt audio).
Próbkowanie dźwięku Obecne karty dźwiękowe i interfejsy pozwalają na próbkowanie 96 khz, a nawet w przypadku bardziej zaawansowanych urządzeń 192 khz. Należy jednak pamiętać o bardzo ważnej rzeczy: im większa częstotliwość, rym większa ilość danych, co w praktyce oznacza, że plik wyjściowy będzie większy.
Konwersja cyfrowo-analogowa Niejako odwróceniem procesu powstawania dźwięku cyfrowego jest konwersja cyfrowo-analogowa. Proces taki zachodzi, gdy np. słuchamy muzyki bądź gdy nagrywając ją, słyszymy efekt w głośnikach (wówczas zachodzą oba procesy jednocześnie, konwersja analogowocyfrowa i cyfrowo-analogowa). W takiej sytuacji dźwięk zapisany w postaci O i l przekształcany jest na sygnał analogowy (określone napięcie, które przesyłane jest do głośników). Należy pamiętać, że konwersja cyfrowo-analogowa nie oznacza, że mamy w niej do czynienia z dokładnym odwróceniem poszczególnych etapów tworzenia dźwięku cyfrowego. Dźwięk cyfrowy, który ma zostać przetworzony na sygnał analogowy, nie jest idealnym odtworzeniem swojego pierwowzoru (głównie wynika to z etapu kwantowania). Dopiero dzięki dodatkowym procesom sygnał, który słyszymy, jest bardzo zbliżony do oryginału.
Karty dźwiękowe
Karta dźwiękowa
Rozwój kart dźwiękowych Covox
Rozwój kart dźwiękowych AdLib
Rozwój kart dźwiękowych Gravis Ultrasound
Rozwój kart dźwiękowych Sound Blaster - firmy Creative, karta która powstała 1989 roku. W przeciwieństwie do Adlib-a potrafi generować poza syntezą fm także digitalizowany dźwięk mono o częstotliwości próbkowania ok. 15 khz (Oczywiście pracowała w "mono"), oraz nagrywać sygnał z mikrofonu lub wejścia liniowego. Sound Blaster nie miał cyfrowego miksera, głośność trzeba ustawiać pokrętłem z tyłu karty. Na karcie znajdziemy interface do jojsticka - co później stało się standardem. Karta oczywiście na 8-bitowej szynie ISA. Przez długi czas niekwestionowany standard - każda szanująca się karta i gra była i praktycznie jest z nią zgodna.
Karta dźwiękowa schemat (tory przetwarzania dźwięku)
Karta dźwiękowa schemat (tory przetwarzania dźwięku) plik PCM wejścia plik MOD wyjścia plik MIDI ADC przetwornik analogowo-cyfrowy DAC przetwornik cyfrowo-analogowy FDP filtr dolnoprzepustowy FM układ syntezy FM (synteza dźwięku poprzez modulację częstotliwości) WaveTable tablica próbek dzwięku dla syntezy MIDI
Karta dźwiękowa schemat (wersja II )
Procesor DSP Procesor sygnałowy DSP (ang. Digital Signal Processor) służy do cyfrowego przetwarzania sygnałów. Prostym przykładem zastosowania procesora DSP umieszczonego na karcie dźwiękowej jest stworzenie efektu pogłosu lub echa: ciąg cyfrowych próbek, który procesor przesyła do przetwornika C/A, zapamiętywany jest dodatkowo w pamięci. Ciąg ten wyczytany z pamięci z pewnym opóźnieniem przesyłany jest również na wejście przetwornika C/A. W ten sposób na wyjściu przetwornika pojawiają się dwa sygnały analogowe o tym samym brzmieniu, przesunięte w czasie
Złączą karty dźwiękowej
Złączą karty dźwiękowej
Złączą karty dźwiękowej
Zintegrowany kodek dźwięku AC 97
Systemy dźwięku Dźwięk przestrzenny
Systemy dźwiękowe w multimediach Mono Stereo dwukanałowy Dolby Surround format dźwięku pseudoprzestrzennego otrzymywany z formatu dwukanałowego (obecnie rzadko stosowany); po zdekodowaniu źródła stereofonicznego otrzymujemy 3 kanały (lewy, prawy i surround) Dolby Surround Pro Logic format kodowania dźwięku otaczającego, dookólnego (ang. surround - otaczać). Jest to ulepszona wersja systemu dźwieku przestrzennego (stereo) z czterema kanałami: przednim lewym, przednim centralnym i przednim prawym oraz kanałem tylnym. System został opracowany przez Dolby Laboratories i wprowadzony na rynek w 1987 roku. Był to pierwszy system dźwięku dookólnego surround powszechnie przyjęty do użytku domowego.
Systemy dźwiękowe w multimediach Dolby Digital system cyfrowego kodowania dźwięku sześciokanałowego o maksymalnej częstotliwości próbkowania 96 khz, 24-bitowej rozdzielczości (standard sygnału audio zapisywanego na DVD mimo to w większości filmów stosuje się: 16-bit, 48 khz lub 44,1 khz), o dynamice 105 db, kompresji 1:12 i wymaganej przepustowości 448 kb/s. Dolby Digital 5.1 to 5 szerokopasmowych kanałów (od 20 do 20 000 Hz) przeznaczonych dla 5 głośników (lewego, centralnego, prawego, lewego surround, prawego surround); szósty kanał jest przeznaczony dla głośnika niskotonowego (sub-woofera 20-120 Hz).
Systemy dźwiękowe w multimediach
Systemy dźwiękowe w multimediach
Systemy dźwięku przestrzennego
Systemy dźwiękowe w multimediach
Karty dźwiękowe wybrane parametry 1. Głośność i przesterowanie 2. Współczynnik sygnału do szumu 3. Zniekształcenia nieliniowe 4. Rozdzielczość a zakres dynamiki
Decybel (db) Natężenie dźwięku wyrażane jest w watach na metr kwadratowy (W/m 2 ). W praktyce jednak operujemy jednostką zwaną decybelem (db). Jednostka ta określa relacje między dwoma sygnałami lub mówiąc inaczej, odnosi wartość jednego do wartości drugiego zwanego referencyjnym (najsłabszy wykrywalny sygnał). gdzie: L poziom natężenia dźwięku I natężenie dźwięku I 0 wartość odniesienia, wynosząca 10-12 W/m 2
Decybel (db) Skala w decybelach jest nieco inna, niż ta znana np. z lekcji fizyki (według której np. głośność spadającego liścia to 6 db, a startującego odrzutowca to 120 db). W edytorach audio używana jest skala dbfs. do 0 dbfs od minus nieskończoności dbfs Dolna granica jest ruchoma i zależy od formatu dźwięku: dla sygnału 16- bitowego (płyta CD) najniższym poziomem sygnału jest -96 dbfs, a dla dźwięku DVD wynosi -144 dbfs. Człowiek przestaje słyszeć dźwięki mniej więcej od poziomu -60 dbfs w dół.
Decybel (db) Decybel określa poziom natężenia dźwięku w skali logarytmicznej. Jak to wygląda w praktyce? Wystarczy, jeśli zapamiętamy, że gdy jeden dźwięk ma większe natężenie od drugiego o 3 db, oznacza to, że ma dwukrotnie większy poziom natężenia. Przykład: jeśli mamy dwa dźwięki, każdy z nich o poziomie natężenia 30 db, to ich wspólny poziom wyniesie 33 db, a nie 60 db. Czterokrotne zwiększenie to 6 db (czyli 36 db), a ośmiokrotne 9 db (39 db) l db to 26% przyrostu poziomu natężenia, 2 db 59%, 3 db 100%.
Bardzo krótko o poziomie nagrywanego dźwięku Skalę wyrażoną w decybelach znajdziemy zarówno w programach muzycznych, jak i domowym sprzęcie audio. Maksymalny dopuszczalny poziom natężenia dźwięku oznaczony jest jako O db (oznacza to maksymalną głośność. Ponieważ najwyższą wartością jest O db, wówczas niższy poziom oznaczany jest jako wartości ujemne. Często spotykamy się z oznaczeniem -6 db. Oznacza to, że w tym miejscu sygnał osiąga połowę maksymalnego natężenia. Brak sygnału (cisza) wyrażany jest jako -oo db (minus nieskończoność). W miernikach sygnału występują także wartości dodatnie (np. +1 db), ale lepiej, aby miernik sygnału nie wchodził na wartości dodatnie. Zjawisko takie nazywa się przesterowaniem. Praktycznie przesterowanie objawia się zniekształceniem dźwięku, "krztuszeniem się" głośników i może doprowadzić do ich uszkodzenia.
Współczynnik sygnału do szumu - Signal-to-Noise Ratio (SNR) SNR (ang. Signal-to-Noise Ratio) to stosunek sygnału (użytecznego) do szumu we wszelkich urządzeniach elektronicznych oraz w telekomunikacji analogowej i cyfrowej. Określa wartość (wyrażoną najczęściej w db) mocy sygnału użytecznego w zadanym paśmie częstotliwościowym do mocy szumów w tym samym paśmie częstotliwościowym. Im większa wartość, tym lepsza jakość urządzenia. Urządzenia oferujące SNR powyżej 100 db należy uznać za bardzo dobrej jakości. Np. SNR 104 db mamy w specyfikacji SoundBlaster Audigy 2 ZS. System audio E-MU 1820M oferuje SNR 120 db.
Zniekształcenia nieliniowe - Total Harmonie Distortion (THD) Wystarczy, gdy zapamiętamy, że THD to zniekształcenia, które powstają w wyniku dodania składowych harmonicznych (np. w przypadku częstotliwości 2 khz będą to 4 khz, 6 khz, 8 khz itd.). Wartość podawana jest w procentach. Dla przykładu: specyfikacja Hi-Fi dopuszcza maksymalnie 1% zniekształceń nieliniowych. THD karty Audigy 2 ZS Notebook wynosi 0,005%. Im mniejsza wartość, tym lepsza jakość urządzenia.
Rozdzielczość (w bitach) a zakres dynamiki (db) Zakres dynamiki (Dynamie Rangę) to stosunek między najgłośniejszym a najcichszym sygnałem. Wartość ta pozostaje w ścisłym związku z rozdzielczością (podawaną w bitach). W prosty sposób możemy obliczyć, jaki - teoretycznie - zakres otrzymamy przy określonej rozdzielczości: jeśli weźmiemy np. 8 bitów, to otrzymamy maksymalny zakres dynamiki 48 db (8 x 6 db = 48 db)*; gdy weźmiemy rozdzielczość płyty CD (16 bitów), wówczas otrzymamy dynamikę 96 db (16 x 6 db = 96 db). Im większa wartość, tym lepsze parametry karty. * przypomnienie - wzrost mocy sygnału o 6dB to 2 razy mocniejszy dźwięk
Synteza FM 1. Synteza poprzez nakładanie częstotliwości 2. Obwiednia dźwięku
Synteza FM Synteza FM pozwala na generowanie programowe dźwięków. Metoda ta polega na wykorzystaniu interferencji dwóch przebiegów o nieznacznie różniących się częstotliwościach.
Synteza FM OPERATOR Podstawowym składnikiem syntezatora FM jest operator zbudowany z: oscylatora, generatora obwiedni, generatora efektów vibratto i tremmolo sterownika głośności filtru dolnoprzepustowego.
Synteza FM Oscylator odpowiedzialny jest za generowanie jednego z trzech typów fal: sinusoidy fali trójkątnej oraz prostokątnej. Generatory obwiedni odpowiedzialne są za kształtowanie brzmienia sygnału. Filtr usuwa zniekształcenia powstające w paśmie wysokich tonów. INSTRUMRNT Dwa operatory na jeden instrument.
Synteza FM Układ syntezy FM widoczny jest przez 2 układy umieszczone w przestrzeni adresowej 388h i 389h. Pod tymi adresami umieszczony jest bogaty zestaw rejestrów sterujących praca generatorów.
Obwiednia dźwięku Amplituda dźwięku wytwarzanego przez instrument podlega pewnym zmianom w czasie: początkowo narasta (najczęściej bardzo szybko), potem pozostaje w pobliżu pewnej ustalonej wartości pośredniej i dopiero wtedy opada do zera. Te zmiany amplitudy nazywamy obwiednią i można je podzielić na pięć faz: A. faza nabrzmienia (ang. attack), B. faza opadania (ang. decay), C. stadium dochodzenia do ustalonej fazy (ang. slope), D. faza ustalona (ang. sustain),zanikanie dźwięku (ang. relase).
Obwiednia dźwięku Aby generowany dźwięk był zbliżony do naturalnego generowanemu przebiegowi nadawana jest obwiednia (wzorowana na naturalnych źródłach dźwięku) To właśnie długości poszczególnych stadiów są charakterystyczne dla danego instrumentu.
Synteza Wavetable
Synteza WaveTable Synteza WT (wavetable) Z uwagi na sztuczne brzmienie generowanych dźwięków synteza FM nie nadaję się do zastosowań profesjonalnych. Z tego tez względu producenci sprzętu opracowali technikę syntezy wavetable (WT), znanej też pod nazwą PCM (Pulse Code Modulation) lub AWM (Advanced Wave Memory). Zasada działania syntezy WT - W celu uzyskania na przykład brzmienia instrumentu chip muzyczny nie generuje sztucznego dźwięku, lecz odtwarza oryginalny dźwięk instrumentu, nagrany wcześniej w studiu. W praktyce niema jednak możliwości zapisania w pamięci wszystkich dźwięków generowanych przez 128 instrumentów MIDI. Chip muzyczny musi więc często obliczać wysokość i długość dźwięków na podstawie wzorcowych próbek.
MIDI Koncepcja cyfrowego złącza instrumentów muzycznych (MIDI), wprowadzona na rynek we wczesnych latach 80. MIDI pozwala na wymianę informacji i synchronizację sprzętu muzycznego za pomocą standardowych komunikatów, tworząc spójny system sterowania zestawem muzycznym. Komunikaty MIDI mogą być proste (np. włącz dźwięk pianina na 5 sekund), lub złożone (np. zwiększyć napięcie wzmacniacza VCA w generatorze 6, aby dopasować częstotliwość do generatora nr 1). Należy pamiętać, że MIDI nie przesyła dźwięku lecz informacje o nim (i nie tylko). Na przykład muzyk w czasie koncertu naciśnięciem klawisza może wydobyć nie tylko dźwięk, ale również może synchronicznie sterować, sekwenserami, modułami brzmieniowymi itp. - oczywiście pod warunkiem, że wymienione urządzenia będą zgodne ze standardem MIDI.
MIDI Komunikaty MIDI mogą być proste (np. włącz dźwięk pianina na 5 sekund), lub złożone (np. zwiększyć napięcie wzmacniacza VCA w generatorze 6, aby dopasować częstotliwość do generatora nr 1). Należy tutaj pamiętać, że MIDI nie przesyła dźwięku lecz informacje o nim (i nie tylko). Na przykład muzyk w czasie koncertu naciśnięciem klawisza może wydobyć nie tylko dźwięk, ale również może synchronicznie sterować, sekwenserami, modułami brzmieniowymi itp. - oczywiście pod warunkiem, że wymienione urządzenia będą zgodne ze standardem MIDI.
MIDI
Dziękuję za uwagę i zapraszam na ćwiczenia