Co je 3D zvuk? Některé věci, které potřebujete vědět o formátech prostorového zvuku

Vývoj systémů prostorového zvuku - od monofonie po 3D

V současné době se dvoukanálová stereofonie stala klasickým způsobem přenosu a reprodukce zvuku. Účelem stereofonní reprodukce zvuku je zprostředkovat zvukový obraz co nejpřesněji. Lokalizace zvuku je pouze prostředkem k dosažení bohatšího a přirozenějšího zvuku. Přenos prostorových informací nejběžnějšími „klasickými“ dvoukanálovými systémy má však řadu nevýhod, což podněcuje konstruktéry k vytváření různých systémů prostorového zvuku.

Posluchač v koncertním sále slyší nejen přímý zvuk vycházející z jednotlivých nástrojů orchestru, ale také difúzní zvuk přicházející z různých směrů (i zezadu) odrážený od stěn a stropu místnosti, což vytváří efekt prostoru a dotváří celkový dojem z obrazu.

Zpoždění, se kterým se difúzní zvuk dostane k uším posluchače, a jeho spektrální složení závisí na velikosti a akustických vlastnostech místnosti. Při dvoukanálovém přenosu se informace vytvořené difúzním zvukem do značné míry ztratí a v případě studiového nahrávání nemusí být zpočátku přítomny.

K reprodukci nebo syntéze „halova efektu“ lze použít různé metody.

V polovině 50. let společnosti Philips, Grundig a Telefunken testovaly 3D a Raumton trojrozměrné reprodukční systémy.

Přenos zvuku byl monofonní, ale přídavné reproduktory (většinou vestavěné, méně často externí), vyzařující zvuk do stran nebo nahoru, vytvářely díky zvuku odrážejícímu se od stěn a stropu dojem velkého prostoru.

K překonání této překážky bylo vytvořeno několik maticových kvadrafonických systémů (v tehdejší terminologii kvazikvadrafonie), ve kterých byly původní signály čtyř kanálů maticovány pro přenos přes dva kanály a při přehrávání byly původní signály obnoveny sum-diferenční transformace a bez dekodéru bylo možné reprodukovat normální stereo signál.

Protože žádný z těchto systémů nebyl plně kvadrafonický ani plně kompatibilní s dvoukanálovou stereofonií kvůli velkému pronikání signálu z kanálu do kanálu, jejich praktické využití bylo omezené a zájem o ně rychle vyprchal.

Ve „válce standardů“ kvadrafonických systémů nebylo vítězů, myšlenka šťastně zemřela, principy byly zapomenuty, ale termín zůstal. Proto je nyní málo lidí zmateno skutečností, že „něco“, co má čtyři zesilovací kanály a čtyři reproduktory, se hrdě nazývá „kvadrafonický systém“.

Jednoduché panorámování tedy neposkytuje požadovanou věrnost zvuku. Stereo efekty ("běžící zvuk", zvuková vazba "vlevo-vpravo" atd.) prvních stereo nahrávek rychle omrzely. Proto byly nejlepší nahrávky elektronických nástrojů ve studiu v 60. letech pořízeny pomocí mikrofonní technologie, což vysvětluje „živou“ povahu zvuku: Zavedení vícekanálového plně elektronického (bez použití mikrofonů) záznamu nástrojů s následné mixování sice usnadnilo práci zvukaři, ale zároveň zničilo atmosféru sálu. Následně se na tuto skutečnost začalo přihlížet při pořizování studiových nahrávek, i když k úplnému návratu k mikrofonní technice nedošlo.

Při použití dvoukanálového schématu přehrávání je hlavní zóna efektivního umístění zdánlivých zdrojů zvuku (ASS) umístěna před posluchačem a pokrývá prostor asi 180 stupňů v horizontální rovině. Dva přední kanály nemohou adekvátně reprodukovat zvuky, jejichž zdroje jsou ve skutečnosti umístěny za a ve vertikální rovině, pokud nejsou podporovány dalšími signály.

Použití zadních reproduktorů v kombinaci s panningem zvuku funguje dobře se zdroji zvuku umístěnými před a za posluchačem a méně dobře s bočním umístěním. Samotné panning zvuku však nikdy nemůže poskytnout přijatelné umístění zdrojů zvuku ve vertikální rovině.

Při vývoji maticových systémů se ukázalo, že značná část prostorové informace je obsažena v rozdílovém signálu (stereo informační signál), který může být dodáván do reproduktorů zadních kanálů buď v čisté formě, nebo smíchaný s určitým podíl předních signálů. V nejjednodušším případě to ani nevyžaduje další zesilovací kanály a signály mohou být maticovány na výstupu zesilovače:

Další, neméně významnou nevýhodou takových systémů je nezávislost úrovně zadního signálu na povaze zvukového záznamu. Při nízké úrovni zadního signálu je prostorový efekt málo patrný, při zvýšení úrovně se objeví zlom ve zvukové scéně a její fragmenty se posunou dozadu (efekt „obklopení orchestru“, který neodpovídá skutečnosti) .

Při přehrávání „živých“ nahrávek (které mají přirozené rozložení celkových, rozdílových a fázových složek) se tato nevýhoda projevila nevýznamně, ale na většině studiových fonogramů zadní kanály vnesly značné chyby do polohy IZ. K překonání tohoto nedostatku se rané systémy prostorového zvuku pokusily použít automatické panorámování.

Řídicí signály byly získány z úrovně prostorové informace - zvýšení úrovně rozdílových signálů vedlo ke zvýšení zisku v zadních kanálech. Převzatý model posouvání byl však velmi hrubý, v důsledku čehož chyby v ovládání expandéru vedly k chaotickým změnám v úrovni zadních signálů (efekt „těžkého dýchání“).

Zájem o systémy prostorového zvuku se znovu objevil s příchodem digitálních médií, jejichž úroveň vnitřního šumu je zanedbatelná a ani zpracování analogového signálu prakticky nezhorší dynamický rozsah systému. Rozvoj metod digitálního zpracování signálu vedl ke vzniku digitálních zvukových procesorů (Digital Sound Processor - DSP).

Existuje řada metod, které umožňují zařízení reprodukovat zvuk lokalizovaný v prostoru s omezeným počtem akustických systémů. Různé implementační metody mají silné a slabé stránky, takže je důležité pochopit základní rozdíly mezi hlavními metodami zpracování signálu. Moderní systémy prostorového zvuku (Dolby Surround, Dolby Pro-Logic, Q-Sound, Curcle Surround a další) jsou založeny na stejné myšlence převodu součtu a rozdílu, doplněné o „proprietární“ metody zpracování signálu (jak analogové, tak digitální) . Často se spojují pod společným názvem „3D systémy“ („znovuzrození“ čtyřicet let starého termínu!).

Než se podíváte na principy zpracování zvukových signálů v systémech prostorového zvuku, zvažte typický proces nahrávání. Nejprve se vytvoří nahrávka, která má mnoho jednotlivých kanálů – nástroje, hlasy, zvukové efekty atd. Během mixování se pro každou zvukovou stopu řídí úroveň hlasitosti a umístění zdroje zvuku, aby bylo dosaženo požadovaného výsledku. V případě stereo záznamu jsou výsledkem mixování dva kanály pro prostorové systémy, počet kanálů je větší (například 6 kanálů pro formát „5.1“ Dolby Digital/AC-3).

V obou případech se každý kanál skládá ze signálů, které jsou navrženy tak, aby byly odeslány do jednotlivých reproduktorů, když uživatel poslouchá. Každý z těchto signálů je výsledkem složitého smíchání původních zdrojových signálů.

Pamatujte, že panorámování ovlivňuje pouze amplitudu zvukového signálu.

Konverze zvuku v moderních 3D systémech zahrnuje další informace o amplitudě a fázovém rozdílu/latenci mezi výstupními kanály do audio streamu. Typicky množství zpracování závisí na frekvenci signálu, ačkoli některé efekty jsou vytvářeny pomocí jednoduchých časových zpoždění.

Jaké metody se používají ke zpracování zvukového signálu? Především se jedná o stereo expanzi (Stereo Expansion), která vzniká ovlivněním rozdílového stereo signálu předních kanálů. Tento způsob lze považovat za klasický a aplikuje se především na běžné stereo nahrávky.

Zpracování signálu může být buď analogové nebo digitální.

Digitální zvukové procesory využívají zobecněný model dozvuku, který redukuje řízení procesu dozvuku na nastavení klíčových parametrů (doba zpoždění, počet odrazů, rychlost doznívání, změna spektrálního složení odražených signálů). Takto jsou implementovány režimy hala, live, stadion atd.

Imitace se ukazuje jako docela realistická. Analogové procesory pro tento účel používají zpožďovací linky. Ovládání parametrů reverbu je v tomto případě mnohem složitější, takže obvykle existuje pouze jeden pevný režim provozu.

Je samozřejmě obtížné popsat strukturální vlastnosti všech existujících systémů prostorového zvuku, ale jejich práce je založena na diskutovaných principech - rozdíl je pouze v detailech algoritmů a sadě režimů (předvoleb).

Nejlepším rádcem při výběru zvukového procesoru je proto váš vlastní sluch.

Tento článek vychází z mé diplomové práce na téma „Vývoj principů pro simulaci prostorového zvuku v zábavním sektoru“, Katedra informačních technologií Moskevského leteckého institutu, 2011. Pro přizpůsobení textu byly vystřiženy suché statistiky, oživen jazyk a vloženy odkazy na knihy a články, které mohu doporučit. Nastolené problémy budou zajímat ty, kteří stále studují mechanismy lokalizace zvuku. Softwarová část není v článku zmíněna. Pro další zajímavost nebyla z článku vystřižena praktická část tvorby binaurálního atrapy mikrofonu.

Rád bych poděkoval Borisi Klimovovi za vytvoření exkluzivních ilustrací a také Naděždě Gurské za analýzu a úpravu textu.

Zavedení

Prostorový zvuk je klíčem k tomu, aby člověk mohl cítit efekt „přítomnosti“. Vnímání zvukového prostoru bylo zjevně požadováno dlouho před nástupem prostředků pro záznam zvuku: v průběhu staletí vznikaly prostory jako kostely, divadla a koncertní sály, kde byl posluchač „ponořen“ do zvukového prostoru vytvořením přirozený akustický efekt - dozvuk. Vědecké studie chování akustiky v koncertních sálech od společnosti Bose ukázaly, že přibližně 11 % se dostane k posluchači přímo, zbývající procento zvuku přichází v odražené formě od stěn, podlahy a stropu a dalších předmětů kolem posluchače, čímž vytváří hlasitost. zvuku. Z informačního hlediska pochází 25 % informací, které člověk dostává o světě kolem sebe, ze zvuku.

Přístup ke zvuku v moderních kinech navyká posluchače na to, že zvuk může a měl by být kvalitní a realistický. Profesionální vývojáři moderních herních aplikací věnují práci se zvukem až 40 procent svého rozpočtu a dočasných lidských zdrojů. Na druhou stranu je stále potřeba některé vývojáře her a aplikací přesvědčit, aby vynaložili čas a peníze na implementaci vysoce kvalitního zvuku.

Na téma různých přístupů je zajímavé přečíst si články “Scoring computer games”, díly 1 a 2 od Christophera (volně hledané na internetu).

Lidské vnímání zvuku

Lidský sluch je schopen vnímat zvuk v rozsahu od 16-20 Hz do 15-20 kHz. Zvuky s frekvencí pod 20-30 Hz (infrazvuk) jsou vnímány nikoli orgánem sluchu, ale hmatem, například prostřednictvím vibrací povrchů. Frekvence spodních mezních hodnot slyšitelného spektra lze vnímat prostřednictvím rezonancí lidských vnitřních orgánů. Nízkofrekvenční zvuk má při nízké intenzitě další emocionální dopad (například oblíbený efekt subdrop).

Pokles rozsahu slyšitelných frekvencí je spojen se změnami ve vnitřním uchu a rozvojem věkem podmíněné senzorineurální nedoslýchavosti. Ve věku 60 let nepřekročí slyšitelný rozsah na horní hranici 10-12 kHz. Vzhledem k tomu, že hlavní kontingent zábavního sektoru tvoří mladí lidé, je třeba plně zohlednit rozsah vnímaný sluchem. Ale zvukový specialista musí mít také plný sluch, slyšet nepřirozený a neúplný zabarvení a být schopen rozpoznat rezonance. A co není nedůležité, je ochrana sluchu před přetížením. Mnoho lidí v hudebním a zvukovém průmyslu zažívá neustálý stres z ozvučovacích zařízení a hlasitých akustických nástrojů (jako já, po více než 12 letech hraní na bicí nástroje). Moderní člověk je náchylný na negativní vlivy okolního hluku, který snižuje jeho citlivost a otupuje horní hranice frekvencí před přirozenou ztrátou sluchu. Není třeba zanedbávat ochranu sluchu, jako jsou špunty do uší. Nízkofrekvenční zvuky mohou mít také negativní dopad.

Více podrobností o negativním vlivu zvuku (včetně technického) lze nalézt v knize Chadda G. - Zvuk.

Vnímání zvuku je individuální, závisí na konfiguraci (tvaru) boltce, fyziologických vlastnostech, věku a psychickém rozpoložení v konkrétním okamžiku. V uvažované oblasti závisí vnímání zvuku také na:
- reprodukční zařízení (reproduktory přehrávacího zařízení, sluchátka, reproduktory, vícekanálové systémy),
- místnost, ve které se poslech provádí,
- kvalita konverzních nástrojů (například implementace zvukového procesoru, enginu),
- dodržování zásad tvorby správného zvukového obrazu při zvukovém designu.

Mechanismy lokalizace zdroje zvuku lidským sluchem

Schopnost člověka lokalizovat zdroj zvuku v prostoru je založena na principu binaurálního slyšení. Binaurální (z latinského bini – „dva“ a auricula – „ucho“) struktura sluchového ústrojí spočívá v odlišném vnímání zvukových signálů přicházejících do pravého a levého ucha. Algoritmus lokalizace zdroje zvuku:
- zvukový signál vycházející ze zdroje zvuku a odrazů místnosti vstupuje do vnější části sluchového ústrojí, kde konfigurace boltce umožňuje přenášet frekvenčně zpracovaný signál do vnějšího zvukovodu,
- signál přechází do bubínku člověka, uplatňují se mechanismy vnitřního ucha,
- z vnitřního ucha se informace dostávají do částí mozku, kde se na základě rozboru porovnání signálů přijatých z každého ze zvukovodů vyvozují závěry o umístění zdroje zvuku.

Lidský mozek porovnává informace přicházející z ušních bubínků s informacemi, které jsou již uloženy v paměti.

Rýže. 1. Stavba vnější části lidského sluchového ústrojí

Podrobně se o struktuře vnějšího a vnitřního sluchu a mnohem více dočtete v knize Iriny Aldoshiny a Roye Prittse – Hudební akustika, kapitola „Vnímání zvuku. Základy psychoakustiky"

K určení polohy zdroje zvuku v prostoru sluchový systém využívá základních lokalizačních mechanismů: podle časového rozdílu, podle rozdílu intenzity, podle rozdílu v amplitudově-frekvenčním spektru. Mezi pomocné mechanismy patří odrazy zvuku od lidského trupu a ramen, dozvuk, okluze (zvuk procházející překážkou), obstrukce (zvuk filtrovaný překážkou), Dopplerův jev, Haasův efekt (efekt přednosti). Nezapomínejte na vliv psychologického vnímání: pokud zdroj ve viditelném prostoru neodpovídá zvuku nebo dojde k narušení synchronicity, kvalita lokalizace prudce klesá.

Je nutné určit prostorovou polohu zdroje zvuku za přítomnosti rušení zvuku. Existují přirozené mechanismy hlukové imunity sluchového ústrojí. Jeden z nich se projevuje binaurálním uvolněním z maskování. Tento jev spočívá v tom, že je snazší lokalizovat zvukový signál na pozadí statického šumu (například okolního hluku).

Pár slov o průhlednosti zvuku. Dovolte mi uvést známý příklad. Představme si několik vrstevnicových kreseb zvířat na sebe navrstvených. Rozpoznávání vzorů spojených v prostoru je tím obtížnější, čím blíže jsou tvary vyobrazených zvířat (pojem tvar má stejný význam jako ve zvukovém signálu). Pokud jsou tyto kresby rozprostřeny v prostoru, pak je úkol identifikovat zvíře podle tvaru mnohem jednodušší.

Lokalizace podle časového rozdílu (fázová lokalizace)

Tento mechanismus pracuje na frekvencích od 300 Hz do 1,5 kHz. Vzhledem k rozdílu mezi polohou levého a pravého ucha trvá zvuku přicházející ze zdroje umístěného pod úhlem k přednímu směru různou dobu, než se dostane k bubínku.


Rýže. 2. Schematický příklad fázové lokalizace

Vzhledem ke stejné době potřebné k dosažení signálu z levého a pravého ucha tento mechanismus lokalizuje zdroj v azimutu 0 a 180 stupňů. Rozdílné časy pro dosažení ušních bubínků mají za následek fázový posun. Sluchový systém rozlišuje fázové posuny až o 10-15 stupňů. Se zvyšující se frekvencí, a tedy s klesající vlnovou délkou zvuku, se fázový posun signálů přicházejících ze stejného zdroje do různých uší zvyšuje. Jakmile posun dosáhne hodnoty blízké polovině vlnové délky zvuku, mechanismus přestane fungovat. Lidský mozek nedokáže jednoznačně určit, zda zvukový signál v jednom ze zvukovodů zaostává za druhým, nebo jej naopak posouvá dopředu.

Maximální časový rozdíl odpovídající úplnému posunu zdroje zvuku doprava nebo doleva nesmí být větší než 630 μs.

Vzdálenost mezi pravým a levým uchem dospělého člověka je 0,15 m-0,20 m, pokud vezmeme průměrnou hodnotu podle pohlaví. Se zdrojem vyzařujícím zvukovou vlnu o frekvenci 20 Hz a rychlosti zvuku 340 m/s bude vlnová délka 17 m. Pokud se tedy člověk otočí jednou stranou ke zdroji, dojde k fázovému posunu přicházejících signálů v jednom uchu a poté ve druhém bude přibližně 1,1 % z celé periody vlny 20 Hz (lokalizace na tak nízkých frekvencích není možná). Fyziologicky závisí přesnost lokalizace na velikosti hlavy, tedy na vzdálenosti mezi ušima. Čím větší je tato vzdálenost, tím větší je rozdíl ve zvukových signálech přicházejících do každého ucha.

Když zvuk vydává zdroj umístěný pod určitým úhlem k přednímu směru, úroveň akustického tlaku na ušní bubínky v různých uších se bude lišit. Je to dáno tím, že jedno ucho bude „ve stínu“ vytvořeném hlavou, a také tím, že zvukové vlny nad 1000 Hz v prostoru poměrně rychle utlumují.


Rýže. 3. Schematický příklad lokalizace podle úrovně intenzity

Tento mechanismus je poměrně účinný, ale v rozsahu zvukových frekvencí od 1600 Hz. Když je vlnová délka zvuku srovnatelná s průměrem lidské hlavy, ucho nejvzdálenější od zdroje přestává být v „akustickém stínu“, což je způsobeno jevem difrakce zvukové vlny na povrchu hlavy. Zároveň bylo experimentálně zjištěno, že schopnost lidského ucha určit úhel mezi dvěma zdroji v horizontální rovině ve frekvenčním rozsahu 1500-2000 Hz prudce klesá.

Tento mechanismus pomáhá určit vzdálenost ke zdroji zvuku. Hladina zvuku ze slabého, ale blízkého zdroje však může být stejná jako ze silného, ​​ale vzdáleného zdroje. Za takových podmínek je lokalizace usnadněna následujícím mechanismem.

Lokalizace rozdílem v amplitudově-frekvenčním spektru

Mechanismus je založen na schopnosti mozku analyzovat poklesy a vzestupy určitých frekvencí v komplexním signálu. Zvuk přicházející pod úhlem 90° obsahuje nízkofrekvenční i vysokofrekvenční složky a ve spektru zvuku působícího na vzdálené ucho bude méně vysokofrekvenčních složek - stínící efekt hlavy. Zvukový signál se navíc odráží odlišně od částí boltce a různé části zvukového spektra jsou zesíleny a zeslabeny.

Tento mechanismus je zodpovědný za předozadní lokalizaci a vertikální rovinu. Studium filtračního efektu hlavy a uší posluchače umožnilo zavést koncept nosných pásem. Při lokalizaci člověk neanalyzuje celé spektrum příchozího zvuku, ale pouze změny v některých frekvencích. Takové pruhy vznikly evolučně; sluch si vyvinul vlastní systém pro sledování a varování před nebezpečím, poměrně přesně lokalizoval, odkud hrozba pochází.

Změny v pásmech od 16 do 500 Hz a od 2 do 6 kHz jsou zodpovědné za lokalizaci frontálních zdrojů zvuku. Pásmo od 0,7 do 2 kHz - změna barvy zdrojů, které mohou být umístěny za nimi.

Signál se složitým spektrálním složením je lépe lokalizován a smysl „předozadního“ směru je tvořen především těmi směrovými pásmy, ve kterých je soustředěna většina výkonu signálu. Čisté tóny, které se v přírodě prakticky nevyskytují, jsou lokalizovány hůře než komplexní signály. Čisté tóny nad 8000 Hz je tedy obtížné lokalizovat. Rovněž není možné určit umístění nízkofrekvenčních zdrojů zvuku - méně než 150 Hz.

Lokalizace ve vertikální rovině je mnohem horší než v horizontální. Bez psychologického, vizuálního vlivu je téměř nemožné vytvořit napodobeninu předmětu, který by měl být umístěn například nahoře. Tento zvuk by měl být přinejmenším známý a očekávaný.

Gibson D. ve svých knihách a videích předkládá koncept vertikálního uspořádání nástrojů v hudebním mixu podle jejich výšky (tessitura) nebo formantu (oblast zesílených dílčích tónů), protože ve vertikální rovině zvuk -reprodukční zařízení je postaveno na stejném principu. Díky akustické výhybce s definovanými hranicemi je komplexní signál rozdělen do frekvenčních pásem. U třípásmového systému je dole woffer pro přenos nízkých frekvencí, ve střední části je středový měnič pro středy a výškový reproduktor v horní části systému pro přenos vysokých frekvencí. A sub-woffer přenáší některé informace přes podlahu. Tento přístup je zajímavý, ale není vhodný pro mnoho systémů, například při použití sluchátek nebo jakéhokoli jiného systému bez pruhování.

Více podrobností o popsaných principech lze nalézt v knize Gibson D. - A Visual Guide to Recording and Producing.

Nicméně psychoakustické snížení intenzity nízkých frekvencí pomáhá objekt „zvednout“ a učinit jej lehčím.

Přesouvání zdroje zvuku

Až do 60. let se studium lidské schopnosti lokalizovat zdroj zvuku v prostoru zaměřovalo především na stacionární zdroje zvuku. Poté začalo studium lidského vnímání a pohybujících se zdrojů zvuku: byly stanoveny hlavní charakteristiky vnímání.

V průběhu výzkumu se ukázalo, že k tomu, aby měl člověk pocit zvukového pohybu, je nutný určitý čas – časové okno. Pohybuje se od 0,08 do 0,12 s. Lokalizace krátkého, nehybného zvuku (například cvaknutí trvající asi 0,001 s) je celkem snadné.

Člověk také dokáže rozlišit rychlost pohybu zdroje zvuku: čím je vyšší (v určitých mezích), tím je tato schopnost jemnější. Pohybuje-li se zdroj zvuku rychlostí 90°/s (pohyb po půlobvodu před hlavou subjektu), člověk rozlišuje změnu rychlosti o 15 %; a při rychlosti pohybu 360°/s - o 5,5 %.

Pokud je zdroj stacionární, pak k jeho lokalizaci člověk podvědomě provádí mikropohyby hlavou, což řádově zvyšuje přesnost určení polohy zdroje v prostoru.

Efekty

Abychom věrohodně přenesli zvuk z pohybujícího se zdroje, je nutné vzít v úvahu (vliv změn frekvence zvuku ze zdroje, když se pohybuje neradiálně vzhledem k posluchači). Podle subjektivního pocitu z efektu se zvuk prudce mění v tónu – při přibližování se předmětu stává vyšší a při vzdalování nižší. V herním poli hraje významnou roli Dopplerův efekt. Zejména pokud jde o automobilové simulátory a další aplikace související s rychlým pohybem objektů. Dopplerův efekt je běžný plugin pro sekvencery, a pokud vím, existuje v mnoha zvukových enginech.

Jedním z hlavních efektů vytváření prostoru je efekt dozvuku (proces opakovaného odrazu zvukového signálu od různých povrchů s postupným snižováním jeho intenzity). Simulovaný dozvuk má řadu parametrů - čas raného odrazu, čas pozdního odrazu, rychlost doznívání, procento „suchého“ signálu se zpracovávaným. Tyto parametry udávají velikost místnosti a umístění zdroje zvuku v ní vzhledem k posluchači. Ve své práci používám výhradně konvoluční dozvuky, aplikuji na ně impulsy z reálných místností. Aniž bychom zacházeli do detailů technologie, samotným impulsem je šumový „otisk“ místnosti (soubor wav), který moduluje původní zvukový soubor, čímž jej umístí do simulovaného prostoru. V hudební oblasti se konvoluční technologie používají již delší dobu, takže v plášti Kontakt (4,5) od NI je konvoluční reverb se sadou impulsů zařazen do seznamu standardních efektů.

Zvukové systémy. Binaurální systém

Existují dva hlavní přístupy k uspořádání moderních zvukových systémů v místnosti: vícekanálové systémy a dvoukanálové systémy (včetně sluchátek). Ve vícekanálových systémech je zvuk přenášen z monitorů umístěných před a za (nebo kolem) posluchače.

Více podrobností o monofonních, binaurálních, stereofonních a vícekanálových systémech a jejich složitostech lze nalézt v knize Yu Kovalgin - Stereofonní vysílání a záznam zvuku.

Pro posílení prostorového efektu se výrobci snaží prosazovat systémové koncepty, které již nejsou pěti-, ale šesti-, sedmi- a dokonce devítikanálové. Zvýšení počtu kanálů vyžaduje komplikaci práce zvukaře, zvýšení počtu reproduktorových soustav, propojování kabelů a použití složitějších zesilovačů, a proto umožňuje zvýšit tržby z prodeje.
Ne všichni spotřebitelé potřebují vícekanálové audio systémy. Pro některé je to z ekonomických důvodů nepřijatelné; Někteří lidé z pochopitelných důvodů preferují používání sluchátek (v noci, při pohybu v MHD apod.).

Pouhé dvě uši poskytují člověku všechny potřebné informace o předmětu, což znamená, že k přenosu stačí pouze dva reproduktory. Při použití binaurálního záznamu jsou zdánlivé zdroje zvuku při použití sluchátek umístěny mimo hlavu posluchače do místa, kde se nacházejí skutečné zdroje zvuku. Naproti tomu při poslechu konvenčních stereofonních signálů přes sluchátka jsou zdánlivé zdroje zvuku pociťovány jako umístěny uvnitř hlavy posluchače.

Vzhled dozvuku ztěžuje odhad azimutu zdánlivých zdrojů zvuku v zadní oblasti, kde posluchači často udávají odpovídající směr zrcadla namísto skutečného směru. K tomuto jevu dochází zvláště často, když standardní doba dozvuku v poslechové místnosti překročí 0,3 s.

Správný přenos prostorových informací při přehrávání pomocí dvou monitorů je možný, ale i nepatrný (cca 9-15 cm) posun středu hlavy posluchače doleva nebo doprava od tohoto bodu vede k tomu, že lokalizace zdánlivého zvuku zdroje je nemožné mimo ohnisko os monitorů.

V optimálním místě poslechu poskytuje binaurální systém zvuk, který je s jistotou lepší než konvenční stereo. Jeho použití je však velmi omezené: přehrávání pomocí sluchátek, přenosná zařízení pro rozhlasové vysílání a reprodukci zvuku, počítačové modelování. Binaurální zvukový systém není příliš vhodný pro podmínky skupinového poslechu.

Při přehrávání binaurálního signálu přes reproduktorový systém dochází ke zkreslení výhybky v důsledku vstupu signálu pravého kanálu do levého ucha posluchače a naopak.

V realitě herního zvukového designu se nahrané binaurální zvukové soubory nepoužívají, protože není možné změnit jejich polohu v prostoru, neexistuje virtuální zdroj a virtuální posluchač, nejde o modelování.

Algoritmy

Hlavní algoritmus, který využívá základní mechanismy lokalizace lidského zvuku, je implementován v HRTF (Head Related Transfer Functions - funkce pohybujícího se zvuku vzhledem k posluchači. HRTF jsou kvantitativně určeny inverzní integrální Fourierovou transformací koeficientů nazývaných HRIR (Head Related). Impulsní odezva), které jsou v první aproximaci určeny tlakovým poměrem na bubínek ucha zvukové vlny ve volném prostoru (volné pole) a v reálném prostoru, s přihlédnutím k hlavě, uším, tělu a dalším překážkám osoby. .

HRTF je komplexní funkce se čtyřmi proměnnými: třemi prostorovými souřadnicemi a frekvencí. Při použití sférických souřadnic k určení vzdálenosti ke zdrojům zvuku větší než jeden metr se předpokládá, že zdroje zvuku jsou ve vzdáleném poli a hodnota HRTF se snižuje nepřímo se vzdáleností. Většina měření HRTF se provádí ve vzdáleném poli a počet proměnných je snížen na tři: azimut, elevace a frekvence. Účinek HRTF závisí na frekvenčním rozsahu zpracovávaného signálu: pomocí funkcí HRTF lze úspěšně interpretovat pouze zvuky s hodnotami frekvenční složky mezi 3000 Hz a 10000 Hz. Pokud signál ze zdroje zvuku neobsahuje speciální frekvenci, která ovlivňuje rozdíl mezi předními a zadními funkcemi HRTF, pak takový signál nebude nikdy lokalizován v předozadním směru.

HRTF byla simulována pomocí figuríny KEMAR (Knowless Electronics Manikin for Auditory Research) a speciálního „digitálního ucha“ vyvinutého společností Sensaura. Mikrofony jsou umístěny v uších figuríny a reproduktory jsou umístěny kolem figuríny, což vede k záznamu toho, co každé ucho slyší. Výsledky získané z takového modelování slouží k rozšíření databáze HRTF, kterou lze následně využít k interaktivnímu výběru parametrů při přehrávání polohovaného 3D audia (Sensaura má ve své databázi více než 1100 HRTF). Potřeba takové databáze je vysvětlována jednak rozdílem ve velikosti a tvaru hlavy a uší figuríny a potenciálního posluchače a jednak tzv. sweet spot zónou danou těmito parametry, ve které se zvukový efekt ve vertikální rovině je správně vytvořen a správné určení umístění zdrojů zvuku v prostoru. Čím větší plocha sweet spotu, tím větší svobodu jednání má posluchač. Vývojáři proto neustále hledají způsoby, jak zvýšit oblast účinku sweet spotu.

Při implementaci technologií s HRTF spoléhá QSound nejen na matematické metody, ale také na testování posluchači (takových poslechů bylo provedeno asi 550 tisíc). Specialisté na Sensaura po sérii experimentů zjistili, že HRTF ve své čisté formě „funguje“ pouze při hraní přes sluchátka. Zvukové modelování je v tomto případě triviální úkol: každý reproduktor ovládá své odpovídající ucho. Když je však stejný zvuk přehráván přes reproduktory, pravé ucho také slyší zvuk určený k „oklamání“ levého ucha z trojrozměrného pohledu a naopak. Aby se tento jev eliminoval, musí se ke zvuku přidat další kompenzační výpočty. Byly vyvinuty úspěšné kompenzační algoritmy, které se nazývají Transaural Cross-talk Cancellation (TCC). Problém byl vyřešen pomocí jiného nápadu od inženýrů Sensaura. Spočívá ve skutečnosti, že funkce HRTF fungují pouze pro průměrné ucho, protože jsou odvozeny pomocí jedné figuríny nebo průměrných hodnot velké skupiny lidí. Sensaura vyvinula digitální model ucha, ve kterém si můžete nastavit parametry boltce. Pomocí tohoto digitálního modelu lze kombinací různých parametrů reprodukovat tvar téměř každého ucha. Výsledný digitální ušní ovladač funguje takto: Při instalaci člověk poslouchá řadu testovacích zvuků a upravuje nastavení ovladače tak, aby si co nejlépe vychutnal trojrozměrnost zvuku. Jednotlivé parametry posluchače se zaznamenávají do speciálního „profilu“, který následně využívají aplikace.

Všechna práva v tomto dokumentu náleží autorovi. Reprodukce tohoto textu nebo jeho části je povolena pouze s písemným souhlasem autora.

Co je 3D zvuk a proč je o něm tolik kontroverzí? Jak souvisí pojem „trojrozměrný prostorový zvuk“ se schopností člověka vnímat zvuk dvěma ušima? Tyto otázky si často kladou jak uživatelé, tak profesionálové. Faktem je, že rozšířené používání 3D konceptů (3D grafika, 3D zvuk) přináší zmatek a zmatek do myslí běžných uživatelů. Často jsou tyto pojmy používány, mírně řečeno, ne zcela vhodně, což vnáší další rozpory v jejich používání a správném pochopení. 3D grafika není tématem tohoto článku. Zde se zaměříme na trojrozměrný zvuk.

Implementace prostorového zvuku (3D zvuk) v té či oné podobě, ve vztahu k počítačové technologii, se používá k přirozenému zvuku počítačových her nebo filmů, k vytvoření úplného pocitu ponoření do procesu hraní hry nebo sledování. film. Tato formulace problému činí použití konvenčního stereofonního zvuku nedostatečným. Je to způsobeno tím, že stereo signál přicházející k posluchači ze dvou fyzických zdrojů zvuku neposkytuje prostorový zvuk, ale určuje umístění imaginárních (slyšitelných) zdrojů pouze v rovině, ve které se skutečné (fyzické) zdroje zvuku nacházejí. . Mimochodem, „stereofonní“ ve skutečnosti znamená paradoxně „trojrozměrný zvuk“ (z řeckého „stereos“ - prostorový, trojrozměrný, pevný). Běžný stereo signál tedy nestačí k vytvoření plného realismu zvuku, když lze zdroje zvuku umístit v trojrozměrném prostoru. Je také mylná představa, že prostorový zvuk zajišťuje kvadrafonní systém (dva zdroje před posluchačem a dva za ním). Faktem je, že stejně jako ve stereofonním systému jsou všechny čtyři zdroje umístěny ve stejné rovině, což neumožňuje vytvořit úplný pocit trojrozměrného zvuku.

Obecně existují tři hlavní způsoby implementace prostorového zvuku:

rozšíření stereo základny(Stereo Expansion) - speciální zpracování existujícího stereo signálu a tím rozšíření zdánlivého zvukového pole (imitace rozšiřování vzdálenosti mezi zdroji);

polohování zvuku(Positional 3D Audio) - pracující s mnoha samostatnými zvukovými proudy a umístěním každého z nich v prostoru kolem posluchače;

virtuální (imaginární) prostorový zvuk(Virtual Surround Sound) – použití určitého počtu zvukových toků za účelem reprodukce skutečného zvuku pomocí omezeného počtu fyzických zdrojů zvuku.

Co to všechno znamená v praxi? V praxi to znamená, že metoda rozšiřování stereo základny je poměrně jednoduchá na implementaci a velmi často nachází uplatnění u stereo domácích spotřebičů. Jak je však její implementace jednoduchá, samotná metoda nedává pocit „trojrozměrného zvuku“ v tom smyslu, v jakém si jej představujeme, a to díky poskytování zvuku pouze v jedné rovině. Nestačí také použít tzv. rýžování. Panning je ovládání úrovně signálu v kanálech bez ohledu na frekvenci signálu. Posouvání umožňuje vytvořit iluzi pohybu imaginárního zdroje signálu někde mezi fyzickými zdroji (samozřejmě ve stejné rovině jako oni).

K vytvoření více či méně realistického prostorového zvuku je potřeba něco zásadně jiného. Zkusme na to přijít.

Kupodivu, ale celý problém je ve struktuře lidského sluchadla. Ukazuje se, že je tak nedokonalý, že i v reálném životě se můžeme setkat s obtížemi spojenými s nepřesným vnímáním zvukových signálů a určením jejich prostorového umístění. Jde o to, že všichni žijeme na planetě Zemi a po celou dobu existence člověka se jeho hlavní potrava a nepřátelé nacházeli v rovině rovnoběžné se zemí. Dvě uši umístěné po obou stranách hlavy nám proto umožňují určit umístění zdrojů zvuku pouze v horizontální rovině (binaurální efekt). Velmi špatně přitom rozlišujeme zvuk přicházející zepředu a zezadu. Schopnost lidského ucha (naslouchátka) posoudit umístění zdrojů zvuku ve vertikální rovině je také extrémně omezená. Kromě toho je známo, že tělo posluchače, zejména hlava, uši a trup, je překážkou šíření zvukových vibrací. Při interakci s tělem se zvuk odráží, tlumí a zkresluje, což vede k tomu, že posluchač nevnímá původní, ale změněný zvuk. To vše vytváří potíže při simulaci prostorového zvuku.

Co se děje uvnitř nás? Přijímačem signálu u člověka je ušní bubínek, skrytý ušním boltcem. Při vnímání zvuku mozek dekóduje signál přijatý z ušního bubínku a interpretuje jej určitým způsobem, aby správně určil prostorové umístění zdroje/zdrojů zvuku. A právě tato úvaha je brána jako základ pro všechny existující technologie pro vytváření prostorového zvuku.

Ukazuje se, že pokud provedete speciální zpracování zvukového toku s přihlédnutím k maximálnímu počtu funkcí vnímání zvuku sluchadlem, může být možné simulovat prostorový zvuk i s použitím pouze dvou zdrojů (reproduktory nebo sluchátka) . Je třeba zdůraznit, že jakýkoli algoritmus pro vytváření 3D zvuku je implementován pomocí filtračních algoritmů (pracujících s amplitudou a frekvencí zvukového signálu) různé složitosti, které určitým způsobem „klamou“ sluchadlo, „uvěří“, že to, co slyší, se nachází v trojrozměrném prostoru kolem posluchače.

Jedním z těchto algoritmů (metod) je HRTF - Head Related Transfer Function. Pomocí tohoto algoritmu lze zvuk převést speciálním způsobem, který poskytne vynikající 3D zvuk, určený pro poslech se sluchátky (vysvětlení naleznete níže). Je třeba poznamenat, že HRTF (v té či oné formě) je základem mnoha metod vytváření prostorového zvuku, které dnes existují. Ne nadarmo jsme však začali hovořit o HRTF jako o jednom z algoritmů, protože tento algoritmus ve své čisté podobě (ale stejně jako všechny ostatní) není jediný a dokonalý. Jde o to, že HRTF není stejný pro různé posluchače a ještě více pro různé polohy hlavy (pokud se bavíme o přehrávání ne přes sluchátka). Určitě existují způsoby, jak najít vyváženou HRTF pro všechny posluchače, ale tento přístup neposkytuje vysoce kvalitní zvukový zážitek pro každého a rozhodně neřeší problém rotace hlavy. To je pravděpodobně důvod, proč standard pro HRTF stále neexistuje.

Samozřejmě, pokud sluchátka nasazená na hlavě posluchače fungují jako zdroje zvuku, pak se jejich umístění vzhledem k hlavě posluchače nezmění, bez ohledu na to, jak moc je hlava natočena. V tomto případě, jak jsme si řekli, lze pomocí HRTF dosáhnout vysoce kvalitního prostorového zvuku. Jsou-li zdroji například dva reproduktory, pak je pro vytvoření přirozeného prostorového zvuku mimo jiné nutné zejména přesně sledovat otáčení hlavy posluchače, aby byly signály z každého fyzického zdroje vhodně upraveny. Navíc při přehrávání zvuku přes sluchátka se signál z každého kanálu dostane pouze do odpovídajícího ucha, ale při přehrávání přes reproduktory mohou být signály smíchány, což má za následek zkreslení přeslechů. Tento nedostatek je částečně odstraněn pomocí speciálního zařízení - bifonického procesoru.

Takže, jak jsme řekli výše, při použití reproduktorů jako zdrojů zvuku vyvstává problém s nutností umístit posluchače striktně do určité oblasti prostoru mezi zdroji zvuku. Tato oblast se nazývá Sweet Spot. Vzhledem k absenci schopnosti ovládat pozici posluchače v prostoru vzhledem ke zdrojům zvuku, ostatní věci jsou stejné, Sweet Spot ukládá přísná omezení na pozici posluchače. To znamená, že jakmile posluchač opustí oblast Sweet Spot, zvuk produkovaný zdroji již není vnímán jako prostorový. Při vytváření technologií prostorového zvuku proto vývojáři čelí problému rozšíření oblasti Sweet Spot.

Jednou z účinných metod řešení tohoto problému je zavedení dalšího třetího zdroje zvuku, kde se posluchač stane nezávislým na oblasti Sweet Spot. Tříkanálové systémy prostorového zvuku se často používají ve spotřebitelských audio a video zařízeních. Existují také vícekanálová (tří-, čtyř- nebo více) rozšíření této metody.

Avšak spolu s problémy implementace trojrozměrného zvuku pomocí HRTF má jakýkoli systém reprodukce zvuku další problémy. Například sluchátka špatně reprodukují přední signály. Při použití sluchátek je také problém s lokalizací zvukového signálu uvnitř hlavy posluchače a také efekt nekonečného rozšiřování stereo základny. Samozřejmě existují způsoby, jak s těmito účinky bojovat, ale to neřeší všechny problémy. Dvoukanálové systémy neposkytují dobrý zážitek z poslechu zvuku zezadu. Při implementaci vícekanálových systémů je slabým místem potřeba poměrně přesné lokalizace zdrojů signálu, protože to je často obtížné. Navíc je tu také problém zvuku v jedné rovině.

Vytváření skutečného vysoce kvalitního prostorového zvuku je tedy komplikováno jak potřebou zohlednit všechny vlastnosti lidského sluchového ústrojí, tak nutností dynamicky sledovat polohu posluchače vůči zdrojům zvuku, jakož i zohledněním vzít v úvahu vlastnosti přenosu zvuku posledně jmenovaného. Proto je těžké říci, které schéma tvorby 3D zvuku je pokročilejší. Je mnohem snazší říci, že všechna existující schémata jsou daleko k dokonalosti a všechny 3D zvukové technologie postavené na použití HRTF nebo jiných algoritmů mají mnoho nevýhod, protože je prostě nemožné vytvořit univerzální schéma, které by zohledňovalo všechny z výše uvedených vlastností sluchu, zdrojů zvuku a jejich umístění vzhledem k posluchači.

Jako reference uvádíme, že k vytvoření knihoven HRTF se používá umělá figurína KEMAR (Knowles Electronics Manikin for Auditory Research) nebo speciální „digitální ucho“. V případě použití figuríny je podstata měření následující. Mikrofony jsou zabudovány do uší figuríny. Zvuk je produkován ze zdrojů umístěných kolem figuríny a zaznamenáván z mikrofonů. Výsledkem je, že záznam z každého mikrofonu představuje zvuk „slyšený“ odpovídajícím uchem figuríny s přihlédnutím ke všem změnám, kterými zvuk na své cestě k uchu prošel. Výpočet HRTF se provádí s přihlédnutím k původnímu zvuku a zvuku „slyšeného“ figurínou.

Je třeba také říci, že jsme zvažovali pouze jednu stránku implementace plnohodnotného prostorového zvuku. Faktem je, že spolu s obtížemi spojenými se „správným“ přenosem trojrozměrného zvuku vznikají při vytváření her také problémy se správnou simulací různých fyzikálních vlastností zvuku (efekty odrazu od různých povrchů, pohlcování a zkreslení zvuku). zvuk). Správná implementace těchto vlastností také zásadně ovlivňuje posluchačův smysl pro prostorovost zvuku. Tento problém se však týká především přesnosti mechanismů, které vývojáři do her vkládají. Pokud jde o problém, o kterém jsme hovořili výše<донесения>trojrozměrný zvuk uživateli (nebo spíše jeho nervovému systému), pak to zůstává nevyřešeno, protože dosud nebyly nalezeny ideální modely pro implementaci trojrozměrného zvuku.

Chcete získat kvalitní prostorový zvuk do sluchátek nebo domácího kina zcela zdarma? Přečtěte si tento návod.

S každým novým vydáním (aktualizací) operačního systému Windows 10 vývojáři nepřestávají uživatele udivovat různými užitečnými minifunkcemi. Stačí jít na libovolné parametry systému, zařízení, personalizace, soukromí atd., určitě najdete nastavení, která na první pohled nejsou příliš nápadná, ale velmi užitečná.

A bez ohledu na to, kdo to říká, Microsoft vyvíjí svůj operační systém především pro vás a pro mě. Všechna tato prohlášení, že shromažďují důvěrná data a špehují nás, jsou nesmysl!

Kompetentní uživatel nakonfiguruje systém tak, aby přenos tajných informací na druhou stranu byl minimalizován. Pokud si nepřejete shromažďovat údaje o vašich preferencích, deaktivujte tuto možnost. Už vás nebaví reklama – zablokujte její zobrazování. Pokud se bojíte virů a jiných škodlivých aplikací, používejte oficiální, nikoli hacknutý software!

A nakonec, pokud se vám nelíbí samotný Windows, najděte náhradu ve formuláři nebo MacOS. Ale o tom teď nemluvme!

Nejnovější aktualizace systému přichází s novou funkcí prostorového zvuku. Pokud jej aktivujete, jistě získáte pocit, že zvuk hraje kolem vás, a ne přes vaše sluchátka. Řečeno trochu jinak, bude 3D nebo trojrozměrné.

Jak vidíte, Microsoft zde tuto funkci uživateli nevnucuje, protože je ve výchozím nastavení zakázána. A pak zjistíme, jak to povolit.

PROSTOROVÝ ZVUK

Windows 10 umí vysílat prostorový zvuk pomocí kombinace speciálního ovladače, aplikace a sluchátek. Tato technologie je navržena tak, aby zlepšila kvalitu zvuku především vašich sluchátek.

Chcete-li jej povolit, potřebujete:

  • klikněte pravým tlačítkem myši na ikonu v systémové liště a klikněte na „Přehrávací zařízení“;
  • vyberte „Reproduktory“ a klikněte na tlačítko „Vlastnosti“;
  • přejděte na kartu „Prostorový zvuk“ a vyberte jeho formát z rozevíracího seznamu (Windows Sonic nebo Dolby Atmos pro sluchátka).

DOLBY ATMOS

Jedná se o technologii prostorového zvuku pro vytváření dynamických zvukových prostředí v reálném čase. Ke svému fungování vyžaduje speciální aplikaci z obchodu. Pokud vyberete tuto možnost a kliknete na tlačítko Použít, automaticky se nainstaluje aplikace Dolby Access.

Významnou výhodou aplikace je, že podporuje vylepšení zvuku pro domácí kina, pokud hardware podporuje technologii Dolby.

Nastavení nebude nutit uživatele ponořit se do džungle složitých parametrů. Jednoduše vyberte příslušný profil na úvodní obrazovce a aplikace automaticky nakonfiguruje zařízení.

WINDOWS SONIC

Umožňuje integrovaný prostorový zvuk na Xboxu a Windows s podporou prostorových i výškových signálů. Zvuk bude možné přenášet bez nutnosti změny kódu.

Nyní výsledek! V mém případě i ta nejjednodušší a nejlevnější sluchátka při volbě formátu Dolby Atmos změnila zvuk, o řád lepší než ten původní. co se ti stalo? Čekám na vaši odpověď v komentářích.

Vyzývám vás, abyste se podívali na . Naše facebooková skupina na vás čeká.

Surround - prostorový zvuk


Po celou dobu existence zvukového záznamu měli posluchači i konstruktéři zařízení neuhasitelnou touhu, aby byl zvuk zaznamenán a následně reprodukován co nejpodobnější originálu. Co vývojáři audiotechniky nedělají, aby se přiblížili ideálu: bojují proti šumu, minimalizují zkreslení, rozšiřují frekvenční a dynamické rozsahy prvků cesty záznamu-přenosu-přehrávání zvukového signálu. A mimo jiné usilují o to, aby zvukové pole vytvářené akustickými systémy předávalo posluchači informace o směru zdrojů zvuku a o akustických vlastnostech místnosti, ve které byl záznam pořízen.

Zvukový záznam a rozhlasové vysílání byly v první fázi svého vývoje monofonní. Zvuk vycházející z reproduktoru se k nepoznání lišil od živého zvuku koncertního sálu: zkreslená rovnováha mezi různými hudebními nástroji, zkreslený témbr a hlavně zcela ztracená prostorovost. To je velmi závažná chyba. Koneckonců, lidský sluchový analyzátor má schopnost lokalizovat zdroje zvuku, což nám pomáhá při navigaci v prostoru. Pokud všechny zvuky vycházejí z jednoho bodu, působí to nepřirozeně.

Trochu historie

První experimenty k získání prostorového zvuku (pomocí tří až sedmi kanálů) byly provedeny již ve 30. letech minulého století. Srovnávací testy vícekanálových a monofonních systémů přinesly překvapivé výsledky. Bylo zjištěno, že při přehrávání dokonce 2 samostatných kanálů se subjektivní kvalita zvuku dramaticky zlepšuje. A nejmarkantnější je, že odborníci preferovali stereo zvuk i v případech, kdy jim byly předloženy objektivně lepší, ale monofonní fonogramy. Rozhodující výhodou byla možnost prostorové lokalizace zdánlivých zdrojů zvuku (obr. 1.33).

Rýže. 1.33. Rozložení zdánlivých zdrojů zvuku ve stereo panorama:

V počáteční fázi se vývojáři rozhodli omezit se na dva kanály. To bylo samozřejmě dáno především omezenými možnostmi tehdejšího vybavení: gramofonové desky ve skutečnosti umožňovaly umístit pouze dva plnohodnotné kanály.

Stereo zvuk dává zvuku určitou jasnost: části jednotlivých nástrojů jsou na pozadí orchestru lépe rozlišitelné. Kromě toho může stereo systém reprodukovat zdání zvukové atmosféry místnosti, ve které byl záznam pořízen. Začala éra dvoukanálových stereofonních systémů. Postupně se objevily stereofonní desky a stereo přehrávače, stereo magnetofony a stereo rozhlasové vysílání.

Stereo zvuk má zase značnou nevýhodu. Stereo panorama je omezeno úhlem mezi směry k reproduktorům a je ploché. Takový zvuk postrádá přirozenost skutečného zvukového pole, kdy je člověk schopen vnímat skutečné zdroje téměř ze všech směrů a odhadovat vzdálenost ke zdrojům zvuku. Pocit prostorového zvuku vytvořený v posluchači by mohl výrazně obohatit témbry hudebních nástrojů a hlasy zpěváků. V tomto případě by bylo možné simulovat proces dozvuku charakteristický pro místnost, ve které byl záznam pořízen.

Jedním z prvních pokusů překonat nevýhody stereofonních systémů byla kvadrafonie. Pro reprodukci kvadrafonických fonogramů se používají 4 akustické systémy (obr. 1.34).

První čtyřkolkové systémy pro domácnost se objevily na počátku 70. let minulého století. Zdálo se, že je čeká slavná budoucnost. To se však nestalo. Důvodů je několik. Jeden z nich je pro mnoho nových technologií tradiční a je ten, že výrobci kvadrafonních zařízení nebyli schopni dospět k jednotnému standardu pro záznam a přehrávání 4kanálového zvuku. Svou roli sehrály nedokonalosti a vysoká cena čtyřkanálových záznamových a přehrávacích zařízení. Ale hlavní věc je jiná: s přechodem ze „sterea“ na „quad“ v té době nevznikla nová kvalita zvuku. Kvadrofonní systémy, stejně jako stereofonní, neposkytovaly plný přenos vlastností skutečného zvukového pole. Byly zde pouze dva nedostatky, ale byly významné:

  • s kvadrafonií v 70. letech minulého století nebylo získáno kruhové stereo panorama - posluchač cítil obvyklé stereo panorama před sebou a další stereo panorama za sebou;
  • všechny imaginární zdroje zvuku se nacházely ve stejné rovině na linkách mezi reproduktory, takže stále neexistoval žádný trojrozměrný prostorový zvuk.
Je třeba poznamenat, že tyto nedostatky nejsou způsobeny ani tak omezenými možnostmi čtyřkanálové reprodukce zvuku, ale obtížností implementace panorámování zdánlivých zdrojů zvuku během záznamu. Při přípravě zvukových záznamů pro moderní vícekanálové systémy se tento faktor bere v úvahu. Důležitou roli v tomto případě hraje počítač, který si dokáže poradit s modelováním procesů objemového dozvuku a poskytuje zvukaři pohodlné ovládání pro přesun zdrojů zvuku po kruhovém panoramatu.

Rýže. 1.34. Rozložení zjevných zdrojů zvuku na quad panorama:

Ale v těch vzdálených dobách kvadrafonie ustoupila a stereofonie zvítězila a začala se rozvíjet po linii miniaturizace zařízení, zlepšování jeho technických a spotřebitelských kvalit a přechodu na nová média – kompaktní kazety a CD. Nahrávací společnosti a výrobci audio zařízení měli stále mnoho práce a velký prodejní trh. Posluchačům opět nabídli změnu hudebních knihoven. Hudební materiál nashromážděný na gramofonových deskách během předchozích desetiletí, aktualizován a adaptován nejprve pro monofonní kotoučové magnetofony, poté implementován na kompaktní kazety ve stereo formátu, byl opět nabízen milovníkům hudby, nyní však na laserových discích.

Na samém konci 20. století však stereofonie, zdá se, začala ztrácet půdu pod nohama. Technologie digitálního záznamu zvuku, stejně jako prostorná, pohodlná a levná média, odstranily dříve existující problém s ukládáním vícekanálových zvukových záznamů s dlouhou dobou trvání. Kromě toho existuje naléhavá potřeba zvuku, který přenáší akustické vlastnosti okolního prostoru. Virtuální grafické světy počítačových her jsou stále složitější a podobné realitě, což znamená, že vyžadují odpovídající zvukový design. Kino, které zažilo krizi v konkurenci s televizí, bylo oživeno v podobě domácích kin a kinosálů nového formátu, hlavní rozdíl od jeho předchůdců nespočívá v obrazu, ale v zásadně novém zvuku (i když kvalita obrazu se také zlepšila díky DVD a moderním promítacím prostředkům).

Nová éra v nahrávání zvuku začala jako výsledek výzkumu provedeného inženýry v Dolby Laboratories (http://dolby.com). Jednalo se o zásadně nový přístup k vícekanálovému přenosu zvuku. Rozdíl od tradiční metody spočíval především v tom, že maticové kódování bylo použito pro uložení audio signálů dvou dalších kanálů, tj. jejich smíchání s hlavními dvěma kanály. Změnil se i způsob umístění reproduktorových soustav - kromě tradičního kvadrafonního uspořádání reproduktorových soustav v rozích místnosti přibyl centrální kanál umístěný mezi pravým a levým předním kanálem, aby byla zachována široká stereo základna pro diváky sedící na bočních sedadlech a efektový kanál (Surround) je umístěn za zády). Tak se zrodil nový zvukový systém kina Dolby ® Stereo.

Jak již víte, tento čtyřkanálový formát je maticový formát, ve kterém je zvuk určený pro každý ze čtyř kanálů zakódován a zaznamenán do dvou kanálů a při přehrávání dekódován zpět na čtyři kanály: levý, středový, pravý a zadní. Signál zadního kanálu je obvykle odesílán do dvou zadních reproduktorů současně. Formát Dolby ® Stereo byl poprvé použit ve filmu „Star Wars“ v roce 1975.

Použitá technologie kódování neumožňovala separaci mezi kanály větší než 8 dB. To bylo později změněno tak, aby se vzdálenost mezi kanály zvýšila na 15 dB, ale frekvenční odezva zadního kanálu zůstala omezena na 100 Hz - 7 kHz.

Rýže. 1,35. Umístění zvukových emitorů v systému Dolby ® Stereo:

Zcela nový kvalitní reprodukční systém, kompatibilní se starým standardem záznamu zvuku, byl systém Dolby® Pro Logic®. Použil dekodér, který implementuje prostorové zaostřování zvukových obrazů - technologii používanou ke snížení vzájemného pronikání signálů z jednoho kanálu do druhého. Dolby ® Pro Logic ® také představil možnost zpožďovat zvukový signál v zadním kanálu. Tím bylo zajištěno sladění geometrických a akustických charakteristik konkrétní místnosti s charakteristikou „referenčního kinosálu“, do kterého se při výrobě přimíchával vícestopý zvuk. Je velmi důležité, že se do dnešního dne nashromáždilo obrovské množství hudby, filmů a televizních programů nahraných na různá moderní média se zvukem ve formátu Dolby ® Pro Logic ® . Pak přišla éra digitálního kódování a digitálního záznamu vícekanálového prostorového zvuku a zrodil se Dolby ® Digital. Pro kódování digitálního zvuku používá algoritmus nazvaný AC-3 (algoritmus třetí generace kódování zvuku od Dolby je vícekanálový algoritmus komprese zvuku (počet nezávislých kanálů od 1 do 6) se ztrátami oblasti psychoakustiky, s přihlédnutím k vlastnostem lidského sluchadla, se používají k rozhodnutí, jaká část informace v audio signálu může být vyřazena, aby nebyla pro lidské ucho při kódování pomocí AC-3 příliš patrná algoritmu, přenosové rychlosti od 32 Kbps (pro jeden mono kanál s minimální kvalitou) až 640 Kbps (pro 5.1 kanálů s minimální ztrátou kvality) Typická přenosová rychlost pro 5.1 nahrávky je 385 Kbps.

Kodér Dolby® Digital podporuje vzorkovací frekvence digitálních dat 32 kHz, 44,1 kHz a 48 kHz při 16, 18 nebo 20 bitech. Je možné zvýšit bitovou hloubku na 24 bitů. Používá se ztrátová komprese dat, ale kvalita zvuku je stále vyšší než u předchozích analogových systémů. Dolby® Digital dokáže zakódovat až 6 kanálů ve formátu 5.1, kde 5 je kanálů s plným rozsahem (2 020 000 Hz) a 1 kanál s nízkofrekvenčními efekty (méně než 120 Hz).

Hlasitost akustických scén, jasnější detaily, přirozený pohyb zdrojů zvuku zepředu dozadu, stereofonní zvuk vzadu – to vše zajistilo úspěch systému.

Dalším krokem ve vývoji systémů prostorového zvuku je systém Dolby ® Digital EX, který lze považovat za doplněk k Dolby ® Digital. V Dolby ® Digital EX, stejně jako v Dolby ® Digital, lze fyzicky zakódovat až 6 nezávislých kanálů (5.1), avšak díky použití maticového kódování jsou informace z jednoho nebo dvou dalších prostorových kanálů smíchány do levého a pravého zadní kanály. Díky tomuto řešení je zachována kompatibilita se zařízením Dolby ® Digital a zároveň díky zavedení dalších prostorových kanálů (6.1, 7.1) na zařízení Dolby ® Digital EX ještě vyšší přesnost lokalizace zdrojů zvuku v prostoru je dosaženo.

Samozřejmě to není jen Dolby Lab, kdo se zabývá vícekanálovým zvukem. Například společnost RSP Technologies vytvořila maticový prostorový systém nazvaný Circle Surround, který má zadní kanál s celým rozsahem frekvencí, a proto je nejvhodnější pro přehrávání hudby. Nová verze Circle Surround může také fungovat v šestikanálovém režimu s oddělenými zadními kanály a kanály pro subwoofer.

V současné době můžeme hovořit o rozšíření nového spotřebitelského formátu: DVD-audio. Zvuková data na tomto médiu lze ukládat pomocí různých kódovacích algoritmů, včetně Dolby ® Digital. Vzhledem k velké kapacitě DVD médií (4,7 GB na jednovrstvém disku) však odpadá ztrátová komprese zvukových informací. DVD-audio dokáže ukládat vícekanálové nahrávky ve formátech až 24 bitů/96 kHz bez jakékoli komprese, a tedy bez jakékoli ztráty.

Formát 5.1

Označení "5.1" udává počet kanálů, ale neposkytuje informaci o žádné konkrétní metodě kódování vícekanálového zvuku. Je použito pět kanálů s celým frekvenčním rozsahem (levý přední, středový, pravý přední, levý zadní a pravý zadní), stejně jako jeden nízkofrekvenční kanál (s rozsahem od 3 do 120 Hz), připojený k subwooferu (obr. 1,36).

V tomto systému 5.1 se vytváří kruhové stereo panorama. Vzhledem k tomu, že při ultranízkých frekvencích není náš sluch prakticky schopen určit směr zdroje zvuku, není umístění subwooferu podstatné.

Subwoofer se také používá v běžných stereo systémech. Nízkofrekvenční část spektra celkového signálu stereo kanálů je přiváděna do jeho kanálu, což má za následek zaručenou reprodukci basových zvuků. V systému 5.1 však hraje kanál nízkofrekvenčních efektů zvláštní roli. Neměl by být považován za nízkofrekvenční komponent vícepásmového reproduktorového systému, ale spíše za nezávislý kanál nízkofrekvenčních efektů.

Při nahrávání na magnetofon má většina systémů 5.1 následující pořadí kanálů (počínaje první stopou): levý přední, střední, pravý přední, levý zadní, pravý zadní a nízkofrekvenční kanály. V některých případech (například u vícekanálových zvukových karet) je poskytováno jiné pořadí: levý přední, pravý přední, levý zadní, pravý zadní, střed, nízká frekvence.

Podle odborníků je formát 5.1 nejslibnější, protože je podporován hlavními vývojáři. Je důležité, aby byla k dispozici vhodná média (DVD).

Rýže. 1.36. Umístění zvukových zářičů v systému 5.1:

A ačkoli dosud nebyl přijat jediný standard a existuje několik kódovacích systémů pro 5.1 současně, fiasko „primitivní“ kvadrafonie se pravděpodobně nebude opakovat, i když „přežije“ ne jeden, ale několik různých kódovacích systémů. Zásadní rozdíl mezi formátem 5.1 a kvadrafonií před třiceti lety je v tom, že v tomto případě je zvukový signál v digitální podobě, takže vytvoření univerzálního dekodéru schopného pracovat se zvukem zakódovaným různými systémy nezpůsobí žádné zvláštní potíže a nepovede k citelné zvýšení nákladů na zařízení.

Na úspěchu formátu 5.1 mají zájem výrobci audio a video zařízení, počítačů, počítačových komponent a programů. Zajímají se o to spotřebitelé: diváci, posluchači, hráči. Zvukoví inženýři a hudebníci nacházejí v tomto formátu nové výrazové prostředky k realizaci kreativních nápadů a posílení dopadu na naše emoce. Formát skutečně dává reprodukovanému zvuku novou kvalitu: posluchač je jím obklopen. Pravda, virtuální zvukový svět v tomto případě neodpovídá tomu skutečnému. V syntetizovaném zvukovém prostoru může být zdroj zvuku vpravo, vlevo, vpředu, vzadu a může se pohybovat v těchto „souřadnicích“. A ve skutečném zvukovém prostoru je navíc ještě „nahoře“ a „dole“.

Vlastnosti studiového vybavení 5.1

Nyní budeme hovořit pouze o základních prvcích zvukového studia, mezi které v první řadě patří:

  • mixér;
  • vícekanálové záznamové zařízení;
  • Zařízení pro zpracování a efekty;
  • monitory pro poslech zvukových stop.
Hlavním nástrojem pro mixování vícekanálového zvuku je mixpult vybavený nástroji pro posouvání.

Ve stereu se ovládání panorámy používá k umístění zdánlivého zdroje zvuku na určité místo. Pomocí něj nastavíte relativní úrovně zvukových signálů, které jsou přiváděny do každého ze dvou kanálů, a tím určíte polohu zdroje zvuku mezi dvěma reproduktorovými systémy. Při práci s vícekanálovým zvukem musíte stejný proces ovládat v 5 kanálech, kromě toho je samozřejmě nutné upravit i kanál subwooferu. Proto při použití tradičního mixážního pultu je nutné manipulovat s více ovládacími prvky pro umístění jednoho zdroje zvuku. Všimněte si, že stav faderů, které ovládají úroveň signálu a ovládání panoramatu v každém kanálu, je obtížné srovnávat s pozicí zdánlivého zdroje zvuku v kruhovém panoramatu. Ještě obtížnější je přimět zvuk, aby se pohyboval po dané dráze. To je možné pouze u mixérů s automatizací. Joystick by byl velmi vhodný jako kruhové ovládání panorámy v mixu navrženém pro práci s vícekanálovým zvukem.

Mixér schopný pracovat s prostorovým zvukem navíc musí mít ne jeden, ale hned několik výstupů (podle počtu kanálů). Například v systému 5.1 musí mít směšovač alespoň 6 výstupů. Vybavení pro stereo nahrávací studio není levné a na cenu studia 5.1 nemůžete ani pomyslet!

Vícekanálová zařízení pro záznam zvuku jsou také trochu drahá. Musí mít 6 nebo více kanálů. Navíc je velmi žádoucí, aby zvuk v nich byl reprezentován alespoň 24 bity.

Mixéry a digitální magnetofony jsou zařízení, která mají vícekanálovou povahu. Některé z modelů určených pro práci se stereo zvukem lze proto s větším či menším pohodlím použít ve studiu formátu 5.1. S ekvalizéry, zařízeními pro zpracování dynamiky a zejména efekty je ale situace složitější. Samozřejmě můžete poskytnout 6 kanálů sestavením „baterie“ 3 dvoukanálových zařízení. O smysluplné úpravě parametrů však v tomto případě není třeba mluvit. Představte si například obtížnost vytvoření realistického reverbu ve vícekanálovém systému.

Důstojnou náhradou za digitální magnetofony a hardwarové mixpulty mohou být softwarová multitracková studia a v některých z nich obsažené virtuální mixpulty, které umožňují ovládat posouvání pomocí běžné myši. V Cubase SX je k dispozici snadno použitelný prostorový mix, který jasně zobrazuje polohu zdroje zvuku v kruhovém panoramatu (viz kapitola 5).

Ne každý majitel domácího stereo studia si může dovolit mít reproduktorový systém stereo monitoru. V případě stereo mixu jsou však přijatelným řešením relativně levná monitorová sluchátka. A ve formátu 5.1 vás stereo sluchátka nezachrání. Bez pěti širokopásmových reproduktorových soustav (a také subwooferu) se neobejdete.

Při práci se stereo zvukem jsou hlavními požadavky na monitory: rovnoměrnost jejich frekvenční charakteristiky, nízká úroveň zkreslení a úplná identita dvou reproduktorových soustav.

Podobné požadavky by mohly být kladeny na pět širokopásmových 5.1 monitorů. Zdá se, že by také měly být naprosto stejné. Ale v tomto případě se budete míchat do kruhového panoramatu v podmínkách, které se liší od podmínek, ve kterých bude mnoho posluchačů vaší kompozice. Faktem je, že většina majitelů domácího kina má zadní reproduktorové soustavy, které jsou nejen výkonově slabší než přední, ale navíc mohou mít jiný typ konstrukce. Centrální reproduktorový systém se zase často liší od těch krajních. Ukazuje se, že dojem posluchače se nemusí shodovat s tím, který jste zamýšleli.

Všimněte si, že podobný problém existuje při práci se stereo zvukem: míchání se provádí na studiových monitorech a přehrávání se provádí na široké škále akustiky, od vysoce kvalitních reproduktorů po reproduktory přenosného kazetového magnetofonu. Pravda, během procesu masteringu musí zvukové záznamy projít testem kompatibility s nekvalitním zařízením a jedním z hlavních úkolů této fáze je přizpůsobení záznamu konkrétnímu typu média.

Pokud jde o kanál nízkofrekvenčních efektů systému 5.1, při mixování hudební skladby by se subwoofer neměl vůbec používat, pokud podle výtvarného návrhu hudební skladba neobsahuje efekt jako je výbuch, výstřel, atd.

Zkušenosti z minulých let, kdy kraloval formát CD-audio, ale ukazují, že případná oficiální doporučení pro použití formátu jsou dodržována pouze zpočátku. Zvukoví inženýři a producenti jsou postupně ve svých kreativních plánech odvážnější a překračují hranici zvanou „oficiální doporučení“. Jak nám říká naše intuice, nakonec se nízkofrekvenční kanál systému 5.1 využije „naplno“: tam, kde je potřeba a kde není potřeba. Například zřejmou myšlenkou je použít nízkofrekvenční kanál ke zvýraznění rytmu basového bubnu v taneční hudbě.

Jak organizovat monitorování při míchání vícekanálového zvuku? O tom se vede určitá debata. Většina odborníků však doporučuje používat stejnou akustiku, bez úprav pro nedokonalosti domácích systémů. Monitory by měly být umístěny ve stejné vzdálenosti od posluchače, zejména tři přední monitory by měly tvořit spíše oblouk než přímku. Pokud to není možné, snižte odpovídajícím způsobem hlasitost středového monitoru.

Jak by měly být ideálně umístěny monitory pro systém 5.1? Představte si, že jste uprostřed systému 5.1. Centrální monitor by měl být umístěn před vámi. Pomyslná čára mezi vámi a centrálním monitorem je osa, vzhledem k níž bude určeno umístění zbývajících monitorů. Levý a pravý přední kanál jsou umístěny v úhlech -30° a 30° vzhledem k této ose. Úhel levého monitoru-váš-pravý monitor je tedy 60°. V případě potřeby lze tento úhel zmenšit na 50° - 45°. Subwoofer by měl být také umístěn někde před vámi. Zadní monitory by měly být umístěny v úhlu -110° (vlevo vzadu) a 110° (vzadu vpravo). V ideálním případě by všechny monitory měly být od vás ve stejné vzdálenosti a zkalibrovány tak, abyste je slyšeli se stejnou hlasitostí, když jsou signály stejné úrovně odesílány na různé monitory. Výška monitorů je na úrovni vaší hlavy nebo mírně vyšší.

Funkce míchání do kruhového panoramatu

Vzhledem k tomu, že se vážně zabýváme problematikou zpracování zvuku, již řadu let bedlivě sledujeme publikace týkající se tohoto tématu. Můžeme tedy s jistotou konstatovat, že není tolik prací věnovaných problematice technologie stereo míchání. Ale prakticky neexistují žádné články obsahující konkrétní doporučení pro vytváření vícekanálových nahrávek. Zjevně se to dá vysvětlit tím, že problém je nový, chybí potřebné zkušenosti a neexistují žádné zavedené tradice. Nezávislá hudební díla spojená do kruhového panoramatu se každopádně ještě nestala masovým fenoménem. Vícekanálový zvuk primárně existuje jako doplněk k obrazům videa. Je jasné, že přístupy k posouvání zvuku pro filmový soundtrack a zvuk hudební skladby se musí lišit. Při doprovodu videa je nutné umístit hlavní zvuk dopředu, protože se akce odehrává na obrazovce před divákem. Zadní kanály se používají k přidání hlasitosti zvuku a implementaci speciálních efektů. Při práci s prostorovou hudbou se samozřejmě můžete zaměřit na dostupný vývoj v oblasti tvorby zvuku pro moderní filmovou produkci. To znamená, že můžete umístit hlavní zvuk dopředu, mírně obklopit posluchače, a použít zadní kanály k obnovení akustiky prostředí a přesunu sekundárních zdrojů zvuku. A přesto, pokud mluvíme o hudebním díle, které vzniká bez očekávání spojení s video zápletkou, pak si autor může užívat naprostou svobodu v používání nových výrazových prostředků, které jsou vlastní kruhovému panoramatu samotnému. Posluchače můžete například „posadit“ mezi interprety, přesouvat kolem něj celé zvukové pole nebo jednotlivé zdroje zvuku a posunout je do „hloubky“ panoramatu.

Je pravda, že speciální efekty posouvání je nejlepší používat s mírou. Například stěží má smysl navrhovat virtuální piano, jehož klaviatura, soudě podle zvuku, vypadá jako kruh obklopující posluchače. Zvuky bicích umístěné v zadních kanálech a zejména náhlé hlasité zvuky přicházející zezadu mohou být velmi dobře1 důvodem, proč se vaše skladba nestane hitem. Málokomu se bude líbit, když se bude muset každou chvíli reflexivně otočit nebo vyděšeně vyskočit.

Při přípravě stereo nahrávek jsme nuceni se záměrně omezovat ve využití schopností stereo panorama ve vztahu k některým hudebním nástrojům. Kromě toho jsou omezení diktována nejen uměleckými, ale také technickými ohledy. Například absolutně nemá smysl posouvat basy ze středu stereo panorama. Za prvé proto, že stereo efekt je v oblasti nízkých frekvencí stále velmi slabý. Za druhé, pokud se basy posunou doleva nebo doprava, výkon jednoho z reproduktorů nebude plně využit. A to je vážná nevýhoda, protože nízkofrekvenční oblast spektra vždy tvoří znatelný podíl na celkovém výkonu zvukového signálu.

Podobné problémy existují v systémech 5.1, i když zde subwoofer řeší problém generování nízkofrekvenčních zvuků. Jedním takovým problémem je použití středového kanálu. Ve filmech je navržen tak, aby ukotvil dominantní zvuky v obraze, aby diváci mimo střed vnímali tyto zvuky jako přicházející z obrazovky. V hudbě jsou zvuky, které jsou ve stereu obvykle posílány rovnoměrně do levého a pravého kanálu (hlavní zpěv, basa, část bicích), lépe distribuovány mezi středový a přední kanál. Tím se zabrání přetížení centrálního kanálu. Kromě toho se slyšitelnost zvuků zvýší, pokud některé z nich směřují více do centrálního kanálu a jiné - současně do levého a pravého předního kanálu.

Formát 5.1 poskytuje spoustu nových možností pro aplikaci efektů, jako je delay a reverb. Reverb signál může být umístěn ve stejném směru jako přímý signál. Současně, stejně jako u stereo nahrávek vede příčný směr dozvuku ke zjevnému rozšíření stereo základny, lze nabýt dojmu zvýšení hlasitosti virtuální místnosti, pokud je dozvuk předních zvuků veden mírně pozadu, a ty zadní - mírně vepředu. V rámci 360stupňového panoramatu lze dynamicky posouvat nejen zdánlivé zdroje zvuku samotné, ale i jimi generované ozvěny.

Při míchání do kruhového panoramatu se objevují další znaky, kterými ucho dokáže rozlišit jednotlivé části: směr ke zdroji zvuku v rozsahu 360° a do jisté míry i vzdálenost k němu (hloubka panoramatu). Není tedy potřeba provádět frekvenční filtrování za účelem zvýraznění některých zvuků od jiných, nebo ke změně hlasitosti nástrojů během skladby nebo ke kompresi jednotlivých zvukových signálů.

Pokud jde o dodatečné zpracování již namíchané kompozice kompresorem, zdá se taková operace nepřijatelná. To může vést k posunutí pozic zdánlivých zdrojů zvuku dříve umístěných v určitých bodech. A ty zdroje, jejichž aktuální úrovně signálu v určitém bodě překročí práh odezvy kompresoru, se také budou „pohybovat“ chaoticky po náhodných trajektoriích. Zdá se, že situace se změní až s příchodem široce dostupných vícekanálových virtuálních efektů a zpracování, které implementují algoritmy zpracování, které zohledňují specifika panningu prostorového zvuku a psychoakustický faktor. V současné době lze počátky takových algoritmů nalézt v softwarových kodecích, které převádějí například soubory WAV umístěné na 6 samostatných stopách do jediného digitálního toku AC-3. Bohužel podstata takových algoritmů je před uživatelem skryta a počet parametrů dostupných pro nastavení je extrémně malý.

Zdá se, že zajištění mono kompatibility nahrávek smíchaných ve formátu 5.1 je nereálné. Problematické je také zajištění stereo kompatibility hotového zvukového doprovodu. Jediným správným řešením by zřejmě bylo cíleně a odděleně mixovat kompozici do formátu mono, stereo a 5.1.

Podstata, úkoly a fáze masteringu ve vztahu ke stereofonním fonogramům - upřímně řečeno, tento problém je velmi obtížný. A s masteringem ve vícekanálových formátech je situace ještě složitější. Mnohé je stále nejasné. Nefiltrujte, nekomprimujte, nekontrolujte mono kompatibilitu, nepřipravujte se na výstup alba na různá média. Co by se tedy mělo dělat s nahrávkami 5.1 ve fázi masteringu?

A ještě jednu věc bych rád řekl. Můžete poslouchat FM rádio nebo CD a přitom dělat vlastní věci, jako je čtení této knihy. Zároveň je důležité, aby byl zvuk pohodlný: nemělo by docházet k žádným změnám hlasitosti a zabarvení, které by odváděly pozornost od hlavní činnosti. Ale poslouchat skladbu ve formátu 5.1 „z doslechu“ je téměř nemožné. Samotný formát 5.1 znamená ponoření posluchače do hudby. Jiným přístupem by tedy mohlo být nedělat ve fázi masteringu 5.1 nic kromě možná normalizace. To znamená, že veškerá odpovědnost za subjektivní kvalitu konečného zvukového záznamu je přenesena na fázi míchání a mastering se provádí na principu „co je, je“. Pokud však posluchač stále potřebuje pohodlnější zvuk beze změn hlasitosti, může na svém systému povolit odpovídající možnost (například Povolit kompresi dynamického rozsahu).




Nahoru