Стиснення динамічного діапазону - студопедія

Замислимося над питанням - а навіщо нам піднімати гучність? Для того щоб чути тихі звуки, які не можна почути в наших умовах (наприклад, якщо не можна слухати голосно, якщо є сторонні шуми в кімнаті і т.д.). А чи можна посилити тихі звуки, а голосні не чіпати? Виявляється можна. Ця техніка називається стисненням динамічного діапазону (компресія, Dynamic Range Compression, DRC). Для цього необхідно змінювати поточну гучність постійно - тихі звуки посилювати, гучні - немає. Найпростіший закон зміни гучності - лінійний, тобто гучність змінюється за законом output_loudness = k * input_loudness, де k - коефіцієнт стиснення динамічного діапазону:

Малюнок 18. Стиснення динамічного діапазону.

При k = 1 ніяких змін немає (вихідна гучність дорівнює вхідний). при k <1 громкость будет увеличиваться, а динамический диапазон - сужаться. Посмотрим на график (k=1/2) - тихий звук, имевший громкость -50дБ станет громче на 25дБ, что значительно громче, но при этом громкость диалогов (-27дБ) повысится всего лишь на 13.5дБ, а громкость самых громких звуков (0дБ) вообще не изменится. При k> 1 - гучність буде зменшуватися, а динамічний діапазон - збільшуватися.

Подивимося на графіки гучності (k = 1/2: стиснення ДД в два рази):

Малюнок 19. графіки гучності.

Як видно в оригіналі були присутні як дуже тихі звуки, на 30дБ нижче рівня діалогів, так і дуже гучні - на 30дБ вище рівня діалогів. Т.ч. динамічний діапазон становив 60дБ. Після компресії гучні звуки всього лише на 15дБ вище, а тихі - на 15дБ нижче рівня діалогів (динамічний діапазон тепер становить 30дБ). Таким чином, гучні звуки стали значно тихіше, а тихі - значно голосніше. При цьому переповнення не відбувається!

Тепер звернемося до гістограми:

Стиснення динамічного діапазону - студопедія

Малюнок 20. Приклад компресії.

Як добре видно - при посиленні до + 30дБ форма гістограми добре зберігається, що означає, що гучні звуки залишаються добре вираженими (не йдуть в максимум і не обрізаються, як це відбувається при простому посиленні). При цьому виділяються тихі звуки. Гістограма це показує погано, проте різниця дуже помітна на слух. Недолік методу - ті ж самі стрибки гучності. Однак механізм їх виникнення відрізняється від стрибків гучності виникають при обрізанні, а їх характер відрізняється - вони проявляються в основному при дуже сильному посиленні тихих звуків (а не при обрізанні гучних, як при звичайному посиленні). Надмірний рівень компресії призводить до сплощення звукової картини - все звуки прагнуть до однакової гучності і невиразності.

Сильне посилення тихих звуків може привести до того, що стануть чутні шуми записи. Тому в фільтрі застосований, трохи модифікований алгоритм, щоб рівень шумів піднімався менше:

Стиснення динамічного діапазону - студопедія

Малюнок 21. Збільшення гучності, без збільшення шуму.

Тобто на рівні гучності -50дБ відбувається перегин передавальної функції, і шуми будуть посилюватися менше (жовта лінія). При відсутності такого перегину шуми будуть значно голосніше (сіра лінія). Така проста модифікація значно знижує рівень шумів навіть при дуже сильних рівнях стиснення (на малюнку - стиснення 1: 5). Рівень "DRC" в фільтрі задає рівень посилення для тихих звуків (на рівні -50dB), таким чином рівень компресії 1/5, показаний на малюнку, відповідає рівню + 40дБ в настройках фільтра.

Схожі статті