Основы психоакустики

Взято с сайта http://fdstar.com/

           Проблемами возникновения, передачи и восприятия звуков занимаются различные направления современной акустики, одним из которых является музыкальная акустика, которая изучает создание музыкальных звуков (акустика музыкальных инструментов, акустика речи и пения, электроакустика); передачу звуков (архитектурная акустика, звукозапись, усиление и вещание и др.) и восприятие звука (психоакустика - акустика слуха).

В конце 20 века именно психоакустика вышла на первый план. Научно-техническая революция открыла принципиально новые возможности работы со звуком, в том числе с помощью компьютерных музыкальных технологий. Она послужила базой для мощного развития аудиоиндустрии, создав новые средства передачи пространственной звуковой информации: цифровое радиовещание, телевидение, звукозапись и т.д. В настоящее время достигнут принципиальный прогресс в том, как надо делать аппаратуру записи, передачи и воспроизведения звука. Однако конечным судьей этого процесса остается слуховая система, а принципы распознавания ею слухового образа еще до конца не изучены. Именно поэтому на эту науку сейчас обращены основное внимание и средства.

Основные задачи психоакустики - понять, как слуховая система расшифровывает звуковой образ, установить основные соответствия между физическими стимулами и слуховыми ощущениями, и выявить, какие именно параметры звукового сигнала являются наиболее значимыми для передачи семантической (смысловой) и эстетической (эмоциональной) информации.

Это принципиально важно как для дальнейшего развития аудиотехники, так и для музыкального искусства в целом (исполнительского творчества, совершенствования музыкальных инструментов, развития компьютерного музыкального синтеза и т.д.) и особенно для звукорежиссеров, поскольку понимание процессов формирования субъективного "слухового пространства" является необходимой базой их творчества.

1. Механизм работы слуховой системы

Звуковой сигнал любой природы может быть описан определенным набором физических характеристик: частота, интенсивность, длительность, временная структура, спектр и др. (Рис. 1). Им соответствуют определенные субъективные ощущения, возникающие при восприятии звуков слуховой системой: громкость, высота, тембр, биения, консонансы-диссонансы, маскировка, локализация-стереоэффект и т.п.

Слуховые ощущения связаны с физическими характеристиками неоднозначно и нелинейно, например, громкость зависит от интенсивности звука, от его частоты, от спектра и т.п.

Еще в прошлом веке был установлен закон Фехнера, подтвердивший, что эта связь нелинейна: "Ощущения пропорциональны отношению логарифмов стимула". Например, ощущения изменения громкости в первую очередь связаны с изменением логарифма интенсивности, высоты - с изменением логарифма частоты и т.д.

Всю звуковую информацию, которую человек получает из внешнего мира (она составляет примерно 25% от общей), он распознает с помощью слуховой системы и работы высших отделов мозга, переводит в мир своих ощущений, и принимает решения, как надо на нее реагировать.

Прежде чем приступить к изучению проблемы, как слуховая система воспринимает высоту тона, коротко остановимся на механизме работы слуховой системы. В этом направлении сейчас получено много новых и очень интересных результатов.

Слуховая система является своеобразным приемником информации и состоит из периферической части и высших отделов слуховой системы. Наиболее изучены процессы преобразования звуковых сигналов в периферической части слухового анализатора.

Периферическая часть

- это акустическая антенна, принимающая, локализующая, фокусирующая и усиливающая звуковой сигнал;
- микрофон;
- частотный и временной анализатор;
- аналого-цифровой преобразователь, преобразующий аналоговый сигнал в двоичные нервные импульсы - электрические разряды.

Общий вид периферической слуховой системы показан на рисунке 2. Обычно периферическую слуховую систему делят на три части: внешнее, среднее, и внутреннее ухо.

Внешнее ухо состоит из ушной раковины и слухового канала, заканчивающегося тонкой мембраной, называемой барабанной перепонкой. Внешние уши и голова - это компоненты внешней акустической антенны, которая соединяет (согласовывает) барабанную перепонку с внешним звуковым полем. Основные функции внешних ушей - бинауральное (пространственное) восприятие, локализация звукового источника и усиление звуковой энергии, особенно в области средних и высоких частот. Слуховой канал представляет собой изогнутую цилиндрическую трубку длиной 22,5 мм, которая имеет первую резонансную частоту порядка 2,6 кГц, поэтому в этой области частот он существенно усиливает звуковой сигнал, и именно здесь находится область максимальной чувствительности слуха. Барабанная перепонка - тонкая пленка толщиной 74 мкм, имеет вид конуса, обращенного острием в сторону среднего уха. На низких частотах она движется как поршень, на более высоких - на ней образуется сложная система узловых линий, что также имеет значение для усиления звука.

Среднее ухо - заполненная воздухом полость, соединенная с носоглоткой евстахиевой трубой для выравнивания атмосферного давления. При изменении атмосферного давления воздух может входить или выходить из среднего уха, поэтому барабанная перепонка не реагирует на медленные изменения статического давления - спуск-подъем и т.п. В среднем ухе находятся три маленькие слуховые косточки: молоточек, наковальня и стремечко. Молоточек прикреплен к барабанной перепонке одним концом, вторым он соприкасается с наковальней, которая при помощи маленькой связки соединена со стремечком. Основание стремечка соединено с овальным окном во внутреннее ухо.

Среднее ухо выполняет следующие функции: согласование импеданса воздушной среды с жидкой средой улитки внутреннего уха; защита от громких звуков (акустический рефлекс); усиление (рычаговый механизм), за счет которого звуковое давление передаваемое во внутреннее ухо, усиливается почти на 38 дБ по сравнению с тем, которое попадает на барабанную перепонку.

Внутреннее ухо находится в лабиринте каналов в височной кости, и включает в себя орган равновесия (вестибулярный аппарат) и улитку.

Улитка (cochlea) играет основную роль в слуховом восприятии. Она представляет собой трубку переменного сечения, свернутую три раза подобно хвосту змеи. В развернутом состоянии она имеет длину 3,5 см. Внутри улитка имеет чрезвычайно сложную структуру. По всей длине она разделена двумя мембранами на три полости: лестница преддверия, срединная полость и барабанная лестница (Рис. 3). Сверху срединная полость закрыта мембраной Рейсснера, снизу - базилярной мембраной. Все полости заполнены жидкостью. Верхняя и нижняя полости соединены через отверстие у вершины улитки (геликотрему). В верхней полости находится овальное окно, через которое стремечко передает колебания во внутреннее ухо, в нижней полости находится круглое окно, выходящее обратно в среднее ухо. Базилярная мембрана состоит из нескольких тысяч поперечных волокон: длина 32 мм, ширина у стремечка - 0,05 мм (этот конец узкий, легкий и жесткий), у геликотремы - ширина 0,5 мм (этот конец толще и мягче). На внутренней стороне базилярной мембраны находится орган Корти, а в нем - специализированные слуховые рецепторы - волосковые клетки. В поперечном направлении орган Корти состоит из одного ряда внутренних волосковых клеток и трех рядов наружных волосковых клеток. Между ними образуется тоннель. Волокна слухового нерва пересекают тоннель и контактируют с волосковыми клетками.

Слуховой нерв представляет собой перекрученный ствол, сердцевина которого состоит из волокон, отходящих от верхушки улитки, а наружные слои - от нижних ее участков. Войдя в ствол мозга, нейроны взаимодействуют с клетками различных уровней, поднимаясь к коре и перекрещиваясь по пути так, что слуховая информация от левого уха поступает в основном в правое полушарие, где происходит главным образом обработка эмоциональной информации, а от правого уха в левое полушарие, где в основном обрабатывается смысловая информация. В коре основные зоны слуха находятся в височной области, между обоими полушариями имеется постоянное взаимодействие.

Общий механизм передачи звука упрощенно может быть представлен следующим образом: звуковые волны проходят звуковой канал и возбуждают колебания барабанной перепонки. Эти колебания через систему косточек среднего уха передаются овальному окну, которое толкает жидкость в верхнем отделе улитки (лестнице преддверия), в ней возникает импульс давления, который заставляет жидкость переливаться из верхней половины в нижнюю через барабанную лестницу и геликотрему и оказывает давление на перепонку круглого окна, вызывая при этом его смещение в сторону, противоположную движению стремечка. Движение жидкости вызывает колебания базилярной мембраны (бегущая волна) (Рис. 4). Преобразование механических колебаний мембраны в дискретные электрические импульсы нервных волокон происходят в органе Корти. Когда базилярная мембрана вибрирует, реснички на волосковых клетках изгибаются, и это генерирует электрический потенциал, что вызывает поток электрических нервных импульсов, несущих всю необходимую информацию о поступившем звуковом сигнале в мозг для дальнейшей переработки и реагирования.

Высшие отделы слуховой системы (включая слуховые зоны коры), можно рассматривать как логический процессор, который выделяет (декодирует) полезные звуковые сигналы на фоне шумов, группирует их по определенным признакам, сравнивает с имеющимися в памяти образами, определяет их информационную ценность и принимает решение об ответных действиях.

 

2. Определение высоты звука

Nx fo(-1)(Гц)

 2Гц

3Гц

4Гц

5Гц

6Гц

7Гц

8Гц

9Гц

10Гц

100

50

33,33

25

20

16,67

14,29

12,50

11,11

10

200

100

66,67

50

40

33,33

28,57

25

22,22

20

300

150

100

75

60

50

42,86

37,30

33,33

30

400

200

133,3

100

80

66,67

57,14

50

44,44

40

500

250

166,7

125

100

83,33

71,43

62,50

55,56

50

600

300

200

150

120

100

85,71

75

66,67

60

700

350

233,3

175

140

116,7

100

87,50

77,78

70

800

400

266,7

200

160

133,3

114,3

100      

88,89   

80

900

450

300

225

180

150

128,6

112,5

100

90

1000

500

333,3

250

200

166,7

142,9

125

111,1

100

Важнейшим свойством слуховой системы является возможность определения высоты звука. Это свойство имеет огромное значение для выделения и классификации звуков в окружающем звуковом пространстве, эта же способность слуховой системы лежит в основе восприятия интонационного аспекта музыки, то есть мелодии и гармонии.

В соответствии с международным стандартом ANSI- 1994 "Высота (Pitch) - это атрибут слухового ощущения в терминах, в которых звуки можно расположить по шкале от низких к высоким. Высота зависит главным образом от частоты звукового стимула, но она также зависит от звукового давления и от формы волны".

Таким образом, высота - это линейная классификация звуковых сигналов, в отличие от громкости, о которой можно сказать больше-меньше, т.е. это - относительная классификация.

Прежде всего, необходимо отметить, что слуховая система способна различать высоту звука только у периодических сигналов. Если это простое гармоническое колебание, например, синусоидальный сигнал от генератора, то период колебаний T определяет частоту f = 1/T, поэтому определяющим параметром для различения высоты является частота сигнала.

Если это сложный звук, то высоту слуховая система может присвоить по его основному тону, но только если он имеет периодическую структуру, т.е. спектр его состоит из гармоник (обертонов, частоты которых находятся в целочисленных отношениях). Если это условие не выполняется, то высоту тона определить слуховая система не может. Например, звуки таких инструментов как тарелки, гонги и др. не имеют определенной высоты.

Высота простых тонов

Изучение связи частоты звука и воспринимаемой высоты предпринималось еще Пифагором, а также многими известными физиками: Галилеем, Гельмгольцем, Омом и др. В настоящее время на основе тщательных экспериментов, в процессе которых слушателю предъявлялись два звука разной частоты с просьбой расположить их по высоте, установлена зависимость высоты тона от частоты сигнала, показанная на рисунке 5. Значения высоты отложено в специальных единицах - мелах. Один мел равен ощущаемой высоте звука частотой 1000 Гц при уровне 40 дБ (иногда для оценки высоты тона используется другая единица, барк = 100 мел). Как видно из рисунка, эта связь нелинейна - при увеличении частоты, например, в три раза (от 1000 до 3000 Гц), высота повышается только в два раза (от 1000 до 2000 мел). Нелинейность связи особенно выражена на низких и высоких частотах, в определенных пределах изменение высоты тона в мелах пропорционально логарифму частоты.

Многочисленные исследования были посвящены порогам различимости по высоте двух разных тонов, отличающихся по частоте. Результаты современных исследований представлены на рис.6, на котором видно, как слуховая система может различить по высоте два звука, отличающихся по частоте всего на 0,2%. Такая тонкая разрешающая способность слуха позволила установить, что ниже частоты 500 Гц можно выделить примерно 140 градаций высоты тона, в диапазоне от 500 Гц до 16 кГц - примерно 480 градаций высоты тона (всего 620 градаций). В европейской музыке инструменты с равномерно темперированной шкалой используют порядка 100 градаций высоты тонов. Но возможности слуховой системы гораздо больше - 620 градаций высоты, и это основа для развития современной микротоновой и спектральной музыки, то особенно продвинулось в связи с появлением компьютерных технологий.

Ощущение высоты чистого тона (одной частоты) связано не только с частотой, но и с интенсивностью звука и его длительностью. Как показали различные исследования, при повышении интенсивности звука громкие низкие звуки кажутся еще ниже, а высокие звуки с повышением громкости кажутся слегка выше (зависимость показана на рисунке 7), для средних частот 1-2 кГц влияние интенсивности незаметно. Следует отметить, что эта зависимость незначительна, а для сложных музыкальных звуков почти незаметна. Это великое счастье для музыки, т.к. иначе при переходе от pp к ff звуковысотные отношения (мелодия и гармония) были бы нарушены.

Ощущение высоты тона зависит и от его длительности: короткие звуки воспринимаются как сухой щелчок, но при удлинении звука щелчок начинает давать ощущение высоты тона. Время, требуемое для перехода от щелчка к тону, зависит от частоты: для низких частот требуется для распознания высоты тона примерно 60 мс, для частот от 1 до 2 кГц - 15 мс. Для сложных звуков это время увеличивается, для звуков речи оно может составлять 20-30 мс.

Высота сложных звуков

В музыке простые синусоидальные тоны практически не используются, каждый музыкальный тон имеет сложную структуру и состоит из основного тона и гармоник (пример ноты до на скрипке показан на рисунке 1).

Однако можно установить соответствие по высоте музыкального тона, например ноты ля первой октавы и чистого синусоидального сигнала с частотой 440 Гц. Высоты этих двух звуков будут одинаковыми, но тембры - разными. Это свидетельствует о том, что для сложных периодических сигналов высота присваивается по частоте основного тона - именно он имеет частоту 440 Гц.

В музыке используются другие шкалы для оценки высоты тона - музыкальные: полутоны, тоны, октавы и другие музыкальные интервалы. Следует отметить, что связь с психофизической шкалой высоты тона, построенной для чистых тонов, неоднозначна. До частоты примерно 5000 Гц увеличение высоты тона на октаву связано с удвоением частоты. Например, переход от ноты ля первой октавы к ноте ля второй октавы соответствует увеличению частоты от 440 до 880 Гц. Но выше частоты 5000 Гц это соответствие нарушается - чтобы получить ощущение увеличения высоты на октаву, надо увеличить соотношение частот почти в 10 раз, что следует иметь в виду при создании компьютерных композиций. Это дало основание некоторым ученым предложить две размерности высоты тона: психофизическую в мелах, пропорциональную в некоторых пределах логарифму частоты, установленную для чистых тонов (pitch height) и музыкальную, соответствующую названию нот (pitch chroma), которая может быть определена примерно до 5000 Гц. Следует отметить, что даже музыканты с абсолютным музыкальным слухом затрудняются в определении нот для звуков с частотой выше 5000 Гц. Это говорит о том, что механизмы восприятия высоты тона до 5000 Гц и выше - различны.

Для объяснения механизма восприятия высоты как простых, так и сложных звуков используются две теории: "теория места" и "временная теория".

3. Теория места

Теория места при восприятии высоты основана на способности базилярной мембраны выполнять частотный анализ сложного звука, т.е. действовать как спектральный анализатор. Базилярная мембрана организована тонотопически, т.е. каждый тон имеет свою топографию размещения. Как уже было указано выше, звуковой сигнал вызывает появление на мембране бегущей волны (Рис. 4), но специфика возбуждения состоит в том, что максимум смещения этой бегущей волны располагается в разных местах базилярной мембраны - низкие частоты имеют максимум смещения вблизи вершины мембраны, высокие - вблизи овального окна. Каждая частота имеет свое место максимума возбуждения на мембране (Рис. 8). В зависимости от спектрального состава на базилярной мембране возбуждаются различные участки. Возбуждаются волосковые клетки, находящиеся на этом месте, и их электрическая активность сообщает мозгу, какие частоты присутствуют в спектре. Таким образом, частота тона представлена в коде, основанном на том, нейроны каких участков активны, а каких - молчат. Физиологические исследования показывают, что тонотопическая организация нейронов сохраняется во всех отделах мозга, вплоть до отделов слуховой коры. Логично допустить, что распознавание частоты и распознавание высоты есть результат тонотопического кодирования - в этом и заключается теория места.

При действии синусоидального сигнала в слуховом нерве формируется "образец возбуждения" - скорость разрядов нейронов как функция места на базилярной мембране. При этом пик этого образца движется вдоль мембраны при изменении частоты. Интересно отметить, что для того, чтобы слух различил два тона по высоте, необходимо, чтобы на базилярной мембране максимум смещения, соответствующий данным частотам, сместился всего на 52 мкм (если выразить в мелах, то одна градация высоты равна 3,9 мела).

Таким образом, можно считать, что периферическая слуховая система содержит банк полосовых фильтров ("слуховых фильтров") с перекрывающимися полосами (Рис. 8). Их ширина свыше 1кГц составляет примерно 10-17% от центральной частоты (например, на частоте 1000 Гц ширина полосы составляет 160 Гц). С шириной слуховых фильтров связано известное понятие "критической полосы" - внутри этой полосы звуковая информация интегрируется слухом; при выходе за пределы этой полосы происходит скачкообразное изменение слуховых ощущений, и это подтверждается экспериментами по маскировке, громкости, фазовой чувствительности и др.

При восприятии музыкального звука в соответствии с теорией места для слуховой системы существуют три возможности определения высоты:

Метод 1: локализовать место фундаментальной частоты и по нему определить высоту тона;

Метод 2: найти минимальную частотную разницу между соседними гармониками, которая равна фундаментальной частоте: [(n+1)f0)-(nf0)]=(nf0)+(1f0)-(nf0)=f0, где n =1,2,3… и принять ее за основу при распознавании высоты;

Метод 3: найти общий наибольший сомножитель, который получается при делении всех гармоник на последовательные целые числа, и использовать его как базу для определения частоты. Первой была предложена теория, по которой ощущаемая высота соответствует частоте только в том случае, если в звуковой волне присутствует энергия на этой частоте (второй закон Ома). Отсюда следовало, что присутствие фундаментальной частоты является обязательным для определения высоты звука. Первые сомнения в этой теории появились, когда стало возможным электрическим путем синтезировать спектры сложных звуков. В 1940 Шутен продемонстрировал, что ощущение высоты тона (сложной периодической волны) не изменится, если вырезать в музыкальном тоне фундаментальную частоту (Рис. 9).

Из этого следовало:

- присутствие фундаментальной частоты не обязательно для восприятия высоты;
- низшая частота не всегда является основой определения высоты.

Этот эксперимент получил название "феномен пропущенной фундаментальной" и доказал, что метод 1 не может служить единственной базой для определения высоты сложного тона, хотя он работает для большинства музыкальных, в том числе вокальных звуков.

Метод 2 дает возможность определить высоту тона по определению позиции соседних гармоник, даже если фундаментальная частота отсутствует. Для большинства музыкальных звуков соседние гармоники обычно присутствуют. Слуховая система, оценивая положение их максимумов на базилярной мембране, вычисляет частотную разницу между ними и по ней определяет высоту. Однако с помощью современных технических средств можно создать ситуацию, которую объяснить с помощью этого метода невозможно. Например, подаем звук, в котором присутствуют только нечетные гармоники 1f0, 3f0, 5f0, 7f0, например, 100, 300, 500, 700 Гц и др. Если фундаментальная частота есть в спектре, то слух определяет высоту по ней f0 = 100 Гц. Если ее вырезать, то расстояние между гармониками останется 2 f0, но слух продолжает определять высоту тона, равную фундаментальной f0=100 Гц.

Метод 3 позволяет объяснить и пропущенную фундаментальную и наличие только нечетных гармоник, т.к. от отсутствия каких-то гармоник общий наибольший сомножитель 100 Гц не меняется (см. таблицу). Этот метод позволяет также объяснить восприятие слабого ощущения высоты тона у колоколов и других источников квазипериодических тонов.

Механизм места разворачивает данную гармонику, если критическая полоса ее слухового фильтра, построенного на ней как на срединной частоте, достаточна узкая и соседние гармоники внутрь этого фильтра не попадают. Если гармоники находятся настолько близко по частоте друг от друга, что внутрь одного слухового фильтра попадает несколько гармоник, то они не разворачиваются. Какой бы ни была фундаментальная частота, слуховой механизм разворачивает только первые 6-7 гармоник - именно они и являются определяющими при определении высоты звука. Теория места создает базис для понимания того, как можно определить высоту путем анализа гармонического ряда, но эта теория не может объяснить ряд проблем, например, очень высокая точность определения высоты звука для тонов, чьи частотные компоненты не разворачиваются (т.е. звуки с гармониками выше седьмой).

4. Временная теория

Временная теория восприятия высоты базируется на анализе временной структуры звуковой волны (теория места на ее спектральном анализе). Эта теория использует синхронизацию разрядов нейронов органа Корти с фазой колебания базилярной мембраны (эффект запирания фазы). При смещениях определенной точки мембраны в сторону расположения волосковых клеток в них возникает электрический потенциал, при смещении в противоположную сторону - потенциал отсутствует. Благодаря фазовому запиранию время между импульсами в любом отдельном волокне будет равно целому числу 1, 2, 3... умноженному на период в основной звуковой волне. Нервные волокна кооперируются, чтобы кодировать частоты выше 300 Гц.

Основа временной теории - анализ формы волны в различных частях базилярной мембраны. Если рассматривать механизм частотного анализа на базилярной мембране как работу линейки фильтров различной ширины, то форма волны звукового сигнала, выходящего из этого набора фильтров, должна иметь вид, показанный на рисунке 10а. Например, если анализируется музыкальный тон с основной частотой 200 Гц, то выход из фильтра с центральной частотой 200 Гц имеет форму синусоидальной волны, т.к. эта гармоника разворачивается анализирующим фильтром. Аналогично разворачиваются этими фильтрами и все гармоники до пятой (около 1300 Гц). На выходе они имеют синусоидальную волну. Шестая гармоника (около 1560 Гц) имеет уже вариации амплитуды, но индивидуальные циклы еще видны. Волновая форма выходного сигнала для фильтра, центральная частота которого (в данном примере) выше шестой, не синусоидальная, т.к. гармоники не разворачиваются индивидуально, демонстрируя, что частотный диапазон полосового фильтра шире, чем расстояния между ними. По меньшей мере две гармоники комбинируются на выходе этого фильтра. Известно, что если две частоты находятся достаточно близко друг от друга, между ними возникают биения, т.е. одно колебание со средней частотой, равной разности частот. В данном случае, когда взаимодействуют две гармоники, этот период определяется фундаментальной частотой T=1/f0. Таким образом, период всех волн, выходящих после фильтров с центральной частотой выше шестой гармоники и состоящих из соседних гармоник, будет одинаковым и равным 1/f0.

Минимальное время между импульсами от различных мест на базилярной мембране определяется периодом волны, выходящей от соответствующего фильтра. Для мест, которые соответствуют частотам от основной до шестой гармоники, минимальное время равно периоду данной гармоники. Для мест, соответствующих более высоким гармоникам, промежутки между импульсами равны периоду огибающей, т.е. основному тону (Рис. 10б). Таким образом, выше шестой гармоники разряды нейронов синхронизированы с формой огибающей, и период разрядов совпадает с периодом для фундаментальной частоты. Иными словами, для всех гармоник периоды разрядов или равны, или отличаются в целое число раз от частоты основного тона.

Это основа временной теории восприятия высоты тона: мозг определяет периодичность разрядов и по ним восстанавливает частоту основного тона.

Восприятие музыкальной высоты связано с оценкой временной формы звукового сигнала (за счет использования эффекта "фазового запирания").

Временная теория позволяет понять, как найти фундаментальную частоту на основе анализа временных интервалов между нервными импульсами от различных мест на базилярной мембране и по ней определить высоту тона. Однако, временная теория не объясняет восприятия высоты тона на частотах выше 5000 Гц, т.к. эффект фазового запирания не срабатывает на этих частотах. Вероятно, в этой области частот меняется механизм восприятия высоты тона.

Необходимо отметить, что на частотах выше 5 кГц в слуховой диапазон (до 20 кГц) попадают только две-три слышимых гармоники, этого слишком мало для слуха, поэтому, как уже было показано выше, восприятие высоты тона существенно обедняется и практически заканчивается восприятие музыкальной высоты (chroma pitch) тона (интонации). Вероятно, по этой причине, которая была интуитивно известна музыкантам, на большинстве музыкальных инструментов (рояль и др.) клавиатура заканчивается в области 5 кГц. На органе есть трубы, которые дают тон 8 кГц, но они употребляются только вместе с другими.

5. Современная теория восприятия высоты тона

Согласно современным теориям мозг принимает информацию от периферийной слуховой системы как за счет индикации места (частотный анализ), так и за счет информации о форме звуковой волны (временной анализ). Самостоятельно каждая теория, по-видимому, не может объяснить восприятие высоты полностью, т.к. та и другая информация передается по одним и тем же нервным волокнам.

Современная модель для восприятия высоты тона, объединяющая оба метода, показана на рисунке 11: сначала идет фильтрация сигнала по частоте с помощью развертки по месту, затем - анализ по межимпульсным интервалам (до шестой-седьмой гармоники они соответствуют периоду каждой гармоники), выше - по периоду огибающей. Поскольку период огибающей равен периоду основной частоты, то здесь различие высоты тона определяется только по месту возбуждения. Так определяется общий период, и по нему данному звуку присваивается определенная высота. Таким образом, обе теории дополняют друг друга.

Анализ восприятия высоты музыкального тона с помощью предложенной модели позволил получить ряд интересных результатов:

а) для музыкальных тонов с основной частотой от 100 до 400 Гц (с уровнем звукового давления не менее 50 дБ) основную роль в определении высоты тона играют первые пять-шесть гармоник (если их уровень превышает 10 дБ), т.е. те гармоники, которые разворачиваются слуховыми фильтрами;

б) звуковые сигналы, содержащие только очень высокие гармоники (свыше двадцатой), не вызывают ощущения высоты тона;

в) музыкальные сигналы, содержащие очень низкие частоты (с основной частотой ниже 50 Гц, например, звуки органа) вызывают ощущение высоты тона только по гармоникам, т.к. такие низкие частоты не вызывают смещений базилярной мембраны - они на ней не размещаются, им не хватает места. При этом наиболее существенную роль играют пятые-шестые гармоники;

г) основная частота звука, если она выше 1000 Гц, является доминантной компонентой в определении высоты тона;

д) музыкальные звуки, содержащие только неразвернутые гармоники (свыше шестой) могут дать ощущение высоты тона по огибающей, при этом слух дает достаточно тонкую дифференциацию сдвига максимума огибающей, т.е. точно чувствует высоту.

е) фазовые соотношения различных гармоник в музыкальном сигнале оказывают влияние на восприятие высоты, т.к. их изменение приводит к изменению структуры огибающей для высших неразвернутых гармоник. Для музыкальных сигналов, содержащих много низких и высоких гармоник, изменение фазовых соотношений может привести к улучшению четкости восприятия высоты, не вызывая ее сдвига (т.к. они не влияют на оценку низших развернутых гармоник). Для сигналов, содержащих в основном высокие гармоники, изменение их фазы может вызвать сдвиг высоты тона и изменение его четкости, т.к. может привести к сдвигу пиков в огибающей, по которым и определяется высота тона.

Таким образом, фазовые соотношения в музыкальном сигнале оказывают существенное влияние на звуковысотные отношения, что особенно важно учитывать в звукорежиссерской практике.

6. Высота тона и центральный процессор

Восприятие высоты тона для сложных музыкальных сигналов, как указано выше, начинается с анализа в периферической слуховой системе, где производится их частотный и временной анализ, а затем полученная информация передается в высшие отделы мозга - "центральный слуховой процессор", где полученная информация определенным образом группируется и осмысливается.

Мозг группирует несколько тонов (гармоник) с одинаковым частотным интервалом в одно ощущение высоты тона. Это принципиальное свойство слухового процессора (высших отделов коры головного мозга): из сложного внешнего звукового мира он выделяет звуки и группирует их по определенным признакам: по месту, по времени начала и конца, по периодичности повторений и т.п. Это связано с тем, что кратковременная память оперирует только шестью-семью символами и без группировки мозг не может принимать быстрых решений.

Современная психология утверждает, что мозг мыслит образами. По-видимому, музыкальные звуки также запоминаются в виде некоторых гармонических эталонов (шаблонов - template), которые формируются в детстве, аналогично звукам речи.

В настоящее время принята гипотеза, что центральный процессор, получив информацию от периферической слуховой системы о наличии компонент с кратными периодами в музыкальном звуке, группирует их и сравнивает с гармоническим шаблоном, в котором имеются все последовательные гармоники. Для каждого входного сигнала подбирается по фундаментальной частоте гармонический шаблон, который ему лучше подходит. В соответствии с этой моделью наиболее соответствующая фундаментальная частота подобранного шаблона и будет воспринимаемой высотой тона. Если два шаблона с разными фундаментальными частотами подходят к данному сигналу, можно ожидать услышать или неопределенную высоту или две высоты. В случае отсутствия фундаментальной частоты, сравнение производится по отдельным гармоникам. Если удается подобрать хотя бы несколько гармоник, которые подходят под эталон, то по повторяющемуся интервалу между ними присваивается высота тона (виртуальная высота тона слышится, например, в звуке колоколов). Наиболее важными для синтеза ощущения высоты тона являются первые три - шесть развернутых гармоник. Компоненты сигнала, которые ведут себя аномально (например, одна гармоника включается-выключается или резко отличается от шаблона), выделяются центральным процессором и им присваивается отдельная высота.

Имеется много доказательств в поддержку данной гипотезы: например, при подаче разных гармоник в разные уши через телефоны (600 Гц в одно ухо и 800 Гц в другое), отчетливо слышен разностный тон высотой, соответствующей частоте 200 Гц, т.е. центральная система синтезирует высоту из гармоник в разных ушах. Другое доказательство, когда гармоники предъявляются неодновременно: при последовательном включении третьей, четвертой и пятой гармоники по 40 мс с интервалом10 мс, отчетливо слышался низкий тон с фундаментальной частотой и т.п.

Таким образом, в соответствии с этой моделью, гармоники собираются вместе, сравниваются центральным процессором с гармоническим эталоном (шаблоном) и по нему синтезируется высота музыкального тона.

Говоря о высоте комплексного тона, можно сказать, что "высота - великий консолидатор". Начиная с большого количества гармоник, процессор высоты объединяет их вместе в одно ощущение высоты. Слуховая организация определения высоты - основная часть осмысления звуков окружающего мира.

Важность определения высоты для слуховой системы не случайна и, вероятно, вовсе не результат стремления всего человечества сочинять музыку. Восприятие высоты играет центральную роль в определении индивидуальных объектов в акустическом мире и отделении их друг от друга. Окружающий мир наполнен конкурирующими звуками: интересными, угрожающими, шумовыми и др., все смешано вместе и слуховая система несет ответственность за их выделение и идентификацию. Высота есть главный идентификатор, позволяющий отделять данный звук от других объектов.

Нелинейные свойства слуха

Еще в 1714 году знаменитый скрипач Тартини заметил и описал странное явление: когда на скрипке громко проигрываются две ноты, иногда можно отчетливо слышать третий тон, которого не было у исполнителя. Такие же дополнительные тоны можно услышать на звуках флейты при двухголосном звучании. Это явление вызвало большой интерес среди музыкантов и ученых, привело к постановке многочисленных экспериментов и позволило установить, что эти дополнительные "фантомные" тоны возникают непосредственно в слуховой системе и являются следствием ее нелинейности.

Интересно, что недопонимание этих процессов до сих пор приводит к недоразумениям, например, когда люди с тонким музыкальным слухом отчетливо слышат дополнительные тоны при исполнении некоторых аккордов, в то же время их коллеги могут их и не услышать. Особенно это касается людей старшего возраста, так как с возрастом слуховые пороги существенно меняются - чувствительность к высоким частотам уменьшается каждые десять лет примерно на 1000 Гц.

Учитывая огромные возможности для работы со звуком, которые предоставляют звукорежиссеру современные музыкальные технологии, им следует ознакомиться с теми звуковыми явлениями, к которым приводит нелинейность слуха.

По общему определению, система называется нелинейной, если выходной сигнал Y(t) отличается от входного сигнала X(t) наличием дополнительных спектральных составляющих. Обычно это имеет место, если связь между воздействующей силой (давлением) и откликом системы (смещением) является нелинейной. Практически вся электроакустическая аппаратура (громкоговорители, микрофоны, акустические системы и др.) является нелинейной (для оценки ее всегда нормируется коэффициент нелинейных искажений), однако эта нелинейность проявляется при достаточно больших уровнях входного сигнала.

Принципиальным отличием слухового аппарата является то, что он производит нелинейное преобразование входного звукового сигнала, как при большом его уровне, так и при очень малом, только механизмы этого преобразования различны.

Нелинейность слуха проявляется, прежде всего, в появлении "субъективных" или "слуховых" гармоник. При воздействии на барабанную перепонку достаточно громкого синусоидального звука с частотой f0 в процессе его обработки в слуховом аппарате возникают гармоники этого звука с частотами 2f0, 3f0 и т.д. Например, если подать первичный тон с частотой 500 Гц, то можно услышать звуки с частотами1000 Гц, 1500 Гц и т. д. Поскольку при объективных измерениях подводимого сигнала можно точно установить, что в спектре первичного воздействующего тона этих гармоник нет, они и получили название "субъективных" гармоник.

Наличие субъективных гармоник и их количественная оценка может быть выполнена с помощью прослушивания биений. Это явление возникает, если на систему подать два близких по частоте тоне, например 1000 Гц и 1010 Гц; тогда вместо двух тонов будет отчетливо слышен один тон со средней частотой 1005 Гц, модулированный по амплитуде разностной частотой 10 Гц. Если разницу между двумя тонами увеличивать, то при разности частот выше 15 Гц биения исчезают; сначала начинают прослушиваться два тона с большой шероховатостью (как если бы звучали одновременно два ненастроенных музыкальных инструмента), затем отчетливо слышны два чистых тона. К биениям слух очень чувствителен, поэтому использование биений - основной метод настройки музыкальных инструментов.

Если к звуку, под действием которого возникают субъективные гармоники, например, 500 Гц, добавить второй скользящий тон, частоту и уровень которого можно плавно изменять, то при неточном совпадении частоты этого звука с частотой субъективной гармоники (например, 990 Гц и 1000 Гц) можно услышать на фоне громкого основного звука биения с разностной частотой (fраз=10 Гц), возникшие в результате взаимодействия скользящего звука и субъективной гармоники. Аналогичные измерения могут быть сделаны и для гармоник более высоких порядков. Наиболее резкие биения будут прослушиваться при равенстве их амплитуд. Поэтому, отрегулировав амплитуду давления скользящего звука до получения наиболее четких биений и измерив величину этого давления, можно определить величину субъективной гармоники. Эта техника называется "метод наилучших биений" -method of best beats. Полученные результаты позволили установить зависимость величины этих субъективных гармоник от уровня основного тона: например, при уровне тона с частотой 1000 Гц, равном 80 дБ SPL, уровень второй субъективной гармоники оказался равным 63 дБ. Уровень этих гармоник существенно зависит от уровня основного тона - только тогда, когда он становится ниже 40 дБ, эти гармоники становятся малыми, и возникает ощущение чистого тона.

При увеличении уровня интенсивности первичного тона величина субъективных гармоник резко возрастает. Это обстоятельство имеет существенное значение для восприятия слухом низкочастотных колебаний в диапазоне от16 Гц до примерно100 Гц.

Для того чтобы понять особенности слухового восприятия в этой области, вспомним, (см. предыдущую статью), что базилярная мембрана организована тонотопически, т. е. каждый тон имеет свою топографию размещения. В зависимости от спектрального состава на базилярной мембране возбуждаются различные участки, волосковые клетки находящиеся на этом месте возбуждаются и их электрическая активность сообщает мозгу, какие частоты присутствуют в спектре. Таким образом, базилярная мембрана выполняет функции спектрального анализатора с помощью линейки фильтров. Таким образом, звук с частотой 100 Гц воспринимается почти самым крайним участком базилярной мембраны близ ее верхушки, так что на базилярной мембране фактически нет участков, воспринимающих колебания более низких частот. Однако область слышимых звуков простирается значительно ниже (мы хорошо слышим частоты ниже 100 Гц). Предполагается, что звуки с частотой менее 100 Гц ощущаются не сами по себе, а из-за создаваемых ими серий субъективных гармоник, попадающих в область частот свыше 100 Гц, т. е. в конечном счете, из-за нелинейности слуха. Целый ряд фактов косвенно подтверждает эта предположение, однако прямого подтверждения еще не найдено, так что пока это гипотеза.

Второй формой проявления нелинейности слуха является появление "субъективных комбинационных тонов". Как известно, если к нелинейной системе подвести два сигнала достаточно большого уровня с частотами f1 и f2 (например, 800 Гц и1000 Гц), то нелинейные искажения вызовут появление комбинационных тонов с различными частотами, т. е. появляются вторичные комбинационные тоны: f2 - f1 и f2+ f1 (200 Гц и 1800 Гц), кубичные комбинационные тоны 2f1- f2 (600 Гц), 2 f2- f1 (1200 Гц), 2f1+ f2 (2600 Гц), 2f2 +f1 (2800 Гц) и др. Для их количественной оценки также могут быть использованы "метод наилучших биений" или метод "погашений" (подается дополнительный сигнал с частотой комбинационного тона и подбирается его амплитуда и фаза, пока комбинационный тон не погасится, т.е. он подается в противофазе). Многочисленные эксперименты показали, что существуют особые комбинационные тоны, которые чаще всего прослушиваются при субъективных экспертизах: это разностные тоны с частотами f2 - f1 и 2f1- f2 (200 Гц и 600 Гц в нашем примере).

Простой разностный тон ведет себя, как в случае классической квадратичной нелинейности: он может быть услышан, если уровень первичных тонов больше, чем 50 дБ SPL; при равенстве уровней первичных тонов он увеличивается на 2 дБ; при возрастании уровня первичного тона на 1 дБ уровень этого тона не очень сильно зависит от отношения частот f2 / f1.

В случае кубичного разностного тона установлено, что он возникает в основном при соотношении частот 11,3. В этом частотном диапазоне он может быть услышан при очень низком уровне первичных тонов: ниже 40 дБ SPL уровень f2 может быть даже ниже 10 дБ. Увеличение амплитуды этого тона происходит не на 3 дБ при увеличении амплитуды первичного тона на 1 дБ (при равенстве их уровней) - как следовало бы при классической кубичной нелинейности - а существенно меньше. Все это заставляет предположить, что в образовании этих тонов участвуют некие дополнительные механизмы, которые мы рассмотрим далее.

Наконец, третий вид проявления нелинейности работы слухового аппарата - это нелинейная компрессия звукового сигнала. Уровень звукового сигнала в слышимом диапазоне меняется от 0 дБ до 120 дБ, т. е. амплитуда звукового давления меняется в 100 000 раз, в то же время динамический диапазон слухового нерва (от температурного шума до насыщения) составляет 1000. Поэтому, кроме функций спектрального анализатора, периферический слуховой аппарат выполняет функции нелинейного компрессора-усилителя.

Многочисленные исследования, особенно в последние годы, позволили получить ряд очень интересных результатов относительно механизмов возникновения нелинейности.

Как было показано в предыдущей статье, слуховой аппарат состоит из трех отделов - внешнее, среднее и внутреннее ухо. Экспериментально доказано, что преобразование сигнала во внешнем и среднем ухе - процесс линейный, основная причина нелинейности - в механизме работы внутреннего уха (улитки). Улитка состоит из трех полостей, в которых находится жидкость (упрощенный разрез улитки показан на рис. 1). При ударе стремечка по мембране овального окна в жидкости возникает звуковой импульс, который распространяется из верхнего отдела в нижний и возбуждает базилярную мембрану. Исследования работы слуховой системы, выполненные знаменитым ученым Бекеши (Bekesy), за которые он получил Нобелевскую премию, показали, в частности, что при высоких уровнях сигнала в жидкости улитки образуются вихревые потоки. Поскольку ширина полостей разная, то этот процесс похож на образование околодонных завихрений, когда вода ударяется о берег (рис. 2а и рис. 2б). Появление этих завихрений искажает форму звукового импульса, а поскольку базилярная мембрана выполняет его спектральный анализ, то эти искажения и приводят к появлению дополнительных гармоник и комбинационных тонов.

Таким образом, первая причина возникновения нелинейных искажений - это гидродинамические процессы в жидкости улитки.

Чтобы рассмотреть вторую причину нелинейности, необходимо еще раз вернуться к механизму преобразования сигнала на базилярной мембране - механические смещения мембраны передаются органу Корти, это коллекция специальных нервных клеток, называемых волосковыми, расположенных рядами вдоль базилярной мембраны, часть этих клеток называется внутренними (ВВК), их порядка 4000, другая часть - наружными (НВК), их около 12000 (рис. 3). Волосковые клетки - это механо-электрический преобразователь, который конвертирует механические смещения мембраны в электрический потенциал, что вызывает поток электрических импульсов (в двоичном коде) в связанных с ними нервных волокнах, т. е. они работают аналогично аналого-цифровому преобразователю.

В последние годы удалось установить, что ВВК связаны в основном с восходящими нервными волокнами, т. е. они, в основном, сообщают звуковую информацию в высшие отделы мозга - это "слуховые микрофоны", а НВК - с нисходящими нервными волокнами, т. е. они в основном получают приказы от мозга. Именно эти наружные волосяные клетки и играют основную роль в нелинейной компрессии звука. При больших уровнях сигнала они удлиняются (на 10% от основной длины) и, тем самым, как бы придерживают смещения базилярной мембраны, предохраняя внутренние волосковые клетки от слишком большого изгиба, а на малых уровнях сигнала они усиливают смещения, как бы "подкачивая" энергию базилярной мембране. Это было выявлено с помощью очень тонких современных экспериментов, позволивших обнаружить на очень низких уровня сигнала отоакустическую эмиссию - т. е. излучение от внутреннего уха). Эта работа НВК на низких уровнях и вызывает, по-видимому, несколько аномальное поведение кубичных комбинационных тонов.

Измерения, выполненные с помощью анализа гамма-излучения от радиоактивного источника, размещенного на живой мембране, показали, что зависимость смещения базилярной мембраны от уровня сигнала имеет вид нелинейной компрессии. Нужно отметить, что этот механизм работает только в определенном диапазоне сигналов, при очень длительном воздействии громких звуков, а это сейчас происходит очень часто, НВК повреждаются и эта зависимость приобретает чисто линейный характер, что приводит к дальнейшему разрушению ВВК и слухового нерва.

Таким образом, появление слышимых "слуховых" гармоник и комбинационных тонов является признаком нормальной работы слухового аппарата и свидетельствует скорее о хорошем состоянии слуха.

В заключение хотелось бы еще раз отметить, что в механизме слухового восприятия звука заложена нелинейная процедура обработки, обусловленная как гидродинамическими процессами в улитке, так и электромеханическими преобразованиями в волосковых клетках. Нелинейность слуха проявляется как при больших, так и при малых уровнях звукового сигнала и играет существенную роль в слуховом восприятии музыкальных, речевых и шумовых сигналов. Это полезно учитывать в практике работы музыкантов и звукорежиссеров.

Слуховой анализ консонансов и диссонансов

Способность слуховой системы классифицировать звуки по высоте лежит в основе построения звуковысотных отношений в различных музыкальных культурах.

Для простых звуков определение высоты звука зависит в первую очередь от частоты сигнала, но также и от его интенсивности и длительности. Для сложных звуков это определяется способностью слухового аппарата делать спектральный анализ его состава, выделять и анализировать частотные соотношения между его гармониками и выявлять в нем признаки периодичности, так как только периодическим сигналам может быть присвоена высота, отнесенная к основному тону. Эта же способность слуховой системы к спектральному анализу и определению частотных интервалов между гармониками лежит в основе ощущения «консонантности» или «диссонантности» звучания различных музыкальных интервалов и аккордов.

Консонанс (от французского слова consonance) — согласие (согласное звучание), соответственно диссонанс — несогласное, нестройное звучание. Эти понятия можно рассматривать с разных позиций: музыкально-психологических — «консонанс» ощущается как мягкое звучание, представляющееся выражением покоя, опоры, а «диссонанс» как раздражающее, беспокойное, являющееся носителем напряжения и движения. Чередование консонансов и диссонансов создает «гармоническое дыхание» музыки. В разных музыкальных культурах и в разные периоды времени отношение к консонансным и диссонансным интервалам было различным: если во время Пифагора к консонансным интервалам относили только октаву, квинту и кварту, а в 13 веке и терции перешли в разряд консонансных, то в музыке 20 века уже широко используются малые интервалы, которые раньше считались резко диссонансными (малая секунда). Вопросы использования и взаимодействия консонансных и диссонансных интервалов определяются учением о гармонии, которая также меняется в разные эпохи с изменением музыкальных вкусов.

К анализу консонансов и диссонансов можно подойти и с психоакустических позиций, то есть рассмотреть, как влияют на их восприятие частотные соотношения между гармоническими составляющими сложных музыкальных звуков. Эти психоакустические отношения являются общими и зависят только от внутренних свойств слухового аппарата. Сейчас, когда в руках звукорежиссеров и музыкантов имеются огромные возможности выбора различных интервалов и аккордов с помощью компьютерных технологий, кажется полезным рассказать об этом, чтобы при создании различных электронных композиций и обработке звукового материала в процессе звукозаписи учитывались особенности слуховой системы воспринимать определенные интервалы и аккорды как раздражающие (диссонансные) или наоборот.

Каждая нота, сыгранная на любом инструменте — это сложный звук, состоящий из основного тона и большого числа обертонов. Обертоном называется любая собственная частота выше первой, но только те обертоны, частоты которых относятся к частоте основного тона как целые числа, называются гармониками, причем основной тон считается первой гармоникой. Если этот звук дает четкое ощущение высоты тона, то он содержит в своем спектре только гармоники, то есть является периодическим (только периодические сигналы дают ощущение высоты тона).

Рис. 1. Отношения частот и музыкальные интервалы между первыми десятью гармониками натурального ряда тона Сз

Значения частоты каждой гармоники относятся к основному тону и друг другу как: 1f0, 2 f0, 3 f0, 4 f0, 5 f0, 6 f0, 7 f0….

Если взять, например, за основной тон ноту до малой октавы и отложить от нее частоты с отношением 2:1, 3:1, 4:1, 5:1 и т. д., то мы получим обертоновый ряд, показанный на рисунке 1. Отношения частот гармоник друг к другу (они называются интервальными коэффициентами) также подчиняются отношению целых чисел и дают основные интервалы: 2:1-октава, 3:2-квинта, 4:3 -кварта, 5:4-мажорная терция и т. д. Музыкальные интервалы между гармониками уменьшаются по мере увеличения их номера в следующих пропорциях: 2:1 > 3:2 > 4:3 > 5:4 > 6:5…

Каждая музыкальный тон теоретически содержит бесконечно большое число гармоник, соответствующих числу собственных частот колебаний струны, язычка и пр. Однако амплитуды их уменьшаются, и они практически становятся неслышимыми (всего попадает в слышимый диапазон, например, для ноты ля первой октавы 16000 Гц/440 Гц = 36 гармоник; если эту ноту сыграть на октаву выше, то в слышимом диапазоне остается 18 гармоник и т. д.)

Для многих инструментов имеются акустические пределы воспроизведения гармоник в силу механической природы их звучащего тела — у большинства акустических инструментов верхний предел лежит в пределах практического верхнего диапазона человеческого слуха до 16 кГц, хотя современные синтезаторы могут создавать сколь угодно большое число гармоник.

Как уже было показано в предыдущей статье, основное влияние на оценку высоты тона оказывают первые 7-8 «развернутых» гармоник, еще 8-9 гармоник несут дополнительную информацию как для оценки высоты, так и для оценки тембра звучания, то есть наиболее значимыми для слуха являются только первые 15-17 гармоник.

При оценке высоты тона производится спектральный анализ как с помощью оценки места максимального смещения на базилярной мембране, соответствующего данной частоте, так и с помощью оценки временных интервалов нейронных импульсов. Следует отметить, что распределение максимумов соответствует не самой частоте, а ее логарифму, именно поэтому слух одинаково оценивает интервал октава, если его образуют две частоты с отношением частот 200:100 Гц или 2000:1000 Гц: по логарифмической шкале отношение этих двух расстояний одинаково и равно 2:1, по линейной — они отличаются в 10 раз. Поэтому практически при всех измерениях используется обычно логарифмическая шкала частот — это соответствует слуховому восприятию интервалов.

Психоакустическая основа восприятия одних музыкальных интервалов как консонансных, других — как диссонансных, связана с понятием «критической полосы», которое имеет чрезвычайно большое значение как для восприятия мелодии и гармонии музыки, так и для современных систем сжатия звуковой информации в цифровом радиовещании и звукозаписи.

Рис. 2. Зависимость ширины критических полос от частоты

Действие базилярной мембраны при спектральном анализе сложного звука можно считать эквивалентным действию линейки полосовых фильтров, каждый фильтр имеет ассиметричную форму с более крутым спадом в сторону высоких частот. Частотнозависимая ширина полосы пропускания фильтров зависит от разрешающей способности слуховой системы и определяет ширину «критической полосы». Определение «критической полосы» в современной литературе принято следующее: «ширина полосы, внутри которой слуховые ощущения резко изменяются». Действительно, ощущения громкости, маскировки и др. при попадании звуковых сигналов внутрь или вне критической полосы по частоте резко различаются. Зависимость ширины критических полос от частоты показана на рисунке 2 (для сравнения приведены линии, соответствующие ширине интервала в один полутон, два полутона, 4 и 7 полутонов на разных частотах). Из рисунка видно, что ширина критических полос с повышением частоты расширяется.

Следует понимать, что на базилярной мембране действует подвижная линейка фильтров, при переходе от одних тонов к другим их центральные частоты меняются. Всего на базилярной мембране размещается примерно 24 критических полосы с частотнозависимой шириной.

Ощущения диссонансности или консонансности созвучий также связано с наличием критических полос, то есть с конечной разрешающей способностью слуховой системы.

Рис. 3. Пример биений

Как известно из теории колебаний, если в системе происходит сложение двух колебаний с близкими частотами f1 и f2, то возникает режим биений, эти биения воспринимаются на слух как пульсации громкости тона со средней частотой 1/2(f1 + f2) и медленно меняющейся амплитудой с частотой (f1- f2). Пример биений показан на рисунке 3. Когда частоты совпадают, два тона звучат в унисон, если начинать увеличивать частоту одного тона, то, вплоть до разницы 15 Гц, отчетливо прослушивается один тон с меняющейся громкостью — «биения», при дальнейшем увеличении разницы частот начинают прослушиваться оба тона с сильной шероховатостью звучания и, наконец, когда разница частот становится больше критической полосы — шероховатость исчезает.

Это процесс можно легко прослушать, подав на акустическую систему два чистых тона от генератора, частота одного должна быть фиксирована, частота другого меняется. Этим свойством, возникновением отчетливых биений, пользуются для настройки музыкальных инструментов. Частота F, на которой начинают прослушиваться два тона с сильной «шероховатостью», называется частотой «перемешивания». Она соответствует примерно разности частот около полутона, то есть df/f = 0,06 (на 500 Гц) и более чем целый тон df/f = 0,12 (на частотах ниже 200 и выше 4000 Гц).

Рис. 4. Зависимость степени ощущения консонантности (диссонантности) интервалов между двумя чистыми тонами в зависимости от ширины критической полосы

Эксперименты, проделанные с большой группой слушателей, среди которых не было профессиональных музыкантов (поскольку их слух натренирован на заученные образцы консонансных и диссонансных созвучий), позволили установить, при какой разнице по частоте два чистых синусоидальных звука воспринимаются как «приятные» консонансные или как резкие, неприятные «диссонансные». Результаты экспертиз были количественно обработаны и представлены на следующем графике (рисунок 4). Максимальная «приятность» звучания — консонанс — обозначен 1, диссонанс — 0, максимальная неприятность, «резкость» — консонанс — 0, диссонанс -1.

Как видно из графика, если разница частот равна нулю, то есть два тона звучат в унисон, то это совершенный консонанс. Если разница частот больше, чем критическая полоса, то это созвучие тоже звучит как консонанс. Для частот, разница между которыми составляет от 5 до 50% от критической полосы, созвучие воспринимается как диссонанс. Максимальный диссонанс прослушивается, когда разница составляет одну четверть от ширины критической полосы. Следует помнить, что ширина эта меняется с частотой (смотри рисунок 2). Поэтому два тона могут звучать как консонансный интервал в одной октаве, и как значительно менее консонансный (или даже диссонансный) — в другой.

Эти результаты полезно иметь в виду при составлении различных электронных музыкальных композиций и компьютерной обработке звука. Следует с осторожностью использовать сочетания звуков, частотная разница между которыми порядка одной четверти критической полосы — если не ставить специальной задачи создать такую музыку, чтобы слушатель от нее впадал в нервное расстройство.

Полученные результаты могут служить базой для определения степени консонансности различных интервалов и музыкальных аккордов сложных музыкальных тонов, содержащих в спектре большое количество гармоник.

В этом случае биения могут возникать как между фундаментальными частотами различных тонов, так и между их гармониками. Используя полученные выше результаты для простых тонов, можно количественно оценить степень консонансности (диссонансности) отдельных музыкальных интервалов.

В таблице 1 рассмотрены два тона, отношения фундаментальных частот которых равно 3:2, (квинта), нижняя частота 220 Гц.

Таблица 1.

Первые семь гармоник нижнего тона, Гц 220 440 660 880 1100 1320 1540
Гармоника верхнего тона, Гц   330 660   990 1320 1650
Разница между частотами двух соседних гармоник, Гц - 110 0   110 0 110
Средняя частота между гармониками, Гц   385 унисон   1045 унисон 1595
Ширина критической полосы, Гц   65 -   133 - 193,5
Половина ширины критической полосы, Гц   32,5     66,5   96,7
Степень консонантности/диссонантности (C, c, D, d)   с С   d C d

Методика оценки степени консонанса (диссонанса) интервала в табл. 1 и табл. 2 основана на сравнении разницы частот двух соседних гармоник с шириной критической полосы, соответствующей средней частоте между ними:

Таблица 2.

Первые семь гармоник нижнего тона, Гц 55 110 165 220 275 330 385
Гармоника верхнего тона, Гц 69,75   137,5 206,3 275 343,8 412,5
Разница между частотами двух соседних гармоник, Гц 13,8   27,5 13,8 унисон 13,8 27,5
Средняя частота между гармониками, Гц 61,9   151 213 - 337 399
Ширина критической полосы, Гц 34,3   42,8 48,7 - 60,7 66,8
Половина ширины критической полосы, Гц 17,2   21,4 24,4 - 30,4 33,4
Степень консонантности/диссонантности (C, c, D, d) D   d D C D

D

 
-если две гармоники имеют равные частоты, или различие между ними меньше 5% от ширины критической полосы, то они обозначаются как совершенный консонанс — С;
-если разница между двумя гармониками по частоте больше ширины критической полосы (столбец 3 и 5), то это несовершенный консонанс — с;
-если разница между частотами ближайших гармоник меньше ширины критической полосы, то это диссонанс-d;
-если эта разница меньше половины ширины критической полосы, то это совершенный диссонанс — D.

Если частотная разница между большинством гармоник двух тонов больше ширины критической полосы или ее половины, то такое созвучие будет восприниматься как консонанс, поэтому, например, квинта относится к консонансным интервалам (рис. 5).

Приведем для примера результаты расчета для большой терции, отношение частот 5:4, нижний тон 55 Гц.

Как видно из полученных результатов, это интервал следует отнести к диссонансным.

Необходимо отметить, что один и тот же интервал или аккорд будет восприниматься как более или менее консонансный (диссонансный) в зависимости от того, в каком месте частотной шкалы он находится (так как ширина критической полосы частотно-зависима). Как следует из практики и подтверждается вышеприведенной методикой, уменьшающиеся интервалы между высокими гармониками (7:8, 8:9 и др.) звучат более диссонансно, чем интервалы между первыми гармониками(1:2, 2:3, 3:4 и др.). Решающую роль в слуховом ощущении степени консонантности (диссонантности) интервала играют развернутые первые 7-8 гармоник, как и при определении высоты тона.

Таким образом, способность слуховой системы воспринимать определенные сочетания звуков как благозвучные (консонансные) или раздражающие (диссонансные) связана с конечной разрешающей способностью слуховых фильтров и является ее фундаментальным свойством.


Автор: Ирина Алдошина

Подпишитесь на наши новости

Belozer Studio