Что такое фаза.
С понятием фазы в области синтеза звука связано достаточно много различных аспектов обработки сигналов. Под понятием "фаза" в зависимости от контекста могут подразумеваться различные характеристики сигналов. Это является основным недостатком в устоявшейся терминологии. Поэтому для начала стоит разобраться с самим термином "фаза". Чтобы не дублировать материал, далее будут опущены некоторые начальные сведения по данной теме, которые можно найти в статье Фильтры Sytrus. Vanilla all pass.
Итак, основная проблема состоит в том, что фазой называется как начальная фаза сигнала, так и его фазовый спектр.
Начальная фаза - это просто опорная точка отсчета, с которой начинается генерация сигнала. Начальная фаза есть не что иное, как простейшая задержка сигнала во времени в пределах периода его повторения.
Фазовый спектр связан с понятием преобразования Фурье для сигнала. Известно, что любой сигнал может быть представлен в виде некоторой суммы синусоидальных функций (гармоник), которые отличаются друг от друга амплитудой, частотой и начальной фазой.

Сигнал (сверху), образованный суммированием четырех синусоид разной частоты и начальной фазы (снизу).
На рисунке сверху показано как образован сложный сигнал с начальной фазой
путем суммирования четырех синусоид разной частоты с начальными фазами
. Совокупность значений начальных фаз всех синусоидальных компонентов в разложении Фурье называется фазовым спектром сигнала. Фазовый спектр принято отображать графически. При этом по горизонтальной оси отсчитываются частоты гармоник Фурье, а по вертикальной оси - их начальные фазы. В данном случае фазовый спектр выглядит следующим образом:

Теперь необходимо выяснить, какое влияние имеет начальная фаза и фазовый спектр на форму сигнала, а также на восприятие звука слуховым аппаратом человека.
Линейный фазовый сдвиг.
Для начала стоит разобраться с зависимостью фазового спектра сигнала от начальной фазы этого сигнала. Как было уже отмечено, начальная фаза - это элементарная задержка сигнала во времени. Преобразование Фурье имеет полезное свойство - задержка сигнала во времени приводит к такой же одинаковой временной задержке для всех гармоник его спектра. Например, если все тот же тестовый сигнал сдвинуть на время
, то все его гармоники окажутся сдвинутыми на тот же самый интервал времени
:

Линейный сдвиг по фазе.
Однако фазовые сдвиги для всех гармоник будут различны. Сам сигнал получит фазовый сдвиг
около 270 градусов, а его гармоники -
около 270, 360, 720, 2000, соответственно. При этом форма фазового спектра может существенно измениться:

Красным цветом отображены приращения фазы для каждой гармоники.
Величина фазового сдвига для отдельной гармоники определяется простой формулой
, где F - это частота гармоники. В соответствии с этой формулой, фазовый сдвиг для каждой гармоники прямо пропорционален ее частоте, т.е. находится в линейной зависимости от частоты. Таким образом, задержка сигнала во времени приводит к линейному фазовому сдвигу его фазового спектра.
Свойства линейного фазового сдвига очевидны. Задержка сигнала во времени не изменяет ни форму сигнала, ни его амплитудный спектр. Примечательна особенность слухового аппарата человека - он не чувствителен к линейному фазовому сдвигу, т.е. воспринимаемый тембр задержанного сигнала не отличается на слух от оригинала.
Восприятие фазового спектра.
Второе затруднение с понятием фазы связано с тем, что во многих источниках информации говорится об отсутствии влияния фазового спектра звука на его восприятие. По большому счету это утверждение справедливо только для линейного фазового сдвига. С другой стороны нелинейные фазовые искажения часто незначительны с точки зрения слуха, а порой и вообще не слышимы.
Можно посмотреть на данный вопрос с чисто технической стороны, без учета психоакустических особенностей человека. Для этого стоит обратиться к свойствам преобразования Фурье. Теорема Фурье гарантирует, что любому сигналу соответствует только одно единственное и уникальное представление в частотной области. Справедливо и обратное - любому сочетанию амплитудного и фазового спектра соответствует единственно возможный сигнал во временной области. Это означает, что любое изменение амплитуды или фазы какой-либо гармоники спектра обязательно изменяет соответствующий спектру сигнал. Линейный фазовый сдвиг - не исключение из правила, а лишь проявление других свойств преобразования Фурье. Линейный сдвиг фазового спектра также приводит к изменению исходного сигнала - результатом операции является смещение сигнала во времени, но без изменения его формы. Таким образом, техническая теория подтверждает, что искажения фазового спектра влияют на форму сигнала, что соответственно может привести и к изменению тембра. На практике в этом можно убедиться с помощью редактора гармоник в Image-Line Sytrus. Для этого необходимо выбрать тип сигнала осциллятора Saw и преобразовать его в серию гармоник. После этого достаточно изменить фазовый спектр с помощью команды Randomize Phases и проследить за искажениями формы сигнала:

Исходный сигнал.

Сигнал после первого применения Randomize Phases.

Сигнал после второго применения Randomize Phases.
Таким образом, любое нелинейное искажение фазового спектра приводит к изменению формы сигнала. Однако это не всегда сопровождается слышимыми изменениями тембра.
Фазовые искажения на практике.
Практически любое устройство обработки сигналов (фильтры, частотный и кольцевой модуляторы, дисторшны, эффекты) всегда вносят нелинейные фазовые искажения в обрабатываемый звук. Это означает, что кроме полезной обработки над сигналом всегда совершаются неконтролируемые пользователем фазовые операции, приводящие к дополнительному изменению формы сигнала, а возможно и тембра. Например, ФЧХ элементарного фильтра низких частот имеет форму, приведенную ниже:

Информация на графике показывает, что спектр сигнала в области частоты среза получает фазовый сдвиг в пределах 90 градусов, в области верхних частот - 180, и останется почти неизмененным в области низких.
Относительно недавно в области компьютерного синтеза звука появились устройства с линейной ФЧХ (например, Linear Phase EQ). Фазовые искажения, вносимые такими устройствами, сводятся к линейному фазовому сдвигу, т.е. к простой задержке сигнала неискажающей его форму. Этим и обусловлена популярность подобных устройств, поскольку они делают только то, что они должны делать, без непроизвольного влияния на тембр звука.
Технологии манипуляции фазой.
Существует достаточно большое количество технологий синтеза звука, основанных на управлении начальной фазой и фазовым спектром сигналов. Большинство из них было рассмотрено ранее в рамках цикла статей об Absynth - allpass-фильтры, фэйзеры, флэнджеры, comb-фильтры и т.д. До сих пор остаются без внимания фазовая модуляция и, так называемый, Phase Distortion.
Фазовая модуляция по свойствам и принципам аналогична частотной. Более того, практически все современные синтезаторы реализуют частотную модуляцию через фазовую, т.е. технически корректное название для FM синтеза - фазовая модуляция. Разница заключается в том, что модулирующий сигнал управляет не частотой несущего колебания, а его начальной фазой. Существуют формулы, позволяющие выразить частотную модуляцию через фазовую и наоборот. Как вариант, физический процесс фазовой модуляции можно пояснить через понятие линейного фазового сдвига. Поскольку линейный сдвиг по фазе эквивалентен задержке сигнала во времени, то модуляция начальной фазы является, по сути, модуляцией времени задержки сигнала. В свою очередь, как известно, модуляция времени задержки идентична частотной модуляции.
Phase Distortion является искусственной цифровой технологией синтеза, в основе которой лежит принцип генерации сигналов цифровым осциллятором. Осциллятор имеет так называемый счетчик фазы. Этот счетчик увеличивается на единицу после синтеза каждого очередного отсчета сигнала. Таким образом, осциллятор всегда знает, в какой фазе находится генерируемый им сигнал. Идея Phase Distortion состоит в том, чтобы намеренно исказить равномерный подсчет фазы для каждого отсчета. Например, после синтеза новой порции сигнала можно увеличить счетчик фазы не на единицу, а на двойку, или уменьшить на тройку. Нестандартные изменения счетчика фазы служат источником появления новых гармоник. По характеру генерации гармоник Phase Distortion можно отнести к специфической разновидности Waveshaper-синтеза.
Моносовместимость.
Итак, выше рассмотрено непосредственное влияние фазы на сигналы, их спектры и тембры. Не менее важно понимание фазовых особенностей в области обработки стереозвука.
Фазовые соотношения всегда оказывают ощутимое влияние на тембр звука при сложении нескольких сигналов. Это означает, что результат любой операции, подразумевающей суммирование любых сигналов, всегда зависит от фазовых спектров слагаемых. Примеры таких обработок - преобразование стерео в моно, смешивание сигналов в микшере виртуальной студии или внутри VST плагина, наложение эффектов, работа плагина в режиме унисона. В общем случае, различие фазовых спектров двух сигналов приводит к тому, что в спектре суммарного сигнала появляются незапланированные подъемы и провалы. Это может быть и полезным свойством (дизайн уникальных звуков), так и совсем нежелательным (моносовместимость).
Преобразование стереосигнала в моно должно происходить с минимальным изменением тембра. Этому мешают различия фазовых спектров в обоих каналах. В зависимости от разности фаз эффект фазового сложения может проявляться как через окраску тембра (Phaser/Comb - подобный эффект), так и через полное подавление различных частотных полос сигнала. Например, этот пресет для Zebra звучит по-разному в стерео и в моно. Если посмотреть на спектры

Спектр и звук стереосигнала.

Спектр и звук моносигнала (преобразование в моно произведено в Adobe Audition).
то видно, что в моноверсии значительно ослаблена область средних частот. Для того чтобы исправить ситуацию можно прибегнуть к помощи различных фазовых анализаторов.
Фазовые анализаторы.
В данном разделе будет опущены стандартные анализаторы типа L-R, M-S, поскольку в сети или в любой книге по звукорежиссуре есть достаточно информации о них. Внимание будет сосредоточено на более экзотических анализаторах.
Анализатор Spectral Phase Display в Adobe Audition.

Данный анализатор показывает изменение разности фаз между двумя каналами сигнала с течением времени. Что конкретно он показывает?

Сильно увеличенный фрагмент предыдущего графика.
Анализатор сканирует весь спектр на предмет одинаковых частот в левом и правом каналах. Для каждой найденной пары он вычисляет разность фаз. Далее он наносит величину этой разности на график в виде линии. Причем интервал времени, на котором найдены данные две частоты, определяет горизонтальную координату и продолжительность линии, разность фаз - вертикальную координату, а само значение частоты - цвет линии. Например, выделенная красная область на графике говорит о том, что на интервале времени от 2.7 до 2.72 секунды сигнал содержит три частоты, для которых фазовый сдвиг находится между -100 и -130 градусами. Недостаток цветового кодирования значений частоты налицо - нет возможности узнать, какие именно частоты отображены на графике.
С точки зрения моносовместимости важно, чтобы информация на графике было сосредоточена в пределах от -90 до +90 градусов. Например, представленный выше график соответствует моносовместимому сигналу, поскольку большая его часть укладывается в допустимый диапазон. Почему же разность фаз от 0 до 90 градусов не так страшна, как разность от 90 до 180 градусов? Чтобы получить ответ достаточно посмотреть на две синусоиды, смещенные друг относительно друга на 90 градусов:

Если внимательно посмотреть на график, то видно, что в любой момент времени изменения амплитуды синусоид носят противоположный характер. В то время как амплитуда одной функции возрастает, у другой - уменьшается, и наоборот. Это означает, что сумма этих двух синусоид никогда не примет значение, превышающее амплитуду одной из гармоник. Более того, с увеличением фазового сдвига до 180 градусов, уровень суммарного сигнала будет уменьшаться, пока не станет равным нулю. Для фазового сдвига, меньшего 90 градусов, характерно только увеличение амплитуды суммарного сигнала.
Таким образом, если фазовый сдвиг не превышает 90 градусов, то спектр суммы сигналов будет только приподнят в соответствующих частотных областях. Конечно, звук при этом получит некоторую окраску. Однако, в случае фазового сдвига более 90 градусов, в спектре появятся также и провалы. Одновременное наличие и провалов и подъемов спектра - это характерный результат для обработки сигналов фэйзером, флэнджером и comb-фильтром с соответствующим изменением тембра. И, наконец, частоты каналов, сдвинутые на 180 градусов, исчезают из общей суммы вообще. Таким образом, чем ближе фазовый сдвиг между частотами каналов к 180 градусам, тем сильнее ощутимы изменения окраски моносигнала.
Коррелометр (Correlation Meter).
Хотя корреляция и не относится напрямую к фазовым характеристикам сигналов, все же она может служить одним из самых важных источников информации при контроле моносовместимости.
Корреляция - это специальная математическая операция, которая используется для оценки степени сходства форм двух сигналов. Данная функция имеет одно интересное свойство, которое помогает облегчить ее понимание. Степень корреляционного подобия сигналов напрямую зависит от степени перекрытия их спектров. Т.е. два сигнала с полностью одинаковыми спектрами имеют максимально возможное подобие. И наоборот, два сигнала с непересекающимися спектрами минимально подобны. Степень подобия определяется коэффициентом корреляции, который принимает значения от 0 (минимальное сходство) до 1 (максимальное сходство). Кроме того, коэффициент интересен тем, что он может иметь отрицательный знак. Отрицательная корреляция означает, что два анализируемых сигнала находятся в противофазе, а вернее имеют фазовый сдвиг от 90 до 180 градусов. К сожалению, по коэффициенту корреляции нельзя сказать каково точное значение сдвига. Однако, как было показано ранее, для контроля моносовместимости важно отсутствие фазовых сдвигов от 90 до 180 градусов, т.е. таких соотношений сигналов, для которых коэффициент корреляции имеет отрицательное значение. Это свойство и обеспечило популярность корреляции при анализе сигналов на моносовместимость.
Коррелометры бывают двух видов - однополосные и многополосные. Однополосные коррелометры анализируют весь спектр стереосигнала целиком и показывают только одно значение коэффициента корреляции. Например, модуль Correlation в составе IXL Stereo Analyzer:

По показаниям такого анализатора можно определить сам факт наличия проблем моносовметимости - отрицательное значение коэффициента корреляции. Как правильно считывать показания? Положительные значения коэффициента означают, что стереосигнал не имеет фазовых сдвигов, превышающих 90 градусов. При этом величина коэффициента отражает степень подобия левого и правого сигналов. Чем ближе его значение к нулю, тем сильнее различаются каналы. Отрицательное значение коэффициента говорит о наличии фазовых сдвигов от 90 до 180 градусов. Однако при этом важен не только знак. Коэффициент с небольшим отрицательным значением не так страшен, как минус единица. Объясняется это просто, величина коэффициента определяет степень перекрытия спектров каналов сигнала. Небольшому значению соответствует малое количество одинаковых частот, а, следовательно, и небольшое количество участков спектра суммарного моносигнала, на которых произойдут подавления частот. В то же время, коэффициент корреляции -1 говорит о том, что сигналы в левом и правом каналах имеют одинаковые спектры, и при суммировании произойдет сильное взаимное гашение, а возможно и полное исчезновение всего частотного диапазона сигнала.
Недостаток однополосных коррелометров - отсутствие возможности определения конкретных частотных областей, для которых имеются проблемы с фазой. Пример многополосного коррелометра - Voxengo PHA-979:

Данный анализатор разбивает спектр стереосигнала на узкие полосы, и рассчитывает коэффициент корреляции для каждой полосы по отдельности. Принцип анализа информации такой же, как и для IXL Stereo Analyzer. Таким образом, появляется возможность идентифицировать конкретные проблемные частоты.
Исправление фазовых проблем.
Способов устранения проблем моносовместимости достаточно много. Есть и узкоспециализированные. В данном разделе описаны только общие решения.
Первым делом нужно установить причину проблем. Например, для приведенного выше пресета на базе Zebra это можно сделать с помощью коррелометра. Если посмотреть на коррелограмму синтезируемого сигнала:

то можно увидеть проблемы с фазой в средней области частот. Как уже было показано, именно в этой области частот и был подавлен спектр суммарного моносигнала.
Первым и самым надежным решением проблемы является изменение настроек синтезатора. Например, приведенный выше пресет для Zebra можно исправить разными способами - или уменьшить разброс панорамы двух каналов (ручки Pan под матрицей), или выровнять коэффициенты частотной модуляции в каналах.
Однако не всегда есть возможность, или желание редактировать параметры синтезатора. В таком случае можно попробовать решить проблему линейным фазовым сдвигом одного из каналов. При этом фазовый спектр редактируемого канала получит дополнительные фазовые сдвиги, которые, возможно, скомпенсируют негативные фазовые разности. Например, с помощью линейного фазового сдвига на -60 градусов (регулятор Phase Left/Right у Voxengo PHA-979) удается получить такую коррелограмму для все того же пресета:

Достоинство линейной компенсации фазы заключается в отсутствии влияния сдвига на тембр сигнала. Однако недостатком является неоднозначность сдвига, особенно для сложных коррелограмм. Вполне возможно, что сдвиг исправит проблемы на одних частотах, но при этом создаст их на других. В таком случае могут помочь узкополосные фазовращатели. Например, DDFM LP10 - это эквалайзер, в каждой полосе которого имеется фазовращатель:

С помощью такого эквалайзера можно осуществить сдвиг фазы (ручка Phase) только в тех областях частот, для которых коррелометр показывает наличие фазовых проблем. Важно не забыть, что сдвигать фазу нужно только в одном канале. Одновременный сдвиг фаз в обоих каналах не приведет к нужному результату, поскольку разница фаз в этом случае не изменится.
