Razer


Система обработки звука Razer Maelstrom Audio Engine

Эволюция звуковоспроизведения

В отличие от видео-технологий, которые за истекшие годы получили в свое распоряжение множество инноваций (цветные экраны, постоянно увеличивающееся разрешение, более яркие ЖК и плазменные панели, разнообразные трехмерные эффекты для дома и для кинотеатров и т.д.), для воспроизведения звука господствующей технологией с 1931 года являлся стереозвук.

1877 г. - Изобретено монофоническое звуковоспроизведение и появился фонограф.

1931 г. - Изобретен стереозвук. Используя баланс громкости между правым и левым каналами, можно создавать эффект перемещения источника звука по линии между двумя динамиками. Фактически это одномерная технология (с одной осью перемещения).

1940 г. - Первое задокументированное использование объемного звука в звуковом сопровождении, состоящем из трех звуковых каналов.

1985 - Для получения более реалистичного звука в кинотеатрах созданы стандарты многоканального звука. Это обеспечило воспроизведение окружающих звуков, таких как дождь или шум толпы, сзади от слушателя.

Тем не менее, многоканальные технологии звуковоспроизведения по своей сути остаются тем же что и стереозвук: звук располагается между двумя динамиками при добавлении все большего их количества (5.1, 7.1 и даже 12.1 на сегодняшний день), что дает дополнительные оси, вдоль которых вы можете слышать звук.

Двумерный слух

Восприятие нами звука является сложным чувством, которое активно ищет источники звуковых событий, происходящих в окружающем нас мире. Поскольку мы можем легко определять как направление, с которого пришел звук, так и расстояние до его источника относительно нашего положения, мы часто используем нашу способность слышать в качестве источника предупреждений о возможной опасности.

Однако в последние годы мы можем видеть недостаточное количество каких-либо усовершенствований в звуковых технологиях, что приводит к пренебрежению надлежащим использованием этих технологий в играх. Традиционная стерео технология позволяет пользователю только определить, справа или слева пришел звук. Но с появлением трехмерных игр игровой процесс больше не ограничивается перемещением из стороны в сторону и прыжками влево-вправо.

Существует определенный разрыв между возможностями восприятия звука человеком и возможностями, в реальности обеспечиваемыми традиционными стереодинамиками или многоканальными динамиками. По этой причине потенциал для создания системы естественного и правильного воспроизведения трехмерного звука огромен, поскольку человек уже умеет использовать звуки и активно искать их, чтобы лучше ориентироваться в окружающем пространстве.

Попробуйте сравнить то, что вы слышите на живом концерте, с прослушиванием записи этого же концерта. Они звучат совершенно непохоже, потому что традиционная стереотехнология делает звук плоским, вытягивая его вдоль одной линии.

HRTF: виртуализированный объемный звук

Первая технология виртуализированного объемного звука появилась в 1980е годы. Эта технология основана на методе обработки звука, называемом Head Related Transfer Function (HRTF, функция передачи, учитывающая строение головы) и позволяет воспроизводить и располагать в пространстве любой звук и практически в любом месте.

HRTF использует способ, при помощи которого мозг декодирует пространственное расположение звуков и добавляет пространственные признаки звука, чтобы воссоздать этот эффект.

Например, когда звук приходит с левой стороны от человека, он сначала попадает в его левое ухо, а затем - в правое ухо (см. рис. 1). Эта разница во времени прихода звука, называемая ITD (Inter-aural Time Difference, «межушная» задержка) используется мозгом для нахождения местоположения источника звука в горизонтальной плоскости. Эта информация комбинируется с «межушной» разницей уровней (Inter-aural Level Difference, ILD) между сигналами, приходящими в правое и левое ухо, образующейся из-за затенения источника звука головой (из-за дифракции звуковых волн, вызванной тем, что ваша голова поглощает звук), чтобы определить положение источника звука.

Рисунок 1: Величина t представляет собой количество времени, необходимое для достижения звуком левого уха. Разница между этим временем и временем для достижения правого уха показана красным.

Наша способность определять расположение источника звука над нами или под нами (угол его возвышения) объясняется тем, что мозг декодирует небольшие вариации звука, происходящие из-за его дифракции в ушной раковине (см. рис. 2). Когда звук приходит в ваше ухо под определенным углом, он изменяется из-за многочисленных переотражений в ушной раковине, прежде чем попасть в слуховой канал. Для разных углов возвышения эти изменения будут разными. Мозг будет декодировать эти небольшие изменения, чтобы получить из них пространственную информацию об угле возвышения. Все технологии HRTF имитируют эти пространственные признаки сигналов, изменяя звук при помощи фильтров, прежде чем он попадет в ваши уши.

Рисунок 2: Ушная раковина - это внешняя часть уха. Она состоит из хрящей и кожи и напрямую влияет на восприятие звука.

Взяв за основу эти принципы, можно установить микрофоны в слуховой канал человека или в муляж человеческой головы, чтобы измерить и сравнить записи звуковых сигналов при разных пространственных положениях источника звука с записями того же звука, когда он достигнет слухового канала. Это прямое сравнение дает два фильтра (левый и правый), которые могут воспроизводить изменения звука для получения его пространственного восприятия.

Используя эти приемы и полученные таким образом фильтры, технология HRTF может имитировать трехмерный образ звука, используя стереонаушники или стереодинамики, без необходимости использования систем с несколькими динамиками.

Традиционные проблемы HRTF

Из-за психологических особенностей, присущих HRTF, существует ряд традиционных проблем, возникающих при генерации трехмерного звука системами HRTF.

Расположение звука спереди/сзади
Существующие в настоящее время технологии HRTF подвержены недостаточно хорошему воспроизведению звуков, расположенных спереди или сзади. Например, если в записи источник звука должен быть расположен перед слушателем, традиционные алгоритмы HRTF могут самопроизвольно расположить его сзади от слушателя. Соответственно, если используются традиционные протоколы HRTF, то во время игры звуки выстрелов, которые должны приходить спереди, могут доноситься сзади, что приводит игрока в замешательство.

Избранность аудитории
Для традиционных протоколов HRTF также свойственен малый процент успеха для большинства слушателей. Как правило, для типичного пользователя шансы на то, что HRTF для него будет работать так, как ожидалось, довольно малы. Большинство протоколов HRTF на сегодня имеют процент успеха 20% или меньше, в то время как большинство пользователей не замечают никакой разницы или, что еще хуже, создаваемый HRTF трехмерный звуковой эффект им активно не нравится и они отключают функцию трехмерного звука.

Потеря достоверности
Традиционные алгоритмы HRTF подвержены также снижению достоверности воспроизведения звука при постобработке, что приводит к потере или ослаблению исходных звуковых сигналов. Когда традиционные алгоритмы HRTF выявляют пространственное положение источника сигнала, это с большой вероятностью приводит к значительным потерям достоверности и, соответственно, к худшему звуковому окружению для слушателей.

Плохой вынос источников звука, приводящий к утомлению слушателя
Генерируемые HTRF звуки обычно воспринимаются как расположенные очень близко к голове слушателя, поскольку в общем случае эффект удаленного звучания при использовании алгоритмов HRTF воспроизвести тяжело, в отличие от случая с применением разнесенных динамиков. Соответственно, HRTF приводит к утомлению слушателя из-за восприятия им звуков, как звучащих «внутри головы».

Звуки, расположенные выше/ниже
HRTF основывается на методах психоакустической локализации звука, которые с наушниками обеспечивают только двумерное звуковое поле. Соответственно, звуки, расположенные на оси z (или выше или ниже от слушателя) воспроизводятся традиционными алгоритмами HRTF с трудом.

Современное поколение технологий HRTF

В индустрии звука многие производители используют теории HRTF для создания технологий виртуализации объемного звука.

Некоторые производители, предлагающие решения с виртуализированным звуком, основываются исключительно на принципах HRTF, и для создания пространственного эффекта применяют к звуку фильтры, изменяющие фазу и уровень сигнала. Это весьма примитивный процесс и для большинства слушателей он не работает, поскольку определенные звуки в этом случае просто будут громче или тише и всего лишь создают эхо в каждом ухе.

Другие производители используют БПФ (быстрое преобразование Фурье) для обработки ряда параметров, таких как фаза, уровень, а также переотражение звука от головы, ушной раковины и тела слушателя. Это более точный метод, но многие из таких технологий дают только простые звуковые фильтры, которые обеспечивают ограниченное количество пространственных признаков звука, т.к. иначе сигнальный процессор не справляется с обработкой поступающих новых сигналов.

Оба этих метода дают звук с пространственными признаками, которые мозг слушателя может использовать для определения местоположения источника звука, но реализуются они на сигнальных процессорах, которые могут обрабатывать алгоритмы и переменные только со скоростью 34 MIPS (Millions of Instructions per Second, миллиона инструкций в секунду).

Большинство современных технологий HRTF страдают от упомянутых выше проблем. Поэтому для большинства игроков виртуальный объемный звук, выдаваемый системами HRTF нынешнего поколения, не подходит для игр и не обеспечивает точное объемное звуковое окружение.

Система обработки звука Razer Maelstrom - следующее поколение технологий HRTF

Система обработки звука Razer Maelstrom берет свое начало в военных технологиях обработки звука, которые изначально были разработаны для пилотов истребителей, которым требовались звуковые предупреждения о приближающихся ракетах. Система обработки звука Razer Maelstrom основана на той же самой платформе, но разработана специально для игр. Система Razer Maelstrom также призвана решить традиционные проблемы алгоритмов HRTF, чтобы получить таким образом более убедительное окружение с объемным звуком.

Система обработки звука Razer Maelstrom - это результат тысяч часов разработки, тестирования и проверок, позволивших создать выдающуюся платформу объемного звука, основанную на HRTF технологиях следующего поколения.

Обработка, выполняемая при помощи алгоритмов Razer Maelstrom, значительно более сложная, нежели в традиционных методах HRTF. Положение динамиков в наушниках было определено после долгих часов обработки, с использованием сложных математических и физических теорий. В то же время учитывались фаза и уровень звука, его переотражения от головы, ушной раковины и тела слушателя, а также такие факторы как расстояние источника звука от слушателя, реверберация и другие эффекты (см. рис. 3).

Рисунок 3: В дополнение к обычным факторам, учитываемым в традиционных технологиях HRTF, Razer Maelstrom использует исходный источник звука плюс точные координаты звукового события и добавляет пространственные признаки, которые при обработке преобразуются в звуковые сигналы, воспроизводимые в левом и правом канале наушников.
Когда звук воспроизводится в наушниках Razer Megalodon, то в левом и правом каналах выдаются правильные звуковые сигналы, и пользователь может точно определить положение звука.

По сравнению с традиционными методами HRTF, повышенная вычислительная мощность системы Razer Maelstrom дает в результате лучшее расположение звуков, расположенных спереди или сзади от слушателя. Помимо этого, дополнительная обработка также обеспечивает более точное объемное звуковое окружение. Система обработки звука Razer Maelstrom также гарантирует минимальные потери в области достоверности воспроизведения при постобработке, поэтому игровое окружение сохранится таким, каким его задумывали разработчики игры. Аналогично, пространственный вынос звуковых сигналов был улучшен благодаря усовершенствованным алгоритмам HRTF Razer Maelstrom.

В дополнение к этому Razer Maelstrom может виртуализировать источник звука и обработать звук совместно с данными о тысячах оцифрованных ушных раковин, гарантируя то, что в результате получатся пространственные признаки звука, которые будут работать для большинства слушателей. Это очень важно, поскольку получаемые пространственные признаки в традиционных технологиях HRTF основываются на одной опорной записи, полученной на муляже головы, что является основной причиной неудовлетворенности большинства слушателей традиционными технологиями HRTF.

С учетом необходимости обработки сложных алгоритмов в реальном времени, одним из ключевых аспектов системы Razer Maelstrom стало использование отдельного модуля обработки звука, который берет на себя большую часть требуемых вычислений. Этот усовершенствованный метод обработки использует отдельный, самый современный цифровой сигнальный процессор, который может вести обработку со скоростью до 500 MIPs, что на 400-800% больше, нежели в других распространенных сигнальных процессорах, и это дает в результате феноменальное увеличение производительности по сравнению с методами HRTF нынешнего поколения. Более того, это улучшает процесс игры, поскольку необходимая работа со звуком переносится с центрального процессора на модуль обработки звука Razer Maelstrom.

Система обработки звука Razer Maelstrom - Для геймеров. От геймеров.

Современные модели виртуализации звука неспособны обеспечить реалистичный пространственный звук в играх. Кроме того, традиционные технологии HRTF возлагают обработку на центральный процессор системы, что приводит к ухудшению производительности в самой игре.

Система Razer Maelstrom была разработана специально для устранения перечисленных выше проблем в играх, и была интенсивно протестирована в различных играх при непосредственном участии игроков. Система Razer Maelstrom - это система виртуальной обработки звука следующего поколения, которая обеспечивает реалистичный объемный звук 7.1 в играх без дополнительных драйверов, что в результате дает улучшенную обработку - настоящая находка для современных игр, требовательных к ресурсам.

Благодаря тысячам звуковых моделей, созданных, чтобы гарантировать оптимальное звуковое окружение в игре, система обработки звука Razer Maelstrom - это наиболее продвинутая система обработки звука, созданная геймерами и для геймеров.

Игровая гарнитура с объемным звуком 7.1 Razer Megalodon

Razer Megalodon - это игровая гарнитура с виртуализированным объемным звуком 7.1, разработанная специально под использование системы Razer Maelstrom, что отличает ее от всех остальных имеющихся на сегодняшний день игровых гарнитур. Razer Megalodon - это самая продвинутая игровая гарнитура в своем роде, использующая HRTF технологии следующего поколения и превосходный цифровой сигнальный процессор с неслыханной вычислительной мощностью.

Поскольку ушная раковина является очень сложным органом, уникальным для каждого человека, мы решили так расположить динамики относительно уха, чтобы создавалось звуковое поле, которое будет естественным образом восприниматься вашей собственной барабанной перепонкой, получая преимущество от проработанной виртуализации ушной раковины в Razer Maelstrom. В ближней к уху зоне звуковое поле будет одинаковым для всех слушателей, но эффект восприятия звука барабанной перепонкой является более личным и будет более точно соответствовать вашему опыту восприятия трехмерных звуков в реальном мире (см. рис. 4).

Рисунок 4: Динамики в гарнитуре Megalodon расположены близко к уху, поэтому звуковое поле является индивидуальным и воспринимается напрямую барабанной перепонкой.

Таким образом, точное размещение динамиков в гарнитуре Razer Megalodon и усовершенствованная техника обработки звука в системе Razer Maelstrom обеспечивают:

- Лучший вынос звука
- Более сфокусированный звук
- Более точный образ виртуального звука

Блок управления гарнитуры Razer Megalodon содержит также модуль обработки звука, который реализует все описанные выше сложные алгоритмы, образующие в совокупности систему Razer Maelstrom. Этот внешний модуль обработки звука использует цифровой сигнальный процессор следующего поколения, который позволяет обрабатывать на 800% больше информации, чем цифровые сигнальные процессоры, используемые в настоящее время.

Конечный результат в точности воспроизведения звука гарнитурой Razer Megalodon и в решении традиционных проблем HRTF является выдающимся. За исключением проблемы звуков, расположенных выше или ниже, система Razer Maelstrom определенно решает большую часть проблем, связанных с традиционными технологиями HRTF. Достаточно сказать, что инженеры Razer, работающие в области звука, активно занимаются настоящим трехмерным воспроизведением звука, поскольку создание круговой картины звука теперь наконец-то доступно.

Заключение

В своей гарнитуре Razer Megalodon компания Razer продемонстрировала, как мощность системы обработки звука Razer Maelstrom и точное расположение динамиков обеспечивают правильное воспроизведение виртуализированного объемного звука лучше, нежели любая другая из имеющихся на рынке технологий HRTF.

Обрабатывая в системе Razer Maelstrom на 800% больше информации в сравнении с традиционными цифровыми сигнальными процессорами, гарнитура Razer Megalodon дает больше пространственных признаков звука, что позволяет игрокам лучше воспринять полную картину виртуального объемного звука. Благодаря этим пространственным признакам игроки могут поместить для себя каждый звук на его место и всегда будут знать, откуда пришел выстрел.

В будущем компания Razer намеревается также решить другие проблемы, присущие традиционным технологиям HRTF. И в результате показывает, как система обработки звука Razer Maelstrom и точное расположение динамиков в гарнитуре Razer Megalodon дают звуковое решение, которое действительно позволяет игрокам слышать в трех измерениях, так что ни один звук больше не останется неуслышанным.