p align="left">2) отображение структуры звукового сигнала, записанного в файле, в графическом виде с возможностью изменения масштаба; 3) обеспечение возможности основных операций редактирования: выделение части сигнала, ее удаление, копирование и вставку. Обеспечение возможности вставки звукового сигнала из другого файла; 4) возможность изменения основных параметров цифрового звука: частоты дискретизации, битрейта, числа каналов; 5) изменение темпа(скорости) звукового сигнала, уровня громкости; 6) применение звуковых эффектов к сигналу, с указанием необходимых для них параметров (для эффекта эха: количество откликов, время между откликами, громкость отклика относительно предыдущего; для эффекта реверберации: количество отражений, задержка отраженного сигнала, громкость отражения относительно предыдущего; для эффектов возрастающей и затухающей громкости: громкость относительно текущей); 7) сжатие полученного сигнала для более компактного хранения с возможностью последующего извлечения. 1.3.3. Особенности системы и условия ее эксплуатацииСистема обработки аудиоинформации предназначена для работы с цифровыми звуковыми сигналами, записанными в файлах одного из следующих форматов: Microsoft Wave, MP3, Electronic Music. Объем информации, обрабатываемой системой, достаточно велик и может достигать нескольких десятков мегабайт. Эти особенности накладывают ограничения на использование непроизводительных и медленных алгоритмов. 1.3.4. Требования к функциональной структуреПостроение системы обработки аудиоинформации предполагает модульную структуру. Система включает в себя 2 подсистемы: подсистему обработки и фильтрации сигнала, подсистему кодирования данных. Общий интерфейс и возможность доступа ко всем модулям в составе каждой подсистемы должна обеспечивать оболочка. Таким образом, существует две оболочки. Первая реализует интерфейс для редактирования звукового сигнала, его параметров, применение к нему различных эффектов. Вторая реализует интерфейс для кодирования(сжатия) отредактированного звукового сигнала. Обмен между подсистемами происходит через звуковые файлы. 1.3.5. Требования к техническому обеспечениюЗадача обработки звуковых сигналов в системе обработки аудиоинформации связана с автоматическим анализом больших массивов аудио информации. Преобразования, проводимые в системе, должны проводиться в процессе интерактивного взаимодействия с пользователем, поэтому паузы на обработку не должны превышать нескольких минут. Исходя из этого, сформулированы требования к техническим характеристикам персонального компьютера, на котором будет функционировать система. Требования сведены в табл. 1.1. Таблица 1.1 Технические характеристики персонального компьютера |
Наименование | Значение | | Частота процессора, МГц | от 900 | | Объем оперативной памяти, Мб | от 128 | | Разрешение экрана монитора | не менее 1024x768 | | | 1.3.6. Требования к информационному обеспечениюСистема обработки аудиоинформации предназначена для обработки звуковых сигналов, записанных в звуковых файлах. Файлы должны быть одного из следующих форматов: Microsoft Wave (*.wav), MP3, Electronic music (*.em1) Основным видом информации, обрабатываемом в системе, является звуковая информация в цифровом представлении. Такой вид данных воспринимается человеком непосредственно, поэтому необходимо обеспечить возможность прослушивания преобразованных сигналов на различных этапах обработки, а также их графическую визуализацию. 1.3.7. Требования к программному обеспечениюСистему обработки аудиоинформации целесообразно разрабатывать для функционирования под управлением операционной системой семейства Windows, так как ОС данного класса наиболее широко распространены в современном мире. Платформами для разработки выбраны среды для разработки приложений Borland Delphi 7 (подсистема обработки и филбтрации сигнала) и Microsoft Visual C++ 2003 (подсистема кодирования данных). Эта среда поддерживают алгоритмические языки Pascal и C++ соответственно и обладают при этом возможностями быстрой разработки и проектирования визуальных интерфейсов.1.4. Основные технические решения проекта системы 1.4.1. Решение по комплексу технических средствКак уже отмечалось в п.п. 1.3.5, для достижения удобного пользователю режима функционирования системы необходимо следующая минимальная конфигурация персонального компьютера: частота процессора 900 МГц, объем оперативной памяти 128 Мб, монитор, поддерживающий разрешение 1024x768 точек. Также желательно наличие следующих периферийных технических средств: микрофон или другое записывающее устройство для получения исходных звуковых сигналов для их последующей обработки в системе, а также устройства вывода звуковых сигналов (колонки) для прослушивания полученных звуковых сигналов и оценки результатов работы системы. 1.4.2. Описание системы программного обеспеченияДля реализации и функционирования проекта необходимо общесистемное программное обеспечение ОС Windows XP, в основе которой лежит ядро, характеризуемое 32-разрядной вычислительной архитектурой и полностью защищенной моделью памяти, что обеспечивает надежную вычислительную среду. Разработка системы обработки аудиоинформации и ее подсистем будет вестись с использованием сред для разработки приложений Borland Delphi 7 и Microsoft Visual C++ 2003. Эти среды разработки включают в себя высокопроизводительный 32-битный компилятор, что позволяет оптимизировать создаваемый код, а также обширный набор средств, которые повышают производительность труда программистов и сокращают продолжительность цикла разработки. Многофункциональные интегрированные среды разработки включают компилятор, удовлетворяющий стандарта ANSI/ISO, встроенный дизайнер форм, богатый набор средств для работы с компонентами, менеджер проектов и отладчик. Удобство разработки и эффективность созданных в данных средах разработки программ делают их оптимальным выбором для построения исследовательской системы, какой является система обработки аудиоинформации. 2. РАЗРАБОТКА ПОДСИСТЕМЫ ОБРАБОТКИ И ФИЛЬТРАЦИИ СИГНАЛА 2.1. Описание постановки задачи обработки и фильтрации звукового сигнала 2.1.1. Характеристика задачиПри разработке подсистемы обработки и фильтрации звукового сигнала требуется выполнить следующие задачи: 1) изучение структуры звуковых файлов различных форматов и реализация возможностей чтения этих форматов для последующей обработки; 2) разработка алгоритмов, позволяющих преобразовывать исходный звуковой сигнал с целью изменения характеристик звучания; 3) программная реализация алгоритмов, позволяющих преобразовывать исходный звуковой сигнал с целью изменения характеристик звучания. Автоматизация процесса обработки и фильтрации звукового сигнала подразумевает реализацию в подсистеме определенных средств и функций. Следует выделить функциональных особенностей, которыми должна обладать подсистема: 1) возможность открытия и анализа файлов форматов Microsoft Wave, MP3 и Electronic Music; 2) отображение структуры звукового сигнала, записанного в файле, в графическом виде с возможностью изменения масштаба; 3) обеспечение возможности основных операций редактирования: выделение части сигнала, ее удаление, копирование и вставку. Обеспечение возможности вставки звукового сигнала из другого файла; 4) возможность изменения основных параметров цифрового звука: частоты дискретизации, битрейта, числа каналов; 5) изменение темпа (скорости) звукового сигнала, уровня громкости, обращение звукового сигнала; 6) применение звуковых эффектов к сигналу с указанием необходимых для них параметров. Перечислим реализуемые звуковые эффекты с указанием их параметров: - эффект эха: реализация повторения звукового сигнала с помощью временных преобразований таким образом, чтобы человеческое ухо воспринимало полученный сигнал как эхо (параметры: количество откликов, время между откликами, громкость отклика относительно предыдущего); - эффект реверберации: придание звучанию объемности, характерной для большого зала, где каждый звук порождает соответствующий, медленно угасающий отзвук; отличается тем, что на входной сигнал накладывается задержанный во времени выходной сигнал, а не задержанная копия входного (параметры: количество отражений, задержка отраженного сигнала, громкость отражения относительно предыдущего); - эффекты возрастающей и затухающей громкости: плавное увеличение громкости от нулевого уровня в начале фрагмента до максимального в конце и наоборот соответственно (параметр: величина громкости в процентах от текущей). Полученный измененный звуковой сигнал поступает в подсистему кодирования данных для уменьшения занимаемого им размера. 2.1.2. Вхоная информацияВходной информацией для подсистемы является цифровой звуковой сигнал, записанный в звуковом файле определенного формата. Формат входного звукового файла представлен в табл.2.1.Файл этого формата содержит заголовок, описывающий общие параметры файла, и один или более фрагментов, каждый из которых представляет собой волновую форму или вспомогательную информацию. Таблица 2.1 Структура звукового файла формата Microsoft RIFF/WAVE |
СМЕЩЕНИЕ ОТ НАЧАЛА ФАЙЛА | ДЛИНА | ОПИСАНИЕ | | 0 | 4 | ИДЕНТИФИКАТОР ФОРМАТА ( 'RIFF ') | | 4 | 4 | ДЛИНА БЛОКА ДАННЫХ ( ДЛИНА ФАЙЛА БЕЗ ЭТОГО ЗАГОЛОВКА) | | 8 | 4 | ИДЕНТИФИКАТОР БЛОКА ЗВУКОВЫХ ДАННЫХ ( 'WAVE` ) | | 12 | 4 | ИДЕНТИФИКАТОР ПОДБЛОКА ЗАГОЛОВКА (`fmt_`) | | 16 | 4 | ДЛИНА ПОДБЛОКА ЗАГОЛОВКА | | 20 | 2 | ТИП ФОРМАТА ПРЕДСТАВЛЕНИЯ ДАННЫХ | | 22 | 2 | ЧИСЛО КАНАЛОВ ( 1 - МОНО, 2 - СТЕРЕО ) | | 24 | 2/4 | ЧАСТОТА ДИСКРЕТИЗАЦИИ, ГЦ | | 26/28 | 2/4 | СКОРОСТЬ ПЕРЕДАЧИ ДАННЫХ, БАЙТ/С (ЧИСЛО КАНАЛОВ х ЧАСТОТА ДИСКРЕТИЗАЦИИ х РАЗРЯДНОСТЬ В БАЙТАХ) | | 28/32 | 2 | ВЫРАВНИВАНИЕ БЛОКА ДАННЫХ (ЧИСЛО КАНАЛОВ х РАЗРЯДНОСТЬ) | | 30/34 | 2 | РАЗРЯДНОСТЬ - ЧИСЛО БИТ НА ОДИН ОТСЧЕТ ( 8, 16 ) | | 32/36 | 4 | ИДЕНТИФИКАТОР ПОДБЛОКА ДАННЫХ ( `DATA') | | 36/40 | 4 | ДЛИНА ЗВУКОВЫХ ДАННЫХ | | 40/44 | | ЗВУКОВЫЕ ДАННЫЕ (0..255 ПРИ 8 БИТ И -32768..32767 ПРИ 16 БИТ) | | | 2.1.3. Выходная информацияВыходной информацией для данной задачи является измененный звуковой сигнал, записанный в файле, структура которого аналогична описанной в п.2.1.2. 2.1.4. Математическая постановка задачиСпектр - один из важнейших инструментов анализа и обработки звука. Французский математик Фурье (1768-1830) и его последователи доказали, что любую, обязательно периодическую функцию, в случае ее соответствия некоторым математическим условиям можно разложить в тригонометричес-кий ряд Фурье:где ai, bi - это так называемые коэффициенты Фурье, рассчитывающиеся по некоторой формуле.На рис. 2.1 представлена цифровая форма представления звука.Цифровая форма представления звукового сигнала218 Рис. 2.1Основные параметры цифрового звука:- частота дискретизации: определяется интервалом времени, через кото-рое происходит измерение значения амплитуды аналогового сигнала;
Страницы: 1, 2, 3, 4
|