Презентация дисциплины

Download Report

Transcript Презентация дисциплины

ОБРАБОТКА РЕЧЕВЫХ ДАННЫХ В ИНФОРМАЦИОННО ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМАХ

Представление дисциплины

Общие сведения по дисциплине

Обработка речевых данных в информационно телекоммуникационных системах Читается для специальности 210406.65 «Сети связи и системы коммутации» Сфера профессионального использования: знания, умения и навыки, получаемые в процессе изучения дисциплины используются инженерным составом подразделений связи, и в структурах использующих телекоммуникационную технику.

2

Краткое описание дисциплины

Курс речи.

(ИТС) «Обработка речевых данных в информационно телекоммуникационных системах» для студентов заочной формы обучения направлен на освоение студентами методов цифровой обработки для реализации задач сжатия, распознавания и синтеза Центральной с точки зрения хранения и передачи, проблемой реализации в информационно – телекоммуникационных системах речевого обмена является создание эффективных методов сжатия, полученных на этапе регистрации, речевых данных с возможностью дальнейшего воспроизведения исходных речевых сообщений с приемлемым качеством.

Необходимо отметить, что решение проблемы сжатия речевых данных рассматривается в работах многих авторов. Для сжатия речи разработаны преобразования, различные процедуры рассматриваются в данном УМК: методы сжатия звуковых данных с использованием грубого квантования по уровню, субполосного статистического обработки, кодирования, методам, основанным на частотных представлениях.

которые линейного предсказания. Представляется так же целесообразным познакомить студентов с новыми методами цифровой обработки речевых данных, разработанных на факультете. При этом основное внимание уделяется

3

Цели и задачи преподавания дисциплины Основной целью

обработки речи.

дисциплины является подготовка студентов по вопросам цифровой обработки речевых сигналов в приложении к различным техническим системам – изложение особенностей речи, как способа информационного обмена, принципов и методов цифровой

4

Место дисциплины среди смежных дисциплин

Данная дисциплина требует

курсов предварительного изучения

: информатика, программирование, математический анализ, теория вероятностей и математическая статистика, дискретная математика, алгебра, теория электрической связи, вычислительная техника и информационные технологии, цифровые методы формирования и обработки сигналов в ИТС.

5

Начальные знания

Для успешного освоения курса требуется знание основ математики, информатики, программирования, теории связи, цифровой обработки сигналов.

6

Итоговые знания, умения и навыки

В результате изучения дисциплины студенты должны получить ЗНАНИЯ: • основ акустической теории речеобразования; • физических характеристик речевых сигналов; • математических основ частотной обработки речевых сигналов; • методов преобразования аналоговых речевых сигналов в цифровой формат; • дискретных речевых сигналов; • вариационных методов частотной методов статистического кодирования.

обработки отрезков В результате изучения дисциплины приобрести УМЕНИЯ И НАВЫКИ: студенты должны • создания прототипов информационных технологий сжатия речевых данных при хранении, передаче и обеспечении скрытности в ИТС.

7

Содержание лекционного курса

Тема 1.

Модели речеобразования и речевосприятия

.

Тема 2.

Моделирование и обработка речевых сигналов на основе частотных представлений

.

Тема 3.

Вариационные методы частотной обработки отрезков дискретных речевых сигналов

.

Тема 4.

Распознавание и синтез речи

.

Тема 5.

Сжатие речевых данных при хранении, передаче и обеспечении скрытности в ИТС

.

8

Тема 1. Модели речеобразования и речевосприятия

1.1 Структурные модели речевого сигнала Основы акустической теории речеобразования. Физический процесс механизма речеобразования. Модель речевого тракта как линейной системы. Электрический эквивалент физической модели системы речеобразования. Структурные модели речевого сигнала.

Классификация звуков речи, основные понятия формантного анализа. Временные и частотные характеристики звуков речи.

1.2 Модели слухового аппарата Понятие слуховой системы, периферическая часть и высшие отделы слуховой системы. Особенности строения периферийных органов слуха. Механизм передачи звука в периферической части слуховой системы. Высшие отделы слуховой системы.

1.3 Психоакустическая модель восприятия звука Основные задачи психоакустики. Физические характеристики речевых сигналов. Понятия чувствительности слуха, порога слышимости, предмаскировка критической и полосы слуха.

способность слухового аппарата. Эффекты слухового маскирования, послемаскировка.

психоакустических закономерностей слухового системах кодирования со сжатием речевых данных.

Интегрирующая Использование восприятия в

9

Тема 2. Моделирование и обработка речевых сигналов на основе частотных представлений

2.1. Математические основы частотной обработки речевых сигналов Представление речевой информации в частотной области.

Разложение непериодических сигналов конечной длительности по базису Фурье, его преимущества и недостатки при анализе речевых сигналов. Оконная функция, и ее роль в частотном анализе.

Распределение энергии отрезков сигналов по частотному диапазону. Равенство Парсеваля.

2.2 Дискретизация речевых сигналов с позиций частотных представлений Преобразование аналоговых речевых сигналов в цифровой формат. Дискретизация и кванотоване. Выбор оптимального значения частоты дискретизации сигнала, чатота Найквиста.

Интерполяционный ряд Котельникова-Шеннона, теорема дискретизации. Оптимальные методы дискретизации

10

Тема 3. Вариационные методы частотной обработки отрезков дискретных речевых сигналов

3.1.

Представление точного значения доли энергии отрезка дискретного сигнала в заданном частотном интервале Непрерывные отрезки речевых сигналов. Использование квадратичной формы для вычисления долей энергии непрерывного отрезка речевого сигнала в заданом частотном интервале. Субполосное ядро. Процедуры вычисления значений квадратичных форм. Дискретные отсчеты отрезков речевых сигналов.

Задача вычисления долей энергии отрезка дискретизованных по аргументу значений исследуемых Вычисление точных значений долей энергий отрезков эмпирических данных, попадающих в выбранный частотный интервал.

3.2. Оптимальное разделение отрезка речевого сигнала на аддитивные компоненты (линейная частотная фильтрация) Фильтрация на основе КИХ-фильтров.

Понятие функций.

оптимальной Вариационные методы решения задачи фильтрации.

непрерывных речевых сигналов и их дискретных отсчетов на аддитивные составляющие с использованием частотных представлений.

3.3. Оптимальное субполосное преобразование Понятие субполосного преобразования исходного вектора речевых данных.

Обратимость процедуры векторов матрицы субполосного анализа.

субполосного разделения преобразования.

Субполосное кодирование на основе использования банков КИХ-фильтров.

Оптимальное субполосное преобразование на основе базиса собственных

11

Тема 4. Распознавание и синтез речи

4.1. Технологии распознавания речи Задача распознавания речи. Требования к современным распознавания системам распознавания дикторов, речи.

Системы распознавания речи: с речевым ответом, распознавания изолированных цифр, последовательности цифр.

распознавания слитной 4.2 Синтез речи на основе текстовых данных Ограничения на синтез речи. Методы синтеза.

Конвертация текста в речь. Оценка синтетической речи.

12

Тема 5. Сжатие речевых данных при хранении, передаче и обеспечении скрытности в ИТС

5.1 Преобразование речевых данных при сжатии Методы сокращения объемов битовых представлений речевых данных. Системы сжатия без потерь информации. Системы сжатия с потерями информации.

5.2 Кодирование речевых сигналов на основе линейного предсказания Основы метода линейного предсказания. Методы определения коэффициентов линейного предсказания. Алгоритмы решения уравнений линейного предсказания.

Понятие устойчивости авторегрессионной модели. Вокодеры с линейным пред сказанием.

5.3 Сжатие речевых данных на основе кодирования пауз в речевых сообщениях Методы обнаружения и кодирования 5.5 Методы статистического кодирования Кодирование длин повторений (RLE).

пауз.

пауз внутри слов. Оценка качества воспроизведения речи.

компонент векторов субполосных преобразований.

Характеристика 5.4. Сжатие речевых сигналов на основе субполосных преобразований сигналов, соответствующих паузам в речевых сообщениях. Алгоритмы реализации детектора активности речи (VAD-Voice Activity Detector). Характеристика проблемы с позиций частотных представлений. Обнаружение речевых сигналов на фоне помех.

Искажение звуковых данных при различных шумовых ситуациях за счет удаления фрагментов звуков речи. Учёт характеристик диктора. Возможность регистрации Субполосное преобразование в задачах сжатия звуковых сигналов. Области применения субполосного анализа речевых данных. Сжатие речевых сигналов на основе методов оптимальных субполосных преобразований. Квантование по уровню Методы сжатия информации без потерь. Статистический алгоритм Хаффмана.

Арифметическое кодирование. Словарное кодирование, метод Зива-Лемпеля.

13

Лабораторный практикум

Лабораторная работа №1 (по теме №2). Исследование временных и частотных характеристик звуков речи.

Лабораторная работа №2 (по теме №3). Исследование временных и частотных характеристик звуков речи. Лабораторная работа №3 (по теме №3). Субполосное преобразование речевых сигналов.

Лабораторная работа №4 (по теме №5). Линейное предсказание речевых сигналов.

Лабораторная работа №5 (по теме №5). Исследование методов обнаружения и кодирования пауз в речевых сообщениях (технология VAD).

Лабораторная работа №6 (по теме №5). Исследование методов обнаружения и кодирования пауз в речевых сообщениях (учет различий в распределении энергий шумов и звуковых данных в частотной области).

Расчетно-графическое задание. Прототип информационной технологии сжатия речевых данных.

14

Формы контроля

Текущий контроль Тестовые задания к каждой теме Проверка выполнения лабораторных работ Итоговый контроль Зачет

15

Глоссарий

Глоссарий – обеспечивает толкование и определение основных понятий, необходимых для адекватного осмысления материала. Например:

1.

Акустическая антенна – орган периферической части слухового аппарата человека, принимающий, локализующий, фокусирующий и усиливающий звуковой сигнал;

2.

Аллофон – набор звуков, имеющих одинаковые свойства ;

3.

Вокодер

– устройство, осуществляющее параметрическое компапдирование речевых сигналов (от английских слов voice – голос и coder – кодировщик)…

16

Список литературы

Основная

Голд, Б. Цифровая обработка сигналов [Текст] : пер. с англ./ Б. Голд, Ч. Рейдер. – М.: Сов. радио, 1973. – 376 с.

Назаров, Х.З. Методы цифровой обработки и передачи речевых сигналов [Текст] / Х.З. Назаров, Ю.Н. Прохоров. – М.: Связь, 1982. – 236с.

Рабинер, Л.Р. Цифровая обработка речевых сигналов [Текст]: Пер. с англ. / Л.Р.Рабинер, Р.В. Шафер; под ред. М. В. Назарова, Ю. Н. Прохорова. – М.: Радио и связь 1981. – 495 с.

Сергиенко, А. Б. Цифровая обработка сигналов [Текст]: учеб. пособие для студ. вузов / А. Б. Сергиенко. – СПб.: Питер, 2002. – 603с. : ил. – (Учебник для вузов).

Шелухин, О.И. Цифровая обработка и передача речи [Текст] / О.И. Шелухин, Н.Ф.Лукьянцев; под ред. О.И. Шелухина. – М.: Радио и связь, 2000. – 456с.: ил.

17

Список литературы

Дополнительная

Вокодерная телефония. Методы и проблемы [Текст] / Под ред. А.А. Пирогова  М.: Связь, 1974.  246 с.

Гантмахер, Ф.Р. Теория матриц [Текст] / Ф.Р. Гантмахер. – М.: Физматлит, 2004. – 560с.

Гельфанд, С.А. Слух: Введение в психологическую и физиологическую акустику [Текст] / С.А. Гельфанд. – М.: Медицина, 1984. – 350 с.

Михайлов, В.Г. Измерение параметров речи [Текст] / В.Г.Михайлов, Л.В.Златоустова; под ред. М.А. Сапожкова. – М.: Радио и связь, 1987. – 168 с.: ил.

Рабинер, Л. Теория и применение цифровой обработки сигналов [Текст] / Л. Рабинер, Г. Голд. – М.: Мир, 1988. – 512 с.

Росляков, А.В. IP-телефония [Текст] / А.В. Росляков, М.Ю. Самсонов, И.В. Шибаева. – М.: Эко-Тредз, 2001. – 250 с.

Слуховая система [Текст] / Сб. статей под ред. Я.А. Альтман. – Л.: Наука, 1990. – 620 с.

Фланаган, Дж. Анализ, синтез и восприятие речи [Текст]: Пер. с англ. / Дж.Фланаган; под ред. А. А. Пирогова. – М.: Связь, 1968. – 396 с.

Хургин, Я. И. Финитные функции в физике и технике [Текст] / Я. И. Хургин, В. П. Яковлев. – М.: Наука, 1971. – 408 с.: ил.

Шульгин, В.И. Основы теории передачи информации [Текст]: Учебное пособие / В.И. Шульгин. – Харьков: Нац. аэро-косм. ун-т. «Харьк. авиац. ин-т», 2003. – 102 с.

18

Сведения об авторе

ФИО: Жиляков Евгений Георгиевич

Место работы: Белгородский государственный университет Ученая степень: доктор технических наук Ученое звание: профессор Должность: декан факультета компьютерных наук и телекоммуникаций Кафедра: математического и программного обеспечения информационных систем

Контактная информация: Адрес – г.Белгород, ул. Победы, 85, корпус 14 19

20