Ви є тут

Исследование и разработка алгоритмов параметризации речевых сигналов в системе распознавания диктора

Автор: 
Ахмад Хассан Мухаммад
Тип роботи: 
диссертация кандидата технических наук
Рік: 
2008
Артикул:
566292
179 грн
Додати в кошик

Вміст

СОДЕРЖАНИЕ
СПИСОК ИСПОЛЬЗУЕМЫХ СОКРАЩЕНИЙ
ВВЕДЕНИЕ.
ГЛАВА 1. ОБЗОР МЕТОДОВ И СИСТЕМ РАСПОЗНАВАНИЯ ДИКТОРА.
1.1. Классификация систем определения индивидуальности диктора но
голосу
1.1.1. Идентификация и верификация
1.1.2. Текстозависимое и текстонезависимое распознавание.
1.1.3. Автоматические и экспертные системы
1.2. Научная сторона проблемы
1.2.1. Различительные признаки.
1.2.1.1. Существенно индивидуальные особенности речи и голоса.
1.2.1.2. Индивидуальные характеристики, связанные со строением и функционированием речеобразующего аппарата.
1.2.1.3. Параметризация речевого сигнала
1.2.2. Способы описания речевого сообщения в целом.
1.2.2.1. Динамическое искажение времени.
1.2.2.2. Использование векторного квантования.
1.2.3. Проблема эталона и его обновление.
1.2.4. Решающие правила
1.2.5. Шумы, помехи, искажения.
1.3. Критерии эффективности систем распознавания.
1.4. Применение систем распознавания говорящего в промышленности.
1.5. Обзор современных программных продуктов распознавания.
1.5.1. Зарубежные программы, организации, достижения
1.5.2. Состояние дел в России.
1.6. Основные проблемы создания систем распознавания диктора
1.7. Выводы к главе 1.
ГЛАВА 2. МЕТОДЫ ПОСТРОЕНИЯ ПРИЗНАКОВЫХ ОПИСАНИЙ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ГОВОРЯЩЕГО
2.1. Ввод речи и ее цифровое представление
2.2. Предварительная обработка и выделение первичных признаков
2.2.1. Дискретное преобразование Фурье
2.2.2. Цифровые фильтры.
2.2.3. Использование оконных функций
2.3. Нормализация уровня сигнала
2.4. Выделение границ фразы в речевом сигнале.
2.5. Определение высоты тона частоты основного тома.
2.6. Методы получения признакового описания сигнала.
2.6.1. Спектральные методы
2.6.2. Коэффициенты линейного предсказания
2.6.3. Кепстральное описание
2.7. Выделение наиболее информативных характеристик.
2.7.1. Последовательный прямой поиск
2.7.2. Последовательный обратный поиск
2.8. Выводы к главе 2.
ГЛАВА 3. ОСНОВНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ В ЗАДАЧАХ РАСПОЗНАВАНИЯ ГОВОРЯЩЕГО.
3.1. Системы распознавания дикторов, основанные на сопоставлении с эталонами
3.2. Мера сходства речевого сигнала с эталоном
3.2.1. Статистический подход
3.2.2. Меры сходства.
3.3. Линейное выравнивание времени
3.4. Алгоритм динамического искажения времени ДИВ.
3.4.1. Описание алгоритма ДИВ
3.4.2. Симметричный алгоритм ДИВ.
3.4.3. Алгоритм поиска глобального наименьшего маршрута
3.4.4. Асимметричный алгоритм ДИВ
3.4.5. Система идентификации диктора с использованием
алгоритма ДИВ
3.5. Векторное квантование и построение кодовой книги при решении задач идентификации.
3.5.1. Меры искажения
3.5.2. Алгоритмы построения эталона
3.5.3. Идентификация но кодовой книге
3.5.4. Система идентификации диктора с использованием весовых
коэффициентов и кодовой книги.
3.6. Выводы к главе 3.
ГЛАВА 4. ЭКС1ЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ.
4.1. Цели и задачи экспериментов
4.2. Исследования методов признаковых описаний речевых сигналов в задачах распознавания.
4.2.1. Выбор речевых характеристик
4.2.2. Измерение частоты основного тона
4.2.3. Выделение наиболее информативных характеристик
4.3. Исследование свойств алгоритма динамического искажения времени
4.3.1. Выбор метрики расстояния
4.3.2. Исследование влияния параметра степени искажения ДИВ
на качество идентификации
4.3.3. Исследование методов параметризации речевых сигналов на
основе алгоритма ДИВ.
4.4. Результаты исследования идентификации дикторов на основе
использования векторного квантования
4.4.1. Исследование зависимости времени работы алгоритмов
идентификации и построения кодовой книги от ее размера
4.5. Сравнительные результаты тестирования систем идентификации дикторов.
4.6. Выводы к главе 4
ГЛАВА 5. РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ РЕАЛИЗАЦИИ РАЗРАБОТАННЫХ МОДЕЛЕЙ СИСТЕМ ИДЕНТИФИКАЦИИ
ЗАКЛЮЧЕНИЕ.
ЛИТЕРАТУРА