Введение.
1 Математические модели, методы и алгоритмы поиска ключевых слов, основанные на скрытых Марковских моделях
1.1 Байесовский критерий минимума средних потерь
1.2 Предобработка акустического сигнала.
1.3 Моделирование акустического сигнала при помощи скрытых Марковских
моделей
1.3.1 Определение скрытой Марковской модели
1.3.2 Моделирование акустического сигнала при помощи СММ.
1.3.3 Учет контекстной зависимости при моделировании акустического сигнала с помощью СММ.
1.3.4 Расчет акустической вероятности РЯЯ
1.4 Оценка параметров скрытых Марковских моделей
1.4.1 Метод максимального правдоподобия
1.4.2 Дискриминативные методы оценки параметров акустических моделей
1.5 Моделирование языка.
1.6 Декодирование.
1.6.1 Витербидекодирование
1.6.2 Алгоритм перемещающегося маркера.
1.6.3 Компенсация ошибок языковой и акустической моделей при помощи штрафа добавления слова и языкового множителя
1.7 Системы поиска ключевых слов, основанные на скрытых Марковских моделях .
1.7.1 Величины, характеризующие качество работы системы поиска ключевых слов
1.8 Недостатки и направление их разрешения
1.9 Постановка задачи исследования
2 Длинноконтекстные акустические модели фонем для уточненного моделирования
ключевых слов.
2.1 Длинноконтекстные акустические модели фонем.
2.2 Критерий близости скрытых Марковских моделей
2.2.1 Расчет интеграла
2.2.2 Итеративный алгоритм расчета критерия близости для скрытых Макровких моделей.
2.2.3 Аппроксимация акустической близости.
2.3 Показатель влияния контекста на параметры акустических моделей фонем
2.4 Аппроксимация длинноконтекстных акустических моделей фонем, оптимальная с точки зрения влияния контекста на параметры моделей.
2.5 Программная реализация и экспериментальные исследования системы поиска
ключевых слов, использующей длинно контекстные модели фонем.
2.5.1 Программная реализация системы поиска ключевых слов, использующей длинноконтекстные модели фонем
2.5.2 Экспериментальные исследования системы поиска ключевых слов, использующей длинноконтекстные модели фонем.
3 Словарь системы поиска ключевых слов, оптимальный с точки зрения минимума средней ошибки распознавания
3.1 Задача формирования словаря заполнения как задача разбиения слов языка на
непересекающиеся подм ножества
3.2 Целевая функция разбиения слов языка на непересекающиеся подмножества.
3.3 Расчет перекрестной энтропии пары скрытых Марковских моделей
3.3.1 Расчет интеграла 1Ху,Хпм
3.3.2 Итеративный алгоритм расчета перекрестной энтропии для скрытых Марковских моделей.
3.4 Метод кластеризации слов языка на непересекающиеся подмножества
3.5 Программная реализация и экспериментальные исследования системы поиска ключевых слов, использующей метод формирования словаря заполнения, оптимальный
с точки зрения минимума средней ошибки распознавания.
3.5.1 Программная реализация системы поиска ключевых слов, использующей оптимальный метод формирования словаря заполнения
3.5.2 Экспериментальные исследования системы поиска ключевых слов, использующей оптимальный метод формирования словаря заполнения.
Выводы Заключение Литература
Принятые обозначения и сокращения
СММ или СММмодель Скрытая Марковская модель
ДКмодель
ДКописатель
ДЦКмодель
РДКмодель
О о,от Ш
Щ,т ,и уМ
х или хт Р0Щ,Р0ХМ
Длинноконтекстная модель описатель длинноконтекстной модели действительная длинноконтекстная модель Родительская дпинноконтекстиая модель
Последовательность слов, представляющая содержание аудиосообщения.
Словарь системы распознавания речи Последовательность векторов признаков
Скрытая Марковская модель СММмодель
СММмодели слова и и последовательности слов IV соответственно
Множество состояний СММмодели
Вероятность перехода из состояния в состояние СММмодели
Плотность распределения вероятности вектора признаков о для состояния
Параметры смеси нормальных распределений, моделирующей распределение о
Множество параметров СММмоделей
Последовательность состояний скрытой Марковской модели Ш Условные плотности распределения вероятностей для
последовательности О в качестве жаргонных названий этих величин в данной диссертации используются термин акустическая вероятность и величина правдоподобия. В данной диссертации Р обозначает как вероятность, так и плотность распределения вероятностей, смысл в каждом конкретном случае ясен из контекста
В данной диссертации используется для обозначения логарифма с основанием
Введение
Актуальность