РАЗДЕЛ 2
ФОРМАЛИЗАЦИЯ РЕЧИ
В соответствии с современными тенденциями создания систем искусственного интеллекта и проблематикой разработок ЭВМ 5-го поколения одной из актуальных задач является создание аппаратно-программных комплексов речевого человеко-машинного диалога. Как одно из направлений, определяющее возможности диалога в интеллектуальных системах при синтезе программных интерфейсов, рассматривается формальное представление речи. Это представление включает в себя:
- множественные представления речи;
- нормирование множественных представлений, переводящее качественные формальные записи в количественные пространственные оценки.
2.1 Формализация слов речи
При решении основной задачи представления фонетики и фонологии необходимо формализовать в виде множеств и взаимосвязей между ними звуковой строй языка и слова с применением теории множеств [100,101], закрепляя элементы фонетики и фонологии в логической взаимосвязи с применением алгебры предикатов [10,11]. На рис. 2.1 изображена структура формализации речи.
Формализацию слов речи (блок 1.2 рис. 2.1) возможно реализовать через формальное представление звуков речи (блок 1.1). В соответствии с этим звуки речи с учетом их множественного и предикатного представления [102] могут быть представлены в виде (2.1).
, . (2.1)
Рисунок 2.1 - Структура формализации речи
Слово речи представимо через последовательность звуков в виде множества (2.2).
, (2.2)
, где X=(x1,...,xn), ,
- максимальная длина слова.
Множественные представления слов с их алгеброй методологически позволяют перейти непосредственно к анализу и формализации правил образования произносимых предложений-команд.
2.2 Формализация предложений речи
Как известно из современной методологии, в распознавании команд подаваемых голосом для формализации предложений речи (рис. 2.1 блок 1.7) необходимо выделить предлоги (блок 1.3), имена объектов и действий (блок 1.4), признаки объектов и действий (блок 1.5) и части предложения, представляющие собой объекты и действия (блок 1.6) [103,104].
Выделим множество предлогов (2.3), согласно работам [105,106]
, (2.3)
, где .
Согласно [29], [30] модель языка можно представить как совокупность объектов, существующих во времени, пространстве и действии. Исходя из этого, классифицируем в предложении объект (блок 1.4) и действие (блок 1.5).
При формализации объектов [107], [108] принята группировка слов по совокупности имен и признаков.
Выделим множество имен объектов (2.4) и признаков объектов (2.5).
, (2.4)
.
, (2.5)
.
При рассмотрении варианта группировки слов по совокупности имен и признаков объектов формируется множество, характеризующее:
- признаки объекта - имя объекта - признаки объекта (2.6);
- признаки объекта - имя объекта (2.7);
- имя объекта - признаки объекта (2.8);
- имя объекта (2.9).
(2.6)
,
,
где W=(x1,...,xn, y,z1,...,zm), ,
- максимальное количество признаков в объекте.
, (2.7)
, где W=(x1,...,xn, y), .
, (2.8)
, где W=( y,z1,...,zn), .
, (2.9)
.
С учетом этих сочетаний совокупность объектов представляется множеством (2.10).
, (2.10)
, где W=(x,y,z).
Предлоги и связанные с ними объекты можно представить в виде множества (2.11).
, (2.11)
g12(W) ? d1(x) ? g11(y), где W=(x,y).
При формализации действий [109], [110] принята группировка слов по совокупности имен и признаков. Выделим множество имен действий (2.12) и признаков действий (2.13).
, (2.12)
.
, (2.13)
.
При рассмотрении варианта группировки слов по совокупности имен и признаков действий формируется множество, характеризующее:
- признаки действия - имя действия - признаки действия (2.14);
- признаки действия - имя действия (2.15);
- имя действия - признаки действия (2.16);
- имя действия (2.17).
(2.14)
,
,
где W=(x1,...,xn, y,z1,...,zm), ,
- максимальное количество признаков в действии.
, (2.15)
, где W=(x1,..., xn, y), .
, (2.16)
, где W=( y, z1,..., zn), .
, (2.17)
.
С учетом этих сочетаний совокупность действий определяется множеством (2.18).
, (2.18)
, где W=(x,y,z).
В связи с тем, что имя и признаки объекта или действия состоят из частей речи, которые входят во множество слов C1, то имя и признаки можно представить как последовательность слов в виде множеств (2.19) и (2.20) соответственно.
, (2.19)
, где .
, (2.20)
, где .
Исходя из того, что объекты, связанные и не связанные с предлогом, а также действия состоят из имени и признаков, которые, в свою очередь состоят из частей речи, входящих во множество слов C1, то объекты и действия можно представить как последовательность слов в виде множества (2.21).
, (2.21)
, где X=(x1,...,xn), .
Приведенные множественно-семантические представления частей речи, объектов и действий вместе с их именами и признаками позволяют рассматривать двухвариантные представления предложений [102], [111]. С одной стороны, предложения языка можно представить как последовательность объектов и действий в виде множества (2.22), а с другой - через последовательность слов в виде множества (2.23).
, (2.22)
, где X=(x1,...,xn),.
, (2.23)
, где X=(x1, ..., xn), ,
- максимальная длина предложения.
В связи с тем, что современная система распознавания речи базируется на вычислительных устройствах различных типов, сопоставление произносимых слов и команд осуществляется с помощью количественных характеристик формируемых различного рода звуковыми картами. Разработанные множественные представления слов и предложений речи с их алгеброй методологически позволяют перейти непосредственно к их числовым характерис