Ви є тут

Система підтримки прийняття рішень в автоматизованій системі управління технологічним процесом синтезу жирів із потрібними властивостями

Автор: 
Демидов Всеволод Ігорович
Тип роботи: 
Дис. канд. наук
Рік: 
2007
Артикул:
0407U003866
129 грн
Додати в кошик

Вміст

Раздел 2
Развитие методов построения функционалов связи «состав-свойство» в условиях
малой выборки
Безусловно, при выборе метода решения поставленной задачи на первом этапе
работы необходимо оценить имеющиеся данные с целью получения ответа на
следующие вопросы:
какое количество факторов влияет на искомое значение;
каково влияние каждого из факторов, и какие из них можно отбросить как
малозначимые с целью построения факторного пространства как можно меньшей
размерности;
каков объем имеющейся выборки;
насколько точны имеющиеся данные.
Ответ на каждый из предложенных вопросов предполагает обращение к данным
конкретной задачи. Ниже представлен анализ имеющихся данных по задаче
определения температуры плавления переэтерифицированных жиров, детальное
описание которой приведено в четвертом разделе работы. При этом следует
заметить, что, хотя анализ и проводится для конкретной узкой задачи, для многих
других задач из разных областей знаний результаты анализа имеющихся данных
будут аналогичны.
Анализ хроматограмм большинства жиров показывает, что каждый из них состоит из
20-30 различных веществ. Все данные вещества могут быть разделены на несколько
групп:
кислоты, встречающиеся в большинстве жиров в концентрациях, превышающих 0.1%;
кислоты, встречающиеся в небольшом количестве жиров в концентрациях 0.001-0.1%,
возможно в 2-3 жирах из исследуемой группы – в концентрациях 0.1-0.5%;
неопределенные примеси.
Кроме того, результаты хроматографии показывают, что в жире могут содержаться
различные цис- и транс- изомеры одной кислоты.
Очевидно, что влияние неизвестных примесей учесть невозможно. Данные о
содержании в жирах кислот второй группы также было решено не использовать при
построении модели по следующим причинам. Во-первых, при сборе данных
использовалась информация, полученная из разных источников, причем значительная
часть источников не приводит информацию о содержании указанных кислот.
Во-вторых, концентрации этих кислот в большинстве жиров невелики и они не могут
существенно влиять на свойства всего жира. В-третьих, увеличение количества
учитываемых в модели кислот приводит к росту размерности задачи, что,
безусловно, снизит точность прогнозирования. По этим же причинам различные
изомеры одной кислоты не рассматривались как разные вещества, хотя их свойства
могут отличаться. С учетом сделанных замечаний в первую группу были отобраны 11
кислот, которые и определяют состав жира. Данные о концентрациях этих кислот
были пронормированы таким образом, чтобы суммарная их концентрация составляла
бы 100%, поскольку многие источники приводят данные уже в таком виде. Следует
отметить, что для всех образцов жира, использованных для нахождения
функциональной зависимости, суммарная концентрация веществ второй и третьей
групп не превышала 3%.
Таким образом, кислотный состав каждого жира был оценен 11-компонентным
вектором. То есть для построение модели расчета температуры плавления жира есть
задача восстановления вида функциональной зависимости с векторным
11-компонентным входом и скалярным выходом на основании имеющейся выборки.
Ввиду того, что объем имеющейся выборки невелик (79 точек), то выборку можно
охарактеризовать как экстремально малую, что является особенностью не только
конкретной задачи (подобная проблема возникает при решении задач в любой
области). Поэтому построение модели типа «состав-свойство» в условиях малой
выборки представляется нетривиальной и важной задачей.
2.1 Анализ методов построения моделей «состав-свойство» в условиях экстремально
малой выборки.
При решении задач восстановления вида функциональной зависимости в условиях
малой выборки при выборе модели целесообразно провести анализ системы с целью
сокращения размерности факторного пространства и определения класса функций для
поиска.
Без использования методов кластерного анализа или выявления главных компонент
удалось установить, что размерность факторного пространства можно снизить с 11
до 10 ввиду того, что сумма концентраций всех используемых для построения
модели кислот близка к единице, поэтому можно провести нормирование этих
концентраций таким образом, чтобы сумма концентраций была равна единице. В этом
случае концентрация одного из компонентов смеси может быть определена как
линейная комбинация, а значит, размерность входного вектора системы можно
сократить.
Далее с целью определения класса функций для поиска был проведен визуальный
анализ зависимости результирующей величины (температуры плавления) от каждого
из компонентов. Для проведения такого анализа целесообразно изменять значения
одного из компонентов входного вектора, не изменяя значений остальных. Однако,
выполнение этого условия невозможно ввиду того что:
в системе используются данные пассивных экспериментов;
изменение концентрации одного ингредиента всегда приводит к изменению
концентрации хотя бы одного из остальных ингредиентов.
Поэтому значения остальных компонентов вектора принимали случайные значения в
каждом из экспериментов. В этом случае можно произвести только качественный
анализ зависимости выходной переменной от каждой из входных. Графики
зависимостей для двух переменных приведены на рис. 2.1.

(а) (б)
Рис. 2.1 Зависимость температуры плавления жира от содержания жирных кислот:
(а) – стеариновой, (б) – олеиновой.
Как приведенные, так и остальные графики не дают возможности указать на
конкретный тип зависимости. Причем с большой вероятностью на температуру
плавления влияют не только сами переменные, но и функции нескольких переменных.
Как природа процесса, так и приведенные графики показывают, что зависимость не