Ви є тут

Выделение структурированной предметной информации из текстов первичных источников на примере физических знаний

Автор: 
Коробкин Дмитрий Михайлович
Тип роботи: 
дис. канд. техн. наук
Рік: 
2006
Артикул:
563310
179 грн
Додати в кошик

Вміст

Введение
Глава 1. Анализ проблемы поддержки процесса формирования информационного обеспечения фонда физических эффектов
1.1. Структурированное представление физической информации в поисковом конструировании и изобретательской деятельности
1.1.1. Энергоинформационная модель цепей и метод структурных параметрических схем
1.1.2. Комбинаторный метод поиска принципов действия.
1.1.3. Теория решения изобретательских задач.
1.1.4. Функционально физический и компьютерные методы поискового конструирования
1.2. Методика модификации фонда физических эффектов.
1.2.1. Методика формирования объектноориентированного фонда физических эффектов.
1.2.1.1. Анализ имеющегося массива физических эффектов
1.2.1.2. Мобилизация первичной информации
1.2.1.3. Анализ первичной информации.
1.2.1.4. Составление описаний физических эффектов
1.2.2. Методика корректировки базы данных по физическим эффектам при включении новых объектноориентированных фондов.
1.2.2.1. Верификация фонда физических эффектов.
1.2.2.2. Коррекция фонда ФЭ
1.2.3. Систематизация фонда ФЭ.
1.3. Существующие подходы к автоматизации процедур формирования объектноориентированного фонда ФЭ
1.3.1. Подходы к автоматизации процедуры мобилизации первичной информации.
1.3.2. Анализ методов классификации и фильтрации документов
1.3.2.1. Метод Байеса
1.3.2.2. Метод опорных векторов V
1.3.2.3. Метод латентносемантического анализаиндексирования I
1.3.2.4. Метод вероятностного латентного семантического индексирования I
1.3.2.5. Метод индексации концептов С1.
1.3.2.6. Классификатор Гроссберга
1.3.2.7. Самоорганизующиеся карты Кохонена .
1.3.3. Подходы к автоматизации процедуры поиска первичных источников описаний физических эффектов.
1.3.4. Подходы к автоматизации процедуры анализа первичных источников описания физических эффектов.
1.3.4.1. Технология автоматической реконструкции содержания текстов на естественном языке
1.3.4.2. Технология извлечения из текста сетевых описаний фактов
1.3.4.3. Недостатки рассмотренных технологий применительно к задаче выделения физических эффектов из текстов первичных источников.
Выводы по первой главе.
Глава 2. Обобщенная методика поддержки процесса формирования
информационного обеспечения фонда физических эффектов.
2.1 Семантический анализ текста на естественном языке
2.2. Методика тематической фильтрации первичных
источников.
2.3. Фильтрация по маске описаний физических эффектов
2.4. Выделение описаний физических эффектов из текста первичных источников
2.4.1. Модель представления структурированной предметной информации.
2.4.2. Отношение семантической однозначности
2.4.3. Методика выделения структурированной физической информации в виде физических эффектов из текста
2.5. Верификация фонда физических эффектов.
2.5.1. Ранги подобия физических эффектов по полям Вход, Объект, Выход
Выводы по второй главе.
Глава 3. Разработка программного комплекса поддержки процесса формирования информационного обеспечения базы данных физических эффектов
3.1. Архитектура программного комплекса
3.2. Подсистема расширения фонда физических эффектов
3.3. Подсистема модернизации фонда физических эффектов
3.4. Подсистема верификации фонда физических эффектов.
3.4.1. Верификация физических эффектов по нолям Вход, Выход, Объект
3.4.2. Верификация физических эффектов по полям Сущность или Наименование.
3.4.3. Выявление физических эффектов с рассогласованными входными и выходными картами.
3.5. Подсистема систематизации фонда ФЭ.
3.6. База данных концептуальных отношений предметной области Физический эффект.
3.7. База данных концептов предметной области Физический эффект.
3.8. База данных ссылок на источники
3.8. База данных тезаурусов фонда физических эффектов.
Выводы по третьей главе.
Глава 4. Применение программного комплекса поддержки процесса формирования информационного обеспечения фонда физических
эффектов.
4.1. Результаты функционирования программного комплекса при решении задач расширения фонда физических эффектов
4.2. Результаты работы программного комплекса при решении задач модернизации фонда физических эффектов
4.3. Результаты проверки эффективности работы программного комплекса.
4.4. Использование результатов диссертационной работы.
4.4.1. Использование для физикотехнических эффектов.
4.4.2. Использование в предметной области Химия
Выводы по четвертой главе.
Основные результаты диссертационной работы.
Список публикаций по теме диссертации
Список сокращений и условных обозначений.
Библиографический список использованной литературы.
Приложение 1. Алгоритмы обобщенной методики поддержки процесса формирования информационного обеспечения фонда физических эффектов
Приложение 2. Акт внедрения результатов диссертационной работы.
Приложение 3. Свидетельство об отраслевой регистрации разработки.
АННОТАЦИЯ
В диссертации производится обзор работ, связанных с использованием структурированных физических знаний. Рассматриваются наиболее известные подходы к способам формализации моделей описания ФЭ и созданию автоматизированных информационных систем на их основе. Анализируется единственная существующая методика формирования фонда ФЭ, выявляются ее наиболее трудоемкие процедуры. Осуществляется обзор существующих методов и программных систем, позволяющих автоматизировать наиболее трудоемкие процедуры методики поиск первичных источников описания ФЭ и выделение структурированной физической информации в виде ФЭ из текстов на естественном русском языке. Делается вывод о нецелесообразности использования рассмотренных программных систем для автоматизации данных процедур.
Строится модель представления структурированной предметной информации, позволяющая выделять из текста информацию, которую можно представить в виде трехкомпонентной структуры А,В.С, где А входное воздействие, С выходное воздействие, В объект. Разрабатывается методика и алгоритм выделения структурированной физической информации в виде физических эффектов из текста первичных источников на основе построенной модели. Предлагается методика и алгоритм тематической фильтрации первичных источников. На основе предложенных модели, методик и алгоритмов разрабатывается обобщенная методика поддержки процесса формирования информационного обеспечения фонда физических эффектов, отличающаяся от известной тем, что позволяет автоматизировать ее наиболее трудоемкие процедуры и тем самым повысить качество описания физических эффектов. Использование созданного программного комплекса ПК ППФИО БДФЭ, реализующего разработанные модель, методики и алгоритмы, позволяет существенно расширить и модернизировать фонд физических эффектов.
ВВЕДЕНИЕ
Актуальность