Содержание
Введение
Глава1. Обзор методов выявления структурных единиц в символьных последовательностях
1.1. Элементарные структурообразующие единицы текста
1.2. Методы сегментирования символьных последовательностей
1.2.1. Морфологический анализ текста без пробелов
1.2.2. Сложностиые разложения символьных последовательностей .
1.2.3. Иерархическое представление последовательностей
с помощью порождающих грамматик.
1.2.4. Выявление моментов изменения свойств последовательности
1.3. Методы фрагментирования символьных последовательностей .
1.3.1. Статистические частотные методы фрагментирования .
1.3.2. Позиционные методы фрагментирования
1.3.3. Суперсинтаксические методы фрагментирования.
1.3.4. Методы фрагментирования, основанные на сопоставлении эволюционно иили функционально близких текстов
1.3.5. Поиск локальных аномалий в режиме скользящего окна
1.3.6. Агрегирование алфавита как способ выявления локальных структурных закономерностей .
1.3.7. Задание структурных элементов в виде образцов.
Выводы по первой главе .
Глава 2. Методы выделения структурных единиц на основе сложностных разложений текста
2.1. Различные модификации меры сложности ЛемпеляЗива .
2.1.1. Понятие повтора и его использование в сложностных разложениях
2.1.2. Векторная мера сложности
2.1.3. Мера сложности с пошаговой оптимизацией по ограниченному набору подстановок
2.1.4. Мера сложности с пошаговой оптимизацией по полному набору подстановок мера С .
2.2. Алгоритмы вычисления сложности символьной последовательности .
2.2.1. Алгоритм вычисления сложности при фиксированной подстановке
2.2.2. Алгоритм вычисления меры С .
2.3. Сложностные профили символьных последовательностей.
2.4. Случай нескольких последовательностей .
2.5. Некоторые свойства сложностных разложений .
2.6. Примеры применения сложностного анализа
к биологическим текстам .
2.6.1. Выявление блочной структуры и эволюционных
перестроек в промоторах.
2.6.2. Выявление взаимосвязей в Бфланкирующих районах
генов гормона роста.
2.6.3. Анализ полных геномов
2.6.4. Сравнительный анализ последовательностей дисков
политенных хромосом
Выводы по второй главе
Глава 3. Анализ серий в агрегированном алфавите .
3.1. Агрегирование алфавита .
3.2. Серийные характеристики
3.3. Использование серийных характеристик для анализа генетических текстов
3.3.1. Выявление аномалий в агрегированных ДНКпоследовательностях .
3.3.2. Анализ точечных мутаций .
3.3.3. Выявление регулярностей в локализации аминокислот
3.3.4. Кластеризуемость элементов в ДНКиоследовательностях совместный учет разных агрегирований
3.4. Сравнительный анализ серийных характеристик
3.5. Анализ взаимного расположения серий
Выводы по третьей главе .
Глава 4. Использование позиционной информации для
выделения структурных единиц и оценивания
их значимости .
4.1. Статистики для выявления неравномерностей позиционного распределения .
4.2. Схема анализа позиционного распределения заданной цепочки
по длине текста.
4.3. Описание экспериментов. Интерпретации результатов
4.3.1. Исходные данные .
4.3.2. Описание экспериментов.
4.3.3. Интерпретация результатов .
4.4. Примеры позиционных аномалий. Их взаимосвязь.
4.5. Пример практического использования позиционных аномалий .
4.6. Обсуждение результатов
Выводы по четвертой главе.
Глава 5. Представление структурных единиц в виде образцов и алгоритмы их поиска в тексте.
5.1. Постановка задачи поиска по частичноспецифицированному запросу
5.2. Алгоритмы поиска по групповому частично специфицированному запросу
5.2.1. Поиск группы константных образцов с помощью
алгоритма АхоКорасик
5.2.2. Поиск по групповому частично специфицированному запросу Алгоритм 1
5.2.3. Поиск по групповому частично специфицированному запросу Алгоритм 2
5.2.4. Апробация алгоритмов 1 и 2
5.3. Использование недетерминированных конечных автоматов
для поиска по групповому запросу
5.3.1. Поиск образца, содержащего неопределенные позиции .
5.3.2. Алгоритм 3 Поиск по группе образцов с элементами типа X
5.3.3. Алгоритм 4 Поиск по группе образцов с элементами типа X
5.3.4. Алгоритм 5 Поиск по групповому частично специфицированному запросу общий случай
5.4. Выявление совпадений, вложений и пересечений
среди образцов запроса.
5.4.1. Описание алгоритма выявления взаимосвязанных образцов
5.4.2. Апробация алгоритма.
5.5. Поиск образцов, содержащих переменные
5.5.1. Формулировка задачи.
5.5.2. Адаптивный алгоритм поиска образцов с одной переменной
в константном окружении.
Выводы по пятой главе .
Заключение
Список использованных источников
- Київ+380960830922