Ви є тут

Кiлькiсна оцiнка впливу структурних факторiв на властивостi макрогетероциклiв що мiстять нiтроген, оксиген та сульфур

Автор: 
Муратов твген Наiлевич
Тип роботи: 
Дис. канд. наук
Рік: 
2004
Артикул:
0404U004278
129 грн
Додати в кошик

Вміст

РАЗДЕЛ 2
ИЕРАРХИЧЕСКАЯ СИСТЕМА ЗАДАЧ QSAR/QSPR НА ОСНОВЕ СИМПЛЕКСНОГО ПРЕДСТАВЛЕНИЯ МОЛЕКУЛЯРНОЙ СТРУКТУРЫ

В данном разделе рассматривается ИС моделей QSAR/QSPR от 1D до 4D на основе СПМС [81828384858687888990-91]. Суть ее состоит в том, что задача QSAR решается последовательно в ряду усложняющихся моделей описания МС. При этом, на каждой последующей ступени ИС, QSAR/QSPR задача решается не ab ovo, а используется информация, полученная на предыдущем шаге. Фактически, речь идет о системе уточняющихся решений.
Данный подход [81828384858687888990-91] позволяет более эффективно интерпретировать полученные QSAR/QSPR соотношения, так как становится понятным для каких молекулярных фрагментов, влияющих на изучаемое свойство, детализация структуры важна, а для каких нет. Кроме того, сравнение результатов последовательных шагов решения QSAR/QSPR задачи, позволяет судить о целесообразности или нецелесообразности усложнения молекулярных моделей для увеличения адекватности QSAR/QSPR соотношений.

2.1. Симплексное представление молекулярной структуры

Каждая молекула представляется в виде системы различных симплексов - четырёхатомных молекулярных фрагментов фиксированной структуры, хиральности и симметрии. Общее количество всех возможных симплексов N в n-атомной молекуле равно:
N=

На 1D уровне симплексами являются любые четверки атомов, входящих в состав молекулы (рис. 2.1). Симплексными дескрипторами (СД) на этом уровне являются количества четверок атомов конкретного состава. Для соединения (AaBbCc...XxYyZz), значение СД AiBjClDm где (i?a, j?b, l?c, m?d..., i + l + j + m = 4) проводился по следующей схеме [92]:
К= f(i)·f(j)·f(l)·f(m),
где

Значения f(j), f(l), f(m) вычисляются аналогично. По этой же схеме можно определить количество более мелких фрагментов - "двоек", "троек", при этом какие-то из параметров i, j, l, m приравниваются к нулю. Модели, получаемые на данном уровне, носят лишь вспомагательный характер и малоинформативны, поэтому в настоящей работе использоваться не будут.
На 2D уровне учитываются: возможные варианты связывания атомов в симплексе (11 базовых топологических типов, табл. 2.1), типы атомов и природа связей (одинарная, двойная, тройная, ароматическая). Атомы, входящие в состав симплексов, могут быть дифференцированы на основе следующих характеристик3: природа "метка" атома"; парциальный заряд; липофильность; атомная рефракция; электроотрицательность атома; донор/акцептор Н в водородной связи и т.д. Таким образом, на этом уровне, СД являются количества симплексов фиксированных состава и топологии. На дальнейших примерах продемонстрировано представление молекулы, как набора симплексов (см. рис. 2.1 и рис. 2.2).
Действительно, генерируемые в симплексном подходе СД несколько похожи на фрагментарные параметры, используемые в HQSAR [23]. Отличие заключается в том, что во время генерации дескрипторов учитываются как связные, так и не связные фрагменты (см. табл. 2.1), а также принимается во внимание не только "метка" атома, но и различные его физические и химические свойства (липофильность, заряд и т.д.).
Таблица 2.1
Возможные базовые типы молекулярных симплексов
Базовый тип1234567891011СимплексПример На 3D уровне учитывается и стереохимия молекулы. Поэтому становится возможным дифференцировать все симплексы на правые (R), левые (L), симметричные ахиральные (S), плоские ахиральные (P). Например:
R L S P Стереохимическая конфигурация симплексов определяется по модифицированным правилам Кана-Ингольда-Прелога [93]. СД на этом уровне являются количества симплексов фиксированных состава, топологии, хиральности и симметрии.
В 4D-QSAR моделях каждый молекулярный структурный параметр (D-дескриптор) рассчитывается суммированием произведений значения дескриптора для каждого конформера (Dk) на вероятность реализации соответствующего конформера (Pk).
,
где N-количество рассматриваемых конформеров,
Dk - значение дескриптора для конформера k.
Как известно [41], вероятность реализации конформера Pk можно определить по соотношению:

где Ei , Ek - энергии конформеров i и k.
Анализируются все возможные конформеры в пределах энергетической щели в 5-7 ккал/моль. Примеры расчета и использования дескрипторов в рамках 4D-QSAR моделей приведены в работе [81]. Таким образом, СД на 4D уровне учитывают вероятность реализации СД 3D уровня в наборе конформеров.
УровеньСтруктураГенерация симплексов1D
C3H7O2N ?6 CCNO, 42 CNOH, 63 CNHH, 21 CCNH, 42 NOHH, 7 CCCH, 35 NHHH, ...2D?, , 2,,, , , 3 , ...3D?L, R,R,L,P , ...?
E=-6.35, P=0.63L, R, 2R,L,P , ...1L, 1R,
2R, 1.14L,
0.86 P , ...4D?
E=-5.75, P=0.23L, R, 2R,L,P , ...?
E=-5.49,
P=0.14L, R, 2R, 2L, ...Рис. 2.1. Примеры генерации симплексных дескрипторов для аланина на 1D-4D уровнях, используя дифференциацию атомов по их природе.
Дифференциация по парциальным зарядам?A?-0.1
-0.1-0.05-0.010.010.05G>0.1?1DA3CE3F3G2?A3C, 3A3E, 9A2E2, 3AE3, 27ACEF, 18CEFG, 9ACF2, 9CE2F, 54AEFG, ...
2D?3, 3,, , ,, , , ...3D?L, R, R, L, P , ...Рис. 2.2. Примеры генерации симплексных дескрипторов для аланина на 1D-4D уровнях, используя дифференциацию атомов по их парциальным зарядам.

Дескрипторы, основанные на расчете количества симплексов того или иного вида, по существу, являются локальными характеристиками МС. Однако, для адекватного описания влияния структуры на изучаемые свойства молекулы зачастую необходим учет структурных особенностей молекулы как целого и/или ее более крупных фрагментов, состоящих из набора симплексов. Для генерации таких интегральных параметров МС в рамках симплексного подхода была предложена следующая процедура, которую можно проиллюстрировать таким примером:
1. Все типы симплексов, которые в