Количество возможных изомеров

Download Report

Transcript Количество возможных изомеров

Предсказание индекса удерживания компонентов
бензинов с помощью топологических индексов
Владимир Чупин
Менеджер по продажам PAC
Олег Милосердов
Институт проблем управления РАН

Понимание состава углеводородов имеет
исключительную важность для
нефтеперерабатывающих предприятий с
экономической и технологической точек
зрения, поскольку более 50% их
эксплуатационных расходов приходится на
сырьё, а качество сырья играет важнейшую
роль в производстве.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Важность понимания состава углеводородов
50% расходов
определение состава
сырьё
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Количество возможных изомеров
Число атомов
углерода
Парафины
Олефины
5
3
6
6
5
17
7
9
36
8
18
92
10
75
Более 600
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
План
 Постановка задачи
 QSPR/QSRR анализ
 Выбор регрессий
 Перечисление графов
 Формирование базы данных
 Instant JChem
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Задача
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Задача
• Идентификация пиков на хроматограмме
Задача
Решение
• По базе данных экспериментальных значений индекса
удерживания
• По предсказанным значениями индекса удерживания
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
QSPR & QSRR

Прогнозирование свойств химических соединений основано на
применении методов математической статистики и машинного
обучения для построения моделей, позволяющих по описанию
структур химических соединений предсказывать их свойства
(физические, химические, биологическую активность)
•
количественные соотношения структура – свойство
Quantitative Structure-Property Relationship (QSPR)
•
количественные соотношения структура – индекс удерживания
Quantitative Structure-Retention Relationship (QSRR)
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Виды молекулярных индексов
 Физико-химические дескрипторы — это
числовые характеристики, получаемые в
результате моделирования физикохимических свойств химических соединений,
либо величины.
Примеры: молекулярный вес (MW),
молекулярные объёмы и площади
поверхностей молекулы.
 Квантово-химические дескрипторы — это
числовые величины, получаемые в
результате квантово-химических расчетов.
Примеры: энергии граничных молекулярных
орбиталей, частичные заряды на атомах и
частичные порядки связей и другие.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Виды молекулярных индексов
 Топологические индексы — инвариант молекулярного
графа в задачах компьютерной химии, некоторое числовое
значение (или набор значений), характеризующее
структуру молекулы.
Примеры: индекс Винера, индекс Рандича, индекс
Балабана и другие.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Виды топологических индексов
Степень=3
 Индексы, основанные множестве степеней
вершин

Индекс Рандича
 Индексы, связанные с матрицей расстояния D

Индекс Винера
 Индексы, зависящие от спектральных
характеристик графа

Спектральный радиус матрицы смежности
 Информационные топологические индексы

Фрагментные индексы
Фрагмент
С
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Задачи QSRR
 Прямая задача QSRR
 Получить числовое значение индекса
удерживания по структуре вещества
 Обратная задача QSRR
 Получить вещество, соответствующее
данному значению индекса удерживания
 Неполный перебор
 Полный перебор
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Обратная задача QSRR
Построение регрессии
2. Генерация структур химических соединений
3. Построение базы данных веществ с
предсказанным значением индекса удерживания
1.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Границы исследования
 3 класса веществ (из 12)
 Алканы, алкены, алкилбензолы
 Количество атомов углерода
 От 4 до 14
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Регрессии
 Обзоры Karoly Heberger по современному состоянию QSRR за
2007 и 2012 годы


Алканы и алкены
«Semi-empirical topological method for the prediction of the
chromatographic retention of cis- and trans-alkene isomers and
alkanes» Vilma E.F. Heinzen, Miriam F. Soares, Rosendo A. Yunes
(1999 Elsevier Science B.V.)
Алкилбензолы
«Semi-empirical topological index: Development of QSPR/QSRR and
optimization for alkylbenzenes» Ledilege Cucco Portoa, E ́rica Silva
Souzaa, Berenice da Silva Junkesb, Rosendo Augusto Yunesa, Vilma
Edite Fonseca Heinzena,( 2008 Elsevier B.V.)
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Идея
 Индекс удерживания связан с количеством
атомов углерода. Атом углерода вносит
линейный вклад в индекс удерживания, но из-за
стерических эффектов этот вклад уменьшается,
поэтому для каждого фрагмента необходимо
определить его вес, который он вносит в
значение полуэмпирического индекса.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Формула
где Ci – вес фрагмента i-ого типа,
ni – количество фрагмента i-ого типа,
di – степень i-ого фрагмента
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Таблица значений весов для
фрагментов в алканах и алкенах
a- если
атомов углерода в молекуле
больше 10, то значения для цис- и
транс- изомеров должны быть
поменяны местами.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Таблица значений для фрагментов в
алкилбензолах
Фрагмент Позиция Ci
Фрагмент Позиция Ci
a метил.
1
para
0,8237
CH3
b этил.
d
0,9
=C<
mono
0,8045
–CH2– c 3-10 атомов углерода в
0,8
=C<e
mono
0,7576
–CH<
углеродной цепи.
f
d11-13 атомов углерода в
0,7
=C<
2
0,6275
>C<
0,9683
3
0,5407
–CH=
углеродной цепи.
a
eα, β и γ разветвления позиции
mono
0,9263
4
0,4959
=C<
ortho
0,9535
5
0,4738
(до 6 атомов углерода).
f α ветвления позиция (10-13
meta
0,9176
6
0,4564
para
0,9173
=C<g
mono
0,7788
атомов углерода).
b
=C<
mono
0,8927
meta
0,7181
g четвертичный атом углерода.
ortho
0,8767
para
0,7624
h изопропил.
h
meta
0,8564
=C<
mono
0,8019
para
0,8774
ortho
0,7357
c
=C<
mono
0,8401
meta
0,7304
ortho
0,77
para
0,7836
meta
0,8062
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Регрессии
 Алкены
 ICALC = 122.8446 * IET - 41.7054;
N=79; r=0.99996
 Алканы
 ICALC= 116.8* IET – 19,05;
N=157; r=0.9901
 Алкилбензолы
 ICALC= 23.0824* IET −39.7381 ;
N=122 r=0.9998
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Регрессии
Графики зависимости экспериментального индекса удерживания алкенов и
алкилбензолов от предсказанного.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Обратная задача QSRR
Построение регрессии
2. Генерация структур химических соединений
3. Построение базы данных веществ с
предсказанным значением индекса удерживания
1.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Генерация структур
 Генерация двоичных деревьев
 Переход от двоичных деревьев к произвольным
 Генерация алканов
 Генерация алкенов
 Учет двойной связи
 Учет цис-/транс-изомерии
 Генерация алкилбензолов
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Результат генерации структур
 Итого было получено более 36 000 структур
Алканы
N
4
5
6
7
8
9
10
11
12
13
14
Всего
2
3
5
9
18
33
73
144
323
708
1663
2981
Алкены
6
10
26
50
116
246
592
1314
3182
7562
18810
31914
Алкилбензолы
1
1
4
8
22
51
136
334
869
1426
Сводная таблица, демонстрирует
количество сгенерированных структур
трех классов веществ, в зависимости от
числа атомов углерода (N)
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Обратная задача QSRR
Построение регрессии
2. Направленная генерация структур химических
соединений
3. Построение базы данных веществ с
предсказанным значением индекса удерживания
1.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Instant JСhem
 Необходима идентификация сгенерированных структур
 Своими силами требует много времени
 Поэтому построили SMILES для каждой структуры
 Для обработки полученной базы данных мы выбрали
программу Instant Jchem компании ChemAxon
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Instant JСhem
 Instant JChem свляется прекрасным инструментом,
который позволяет исследователям работать с базами
данных химических структур:
 Создавать
 Управлять
 Анализировать
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Instant JСhem
 Импорт данных
 Существующие базы данных (Microsoft SQL
Server, MySQL, Oracle и другие)
 Различные стандартные файлы формата *.xls,
*.txt, *.pdf и т.д.
 Специализированные файлы формата*.inchi,
*.smiles, *.mol и т.д.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Instant JСhem
 Для импорта мы использовали файл формата *.xls. После
импортирования данных и некоторых преобразований
таблицы к удобному виду мы получили таблицу со
следующими атрибутами:
 Класс веществ (ALKANE, ALKENE, BENZENE)
 Количество атомов углерода N
 Причастность к цис-/транс- изомерии (для алкенов)
 SMILES
 Индекс удерживания RI
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Представление базы данных в Instant JChem