Количество возможных изомеров
Download
Report
Transcript Количество возможных изомеров
Предсказание индекса удерживания компонентов
бензинов с помощью топологических индексов
Владимир Чупин
Менеджер по продажам PAC
Олег Милосердов
Институт проблем управления РАН
Понимание состава углеводородов имеет
исключительную важность для
нефтеперерабатывающих предприятий с
экономической и технологической точек
зрения, поскольку более 50% их
эксплуатационных расходов приходится на
сырьё, а качество сырья играет важнейшую
роль в производстве.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Важность понимания состава углеводородов
50% расходов
определение состава
сырьё
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Количество возможных изомеров
Число атомов
углерода
Парафины
Олефины
5
3
6
6
5
17
7
9
36
8
18
92
10
75
Более 600
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
Количество возможных изомеров
План
Постановка задачи
QSPR/QSRR анализ
Выбор регрессий
Перечисление графов
Формирование базы данных
Instant JChem
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Задача
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Задача
• Идентификация пиков на хроматограмме
Задача
Решение
• По базе данных экспериментальных значений индекса
удерживания
• По предсказанным значениями индекса удерживания
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
QSPR & QSRR
Прогнозирование свойств химических соединений основано на
применении методов математической статистики и машинного
обучения для построения моделей, позволяющих по описанию
структур химических соединений предсказывать их свойства
(физические, химические, биологическую активность)
•
количественные соотношения структура – свойство
Quantitative Structure-Property Relationship (QSPR)
•
количественные соотношения структура – индекс удерживания
Quantitative Structure-Retention Relationship (QSRR)
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Виды молекулярных индексов
Физико-химические дескрипторы — это
числовые характеристики, получаемые в
результате моделирования физикохимических свойств химических соединений,
либо величины.
Примеры: молекулярный вес (MW),
молекулярные объёмы и площади
поверхностей молекулы.
Квантово-химические дескрипторы — это
числовые величины, получаемые в
результате квантово-химических расчетов.
Примеры: энергии граничных молекулярных
орбиталей, частичные заряды на атомах и
частичные порядки связей и другие.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Виды молекулярных индексов
Топологические индексы — инвариант молекулярного
графа в задачах компьютерной химии, некоторое числовое
значение (или набор значений), характеризующее
структуру молекулы.
Примеры: индекс Винера, индекс Рандича, индекс
Балабана и другие.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Виды топологических индексов
Степень=3
Индексы, основанные множестве степеней
вершин
Индекс Рандича
Индексы, связанные с матрицей расстояния D
Индекс Винера
Индексы, зависящие от спектральных
характеристик графа
Спектральный радиус матрицы смежности
Информационные топологические индексы
Фрагментные индексы
Фрагмент
С
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Задачи QSRR
Прямая задача QSRR
Получить числовое значение индекса
удерживания по структуре вещества
Обратная задача QSRR
Получить вещество, соответствующее
данному значению индекса удерживания
Неполный перебор
Полный перебор
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Обратная задача QSRR
Построение регрессии
2. Генерация структур химических соединений
3. Построение базы данных веществ с
предсказанным значением индекса удерживания
1.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Границы исследования
3 класса веществ (из 12)
Алканы, алкены, алкилбензолы
Количество атомов углерода
От 4 до 14
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Регрессии
Обзоры Karoly Heberger по современному состоянию QSRR за
2007 и 2012 годы
Алканы и алкены
«Semi-empirical topological method for the prediction of the
chromatographic retention of cis- and trans-alkene isomers and
alkanes» Vilma E.F. Heinzen, Miriam F. Soares, Rosendo A. Yunes
(1999 Elsevier Science B.V.)
Алкилбензолы
«Semi-empirical topological index: Development of QSPR/QSRR and
optimization for alkylbenzenes» Ledilege Cucco Portoa, E ́rica Silva
Souzaa, Berenice da Silva Junkesb, Rosendo Augusto Yunesa, Vilma
Edite Fonseca Heinzena,( 2008 Elsevier B.V.)
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Идея
Индекс удерживания связан с количеством
атомов углерода. Атом углерода вносит
линейный вклад в индекс удерживания, но из-за
стерических эффектов этот вклад уменьшается,
поэтому для каждого фрагмента необходимо
определить его вес, который он вносит в
значение полуэмпирического индекса.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Формула
где Ci – вес фрагмента i-ого типа,
ni – количество фрагмента i-ого типа,
di – степень i-ого фрагмента
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Таблица значений весов для
фрагментов в алканах и алкенах
a- если
атомов углерода в молекуле
больше 10, то значения для цис- и
транс- изомеров должны быть
поменяны местами.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Таблица значений для фрагментов в
алкилбензолах
Фрагмент Позиция Ci
Фрагмент Позиция Ci
a метил.
1
para
0,8237
CH3
b этил.
d
0,9
=C<
mono
0,8045
–CH2– c 3-10 атомов углерода в
0,8
=C<e
mono
0,7576
–CH<
углеродной цепи.
f
d11-13 атомов углерода в
0,7
=C<
2
0,6275
>C<
0,9683
3
0,5407
–CH=
углеродной цепи.
a
eα, β и γ разветвления позиции
mono
0,9263
4
0,4959
=C<
ortho
0,9535
5
0,4738
(до 6 атомов углерода).
f α ветвления позиция (10-13
meta
0,9176
6
0,4564
para
0,9173
=C<g
mono
0,7788
атомов углерода).
b
=C<
mono
0,8927
meta
0,7181
g четвертичный атом углерода.
ortho
0,8767
para
0,7624
h изопропил.
h
meta
0,8564
=C<
mono
0,8019
para
0,8774
ortho
0,7357
c
=C<
mono
0,8401
meta
0,7304
ortho
0,77
para
0,7836
meta
0,8062
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Регрессии
Алкены
ICALC = 122.8446 * IET - 41.7054;
N=79; r=0.99996
Алканы
ICALC= 116.8* IET – 19,05;
N=157; r=0.9901
Алкилбензолы
ICALC= 23.0824* IET −39.7381 ;
N=122 r=0.9998
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Регрессии
Графики зависимости экспериментального индекса удерживания алкенов и
алкилбензолов от предсказанного.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Обратная задача QSRR
Построение регрессии
2. Генерация структур химических соединений
3. Построение базы данных веществ с
предсказанным значением индекса удерживания
1.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Генерация структур
Генерация двоичных деревьев
Переход от двоичных деревьев к произвольным
Генерация алканов
Генерация алкенов
Учет двойной связи
Учет цис-/транс-изомерии
Генерация алкилбензолов
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Результат генерации структур
Итого было получено более 36 000 структур
Алканы
N
4
5
6
7
8
9
10
11
12
13
14
Всего
2
3
5
9
18
33
73
144
323
708
1663
2981
Алкены
6
10
26
50
116
246
592
1314
3182
7562
18810
31914
Алкилбензолы
1
1
4
8
22
51
136
334
869
1426
Сводная таблица, демонстрирует
количество сгенерированных структур
трех классов веществ, в зависимости от
числа атомов углерода (N)
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Обратная задача QSRR
Построение регрессии
2. Направленная генерация структур химических
соединений
3. Построение базы данных веществ с
предсказанным значением индекса удерживания
1.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Instant JСhem
Необходима идентификация сгенерированных структур
Своими силами требует много времени
Поэтому построили SMILES для каждой структуры
Для обработки полученной базы данных мы выбрали
программу Instant Jchem компании ChemAxon
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Instant JСhem
Instant JChem свляется прекрасным инструментом,
который позволяет исследователям работать с базами
данных химических структур:
Создавать
Управлять
Анализировать
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Instant JСhem
Импорт данных
Существующие базы данных (Microsoft SQL
Server, MySQL, Oracle и другие)
Различные стандартные файлы формата *.xls,
*.txt, *.pdf и т.д.
Специализированные файлы формата*.inchi,
*.smiles, *.mol и т.д.
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Instant JСhem
Для импорта мы использовали файл формата *.xls. После
импортирования данных и некоторых преобразований
таблицы к удобному виду мы получили таблицу со
следующими атрибутами:
Класс веществ (ALKANE, ALKENE, BENZENE)
Количество атомов углерода N
Причастность к цис-/транс- изомерии (для алкенов)
SMILES
Индекс удерживания RI
Предсказание индекса удерживания компонентов бензинов с помощью топологических индексов.
Владимир Чупин, Олег Милосердов ИПУ РАН 25.06.2014
Представление базы данных в Instant JChem