база знаний: эксперимент, интеллектуальный анализ данных

Download Report

Transcript база знаний: эксперимент, интеллектуальный анализ данных

Чувашский государственный университет имени И.Н.
Ульянова
Кафедра прикладной физики и нанотехнологий
БАЗА ЗНАНИЙ:
ЭКСПЕРИМЕНТ, ИНТЕЛЛЕКТУАЛЬНЫЙ
АНАЛИЗ ДАННЫХ, ИСКУССТВЕННЫЕ
НЕЙРОННЫЕ СЕТИ
В.С. АБРУКОВ,
С.В. АБРУКОВ,
А.В. СМИРНОВ,
Е.В. КАРЛОВИЧ
Постановка задачи работы
Вопросы
• Как лучше обобщить экспериментальные
данные?
• Можно ли их обобщить так, чтобы можно
было решать, как прямые, так и обратные
задачи?
• Можно ли их обобщить так, чтобы иметь
возможность прогнозировать результаты
еще не проведенных экспериментов и
определять технологии получения объекта
с заранее заданными свойствами?
База знаний
Под базой знаний мы понимаем информационное средство,
которое:
• содержит в себе все зависимсоти между всеми
переменными объекта,
• позволяет вычислять значения одних переменных через
другие,
• позволяет решать, как прямые, так и обратные задачи,
• позволяет прогнозировать характеристики и свойства еще
не исследованных объектов
• позволяет прогнозировать параметры технологического
процесса для получения объекта с требуемыми
характеристиками
Data Mining
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ
ДАННЫХ
•
•
•
•
•
Средства предобработки и анализа данных
Искусственные нейронные сети (ИНС)
Самоорганизующиеся карты Кохонена
Деревья решений
и другие средства
ИНС играют ведущую роль при создании
многофакторных вычислительных моделей
экспериментальных данных
ИНС - единственно возможные «аппроксиматоры»
многомерных экспериментальных функций
Искусственные нейронные сети
•
В основе - теорема Колмогорова – Арнольда, адаптированная
применительно к ИНС теоремой Хехт-Нильсена
• ИНС позволяют использовать разнородные данные (качественные и
количественные), «непредставительные» (неполные) выборки,
анализировать сильно нелинейные связи.
• Реальный компьютерный эмулятор ИНС, работает (вычисляет) как
обычная компьютерная программа. Разница в том, что создание ИНС
– модели данных основано на использовании процедуры обучения на
наборе примеров (таблице примеров, базе данных примеров).
ИНС применяются в трех случаях:
• Когда невозможно аналитическое описание задачи.
• Когда аналитическое описание возможно, но нет алгоритма его
решения. Пример - уравнение Шредингера или дифференциальное
уравнение распространения волны горения.
• Когда аналитическое описание возможно и есть алгоритм ее решения,
но время, необходимое для компьютерной реализации алгоритма
слишком велико и не удовлетворяет условиям задачи (например,
задачи управления быстропротекающими процессами).
Пример части биологической нейронной сети
Схема биологического нейрона
Схема искусственного нейрона
•
Искусственный нейрон состоит из входов, синапсов,
сумматора, аксона, нелинейного преобразователя
(функции активации).
• Здесь: xi - компоненты входного вектора (входные
данные); wi - веса синапса (i = 1 ..., n); S - результат
суммирования; Y – передаточный сигнал нейрона; F нелинейный преобразователь (функция активации).
Виды искусственных нейронных сетей
Модели характеристик наноматериалов
Наши ИНС-модели основаны на экспериментах по
исследованию
электрофизических
и
оптических
характеристик наноплёнок линейно-цепочечного углерода
(ЛЦУ) с внедрёнными в них атомами металлов и
неметаллов (ЛЦУА).
Впервые
ЛЦУА
были
получены
в
Чувашском
государственном университете, в межвузовской (ЧГУ-МГУ)
лаборатории высоких технологий (научный руководитель
проф. Кочаков В.Д), с использованием запатентованной
технологии и различных ноу-хау.
ЛЦУА могут представлять большой интерес для элементов
твердотельной
электроники,
элементов
солнечных
батарей,
фотодатчиков,
сенсоров,
медицинских
приложений и т.д.
Пример данных, использованных для создания модели «Вольтамперная
характеристика ЛЦУА». Табл. 1.
(видно только начало таблицы, всего в таблице 698 строк).
Структура ИНС – многофакторной вычислительной модели
вольтамперных характеристик ЛЦУА обобщающей все
экспериментальные данные. На черном фоне слева – факторы,
определяющие значение электрического тока.
Экран многофакторной вычислительной модели «Вольтамперная
характеристика ЛЦУА» для случая внедрения атомов кадмия (48) и
теллура (52). Над графиком – набор конкретных значений факторов и
вычисленное значение тока
Структура ИНС – многофакторной вычислительной модели вольтамперных
характеристик ЛЦУА, решающей обратную задачу – определение того, какой
дополнительно элемент надо внедрить в ЛЦУА, чтобы получить требуемую
вольтамперную характеристику. При обучении ИНС использовались те же данные
(Табл. 1), но менялось назначение данных: значение тока было входным
фактором, а номер и группа элемента 1 – выходными целевыми функциями
Экран модели решения обратной задачи – определение того, какой дополнительно
элемент надо внедрить в ЛЦУА, чтобы получить требуемую вольтамперную
характеристику (требуемое значение тока при заданном напряжении). Показан
график зависимости номера и группы дополнительно внедряемого элемента от
толщины пленки ЛЦУ. Зеленая линия - номер группы.
Экран многофакторной вычислительной модели «Вольтамперная характеристика
ЛЦУА» для случая внедрения атомов лития (3) и астата (85). Над графиком – набор
конкретных данных. Все они выделены красным – в таблице, использованной для
обучения ИНС все эти значения отсутствовали.
Это прогноз не проведенного эксперимента!
Экраны «базы знаний» вольтамперных характеристик
(приведена только малая часть информации
содержащаяся в базе знаний)
Заключение
•
Аналогичные результаты получены нами для спектров пропускания ЛЦУА и
для «фотодатчиков» на основе ЛЦУ (создавались различные сэндвичи из ЛЦУ
и серебра, кадмия, меди и никеля в различных сочетаниях).
• Совокупность всех этих моделей можно представить, как Базу Знаний
характеристик наноматериалов на основе ЛЦУ, которая:
- содержит в себе зависимсоти между переменными объекта,
- позволяет вычислять значения одних переменных через другие,
- позволяет решать, как прямые, так и обратные задачи,
- позволяет прогнозировать характеристики и свойства еще не исследованных
объектов
- позволяет прогнозировать параметры технологического процесса для
получения объекта с требуемыми характеристиками
Эти модели пока не позволяют определять первые и вторые производные
экспериментальных зависимостей, эта задача будет решаться в ближайшем
будущем.
Мы приглашаем к сотрудничеству всех, кто заинтересован в создании
«локальной» базы знаний своих экспериментальных результатов, а также
решением задачи определения производных своих экспериментальных
зисимостей.
Работа выполнена при финансовой поддержке РФФИ (проект № 13-02-97071).
База знаний эксплуатации солнечной
электростанции в феврале 2013.
Исходные данные: база данных
База знаний эксплуатации солнечной
электростанции в феврале 2013.
Исходные данные – статистика
База знаний эксплуатации солнечной
электростанции в феврале 2013.
Исходные данные – корреляционный анализ
База знаний эксплуатации солнечной электростанции в
феврале 2013
Структура ИНС
База знаний эксплуатации солнечной электростанции в
феврале 2013
Качество ИНС-модели
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики (только малая часть)
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной электростанции в феврале 2013
Зависимости, графики
База знаний эксплуатации солнечной
электростанции
• Мгновенно вычисляет и представляет в виде
графиков сотни случаев эксплуатации
солнечной электростанции при различных
метеоусловиях и выдает решения для
оптимальных условий эксплуатации СЭ
Литература
Neural Networks for Instrumentation, Measurement
and Related Industrial Applications (2003)
(Нейронные сети для измерительных
устройств, измерений и промышленных
применений). Proceedings of the NATO
Advanced Study Institute on Neural Networks for
Instrumentation, Measurement, and Related
Industrial Applications (9-20 October 2001,
Crema, Italy)/ ed. by Sergey Ablameyko, Liviu
Goras, Marco Gori and Vincenzo Piuri, IOS
Press, Series 3: Computer and Systems Sciences –
Vol. 185, Amsterdam.
Заключение. Научные исследования
Методы интеллектуального анализа данных - это
новый подход к проведению фундаментальных и
прикладных научных исследований
Его достоинства заключаются в следующем:
- возможность создания многофакторных моделей
эксперимента
- возможность решения как прямых, так и обратных
задач
- возможность прогнозирования результатов еще не
проведенных экспериментов
Заключение. Представление результатов научных
исследований
Методы интеллектуального анализа данных - это возможность
реализации нового подхода к представлению результатов
научных исследований в научных журналах и отчетах НИР в
виде прилагаемого к статье компьютерного исполняемого
модуля многофакторной вычислительной модели
экспериментальных данных.
Его достоинства в следующем:
- возможность представления результатов эксперимента в
наиболее полном и компактном виде
- возможность для читателя ознакомится со всеми
закономерностями, содержащимися в экспериментальных
данных, а не только с теми, которые представлены авторами
статьи или отчета по НИР
- возможность построения читателем своих сценариев анализа
экспериментальных данных и проверке качества эксперимента
Наши контакты
Чувашский государственный университет, корп. 1, каф.
прикладной физики и нанотехнологий
ул. Университетская, 38, комн. 225
Тел. 8352-455600 доб.3602
Fax: 8352-452403
E-mail: [email protected]
Спасибо за внимание!