A 2 - Факультет Информационных Систем и Технологий

Download Report

Transcript A 2 - Факультет Информационных Систем и Технологий

С.А.Пиявский

ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

(СЛОЖНЫМИ СИСТЕМАМИ) Для магистрантов направления 230400 – Информационные системы и технологии 2011 год

ЦЕЛЬ ДИСЦИПЛИНЫ «МПД» Дать теоретические знания и практические умения оптимального управления, преимущественно в сложных системах ЛЕКЦИИ Постановка задачи и структура оптимального управления сложными системами. Классические методы оптимизации (обзор и повторение). Оптимизация динамических систем. Методы принятия автономных решений. Теория игр. Парные игры с нулевой суммой. Игры нескольких игроков. Иерархические игры.

ЛАБОРАТОРНЫЕ РАБОТЫ ЛР1. Классические методы оптимизации (разработка математической модели и получение решения) ЛР2. Оптимизация динамических систем (Принцип максимума ) ЛР3. Методы принятия автономных решений (Выбор места работы и вакансии) ЛР4. Парные игры с нулевой суммой ЛР5. Некооперативные игры n игроков. ЛР6. Иерархические игры

Структура курса

1.

2.

3.

4.

5.

Основная литература

Бурков В.Н., Коргин Н.А., Новиков Д.А. Введение в теорию управления организационными системами / Под ред. чл.-корр. РАН Д.А. Новикова. – М.: Либроком, 2009. – 264 с.

Пиявский С.А. Методы оптимизации и принятия решений, Самара, СГАСУ, 2004 Ларичев О.И. Теория и методы принятия решений, М., Логос, 2000. - 295 с.

Ларичев О.И. Вербальный анализ решений, ИСИ РАН – Мю: Наука, 2006 – 181 с.

http://emm.ostu.ru/lect/lect5.html#vopros2

Постановка задачи в теории оптимального управления сложными системами

Хронология развития теории оптимального управления сложными системами ТАС – теория активных систем ТИ – теория искусственного интеллекта MD – Mechanism Design

Процессуальная схема деятельности

Классификация видов управления ОС

Функции управленческой деятельности

Анализ Регулирование Учет

Пример управления предприятием с использованием методов оптимизации

Области применения теории принятия решений

Процессуальная схема деятельности

ПРИНЯТИЕ РЕШЕНИЯ

Цикл принятия решения

Осознание цели принимаемого решения Формирование набора критериев оптимальности принимаемого решения Описание множества альтернативных вариантов принимаемого решения Разработка и валидизация математической модели объекта принятия решения (переменные, соотношения, ограничения, коэффицинты) Выбор конкретной технологии принятия решения Формирование текущей версии оптимального решения Осмысление текущей версии оптимального решения РЕШЕНИЕ !!!

Пример принятия решения об объеме выпуска продукции предприятием

Простые примеры

1.

2.

3.

4.

5.

Груз веса G, лежащий на горизонтальной плоскости, должен быть сдвинут приложенной силой F. Под каким углом к горизонту приложить ее ( с учетом трения), чтобы ее величина была наименьшей? От канала шириной a под прямым углом к нему отходит канал шириной b. Стенки каналов прямолинейны. Найти наибольшую длину бревна, которое можно сплавить по этим каналам из одного в другой. Под каким углом к оси OX надо провести прямую через точку (a,b), a, b >0, чтобы треугольник, образованный ею и осями координат, имел наименьший периметр?

Под каким углом к оси OX надо провести прямую через точку (a,b), a, b >0, чтобы её отрезок между положительными полуосями имел наименьшую длину?

Найти наибольшую площадь прямоугольника, вписанного симметрично в сектор круга радиуса с центральным углом 2  .

6.

7.

8.

9.

Сечение бетонного канала представляет собой равнобедренную трапецию площадью S и высотой h, которые заданы из гидрологических соображений. Каким должен быть угол между боковой стороной и основанием, чтобы сумма длин нижнего основания и боковых сторон, определяющая расход материала, была наименьшей?

На какой высоте нужно повесить высящую в стороне от стола лампочку, чтобы получить максимальную освещенность поверхности стола?

Как проложить шоссе при транспортировке грузов от железнодорожной станции А до отстоящего от железной дороги на заданное расстояние пункта С, если стоимость провоза по железной дороге равна λ, а по шоссе - β (на единицу пути)? (Исследовать при различных соотношениях λ и β).

Найти соотношение между углами в разных средах различна).

d

d

2 при преломлении света на границе двух сред (по принципу Ферма свет вбирает при преломлении между двумя точками путь, время прохождения которого минимально возможно, а скорость света 10.

Найти кратчайшее расстояние от заданной точки (1,0) до эллипса 4х2+9х2=36.

Принятие решений при управлении процессами

Пример 1. Расширение выпуска продукции и развитие технологического уровня предприятия

(Абсолютная величина с учётом того, что Uy может идти и на уменьшение объёма выпуска)

Принцип максимума Л.С.Понтрягина (необходимое условие оптимальности)

H

(

t

,

y

,

u

 )  

f

0 (

t

,

y

,

u

)   (

t

)

f

(

t

,

y

,

u

)   (

t

)  

дH

(

t

,

y

,

дy u

,  )

H

(

t

,

y

,

u

,  )  max

u

Q H

(

t

,

y

,

u

,  ) 

t

 (

t

0 ,

t

1 ) Условия трансверсальности

Ô

(

y

(

t

0 ),

y

(

t

1 )) 

F

(

y

(

t

0 ),

y

(

t

1 ))   (

t

1 )

y

(

t

1 )   (

t

0 )

y

(

t

0 ) 

y

(

t

min 0 ),

y

(

t

1 )

Принятие многокритериальных решений Вектор частных критериев

f

(

y

)  (

f

1 (

y

),

f

2 (

y

),...,

f N

(

y

)),

Пространство критериев Множество допустимых решений

f 1 y

Y

.

y1

Y

y2 y3 y1 y2 y3

f 2

f 2 (y)

Формирование множества Парето

f 1 (y)

АНР (Analytic Hierarchi Process)

Пример. Выбор площадки для аэропорта

Цель строительства аэропорта: прием и отправка большого числа пассажиров Критерий С1. Стоимость строительства Критерий С2. Время в пути от аэропорта до центра города Критерий С3. Количество людей, подвергающихся шумовым воздействием

Метод ELECTRE ранжирования многокритериальных альтернатив

Классические принципы оптимальности

Требования к методам принятия решений, пригодным для практического применения в системах поддержки принятия решений

Сопоставление различных методов принятия решений

МЕТОД ПРИНН ( П ринятия Р ешений в условиях Н еустранимой Н еопределенности)

Метод ПРИНН на линейной свертке двух критериев Равнозначные критерии Первый критерий «важнее» второго. Доказано, что его «весовой коэффициент ровно

в три раза

больше

Метод ПРИНН на свертке Гермейера двух критериев Равнозначные критерии

F

(

X

,

y

)  3 (max(

f

1 (

y

),

f

2 (

y

))) 2 4 (max(  (min(

f

1 (

y

),

f

2

f

(

y

))) 1 ( 2

y

),

f

2 (

y

))) 2 .

Первый критерий «важнее» второго

F

(

X

,

y

)   (   

f f

1 ( 1 (

y

)) 2

y

) 2

f

 2

при

(

f

(

y

)

f

2 (

y

)) 2 1 (

y

) 

при f

2 (

y

).

f

1 (

y

) 

f

2 (

y

),    

По методу АНР, весовой коэффициент у «лучшего» критерия ровно

в два раза

больше, чем у «худшего»

Дополнительные постулаты метода ПРИНН 1) 2) заменить множество всех допустимых СУН конечным набором типовых СУН, наилучшим образом представляющим все это множество, организовать выбор наиболее рационального решения как процедуру последовательного согласования оценок его эффективности при различных типовых СУН

1 0,8 0,6 0,4 0,2 0 наилучший оптимистический средний осторожный наихудший релейный нивелирующий

Формирование исходной информационной базы Цели Задачи Показатели целевые индикаторы ЛПР СО ЭЦ ЭМ Формирование компьютерной модели целевой программы на основе базовой компьютерной модели Разработка логической структуры математической модели целевой программы Разработка математического содержания базовой оптимизационной модели целевой программы Компьютерная реализация разработанной базовой оптимизационной математической модели И ЭМ Мероприятия Исполнители Ресурсы ЭИ Реализация информационно аналитической системы, увязывающей компьютерную математическую модель с информационно й базой формируемой целевой программы Валидизация базовой оптимизационной компьютерной математической модели целевой программы Реализация компьютерной оптимизационной математической модели целевой программы набора рациональных вариантов целевой программы ПРИНН Универсальный программный комплекс сравнительной оценки и выбора альтернатив в условиях неопределенности наиболее рационального варианта целевой программы ПРИНН Реализация интерактивной компьютерной системы аргументирова нного согласования заинтересованн ыми сторонами данных, моделей и методов ПРИНН Реализация программного комплекса корректировк и и целевых установок и приоритетов целевой программы с согласующим и организациям и целевой программы Формирование первоначального набора рациональных вариантов целевой программы информационной Уточнение методов, закладываемых в оптимизационную математическую модель целевой программы Формирование согласованного базового набора рациональных вариантов целевой программы для принятия окончательного решения ЭЦ ЭМ Реализация программного комплекса многокритериального выбора наиболее рационального варианта целевой программы из базового набора вариантов целевой программы Понимание и согласие ЛПР с основными положениями технологии подготовки и принятия решений по выбору наиболее рационального варианта целевой программы ЛПР ПРИНН Выбор ЛПР-ом наиболее рационального варианта целевой программы при подготовленной информационной и методической базе и осмысление полученного результата с неформальных позиций ЭИ формирование указаний по ЭМ модификации информационной и методической базы и повторный выбор наиболее рационального варианта целевой программы ЛПР При необходимости, корректировка целевых установок и приоритетов, являющихся компетенцией ЛПР и повторный выбор наиболее рационального варианта целевой программы СО ЭМ Принятие ЛПР окончательного решения о наиболее Документальное оформление принятого решения и его ЭЦ подробное обоснование ЭМ

Принятие решений в играх

• Антагонистические • Неантагонистические • Игры с Природой • Кооперативные • Многошаговые • Иерархические

ПАРНЫЕ ИГРЫ С НУЛЕВОЙ СУММОЙ

Цена игры = 0,7 Цена игры = 7,15

Теорема Неймана

.

Каждая конечная игра с нулевой суммой имеет решение в смешанных стратегиях.

Если чистая стратегия входит в оптимальную смешанную стратегию с вероятностью, отличной от нуля, то она называется

активной

.

Теорема об активных стратегиях

.

Если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий.

Для того чтобы число v было ценой игры, а U* и Z* оптимальными стратегиями, необходимо и достаточно выполнения неравенств:

y i

u i

,

v x j

z j v i m

  1

y i

 1

v

 min

i m

  1

a ij u i

* 

v i m

  1

u i

*  1

j n

  1

a ij z

*

j

v

,

j

 1 ,...,

n i

 1 ,...,

m j n

  1

z

*

j

 1

Игры с природой Классические принципы оптимальности

НЕКООПЕРАТИВНЫЕ ИГРЫ N ИГРОКОВ

доминантные стратегии, гарантирующие (максиминные) стратегии, ситуации равновесия Нэша, точки Парето,

B 1 B 2 B 3 Доминантная стратегия

Стратегия будет

доминантной

стратегией, если какая бы обстановка не складывалась, выигрыш игрока будет максимальным при выборе именно этой стратегии:

A 1 –доминантная A 2 A 3 A 4 23

21 5 18

26

24 12 22

32

22 14 9

B 4 18

5 9 10

Доминантная стратегия игрока С - С

2 С 1 С 2

A 1 A 2 A 3 A 4 B 1

13 11 5 11

B 2

6 14 10 21

B 3

30 2 8 3

B 4

18 1 5 1

A 1 A 2 A 3 A 4 B 1 23 21 5 18 B 2 26 24 12 22 B 3 32 22 14 9 B 4 18 5 9 10

С 3 С 4

A 1 A 2 A 3 A 4 B 1

21 20 4 8

B 2

16 21 11 12

B 3

22 21 7 7

B 4

12 2 9 3

A 1 A 2 A 3 A 4 B 1

13 18 2 15

B 2

20 3 2 20

B 3

31 15 11 6

B 4

11 4 2 8

Гарантирующая стратегия игрока С - С

2 Гарантирующая стратегия - когда игрок полагает, что остальные игроки, несмотря на свои собственные интересы, будут действовать против него, а уж выбором своего действия он будет максимизировать то, что зависит от него самого

A 1 A 2 A 3 A 4

С 2 (min=5)

B 1

23 21

5

18

B 2

26 24 12 22

B 3

32 22 14 9

B 4

18 10

5

9

A 1 A 2 A 3 A 4

С 1 (min=1)

B 1

13 11 5 11

B 2

6 14 10 21

B 3

30 2 8 3

B 4

18

1

5

1 A 1 A 2 A 3 A 4

С 3 (min=2)

B 1

21 20 4 8

B 2

16 21 11 12

B 3

22 21 7 7

B 4

12

2

9 3

A 1 A 2 A 3 A 4

С 4 (min=2)

B 1 B 2 B 3 B 4

13 18

2

15 20 3

2

20 31 15 11 6 11 4

2

8

Ситуация равновесия Нэша

Равновесие Нэша – когда ни один из агентов, в одиночку меняя свою стратегию на другую, не может увеличить свой выигрыш при условии, что остальные своих стратегий не меняют.

Платежная матрица игрока А

A 1 A 2 A 3 A 4 B 1 21

20 4 8

B 2

16

21

11 12

B 3 22

21 7 7

B 4 12

2 9 3 Платежная матрица игрока В

A 1 A 2 A 3 A 4 B 1

13 11 5 11

B 2

6

14 10 21 B 3 30

2 8 3

B 4

18 1 5 1

Равновесие по Нэшу для 3-х игроков

Точки Парето Платежная матрица игрока А 35

B 1 B 2 B 3 B 4 A 1 A 2 A 3 A 4 21

20 4 8 16

21

11 12

22

21 7 7 Платежная матрица игрока В

12

2 9 3

A 1 A 2 A 3 A 4 B 1

13 11 5 11

B 2

6

14 10 21 B 3 30

2 8 3

B 4

18 1 5 1 30 25 20 15 10 5 0 0 5 10 15 20 25

ИЕРАРХИЧЕСКИЕ ИГРЫ ДВУХ ИГРОКОВ

Агент Центр Агент Агент • Игра Штакельберга (принцип оптимизма) • Игра Г1 (принцип гарантированного результата) • Игра Г2 ( Стратегия Центра – Решение Агента – Решение Центра) • Игра Г3 (Стратегия Агента – Решение Центра – Решение Агента) • Игры Гк, к=4,…(многоэтапный обмен стратегиями) • Теорема Кукушкина • Игра Россия – Страны-изгои – НАТО • Игра Россия - Украина

Игра Штакельберга (принцип оптимизма)

Центр принимает решение, считая, что агент примет решение, наилучшее для Центра, и сообщает его Агенту, после чего Агент принимает свое решение

Игра Г1 (принцип гарантированного результата)

Центр принимает решение, считая, что агент примет решение, наихудшее для Центра, и сообщает его Агенту, после чего Агент принимает свое решение

Игра Г2

(Стратегия Центра – Решение Агента – Решение Центра) • Центр сообщает Агенту, какое решение примет в ответ на решение Агента; • Агент принимает решение и сообщает его Центру; • Центр принимает окончательное решение и сообщает его Агенту Стратегия своего решения, которую Центр сообщает Агенту А1 – Ц2 А2 – Ц1 А3 – Ц3 Рассуждения Агента А1 – Ц2 = 8 А2 – Ц1 = 4 А3 – Ц3 = 4 Решение Агента - А1 Решение Центра - Ц2 Выигрыш Центра = 9 Выигрыш Агента = 8

Игра Г3

(Стратегия Агента – Решение Центра – Решение Агента) • Агент сообщает Центру свою стратегию принятия решения • Центр в ответ сообщает Агенту , какое решение принял • Агент, в соответствии со своей стратегией, принимает свое решение.

Стратегия своего решения, которую Агент сообщает Центру Ц1 – А3 Ц2 – А3 Ц3 – А2 Рассуждения Центра Ц1 – А3 =1 Ц2 – А3 = 2 Ц3 – А2 = 5 Решение Центра - Ц3 Решение Агента - А2 Выигрыш Центра = 5 Выигрыш Агента = 10

Теорема Кукушкина

Итак, Центру выгоднее всего играть игру Г2, если нельзя – то Г3, если ничего другого нельзя - то Г1. Центру измышлять более многоходовые игры бесполезно.