Systemy Wspomagania Decyzji

Download Report

Transcript Systemy Wspomagania Decyzji

Systemy Wspomagania Decyzji
W oparciu o A.M. Kwiatkowska „Systemy wspomagania decyzji. Jak korzystać z wiedzy i informacji”
Proces podejmowania decyzji
• Analiza – faza identyfikacji problemu, zbieranie danych
gromadzenie wiedzy pochodzącej od ekspertów,
precyzowanie problemu w celu dokładniejszego jego
zdefiniowania, próba określania jego struktury.
• Projekt – faza poszukiwania lub tworzenia modeli
problemu, ich analiza, gromadzenie wiedzy o
możliwościach rozwiązań, podział na części, podział na
etapy realizacji; w fazie tej powstaje kilka różnych
planów rozwiązań projektu.
• Wybór – faza selekcji rozwiązania ze zbioru alternatyw.
• Implementacja – realizacja wybranego planu.
Podejmowanie decyzji w środowisku
wielokryterialnym
• opracowanie możliwych rozwiązań
(alternatyw, wariantów)
• określenie kryteriów
• estymacja ilościowa lub jakościowa
• określenie ważności kryteriów
• eliminacja i wybór
Opracowanie możliwych rozwiązań
(alternatyw, wariantów)
• różne propozycje (przebiegu autostrady)
– przebiegi przez miasto
– obwodnice
• bliskie
• dalekie
• różne źródła rozwiązań
– biura projektowe
– organizacje ekologiczne
– organizacje społeczne
Określenie kryteriów
• zdefiniowanie kryteriów oceny wariantów
– czynniki ekonomiczne (koszty budowy, wykupu
gruntów)
– czynniki techniczne (konieczność stosowania
odpowiednich technologii budowy, odwodnienia,
transportu materiałów)
– czynniki ekologiczne (emisja spalin,
zanieczyszczenie wód gruntowych)
– czynniki społeczne (zwiększenie bezpieczeństwa
na drogach)
Estymacja ilościowa lub jakościowa
• Budowa prognoz i modeli, w oparciu o które
umożliwią wybór wariantu.
• Obliczenie kosztów i korzyści dla każdego
wariantu pod kątem wybranych wcześniej
kryteriów
• Wyrażenie ich za pomocą liczb lub ocen.
Określenie ważności kryteriów
Szeregowanie kryteriów i przypisywanie im wag
poprzez tworzenie wektora wag.
• czy lepiej chronić zabytkowe centrum miasta i
ponieść koszty na budowę obwodnicy?
• czy niedogodności związane z hałasem zostaną
zrekompensowane zwiększeniem miejsc
pracy?
• itp.
Eliminacja i wybór
Cele procesu podejmowania decyzji mogą być
różnorakie:
• wybór jednego rozwiązania lub podzbioru
rozwiązań
• przydział wariantów do określonych kategorii
• uporządkowanie wariantów od najlepszych do
najgorszych
metoda sumy ważonej
Warianty szeregowane są wg wartości sumy lub
wybierany jest wariant o najwyższej wartości
i – nr kryterium
j – nr wariantu
wi – waga i-tego kryterium
kij – wartość j-tego wariantu dla i-tego kryterium
metoda dominacji
• Wszystkie warianty porównywane są parami i
te zdominowane zostają odrzucone.
• Wariant A jest lepszy niż wariant B, gdy dla m
oznaczającego konkretne kryterium
Am> Bm i A n ≥ Bn
n – wszystkie pozostałe kryteria
metoda Copelanda
Algorytm składa się z następujących kroków:
• Wybór pary wariantów A i B
• Porównanie wariantów A z B
• Określenie liczby kryteriów, w których A jest lepsze od
B (s+) oraz liczby tych dla których A jest gorsze od B (s-)
• zwiększenie zmiennej A* jeśli s+ > s-, lub zwiększenie
zmiennej B* w przeciwnym przypadku
• zsumowanie zwycięstw dla wszystkich wariantów
• wybór wariantu o największej liczbie zwycięstw
metoda rangowania
Algorytm składa się z następujących kroków:
• uszeregowanie wariantów ze względu na i-te kryterium
• przypisanie wariantom rang (wag) odpowiadających
miejscu w uszeregowaniu
• powtórzenie wcześniejszych kroków dla wszystkich
kryteriów
• zsumowanie wag
• wybór wariantu o najwyższej randze (lub najniższej, w
zależności od sposobu przypisywania rang)
Systemy wspomagania decyzji
• System Wspomagania decyzji to interaktywny system
komputerowy, który pomaga decydentom wykorzystać
dane i modele w rozwiązywaniu problemów
niestrukturalnych.
• Aplikacje dostarczające informacji i wiedzy, wykorzystywane
głównie przez kierownictwo średniego i wysokiego szczebla
oraz analityków korporacyjnych. W efekcie wykorzystania
systemów SWD uzyskujemy raporty i zestawienia, które
dostarczane są kierownictwu w ramach systemów
informowania kierownictwa
• DSS decision support systems
• KSWD – komputerowy system wspomagania decyzji
Zadania SWD
• wspomaganie menadżerów w ich procesach decyzyjnych
• zwiększenie efektywności podejmowania decyzji
• łączenie użycia modeli i technik analitycznych z użyciem
wielu danych
• umożliwienie zmian w komponentach (możliwość
swobodnego poruszania się po fazach procesu
podejmowania decyzji)
• umożliwienie wprowadzania elementów intuicyjnych i
pracy z niepełną lub niepewną informacją
• umożliwienie przeprowadzania testów
• proponowanie rozwiązania (wariantu) w oparciu o reguły
wnioskowania
Cechy SWD
• Precyzja w odtwarzaniu szeroko pojętego świata
– Czy model odpowiada zgodnie z obserwacjami świata
zewnętrznego?
• Odporność na zakłócenia
– odszumianie
• Modyfikowalność
– możliwość ingerencji w parametry modelu, zawartość
bazy itp.
• Komunikatywność
– regulowane moduły pomocy
Schemat funkcjonalny SWD
• interfejs użytkownika
• system bazy wiedzy
–
–
–
–
–
–
bazy danych
arkusze kalkulacyjne
fakty
reguły
modele
grafika
• system przetwarzania problemu
–
–
–
–
maszyna wnioskująca
system zarządzania bazami danych
system analizy wyników
(moduł uczący się)
Schemat narzędziowy SWD
baza wiedzy
baza modeli
baza danych
moduł sterowania
Interfejs użytkownika
Systemy Business Intelligence
Systemy klasy business intelligence:
• systemy analityczno-decyzyjne w dużych organizacjach
• zasilane z hurtowni danych lub bezpośrednio z
systemów transakcyjnych
• ekstrahują z dostarczonych informacji wiedzę
• wykorzystując bazę zaawansowanych modeli
– statystycznych
– optymalizacyjnych
– algorytmy sztucznej inteligencji
• dostarczają wiedzę w oparciu o informacje płynące z
danych
OLAP (OnLine Analytycal Processing)
Od systemów BI oczekuje się:
• strategicznych i bieżących analiz
• wskazywania najlepszych kierunków inwestycji i
rozwoju
• odkrywania potencjalnych oszczędności i
przychodów
• modelowania biznesowego
• symulacji wyników
• integracji i ujednolicenia danych (informacji) w firmie
Bazy Modeli
• Model oznacza reprezentację badanego
obiektu w postaci innej niż ta, w której
występuje on w rzeczywistości.
Fazy tworzenia modelu
1. Sformułowanie celów modelowania
– opis i wyjaśnienie działania mechanizmu systemu
– przewidywanie zachowania się systemów w
przyszłości, przy różnych warunkach zewnętrznych
– wybór danych wejściowych, właściwych dla
osiągnięcia celu (model decyzyjny)
Fazy tworzenia modelu
2. Wybór kategorii modelu i budowa jego
struktury
– przekształcanie zebranej i nieformalnej wiedzy w
relacje i reguły matematyczne
Klasyfikacja modeli:
–
–
–
–
modele liniowe, nieliniowe
modele ciągłe, dyskretne
modele deterministyczne, stochastyczne
modele autonomiczne, nieautonomiczne
Fazy tworzenia modelu
3. Identyfikacja modelu
Wyznaczenie postaci modelu oraz wartości
parametrów (estymacji) dla których model w
założonym stopniu oddaje zachowanie się
rzeczywistego systemu
Fazy tworzenia modelu
4. Algorytmizacja obliczeń
– rozwiązywanie analityczne
– rozwiązywanie numeryczne
– rozwiązywanie przez symulację
Fazy tworzenia modelu
5. Weryfikacja modelu
Porównywanie wyników modelowania z
rzeczywistością.
Bazy wiedzy
System ekspertowy
• program komputerowy posiadający wiadomości
w formie bazy wiedzy i przeprowadzający
wnioskowanie z możliwością rozwiązywania
problemów i doradztwa
• program komputerowy, który prezentuje sobą, w
pewnej określonej dziedzinie, stopień
doświadczenia w rozwiązywaniu problemów
porównywalny ze stopniem doświadczenia i
wiedzy eksperta
Rozwiązywane problemy
• klasyfikacja
– na podstawie przesłanek otrzymuje się wynik,
określenie stanu czy klasy do której obiekt należy
• plan
– poszukiwanie aranżacji, porządku elementów
• prognoza
– na podstawie aktualnych i historycznych danych
przewiduje się stan przyszły
Sposób realizacji
• systemy dedykowane
– systemy z zaszytą w nich wiedzą, tworzone na
konkretne zamówienie
• systemy szkieletowe
– systemy z pustą bazą wiedzy, umożliwiające
użytkownikowi wprowadzenie własnych
informacji, z którymi pracować ma system
blokowa budowa SE
Baza wiedzy
fakty
reguły
Maszyna wnioskująca
Moduł objaśniający
Interfejs użytkownika
Baza wiedzy
• wiedza a priori
– reguły i fakty dotyczące danej dziedziny, znane z
góry
• wiedza wnoszona
– wiedza wnoszona, dotycząca konkretnego
przypadku, który pojawił sięw trakcie pracy
systemu
Reprezentacja wiedzy
• nadawanie wiedzy formatu kompatybilnego z
komputerem
• utrzymywanie formy bliskiej tej, w jakiej
reguły i fakty podaje ekspert
• łatwość modyfikowania, dodawania i
usuwania faktów i reguł
Trójki OAV (Object-Attribute-Value)
Pan Y
dochód
5000
obiekt
atrybut
wartość
dziś
pogoda
ładna
obiekt
atrybut
wartość
Sieci semantyczne
Rozbudowane trójki OAV; logika przedstawiona
graficznie, reprezentująca kilka obiektów i kilka
atrybutów danego obiektu; stosowane w
systemach analizy języka naturalnego.
ma
równy
Pan Y
dochód
5000
obiekt
atrybut
wartość
mąż
Pani A
jest
Ramki
prosty i jasny sposób przedstawiania wiedzy
Zdania logiczne
Zdania, których wynikiem jest prawda lub fałsz.
predykat(argument): if predykat(argument)
Przykład:
spadek(koszt kredytu) : if spadek(stopa procentowa)
języki sztucznej inteligencji (Prolog, Lisp)
System reguł
Z prawdziwości pewnych faktów można
wnioskować o prawdziwości innych
Reguła składa się z przesłanki i konkluzji
IF ... Then ...
Ogólna postać reguły:
IF x1 is F1 and|or x2 is F2 and|or ... xn is Fn
THEN y is G - konkluzja
gdzie:
x1, x2, ..., xn, y – obiekty
F1, F2, ..., Fn, G – wartości
- przesłanka
przykład:
IF WynikTestuStudenta is > 1350
THEN TestStudenta is Zdany
konkluzja jest wnioskiem, co się powinno stać z
atrybutem (tu TestStudenta)
kilka wyjść
IF x1 is F1 and|or x2 is F2 and|or ... xn is Fn
THEN y1 is G1 and y2 is G2
Właściwości atrybutów
•
•
•
•
nazwa atrybutu
typ atrybutu
dozwolone wartości
specyfikacja wartości (jedno, wielowartościowe)
Właściwości klauzul
• typ (przesłanka/konkluzja)
• krotność (pojedyncza/wielokrotna – ze
spójnikami and/or)
• stan (zdefiniowana/nieznana)
Właściwości reguły
• nazwa reguły
• przesłanka (część reguły po IF, której wartość logiczna jest
obliczana w procesie wnioskowania)
• konkluzja pośrednia (konkluzja, która może być użyta jako
przesłanka w dalszym etapie wnioskowania)
• konkluzja (wniosek końcowy)
• uwagi (dla dokumentacji)
• priorytet (którą regułę stosować jeśli pasuje kilka)
• koszt
• stan
stany reguł
• aktywna – można wykorzystać
• odrzucona – fałszywa przesłanka
• przełączona – przesłanka gotowa do
zastosowania; jeśli prawdziwa pośród wielu
prawdziwych to o wyborze decyduje priorytet
i koszt
• odpalona – reguła zastosowana, jej konkluzja
uznana została za fakt
sieć zależności
Graficzna metoda sprawdzenia kompletności bazy reguł
symbole stosowane w sieciach zależności
zbiór reguł:
sieć zależności zbudowana w oparciu o reguły:
Maszyna Wnioskująca
• Jej zadaniem jest poszukiwanie rozwiązań.
• Wyszukiwanie konkluzji przy wykorzystaniu
zbioru reguł i faktów w określonych
warunkach.
Podstawowe reguły wnioskowania
Przykład:
JEŻELI jest piątek wieczór, TO bawimy się w klubie
modus ponens
(A (A  B))B
Jeśli reguła jest prawdziwa i przesłanka jest
prawdziwa, to konkluzja jest prawdziwa.
modus tollens
((A  B)  B)  A
z faktu, że nie ma nas w klubie można
wnioskować, że nie jest piątek wieczór
sylogizm
((A  B)  (B  C))  (A  C)
zasada przechodniości
kontrapozycja
(A  B)  (B   A)
z fałszu konkluzji można wnioskować fałsz
przesłanki
Algorytm wnioskowania do przodu
Wnioskowanie rozpoczyna się od analizy faktów.
Istniejące fakty są dopasowywane do reguł,
reguły są wykorzystywane (odpalane), dzięki
czemu pojawiają się kolejne fakty.
Na podstawie dostępnych reguł i faktów,
generowane są fakty tak długo, aż wśród nich
znajdzie się poszukiwany cel, lub zabraknie
reguł.
Przykład
Baza wiedzy:
fakty: A, B, C, D, E
reguły:
R1: if A and B then F
R2: if C and D then G
R3: if F and G then H
R4: if E and H then CEL
szukana: CEL
Algorytm wnioskowania wstecz
1. Poszukiwane założenie: CEL
2. Poszukiwanie reguł, które mają CEL w konkluzji
(odpalona R4) – aby R4 była prawdziwa, prawdziwe
musi być H – H staje się hipotezą do udowodnienia
3. W konkluzji H ma R3, zostaje odpalona, do
udowodnienia jest F i G
4. Odpalona R1 – udowodnione F
5. Odpalona R2 – udowodnione G
Udowodnienie wszystkich hipotez pozwala na
stwierdzenie, że CEL jest prawdziwy
Wnioskowanie mieszane
Przykład
Baza wiedzy:
fakty: A, C
reguły (wnioskowanie wstecz):
R1: if F and H then CEL
R2: if E and A then CEL
R3: if E and B then H
reguły (wnioskowanie do przodu):
R4: if A and G then B
R5: if B and D then H
R6: if G and D then E
R7: if A and B then D
R8: if A and C then G
szukana: CEL
Krok
Reguła
Fakty (cele)
Metoda
0
-
AC (CEL)
1
R1
AC (FH)
Wstecz
2
R3
AC (FEB)
Wstecz
Nie można skorzystać z reguł do wnioskowania wstecz, przełączenie na drugi zbiór
3
R8
ACG (FEB)
Do przodu
4
R4
ACGB (FE)
Do przodu
5
R7
ACGBD (FE)
Do przodu
6
R5
ACGBDH (FE)
Do przodu
7
R6
ABCDEGH (F)
Do przodu
8
R2
ABCDEGH CEL (F)
Do przodu
Stany reguł i przesłanek w procesie
wnioskowania
Stany reguł
A
Active
Aktywna
D
Discarded
Odrzucona
TD
Triggered
Przełączona
FD
Fired
Odpalona
Stany przesłanek
FR
Free
Wolna
FA
False
Fałszywa
TU
True
Prawdziwa
Przykład
R1
IF nogi ptaka = długie
THEN grupa = brodzący
R2
IF nogi ptaka = krótkie
wielkość = około 15 cm
sposób chodzenia = podskoki
THEN grupa = śpiewające, drozdy
R3
IF nogi ptaka = krótkie
wielkość = około 15 cm
sposób chodzenia = kiwanie się w chodzie
THEN grupa = śpiewające, szpakowate
Dane do zapytania:
ptak o krótkich nogach, wielkości ok. 15 cm, chodzi kiwając się.
Stany reguł i przesłanek przed przystąpieniem do wnioskowania
Nr reguły
status
Nr klauzuli w przesłance
Status
1
A
1
FR
2
A
1
2
3
FR
FR
FR
3
A
1
2
3
FR
FR
FR
Rozpatrzenie pierwszego faktu (krótkie nogi)
Nr reguły
status
Nr klauzuli w przesłance
Status
1
A, D
1
FR FA
2
A
1
2
3
FR TU
FR
FR
3
A
1
2
3
FR TU
FR
FR
Fakt: nogi = krótkie
Fakt: wielkość ok. 15 cm
Nr reguły
status
Nr klauzuli w przesłance
Status
1
A, D
1
FR FA
2
A
1
2
3
FR TU
FR TU
FR
3
A
1
2
3
FR TU
FR TU
FR
Fakt: wielkość = ok. 15 cm
Fakt: chodzenie = kiwanie się w chodzie
Nr reguły
status
Nr klauzuli w przesłance
Status
1
A, D
1
FR FA
2
A, D
1
2
3
FR TU
FR TU
FR FA
3
A, TD
FR
1
2
3
FR TU
FR TU
FR TU
Fakt: sposób chodzenia = kiwanie się w chodzie
Heurystyki
•
•
•
•
•
Reguły heurystyczne podają sposoby przeszukiwań bazy
wiedzy
Wyszukują w bazie wiedzy przełączone i gotowe do odpalenia
reguły
Nie zawsze prowadzą do optymalnego rozwiązania, ale
powinny dawać jak najlepsze wyniki w żądanym czasie.
Przestrzeń poszukiwań jest przedstawiona w postaci grafu
jakim jest drzewo.
Przeszukiwanie grafów odbywa się w oparciu o dwie grupy
strategii:
– strategie ślepe
– strategie skierowane
Główne strategie poszukiwań
• strategia w głąb
– poszukiwanie jest prowadzone w głąb każdej gałęzi drzewa
• strategia wszerz
– poszukiwanie jest prowadzone kolejnymi poziomami grafu
– gwarantuje znalezienie węzła do którego prowadzi
najkrótsza ścieżka
• strategia najpierw najlepszy
– stosuje funkcję heurystyczną wyrażającą ocenę węzła w
oparciu o kryteria
kryteria oceny węzła
• kryterium zbieżności (osiągnięcia celu)
• kryterium minimalnego kosztu drogi
• kryterium minimalnej złożoności obliczeniowej
procesu przeszukiwania
Moduł objaśniający
• wyjaśnia skąd wzięło się takie, a nie inne rozwiązanie.
• odpowiada na pytania użytkownika:
– „jak?” – prześledzenie procesu wnioskowania
– „dlaczego?” – przy pytaniu o dodatkową daną:
wyjaśnia po co była potrzebna wskazując
odpowiednią regułę
– „dlaczego nie?” – dlaczego wskazana reguła
została odrzucona
– „a co jeśli?” – pokazuje odpowiedź przy założeniu
zmiany faktu luba zmiany treści reguły
Pozyskiwanie wiedzy –algorytm Quinlana
• Algorytm pomocny przy budowaniu drzew
decyzyjnych, z których następnie tworzone są
reguły.
Przykład
hałas:
• poniżej normy
• w normie
• powyżej normy
cena:
• <= 3000
• >3000
wielkość:
• duży
• mały
Obiekty należą do dwóch klas: A oraz B
zbiór obiektów przedstawia się jak niżej:
• <= 3000
powyżej normy
duży
• > 3000
powyżej normy
mały
• > 3000
w normie
duży B
• <= 3000
w normie
duży B
• <= 3000
poniżej normy duży A
• > 3000
poniżej normy duży A
• > 3000
powyżej normy
duży
• > 3000
poniżej normy mały A
• <= 3000
powyżej normy
mały
B
A
B
A
Drzewo decyzyjne
cena
> 3000
<= 3000
hałas
B
A
B
wielkość
A
wielkość
wielkość
duży
wielkość
duży
wielkość
duży
wielkość
hałas
B
A
B
A
A
Generowanie reguł
•
•
•
•
•
•
•
IF cena <= 3000 AND hałas IS powyżej normy AND wielkość IS duży THEN klasa = B
IF cena <= 3000 AND hałas IS powyżej normy AND wielkość IS mały THEN klasa = A
IF cena <= 3000 AND hałas IS poniżej normy AND wielkość IS duży THEN klasa = A
.
.
.
.
Obliczanie entropii zbioru n-elementowego
prawdopodobieństwo, że obiekt należy do klasy A = 5/9
prawdopodobieństwo, że obiekt należy do klasy A = 4/9
Obliczenie entropii atrybutu Ak
gdzie:
Mk
N
k
p(ak, j)
p(ci,|ak,j)
liczba wartości, jakie przyjmuje Ak
liczna klas
liczba atrybutów
prawdopodobieństwo, że ak przyjmie wartość j
prawdopodobieństwo wystąpienia klasy ci gdy ak= j
Wśród dziewięciu opisywanych obiektów cztery mają cenę nie
przekraczającą 3000.
Prawdopodobieństwo, że
cena przyjmie wartość <= 3000, wynosi 4/9
cena przyjmie wartość > 3000, wynosi 5/9
Prawdopodobieństwo występowania poszczególnych klas pod
warunkiem przyjmowania określonych wartości cen
4 obiekty posiadają cenę <= 3000
2 z nich należą do klasy A
p(A|cena<=3000)=2/4
2 z nich należą do klasy B
p(B|cena<=3000)=2/4
Podobnie dla cen > 3000
5 obiektów posiadają cenę > 3000
3 z nich należą do klasy A
p(A|cena<=3000)=3/5
2 z nich należą do klasy B
p(B|cena<=3000)=2/5
Obliczenie przyrostu informacji wprowadzanego
przez każdy atrybut
Wnioski
Drzewo uproszczone algorytmem Quinalana
hałas
wielkość
B
A
B
A