Представяне, съхранение и достъп до информация и - E-DNRS

Download Report

Transcript Представяне, съхранение и достъп до информация и - E-DNRS

Представяне, съхранение и достъп до
информация и знания в ОС
Под Информация разбираме съвкупността от
сведения, възприемани от окръжаваща-та
среда, и отдавани към нея от съхранените в
информационната система.
Данните, са представената във формализиран
вид конкретна информация за обектите на
предметната област, техните свойства и
взаимовръзки, отразяващи
събитията
и
ситуациите в тази област.
Данните се представят във вид, който
позволява да се автоматизира събирането,
съхранението и тяхната последваща
обработка от човека или информационното
средство.
Данните това са записани в съответен код
наблюдение, обект, песен, текст и т.н.,
пригодени за комуникация, интерпретация,
предаване, обработка и получаване на нова
информация.
Информацията се получава от данните в
резултат от решаване на някаква задача.
Разбира се голяма част от информацията
не може да се изведе от данните.
Например
автоматичен
превод
на
художествена литература.
Информацията с която работи изчислителната машина може да се раздели на
процедурна и декларативна.
Процедурната информация включва
програмите, които се изпълняват в
процеса на решаването на определени
задачи.
Декларативната информация се състои
от данните, които се обработват от
програмите.
Стандартната форма за представянето на
данните в изчислителната машина е
машинната дума включваща определен
брой разряди (битове). За представянето
на данните и командите на програмите
могат да се използват определено
количество думи.
Като основна единица за съхранение на
данните се приема машинната дума, тъй
като всяка дума се съхранява в
стандартна "кутия" от паметта с
определен адрес. Данните се представят
във вид на вектори, матрици, списъци,
логически записи, файлове, йерархични
или мрежови структури и т.н.
Необходимостта от практическо използване
и усъвършенстване на системата за
обработка на данните е довело до появата
на базите от данни (БД), които
позволяват да се съхранят голяма по обем
информация. За обработка на декларативната информация от БД се използват
системи за управление на базите от данни
(СУБД).
Обикновено човека или информационната
система работи с данните и знанията от
дадена предметна област (например
отбрана
и
сигурност,
медицина,
икономика и т.н.). Под предметна
област се разбира информацията за
обектите и връзките между тях от
някаква област на знанието.
Знанието е обобщената и формализована
информация за свойствата и законите на
предметната област, с чиято помощ се
реализират процесите за решаване на
задачите, преобразуването на данните и
знанията, и която се използва в процеса на
логически извод.
Логически извод е генериране на нови
съждения (твърдения) въз основа на
изходни факти, аксиоми и правила на
извода. Процесът на решаването на
задачата с използването на данните и
знанията може опростено да се
представи с модела от фигурата.
Модел за извод на хипотеза с използването
на данни и знания.
хипотеза
данни основани
на факти
знания
Модел за извод на хипотеза с използването
на данни и знания.
В този случай знанието е всяка информация,
на която се позоваваме, или програма,
обработваща данните т.е. реализираща
извод с цел получаване на хипотеза.
Знанията от гледна точка на решаването на
задачите от дадена предметна област е
удобно да се разделят на две големи
категории-факти и евристика. Под факти
обикновено се възприемат
общоизвестните в предметната област
истини или обстоятелства.
Евристиката включва емпиричните алгоритми,
основани на неформални съображения, които
ограничават разнообразието и осигуряват
целенасоченост на поведението на решаващата
система, без да гарантират получаването на найдоброто решение. Такива са знанията основано
на опита на специалиста (експерта) в дадена
предметна област, например за родствените
връзки, като се прилагат средствата на езика
Пролог. Обектите са понятия като баща, майка,
син, мъж, жена и т.н.
Нека са известни следните факти:
Виктор е баща на Таня.
Владимир е баща на Виктор.
Баща (Виктор,Таня).
Баща (Владимир,Виктор).
Тук "Баща" е името на отношението или
предиката, а "Виктор", "Таня" и
''Владимир" са константите.
Нека с X,Y,Z означим променливите.
Тогава на Пролог се получава:
Баща (X,Y).
Ако използваме предиката "баща" и
променливите X,Y,Z, то можем да
формираме новото отношения "дядо", по
следната схема:
Ако X е баща на Y и
Z е баща на X
То Z е дядо на Y.
`
Тази
форма
"ако…то"
се
нарича
продукционно правило, продукция или
просто правило.
Дядо (Z,Y):-баща(X,Y), баща (Z,X).
Символът ":-" се интерпретира като "Ако".
Вместо него може да се запише IF.
Запетайката, която разделя предиката
"баща", означава логическата операция
“И”.
Аргументите на предикатите са X,Y,Z са
константите
"Виктор",
"Таня",
"Владимир", които се записват в скобки и
разделят със запетаи. т.е тук се формира
новото отношение "Дядо" на базата на
понятието "Баща".
Името "Владимир", е взето като външно за
отношенията, но не свидетелства за
нищо. Възможно е това да е име на човек
или наименование на град. Точно така се
разглеждат числовите или другите
данни, например файл с данни. Данната
взета съвместно с отношение, определя
някакъв смисъл и така се превръща във
знание.
Особености на знанията, по които
те се различават от данните:
Интерпретация. Данните, съхранени в паметта на
ЕИМ могат да се да се интерпретират само
със съответстващата програма. Данните без
програмата не носят никаква информация,
докато в същото време знанията имат
интерпре-тация, тъй като те съдържат
едновремен-но и данните и съответстващите
им описания.
Структурираност. Данните трябва да имат
гъвкава структура. Те трябва да имат
рекурсивна вложимост на едната
информационна единица в другата. Всяка
информационна единица трябва да се
включва в състава на другата и от могат да
се отделят съставляващите елементи.
Между определените единици "знания"
могат да се установят отношения като
"елемент-множество",
"тип-подтип",
"ситуация-подситуация", които отразя-ват
техния характер и взаимовръзки.
Това позволява да се съхранява един
екземпляр от информацията еднаква за
елементите от множеството.
При необходимост едни единици от
знанието могат да наследяват свойствата
на други единици.
Свързаност.
В БД между информационните единици се
установяват връзки от различен тип, характеризиращи отношенията между обектите,
явленията и т.н.
Съвместимостта между отделните събития или
факти в някаква ситуация се определя от тези
връзки, а също така такива отношения като
едновременност, разположение в една област
на пространството и т.н.
Връзките позволяват да се построят процедури за
анализ на знанията за съвместимост,
противоречивост и други, които трудно се
реализират
при
съхранението
на
традиционните масиви от данни.
Семантична метрика. Върху множеството
на информационните единици в някои случаи
е полезно да се задават отношения, характеризиращи ситуационната им близост. Това е
отношението на релевантност между
информационните единици, което позволява
да се намират знания близки до
съществуващите.
Различават се две форми на представяне на
знанията: декларативна и процедурна.
Декларативните знания не съдържат в явна
форма процедури, които трябва да се
изпълняват. Те представляват множество от
твърдения, не зависещи от това къде се прилагат.
Тяхното използване предполага пълно описание
на пространството от състояния на моделирания
обект, което носи синтактически характер.
Извеждането и търсенето на решение се базира на
процедури за търсене в пространството от
състояния.
Тези процедури отчитат спецификата на
конкретната предметна област т.е. семантиката.
Следователно, при тази форма семантичните и
синтактични знания са отделени и това в
известен
смисъл
придава
по-голяма
универсалност и общност.
 Процедурните
знания съдържат описание на
някои процедури. Състоянието на обекта се
представя във вид на набор от процедури, с
помощта на които се обработват определени
участъци от Базите от знания (БЗ). В този
случай не се изисква съхранение на всички
възможни състояния на обекта, тъй като те
могат да се генерират с помощта на
процедурите, от някакво начално състояние.
При процедурното представяне на знанията
семантиката на обекта се включва в
описанието на елементите от БЗ, което
позволява да се прилагат по-ефективни
процедури за търсене на решение, така че да
не се обработват пълните описания.
Процедурните знания осигуряват побързо търсене на решението в
сравнение с декларативните, но им
отстъпват
във
възможностите
за
натрупване и актуализация.
Активност. Разделянето на информационните
единици на данни и програми (команди) е
довело до това, че данните са пасивни, а
командите
активни.
За
интелигентните
информационни системи знанията инициират
действия. Появата на нови факти в
информационната база и установяването на
връзките между е източник на активност на
системата.
Тези пет особености определят границата, зад
която данните се превръщат в знания, а БД- в БЗ.
Съвкупността от средствата, осигуряващи работата
със знанията, образува системата за управление
на базата от знания (СУБЗ).
Основното направление, което реализира идеите
на изкуствения интелект, е разработката на
системи основани на знания. Централният обект
за изучаване от ИИ-знанията могат да се
представят във вид на съвкупност от сведения
(факти и правила), процеси, явления, а също така
способи за решаване на задачите от
предметната област. Специалистите, които се
занимават с извличането на знанията, тяхната
формализация и структуриране за обработката в
компютърните системи, се наричат инженери по
знанията или знанийни инженери.
Структурата на система основана на
знанията може да има следния вид:
 Извличане
на
знанията
от
различни
източници;
 Формиране на качествени знания;
 Интеграция на знанията;
 Преобразуване
на
знанията
професионалистите;
 Организация на работата с експертите;
 Оценка и формализация на знанията;
 Модели на знанията;
от
Структурата на система основана на
знанията може да има следния вид:
 Логически системи;
 Продукции;
 Семантични мрежи;
 Фреймове;
 Системи за представяне на знанията;
 Бази от знания;
 Манипулиране със знанията;
 Попълване на знанията;
 Класификация на знанията;
Структурата на система основана на
знанията може да има следния вид:
Обобщаване на знанията;
 Изводи на нови знания;
 Методи на резолюцията;
 Квазиаксиоматични системи;
 Системи за правдоподобен извод;
 Разсъждения с помощта на знанията;
 Обяснение на знанията.

За формализацията на знанията, представени в
текстов, графичен вид, във вид на документи и
т.н., е необходимо наличието или възможно да се
разработят методи, които позволяват да се
преобразуват изходните знания във вид,
пригоден за обработка в интелектуалните
информационни системи (ИИС). Знанията
получени от различни източници, трябва да се
интегрират във свързана и непротиворечива
система.
Получените от експертите знания трябва да се
оценят от гледна точка на вече съществуващите
знания, да се съгласуват и се отделят
несъвместимите или противоречиви знания.
За представянето на знанията се използват
логически
модели,
продукционни
правила, таблици за вземане на решение.
Семантични мрежи и фреймове. За
въвеждането, съхранението, обработката и
извеждането на знания са разработени
системи за управление на базите от
знания, които включват езици за описание
и манипулиране със знанията, а също така
и програмни процедури.
Особено място в манипулирането на знанията
заема извода на знанията, заключаващ се в
получаването на новите знания въз основа на
вече съществуващите в системата. Това е едно от
най-проблематичните направления на ИИС от
гледна точка на реализацията. Голям интерес
при
извода
на
знанията
представлява
манипулирането с човешките разсъждения:
аргументация на основата на съществуващите
знания, разсъждения по аналогия и много други
похвати които хората използват в своята
практика.
Обясненията на получените резултати основани на
знания съществено отличава ИИС от останалите
компютърни системи.
ЧОВЕКО-МАШИНЕН
ИНТЕРФЕЙС
Формата на обменяната информация между
човека и компютъра може да бъде:
 Текстово-цифров материал (печатен и на
екран);
 Аудио материал (реч, музика, звукови
картини);
 Видео материал (изображения);
 Пряко въздействие чрез устройства на
различен физически принцип;
 Пряко въвеждане на данни от датчици с
различен физически принцип.
Съдържанието на обменяната
информация определя целта на
взаимодействието, а именно:
Търсене на данни и знания;
 Въвеждане на данни и знания;
 Управление на процеса на взаимодействие за решаване на задача по обработка на
данните и знанията (включително чрез
въвеждане на данните и знанията).

Съвременните форми на представяне на
информацията включват хипертекст и
мултимедия. Текстовете са линейни с
начало и край, а хипертекстът е нелиненен текст, в който отделните елементи са
върхове на една логическа мрежа,
позволяваща търсене по смисъл и
асоциация. Когато отделните елементи не
са просто текстово цифрови, а с друга
форма (видео, звук и др. ) се говори за
мултимедийна среда.
Основа на човекомашинния интерфейс са
диалоговите
системи.
Желани
характеристики на диалоговите системи
са гъвкавост, яснота, лекота в обучението
и използването, надеждност. Основни
функции са организацията и управление
на диалога, въвеждане и извеждане на
информация, контекстно зависима помощ
в сложни ситуации, разширение на
системата от потребителя, комуникация с
други потребители, ресурси и услуги.
Основните модели за интерфейс са
класически (командни езици, меню
системи и др.) и на ИИ (диалог на
квазиестествен език с единични фрази;
диалог на ограничен естествен език;
диалог на естествен език-писмено и
говоримо; разпознаване на образи като
входна информация).
Примери на системи, използващи като основа
представянето на информацията в определен
модел и ефективен човекомашинен интерфейс
са:
 информационно-търсещи и информационно
аналитични системи;
 географски информационни системи (включват
географска и приложни БД и БЗ); с
 системите базирани на стандартите на ООН за
обмен на информация по административни,
търговски и транспортни проблеми;
 системи за компютърно подпомагано обучение;
 WWW-сървъри в Интернет и др.