Единицы информации

download report

Transcript Единицы информации

Единицы
информации
Классификация и основные
свойства единиц информации
Понятие информации


Информация – совокупность
документированных данных,
хранящихся на электронных или
бумажных носителях, относящаяся к
выбранной предметной области
Данные – это знаковые совокупности на
носители, используемые для передачи
или хранения информации,
расположенные в соответствии с
некоторой структурой.
Структура сообщения


Синтаксис (формат) сообщения –
совокупность правил, которым должны
соответствовать структура
информационных сообщений,
передаваемых в виде совокупности
знаков для того, чтобы приемник мог
воспринять ее и обработать;
Семантика сообщения – содержание,
которое изменяет знания приемника
данных.
Форматы данных

Принято различать следующие форматы:


Фиксированный (жесткий) формат данных
– выделяются единицы информации,
причем для каждой из единиц
устанавливается имя и область
допустимых значений;
Свободный формат данных – способ
форматирования документов, при
котором не выделяются специфические
единицы данных.
Основные единицы
информации


Атрибуты (реквизиты)
Составные единицы информации
(СЕИ)
Атрибуты

Атрибут (реквизит) –
информационное отображение
отдельного свойства некоторого
объекта, процесса или явления
Атрибуты




Атрибут характеризуется именем и
значением.
Имя атрибута – условное обозначение
в процессе обработки данных.
Значение атрибута – величина,
характеризующая свойство объекта в
конкретных обстоятельствах.
Все допустимые значения атрибута
образуют множество, называемое
доменом данного атрибута.
Атрибуты


Атрибут с именем X представляет
собой пару (X, z), где z – элемент
множества Z (домена значений).
Определение атрибута в
информационной системе
предполагает указание его имени и
списка значений.
Атрибуты


В языке C/C++ объявление переменных включает
в себя описание типа и задание имени
переменных:
 int a;
 float fahr;
 char name[ ];
 присвоение значения может быть выполнено
при объявлении переменной:
 float price=3.12;
или в процессе работы программного модуля.
Атрибуты


Для некоторых доменов множество
входящих в них значений задается с
помощью перечисления допустимых
значений.
Если в домене есть необходимость
перечислить обозначения объектов из
некоторого класса, то разрабатывается
классификатор, содержащий условные
обозначения (коды) отдельных объектов
и классов, к которым эти объекты
отнесены.
Атрибуты



Если значения атрибутов определены на одном и
том же домене, то такие атрибуты называются
ролевыми.
Пример: на домене FAMILY определены атрибуты:
СТУДЕНТ, ПРЕПОДАВАТЕЛЬ
Домен значений может не храниться как
самостоятельный информационный объект,
однако среди ролевых атрибутов в базе данных
существует атрибут с наиболее полным
значением. Данный атрибут можно использовать
для контроля вводимой информации.
Составные единицы информации


Составной единицей информации (СЕИ)
называется набор из атрибутов и других
СЕИ.
Определение СЕИ построено
рекурсивно, из элементарных единиц
строятся более сложные. База данных
также может быть рассмотрена как
составная единица информации
Составные единицы информации

Множество атрибутов объединяются в
одну СЕИ по следующим принципам:


соответствующие атрибуты описывают
один и тот же процесс;
значения атрибутов, входящих в СЕИ,
возникают одновременно, связаны
логическими или арифметическими
соотношениями
Составные единицы информации

Характеристики СЕИ являются:



Имя – условное обозначение в
процессах обработки информации
Структура – вхождение одних единиц
информации в состав других единиц
информации
Значения – набор значений атрибутов и
СЕИ, входящих в состав
рассматриваемой единицы информации
Составные единицы информации


Одна из задач СЕИ в информационных
системах – описание структуры
экономических документов
Документ – материальный носитель
информации, содержащий
оформленные в установленном порядке
сообщения и имеющий юридическую
силу.
Составные единицы информации



Описание структуры СЕИ
Для описания структуры
независимо от языка
программирования используется
обозначение:
ИМЯ СЕИ(ИМЯ АТРИБУТА, …)
Составные единицы информации


Определение структуры в C/C++
struct Event {
int hour, min;
char theme[100], name[50];
int num;
};

Данное определение – это определение типа. Можно описать
переменные данного типа (данной структуры):
Event e1, e2[5];




Элементы структуры называются полями.
Поля могут быть любого основного типа, массивами,
указателем, объединением или структурой. Для
обращения к полю используется операция выбора
(«точка» для переменной и -> для указателя):
e1.hour=12; e1.min=30;
strncpy(e2[0].theme, “Подготовка к следующему
семинару”, 99);
Составные единицы информации



Определение значения СЕИ можно
дать на основе значений единиц,
входящих в состав СЕИ.
Значения СЕИ, входящих в другую
СЕИ, определяется рекурсивно,
однако необходимо учитывать
размерность СЕИ.
Одно значение СЕИ при хранении
в памяти ЭВМ называется
записью.
Операции над единицами
информации



Переименование единицы информации
– операция присвоения нового имени,
объявление синонима – это
установление второго, третьего и т.д.
равноценного имени
Операция над значением атрибута –
это перекодирование, т.е. замена
существующего кода значения на новый
для всех значений
Выборка – операция выделения
подмножества значений СЕИ,
удовлетворяющих заранее
поставленным условиям
Операции над единицами
информации

Корректировка – выполнение одной из операций:







добавление нового значения СЕИ
исключение существующего значения СЕИ
замена некоторого значения СЕИ на новое значение
Декомпозиция – операция преобразования исходной
СЕИ в несколько СЕИ с различными структурами
Композиция – операция преобразования нескольких
СЕИ с различными структурами в одну
Нормализация – операция перехода СЕИ с
произвольной структурой к СЕИ с двухуровневой
структурой
Свертка – операция преобразования СЕИ с
двухуровневой структурой в СЕИ с произвольной
многоуровневой структурой
Экономические показатели



При анализе экономических документов ставится
задача разделения документа на элементарные
осмысленные фрагменты – показатели
Показатель представляет собой полное описание
количественного параметра, характеризующего
некоторый объект или процесс
Как единица информации показатель является
разновидностью СЕИ. Схематично структура
показателя представляется выражением:
П(P1,P2,…,Pk,Q)
P1,…,Pk – атрибуты-призанки, Q – атрибутоснование
Показатели



Реквизит-признак представляет собой
информационное отображение
качественного свойства некоторого
объекта
Реквизит-основание является
отображением количественного свойство
объекта или процесса.
При хранении экономических
показателей один файл (таблица)
отводится под группу показателей с
одинаковым составом реквизитов
признаков.
Минимальный набор
атрибутов показателя




Атрибуты, отражающие идентификаторы
объекта
Атрибуты, отражающие признак времени
Атрибуты, отображающие некоторое
количественное свойство объекта
Причина выделения показателей заключается в
том, что показатель является минимальной
группой атрибутов, сохраняющей
информативность и достаточной для
образования самостоятельного документа.
Пример

Рассмотрим документ «Приходный ордер». В его состав
входят следующие реквизиты:








Реквизиты основания: Кол-во, Цена, Сумма, на основе
этих реквизитов можно построить три показателя.




Дата
Склад
Пост – код поставщика
Кмат – код материала
Кол-во – количество по документу
Цена
Сумма
П1(Кмат, Склад, Пост, Дата, Кол-во)
П2(Кмат, Цена)
П3(Кмат, Склад, Пост, Дата, Сумма)
Причем Сумма=Кол-во*Цена
Роль показателей

Показатели, описывающие экономические
процессы, включают составные части:







Формальная характеристика, указывающая на
алгоритм получения атрибута-основания в
показателе;
Перечень объектов в процессе;
Название процесса;
Единица измерения атрибута-основания;
Определение периода или момента времени;
Название функции управления;
Название экономической системы.
Критерий качества создания
базы данных

Минимальная избыточность хранимой информации,
выражаемая принципом: каждое сообщение хранится
в БД один раз. Соблюдение данного принципа дает
следующие преимущества:




Сокращается объем памяти ЭВМ, для хранения БД;
Сокращается трудоемкость ввода данных и
упрощаются проблемы контроля достоверности
информации;
Упрощаются алгоритмы корректировки данных;
Использование экономических показателей позволяет
построить структуру БД с минимальной избыточностью,
если сначала расчленить все сведения в ЭИС на
показатели, а потом объединить атрибуты родственных
показателей по принципу:

в один файл включается группа показателей с
одинаковым составом атрибутов-признаков.
Модель арифметических
вычислений



Модель арифметических вычислений
основывается на графе взаимосвязи показателей.
В графе G(S,U) множество вершин S={s(i)}
представляет собой все показатели, хранящиеся в
базе данных. Дуга (ребро графа) u(i,j) задается в
том случае, если есть расчетное соотношения для
показателя s(j) и оно зависит от показателя s(i).
Графы взаимосвязи показателей служит основой
для решения задач:
 разделение промежуточных показателей на
хранимые и динамически вычисляемые;
 распределения файлов по узлам вычислительной
сети
Описание экономического
процесса

Выделяют семь классов признаков описывающих
экономический процесс:







Признаки формальной характеристики – формальный
способ вычисления соответствующего показателя;
Признаки характеристики процесса – характеристики
состояний в которых находится описываемый объект
(наличие, выпуск, реализация и т.п.)
Признаки объекта – указывают характеризуемый
показателем объект (продукция, сырье, персонал и т.п.);
Признаки единицы измерения;
Признаки субъекта – организации, предприятия;
Признаки времени;
Признаки функции управления – принадлежность
показателя к определенной функции управления