Transcript Slide 1

MIS
TEMA - 4
BASE DE DATOS
SICI-3211
17/07/2015
Dr. Nelliud D. Torres Batista
http://classes.uleth.ca/201401/mgt3061a/
1
Objetivos del Capítulo
• Definición de Base de Datos
• Componentes de un Sistema Manejador de Bases de
Datos (DBMS)
• Modelos de Bases de Datos
• Diseño de Base de Datos
• Data Warehouse / Data Mart / Data Minning
17/07/2015
2
Definición de Base de Datos
17/07/2015
Pag: 43
3
MBNA
Managing data and information
• Usualmente las organizaciones generan muchos
datos constantemente
• ¿Cómo una organización organiza todos sus
datos y la información que genera?
– Base de Datos – Una Colección de archivos
integrados y relacionados entre si. Ejemplos:
•
•
•
•
Ebay
Proquest
Facebook
Gmail
4
What is Database Technology ?
• Una colección de datos relacionados
organizado de tal forma que los hace valioso y
útil.
• Permite a las organizaciones recuperar
(retrieve), almacenar (store) y analizar la
información fácilmente.
• Es vital para el éxito de una organización para
ejecutar operación es y tomar decisiones.
3-5
The Hierarchy of Data
6
Types of Data in a Database
• Datos Internos (Internal data)
– Son los datos que se colectan (generan) dentro de la
misma organización
• Datos Externos (External data)
– Posibles fuentes de datos externos:
•
•
•
•
•
•
•
Competitors, customers, and suppliers
Distribution networks
Economic
Government regulations
Labor and population statistics
Tax records
functional information systems
Databases
• Las Bases de Datos son componentes críticos de los
Sistemas de Información.
– Cualquier tipo de análisis que se hace en una
organización, se basa en datos disponibles de la base de
datos.
• Database Management System (DBMS)
– Conjunto de programas que permiten crear, almacenar,
mantener y acceder archivos de la base de datos
• Esto ofrece una ventaja sobre los antiguos sistemas
de archivos (flat files).
• Enfoque Tradicional Vs Enfoque de Base de Datos
The Traditional Approach
Payroll
Grades
Student
Tuition
Grades
Student
Tuition
Parking
Parking
The Traditional Approach to Data Management - Archivos Secuenciales,
9
Relativos e Indexados
The Database Approach
Payroll
Grades
Payroll
Grades
Tuition
Database
management
system
Tuition
Parking
Parking
The Database Approach to Data Management - Combina
automáticamente el uso de los archivos secuenciales, indexados y
10
relativos.
Advantages of the Database Approach
3-11
Advantages of the Database Approach (Cont.)
3-12
Componentes de un Sistema
Manejador de Bases de
Datos (DBMS)
17/07/2015
Pag: 50
13
Exhibit 3.2
Interaction between the user, DBMC, and Database
Components of a DBMS
•
•
•
•
•
Database engine
Data definition
Data manipulation
Application generation
Data administration
• En los próximos slides explicamos cada uno de
estos conceptos.
Database Engine
• Es el corazón del software del DBMS
• Responsable del almacenamiento ,
manipulación y recuperación de los datos
• Convierte consultas (requests) de los usuarios
en su equivalente físico.
• En otra palabras capacita al os usuarios a
poder examinar los datos de una forma fácil y
rápida.
Data Definition
• Crea y mantiene el diccionario de datos de
la base de datos
• Define la estructura de archivos en una
base de datos
– Adding fields
– Deleting fields
– Changing field size
– Changing data type
Data Manipulation
• Es el encargado de añadir, eliminar, modificar
y recuperar records de una Base de Datos.
• Query language
– Structured Query Language (SQL)
• Standard fourth-generation query language
• Se utiliza en muchos DBMS packages
• Utiliza un enunciado (statement) SELECT
– Query by example (QBE)
• Construye enunciados a través de una forma
• Utiliza una interfaz gráfica
Application Generation
• Herramienta que permite diseñar elementos
de una aplicación basándose en una Base de
Datos
– Data entry screens
– Interactive menus
– Interfaces with other programming languages
• Muchas de estas aplicaciones son fáciles y
rápidas para el diseño y creación de
aplicaciones.
• Se utilizan mucho para crear prototipos.
Data Administration
• Se utiliza para:
– Backup and recovery (resguardo y recuperación)
– Security
– Change management
• Create, read, update, and delete (CRUD)
• Tablas y atributos
• Database administrator (DBA)
– Posición que se responsabiliza en administrar la base de
datos.
– Esto incluye crear cuentas, accesos a la base de datos,
modificar las tablas y/o atributos, etc.
– Se puede administrar a nivel Individual o por
departamento
Modelos de Base de Datos
17/07/2015
Pag: 47
21
GENERACIONES
• First-generation
– Hierarchical and Network
• Second generation
– Relational
• Third generation
– Object-Relational
– Object-Oriented
Modelo Jerárquico (Hierarchical)
• Las Bases de Datos tienen sus raíces
en los años 60.
• En aquel tiempo no había un
sistema capaz de manejar grandes B
cantidades de datos que el proyecto
iba a generar.
F
• Su estructura lógica básica se
visualiza como un árbol (tree) al
revés.
A
C
D
G
H
E
Modelo Jerárquico
• La estructura del modelo jerárquico contiene
niveles o segmentos.
• Mantiene un conjunto de relaciones de uno a
muchos entre un segmento padre y sus segmentos
hijos.
– Cada padre puede tener muchos hijos.
– Cada hijo sólo puede tener un padre.
Modelo Jerárquico (Diagrama)
Modelo de Red (NetWork)
• Creado para:
– Representar relaciones de
datos complejas más
efectivamente que puedan
manejar diseñados en
estructuras jerárquicas.
H
– Mejora el rendimiento de la
Base de Datos.
– Impuso un estándar.
D
A
E
B
F
G
C
Modelo de Red (Diagrama)
Modelo Relacional
• Desarrollado por E. F. Codd
(IBM) en 1970.
• Se consideró ingenioso, pero
poco práctico en el 1970.
• Conceptualmente es un
modelo simple.
Empleado
• Las computadoras de esa
Id
época carecían de la
Nombre
capacidad para poder
Depto
implementar ese modelo.
Tipo
• Hoy día no aplican estas
limitaciones.
Departamento
Numero
Descripción
Edificio
Tipo
Clasificación
Descripción
Status
Asalariado
El Modelo Entidad-Relación
• Herramienta ampliamente aceptada y adaptada a
formato gráfico para el diseño de la Base de Datos.
• Fue introducido por Chen en 1976
• Representación gráfica de entidades y sus
relaciones en una estructura de Base de Datos.
• Esto simplifica el diseño de la Base de Datos.
• Este sigue siendo el estándar en el Diseño y manejo
de las Bases de Datos actuales.
Modelo Relacional (Diagrama)
Primary Key (PK)
La relación se establece
relacionando el campo
clave (PK) de una tabla
con el campo foráneo
(FK) en la otra tabla.
Foreing Key (FK)
The Relational Model
• Relational model
– Uses a two-dimensional table of rows and
columns of data
• Data dictionary
– Field name
– Field data type
– Default value
– Validation rule
The
Relational
Model Example
3-32
The Relational Model
• Data retrieval
– Select
– Project
– Join
– Intersection
– Union
– Difference
The Relational Model
Modelo Orientado a Objetos
• Se modela tanto los datos
como sus relaciones en una
estructura sencilla conocida
como objeto.
• Object-Oriented data model
(OODM) es la base para el
object-oriented database
management system
(OODBMS)
• OODM se conoce como el
modelo de datos semántico
(semantic data model)
OTROS MODELOS
• Extended Relational Data Model (ERDM)
– Modelos de datos semánticos desarrollados en
respuesta a la creciente complejidad de las
aplicaciones.
– Con frecuencia se les conoce como (Object/relational
database management system ORDBMS)
– Su principal propósito es para aplicaciones de
negocios.
RESUMEN DE LOS MODELOS
Bases de Datos Orientados al Web
• Proveen una ventaja competitiva a la compañía y la
expone a nivel global.
• Se utilizan en el comercio electrónico.
• Algunos ejemplos de compañías que trabajan
electrónicamente por Internet son Ebay y Amazon,
etc.
• Las redes sociales no podrían existir sin el
componente de las Bases de Datos.
• Las aplicaciones Web tienen mucho auge y es un
tema importante que no se puede ignorar dentro
del campo de las Bases de Datos.
EVOLUCIÓN DE LAS BASES DE DATOS
Diseño de Base de Datos
17/07/2015
Pag: 46
40
Logical Database Design
• Physical view
– Detalla cómo los datos se almacenan y se recuperan de
una medio físico
• Logical view
– Muestra la forma en que la información se le muestra a
los usuarios
– Enfoca en cómo los datos están organizados y como se
recuperan
– Puede haber más de una forma lógica de ver los datos
Logical Database Design (cont’d.)
• Data model
– Determina como los datos se crean, representan y
organizan.
– Incluye:
• Data structure
• Operations
• Integrity rules
BASE DE DATOS - Componentes
• Entidades – Algo importante que deseamos
almacenar. Por ejemplo: Una persona, evento,
lugar, categoría o cualquier otra cosa que se le
pueda nombrar.
• Atributos – Datos que describen a la entidad y por
lo tanto necesitamos almacenarlas.
• Relaciones – Define como las entidades se
relacionan entre si.
ENTIDADES
ENTIDADES
Una ENTIDAD representa una persona, lugar,
objeto , evento o concepto dentro del ambiente de
Sistemas de información. Por lo tanto a cada
entidad se le asigna un nombre propio. Deseamos
guardar datos dentro de una entidad. A
continuación mostramos ejemplos de entidades.
EJEMPLO DE ENTIDADES
• PERSONA: ESTUDIANTE, EMPLEADO, PACIENTE
• LUGAR: ALMACEN, WAREHOUSE, ESTADO, PUEBLO
• OBJETO: MAQUINA, EDIFICIO, AUTOMOVIL, LIBRO
• EVENTO: VENTA, MATRICULA, RENOVACION, QUEJA,
COBRO, PAGO, TRASLADO, TAREA, TRANSFERENCIA,
ASIGNACION, CONTACTO
• CONCEPTO: CUENTA, CURSO, CENTRO DE TRABAJO
UNA ENTIDAD
• DEBE SER:
– Un objeto que tenga muchas instancias en la Base de
Datos.
– Un objeto que se componga de múltiples atributos.
– Un objeto que se pueda diseñar y representar (model).
• NO DEBE SER:
– Un usuario del sistema de Base de Datos
– Un resultado (output) de la Base de Datos (ejemplo: un
reporte)
ATRIBUTOS
ATRIBUTOS
• Attribute – Propiedad o característica de una
entidad o de un tipo de relación. El conjunto de
atributos de una entidad se le conoce también
como una instancia.
• Tipos de atributos: (se discuten más adelante)
– Required versus Optional Attributes
– Simple versus Composite Attribute
– Single-Valued versus Multivalued Attribute
– Stored versus Derived Attributes
– Identifier Attributes
EJEMPLOS DE ATRIBUTOS
•
•
•
•
•
•
ENTIDAD CLIENTE
número
nombre
dirección
teléfono
crédito
e-mail
•
•
•
•
•
•
•
ENTIDAD ESTUDIANTE
número
nombre
edad
genero
departamento
igs
escuela procedencia
ATRIBUTOS - Required versus Optional
• Required attribute - Necesita tener un valor por
cada instancia que tenga la entidad.
– Ej: nombre, género, seguro social, etc.
• Optional attribute - No es necesario que toda
instancia de una entidad tenga un valor en ese
atributo en particular.
– Ej: teléfono, celular, etc.
ATRIBUTOS - Identifier Attributes
• Identifier - Atributo (o combinación de atributos)
que distingue cada instancia de la entidad
haciéndola única. Debe ser un atributo cuyo valor
nunca se repita.
• Simple identifier - Su valor no está sub-dividido en
más de un atributo.
– Ej: Seguro social, número de empleado
• Composite identifier - Un identifier que tiene
valores de más de un atributo.
– Ej: numero de cliente + número de orden
Características de los Identifiers
(Primary Key)
• No cambia de valor.
• No puede ser Nulo (null).
• No pueden ser “inteligentes”. Por ejemplo no pueden
tener valores que puedan cambiar como una dirección,
nombre, edad o algún código que represente un valor que
sea variable.
• Se debe tratar de utilizar identifiers simples (de un solo
atributo) siempre que se pueda.
• A los identifiers se les conoce también como UID (Unique
Identifier) o Primary Key.
Ejemplos de UID
CLIENTE
numero
nombre
seguro social
direccion
teléfono
credito
e-mail
ESTADIO
(PARQUE)
id
nombre
direccion
telefono
capacidad sillas
capacidad carros
El número del cliente es muy
buen candidato para un UID
ya que su valor es único.
El seguro social también
podría ser un buen candidato
para un UID. (ojo )
En el caso de un estadio,
necesitamos crear un atributo
artificial que posea un valor único
para que identifique cada
instancia de la entidad.
RELACIONES
LAS RELACIONES
• Son asociaciones bidireccionales (en
ambas direcciones) e imprescindibles
entre dos o tres entidades o entre una
entidad y ella misma.
• La relación entre las entidades tiene lo
que se conoce como grado o Degree.
DEGREE OF RELATIONSHIPS
• Indica el número de tipos de
entidades que participan en la
relación
–Unary Relationship - Entre la misma
entidad.
–Binary Relationship - Entre dos
entidades.
–Ternary Relationship - Entre tres
entidades.
DEGREE OF RELATIONSHIPS
One entity
related to
another of
the same
entity type
Entities of
two different
types related
to each other
Entities of three
different types
related to each
other
OTRO EJEMPLO DEL GRADO DE
RELACIONES
TIPOS DE RELACIONES
• One-to-One (uno a uno)
– Cada entidad en la relación va a tener exactamente una relación
en sus instancias.
• One-to-Many (uno a muchos)
– La entidad de una parte tiene relación con muchas instancias de la
otra entidad, pero cada instancia de la otra entidad sólo puede
tener relación con una instancia de la primera entidad.
• Many-to-Many (muchos a muchos)
– En ambas entidades en la relación, existen relaciones de muchos a
muchos.
UNO A UNO - EJEMPLOS
EMPLEADO
emp_numero_pk
emp_nombre
emp_fecha_naci
miento
posee
1
ESTACIONAMI
ENTO
estár asignado est_numero
1 est_descripcion
emp_numero_fk
UNO A MUCHOS - EJEMPLOS
DEPARTAMENTO habitado por
dep_id_pk
dep_localización
dep_descripción
1
EMPLEADO
emp_numero_p
estar asignado k
M emp_nombre
emp_seguro
∞ social
MUCHOS A MUCHOS - EJEMPLOS
ESTUDIANTE
est_numero_pk
est_nombre
est_seguro_social
CURSO
tomar
M
∞
tomado por
M
∞
cur_código_pk
cur_semestre
cur_descripción
Ejemplo Diseño de una Base de Datos
Utilizando ACCESS
Data Warehouse / Data Mart
/ Data Minning
17/07/2015
Pag: 54
66
Data Warehouses, Data Marts, and Data
Mining
• Data warehouse: Colecciona información de los negocios utilizando
muchas fuentes de la empresa, no solamente la base de datos.
• Data mart: Un subconjunto (subset) de un data warehouse
• Data mining: Una herramienta para analizar la información con el
propósito de buscar patrones en los datos que pueda servir a la
empresa a obtener ventaja competitiva. Utiliza datos de un data
warehouse o de un data mart.
• Online Analytical Processing – Herramientas gráficas hechas por
sofware que proveen un análisis complejo de los datos que se
almacenan en una base de datos.
67
Data Warehouses
• Data warehouse
– Colección de datos que se utiliza para dar apoyo a la toma de
decisiones gerenciales y para generar BI (business intelligence).
• Los datos en un DW (Data Warehouse) se almacena
utilizando la misma tecnología del modelo relacional de
bases de datos.
• Un DW puede almacenar y comparar multidimensional
data.
• De ahí viene el concepto de hypercubers que permite
analizar tres tipos de datos. Ejemplo: Ventas, Tiendas,
Meses (Dinero vs Lugar demográfico vs Tiempo)
Exhibit 3.9
A Data Warehouse Configuration
Exhibit 3.10
• Data warehouses
are not
transactionoriented.
• Data warehouses
support online
analytical
processing (OLAP).
Slicing and Dicing Data
Business Intelligence
• Business Intelligence (BI)
– Colección de Herramientas que le permite a la gerencia
tomar las mejores decisiones en la toma de decisiones.
– Utiliza los Data warehouse, Data minning, Base de datos,
Programación Web, interfaces gráficas y otras
herramientas que facilitan mostrar datos y conceptos
complejos de una forma simple a la gerencia.
– Más adelante se va a explicar este concepto con más
detalles
BI in Action: Law Enforcement
• Ejemplo de un uso actual de Business intelligence
(BI)
– Used in law enforcement as well as in the business world
• Richmond, Virginia
– System generates BI reports that help pinpoint crime
patterns
– Allocate manpower to days and locations where crime
likely to occur
A not so perfect match
A not so perfect match
•
With the increasing power of Data mining techniques, comes ever increasing and
reaching uses of this powerful technology.
•
1. What are the benefits of DNA databases?
•
2. What problems do DNA databases pose?
•
3. Who should be included in a national DNA database? Should it be limited to
convicted felons?
•
4. Who should be able to use DNA databases?
FIN
17/07/2015
74