2 技术基础

Download Report

Transcript 2 技术基础

第二章 技 术 基 础
第一节 计算机硬件及软件
 第二节 数据库技术
 第三节 数据通信与计算机网络

1
2.1 计算机硬件及软件
一、计算机系统
1、计算机的发展史
第一代
20世纪50年代
真空电子管计算机
第二代
20世纪50年代末到60年代中
期
晶体管计算机
第三代
20世纪60年代中期至70年代
末
集成电路电子计算机
第四代
20世纪70年代末至今
大规模和超大规模集成电路电子计
算机
第五代
20世纪上世纪80年代
开始智能计算机(处于研究阶段)
2
2.1 计算机硬件及软件
2、计算机系统(强调计算机是一个系统) 类型:
 大型机:
特点:
具有强有力的传输数据和处理数据能力,具有大容量的内外 存,
大型机采用专用的操作系统等。
适用范围:
大型计算机可以做联机中央计算机,批处理计算机。
在大型商场、银行、航空公司订票订票处理机构、
国民经济管理部门中,一般都需要采用大型机做
后台服用处理。我国的银河计算机。
3
2.1 计算机硬件及软件
 小型机
特点:
专用操作系统,常采用多CPU结构,具有较大容量的内在和多台
大容量硬盘,数据处理功能较强,实时处理性能比较好等。
适用范围:
作为联机事务处理系统有服务器,或作为有较大数据流量的局域
网服务器。
4
2.1 计算机硬件及软件
 微型计算机
按微机所适用的业务范围分为:商用机、家用机。
按外形大小分为:
台式机、便携机。
便携式分为笔记本型、掌上型
5
2.1 计算机硬件及软件
3、计算机系统功能 ( 计算机是一个系统 )
如下图所示:计算机并非进行电子数据处理的“黑匣子”,也不是一
系列组成部分的简单集合。强调计算机是一个系统。具有系统的特征。
6
2.1 计算机硬件及软件
二、计算机硬件设备
硬件设备是计算机物理设备的总称,通常指电子的、机械的、磁性
的或光的元器件或装置。
1、中央处理器(Central Processing Unit, CPU)
CPU是系统最主要的部件,它由运算器和控制器两个主要部分组成。
 运算器:计算机的运算单元。主要用于完成算术运算和逻辑运算。
 控制器:计算机的神经中枢,它按照主频的节拍发出各种控制信
息,以指挥整个计算机工作。
CPU运算速度是决定计算机系统性能的重要指标
7
2.1 计算机硬件及软件
2、存储器(memory)
存储器是计算机必备的主要部件,分为主存储器和辅助存储两类:
 主存储器(Read Only Memory, ROM):计算机运行过程中用来
存储数据和程序指令的。计算机的主存储器主要是由半导体存储
器组成。
 辅助存储器:辅助存储器又称外部存储器,简称外存,用于数据
和程序的长久保存。常用的辅助存储器有:磁盘(带)、光盘、
移动硬盘、闪存存储器:USB FLASH盘(又称优盘和闪盘)
3、输入设备




计算机键盘(Keyboard)、鼠标器(Mouse);
图文扫描 仪、条形码阅读器;
触摸屏、手写体输入 设备、语音输入设备;
磁盘(带)、A/D,D/A模块。
8
2.1 计算机硬件及软件
4、输出设备





显示器
打印机(针式/激光/喷墨)
绘图仪语音合成与输出设备
磁盘(带)、
A/D,D/A模块
5、其他设备
例如:机箱、主板、系统功能扩展卡(声卡、显卡、网卡等)、光
驱等。
9
2.1 计算机硬件及软件
三、计算机软件
计算机软件
软件分类图:
系统软件
操作系统
语言与编译系统
应用软件
数据库管理软件
通用应用软件
专用应用软件
 系统软件(System Software)用于管理计算机中的CPU、存储器、
通信联接以及各种外部设备等所有系统资源的程序,其主要作用是管
理的控制计算机系统的各个部分,使之协调运行,并为各种数据处理
提供基础功能;
 应用软件(Application Software)是用来完成用户所要求的数据处
理任务或实现用户特定功能的程序。系统软件和应用软件还可以进一
步分为若干个类别。
10
2.1 计算机硬件及软件
1、操作系统软件(Operation System,OS)
 操作系统软件用于管理计算机中的CPU、存储器、通信联接以及
各种外部设备等所有系统资源的程序,其主要作用是管理的控制
计算机系统的各个部分,使之协调运行,并为各种数据处理提供
基础功能。
 操作系统具备两大功能:
 系统资源的管理者、用户与计算机之间的接口
 操作系统软件的版本:
单机版:Windows9x、Windows2000、Linux、Unix……
网络版:Novell、Windows NT…...
11
2.1 计算机硬件及软件
2、数据库管理软件(Database Management System,
DBMS)
 数据库管理软件是专门对数据记录进行综合管理的软件,以数据
文件结构的定义、数据记录的更新、数据记录的查询以及对数据
记录的各种运算提供全面的支持。
3、程序设计语言与编译系统






机器语言
汇编语言
高级语言
第四代语言(4GL)
面向对象的程序语言
标记语言
12
2.1 计算机硬件及软件
4、应用软件
 应用软件是直接面向最终用户的具体应用软件。以操作系统为基
础,用程序设计语言编写,或用数据库管理系统构造,用于满足
用户的各种具体要求。
 通用应用软件:
 专用应用软件:
通用应用软件:Microsoft Office 、用友财务软件
专用应用软件:为某公司定制的人力资源管理信息系统
13
2.2 数据库技术
一、数据库概述
1、数据处理的发展
 简单应用 (20世纪50年代以前)。
基本特征:
无数据管理及完全分散的手工方式。
应用背景:
硬件无外存或只有磁带外存,输入输出设备简单。
软件无操作系统,无文件管理系统,无管理数据的软件。
主要特点:
数据是程序的组成部分,数据不独立。修改数据必须修改程序。
处理时,数据随程序一道送入内存,用完后全部撤出计算机,不
能保留。数据大量重复,不能共享。
14
2.2 数据库技术
 文件系统 (50年代后期到60年代中期)。
基本特征:
具有面向应用的数据管理功能,工作方式是仍然是分散、非手工
的。
应用背景:
硬件外存有了很大的发展,除了磁带机,还出现了大容量的硬盘
和灵活的软磁盘软件出现了操作系统、文件管理系统和多用户的
分时系统,专用于商业事务管理的高级语言COBOL
主要特点:
数据管理方面,实现了数据对程序的一定的独立性,数据不再是
程序的组成部分,修改数据不必修改程序,数据有结构,被组织
到文件内,存储在磁带、磁盘上,可以反复使用和保存。文件逻
辑结构向存储结构的转换由软件系统自动完成,系统开发和维护
工作得到减轻。
15
2.2 数据库技术
 数据库系统 (60年代后期开始)。
应用背景:
硬件大容量磁盘已经出现、硬件价格大幅下降软件联机实时处理
业务增多、面向全组织的复杂数据结构、数据冗余度小,易于扩
充、数据与程序独立、统一的数据控制功能。
特点:
面向全组织的复杂数据结构。
数据冗余度小,易于扩充。
数据与程序独立。
统一的数据控制功能。
16
2.2 数据库技术
2、数据库DB
3、数据库管理系统(DBMS)
数据库管理系统DBMS(database management system)是指用户
与操作系统之的一层数据管理软件,它为用户应程序提供访问数据
库 的方法,包括数据库的建立、查询、更新及各种数据控制。
数据库管理系统功能包括:
 定义数据库的功能。
 管理数据库的功能。
 维护数据库的功能。
 数据通信的功能。
17
2.2 数据库技术
4、数据库系统(DBS)
数据库系统 DBS (database system) 是实现有组织、动态在存储尤
其是关联数据、方便多用户访问的计算机软件、硬件和数据资源组
成 的系统,即它是采用了数据库技术的计算机系统。
数据库系统构成:
 硬件
 软件(主要包括:操作系统、数据库管理系统(DBMS)、应用
软件包和应用程序 )
 人员(主要包括:系统分析员、系统程序员应用程序员、数据库
管理员(DBA) )
18
2.2 数据库技术
二、数据描述
数据描述是数据处理中的一个重要环节,从事物的特性到计算机中
的具体表示,实际上经历了三个领域:现实世界、信息世界和机器
世界。
1、基本术语
信息世界的
数据描述的
主要工具E-R图
19
2.2 数据库技术
 实体(entity):
是指明客观存在并相互区别的事物。实体可以是具体对象,例如
一本书、一个工厂、一种材料等。也可以是抽象的概念和联系,
例如学生的一次选课、一次借书等。
 实体集(entity set):
具有相同性质的同类实体的集合。例如所有教师、所有选课等。
 属性(attribute):
实体具有许多特性,每一个特性称为属性。每个属性有一个联欢
会范围,即值域。例如学生的实体可由学号、姓名、性别、年龄、
系别等属性组成。性别的取值范围是“男”或“女”。
 主键(key):
惟一标识实体的属性集称为主键。例如学生实体的学号可作为学
生实体的主键。
20
2.2 数据库技术
 实体间的联系:
现实世界中,事物是相互联系的。这种联系必然在信息世界中体
现出来,即实体是相互关联的。两个不同实体集的实体间的联系,
它有以下三种情形:
 一对一联系,记为1:1。例如工厂与厂长之间,科研任务与课题
组长之间都是1:1联系。
 一对多联系,记为1:N。例如一个学校有若干学生,而每个学生
都在一个学校学习,学校与学生之间是一对多的联系。
 多对多联系,记为M:N。例如课程与学生之间,一个学生可选多
门课程,而每一门课程可有多个学生选修,课程与学生之间是多
对多的联系。
21
2.2 数据库技术
2、数据模型
数据模型是从计算机系统的观点对数据建模,主要用于数据库管理系
统的实现,它主要包括层次模型、关系模型、网状模型和面向对象模
型等。DB的分类是依据数据模型进行的。
 层次模型:用树型结构表示。
A
A1
A11
A12
A2
A13
A21
A22
22
2.2 数据库技术
 网状模型:用有向图结构表示。
S2
T1
S2
T2
T3
W1
T4
W2
T5
W3
 关系模型:用二维表结构表示。
结算编码
合同号
数量
金额
J0012
HT1008
2 000
50 000
J0043
HT1109
600
13 000
J0033
GT1123
2 300
6 000
23
2.2 数据库技术
 面向对象模型:用对象和类来表示实体类型和实体间联系的数据
模型 。
姓名
性别
年龄
姓名
性别
年龄
班级
特长
类 中学生
类 学生
姓名
性别
年龄
系别
专业
类 大学生
数据模型的要素:
数据模型一般由下列三要素组成:一组对象及其结构、一组操作和
一组(关于对象与操作的)约束。
24
2.2 数据库技术
三、关系数据库
关系数据库是以二维表作为数据模型的数据库系统。
1、关系模型组成
关系模型由三部分组成:数据结构(即关系)、关系操作、关系的
完整性。
 单一的数据结构——关系:在关系模型中,无论是实体还是实体
之间的联系均由单一的类型结构——关系来表示。
 关系操作:基本操作有并、交、差、笛卡尔乘积、限制、投影、
连接、除。关系操作可以用两种方式表示:代数方式即关系代数,
逻辑方式即关系演算。信息在机器世界中是以数据形式存储的,
其数据描述需要用到以下术语:
字段(field)、记录(record)、文件(file)、主键(key):
25
2.2 数据库技术
数据描述需要用到的术语:
 字段(field):
标记实体属性的命名单位称为字段(数据项)。它是可以命名的
最小信息单位。例如学生、姓名、性别、年龄、系别等字段。
 记录(record):
字段的有序集合称为记录(相当于前面提到的数据元素)。一般
用一个记录描述一个实体。例如一个学生记录,由有序的字段集
组成:(2003、秦阳、男、25、管理系)。
 文件(file):
同一类记录的汇集称为文件。文件是描述实体集的。例如所有学
生记录组成了一个学生文件。
 主键(key):
能惟一标识文件中每个记录的字段集,称为文件的主键。例如学
号可以作为学生记录的主键。
26
2.2 数据库技术
 关系模型的三类完整性:
 实体完整性:
若属性A是基本关系R的主关键字中的属性(即主属性),则属
性A不能取空值。
 参照完整性:
若基本关系R中含有另一个基本关系S的主关键字Ks所对应的属
性组F(F称为R的外部关键字),则在关系R中的每个 元组中的F
上的值必须满足:a.或取空值;b.或等于S中某 个元组的主关键字
的值。
 用户定义的完整性:
用户自己对数据完整性的要求。
27
2.2 数据库技术
2、SQL
SQL (Structured Query Language,结构查询语言) 是一个功能强大
的数据库语言。SQL是关系数据库管理系统的标准语言。SQL语句通
常用于完成一些数据库的操作任务,比如在数据库中更新数据,或者
从数据库中检索数据。
SQL功能可以分成以下几组:
 DML(Data Manipulation Language,数据操作语言):用于检
索或者修改数据。
 SELECT:用于检索数据;
 INSERT:用于增加数据到数据库;
 UPDATE:用于从数据库中修改现存的数据
 DELETE:用于从数据库中删除数据。
28
2.2 数据库技术
 DDL(Data Definition Language,数据定义语言): 用于定义
数据的结构,比如 创建、修改或者删除数据库;
 CREATE TABLE
 DROP TABLE
 CREATE INDEX
 DROP INDEX
 DCL(Data Control Language,数据控制语言):用于定义数据
库用户的权限。
 ALTER PASSWORD
29
2.2 数据库技术
3、规范化设计理论
E.F.Codd 于1971年提出规范化理论。他定义了五种规范化模式
(Normal From,简称范式)。
范式表示的是关系模式的规范化程序,也即满足某种约束条件的关
系模式,根据满足的约束条件的不同来确定范式。
在五种范式中,通常只用到前三种:
范式
条件
第一范式(1NF)
元组中每一个分量都必须是不可分割的数据项
第二范式(2NF)
不仅满足第一范式,而且所有非主属性完全依赖于其主码
第三范式(3NF)
不仅满足第二范式,而且它的任可一个非主属性都不传递于任
何主关键字
30
2.2 数据库技术
 1NF
下表不符合第一范式的关系
教师代码
姓名
职称
系
电话
1101
王一丽
教授
管理系
1102
刘
副教授
1254
李爱军
讲师
明
研究课题
研究课题号
研究课题名
3324
500
管理信息
管理系
3324
800
金融工程
投资系
3341
630
电子商务
由非1NF规范化为1NF
教师代码
姓名
职称
系
电话
研究课题号
研究课题名
1101
王一丽
教授
管理系
3324
500
管理信息
1102
刘
副教授
管理系
3324
800
金融工程
1254
李爱军
讲师
投资系
3341
630
电子商务
明
31
2.2 数据库技术
 1NF转化为2NF
上表中关系满足1NF,但不满足2NF。
这种关系会引发下列问题:
数据冗余、插入异常、删除异常。
解决的方法是将一个非2NF的关系模式分解为多个2NF的关
系模式。
在本例中,可将关分解为如下三个关系:
 教师关系:教师代码、姓名、职称、教师所在系、电话;
 课题关系:研究课题号、研究课题名;
 教师与课题关系:教师代码、研究课题号。
32
2.2 数据库技术
 由2NF规范化为3NF:
教师代码
姓名
职称
系
电 话
上表符合第二范式,但是不符合第三范式
这样的关系同样存在着高度冗余和更新异常问题。消除传递
依赖关系的办法是将关系分解为如下几个3NF关系:
 教师关系:教师代码、姓名、职称、系别;
 系别:所在系、电话;
 课题关系:研究课题号、研究课题名;
 教师与课题关系:教师代码、研究课题号。
3NF消除了插入异常、删除异常、数据冗余及修改复杂等问
题,已经是比较规范的关系。
33
2.3 数据通信与计算机网络
一、计算机通信与网络概述
1、计算机网络发展
通信技术是信息技术的一个重要组成部分。数据通信是20世纪50
年代后期随着电子计算机的广泛应用而发展起来的。计算机网络是计算
机技术与通信技术紧密结合的产物。计算机网络的形成与发展经历了三
个阶段:
 面向终端的计算机网络。例如50年代初美国的SAGE系统。
 以资源共享为目标的计算机—计算机网络阶段。例如60年代美国
的ARPA网,IBM的SNA网,DEC的DNA网等。
 开放式标准化网络阶段。例如Internet。
34
2.3 数据通信与计算机网络
2、计算机网络的典型分类
计算机网络的分类方法很多。通常按计算机网络覆盖的范围将其分
类:局域网、城域网和广域网。



局域网LAN(local area network)
城域网 MAN(metropolitan area network)
广域网WAN(wide area network)
其它分类有:交换方式、拓扑结构等。局域网、Internet是应用重点。
35
2.3 数据通信与计算机网络
3、计算机网络的组成与结构
计算机网络完成数据处理与数据传输两个任务,从结构上可分为资
源子网和通信子网两个部分。
主
机
主
机
通 信
子网
主
机
主
机
主
机
资 源
子网
主
机
图6.1 计算机网络结
构图
主
机
36
2.3 数据通信与计算机网络
4、计算机网络的拓扑结构
计算机网络的拓扑结构表示网络中的结点与通信线路之间的几何关
系,反映网络中各实体间的结构关系。
拓扑结构主要有:星形拓扑、总线拓扑、环形拓扑、树形拓扑及网
形拓扑。
37
2.3 数据通信与计算机网络
5、传输媒体
传输媒体是通信网络中发送方和接收方之间的物理通路,计算机网
络中采用的传输媒体分有线和无线两大类。
同
 有线传输媒体: 双绞线(TP) 同轴电缆
轴
电
缆
光纤( 按使用的波长区的不同分为单模和多模光纤通信方式 )
 无线传输媒体 (微波通信、卫星通信、红外通信和激光通信。)他
们又统称为视线媒体
38
2.3 数据通信与计算机网络
6、常见的网络互联设备
 调制解调器:在通信过程中将数据信号转换成模拟信号或者将模
拟信号转换成数据信号的设备。
 网络接口卡:网络接口卡简称网卡,用来负责计算机和网络之间
的集中数据转换。
 中继器:中继器是一种连接设备,用来连接两个以至于同类网络
的网段。中继器的作用是对信号进行整形,防止因线路的阻抗造
成信号的衰减和畸变,增加信息传输的距离。
 集线器:集线器(HUB)是一个具有多个连接端口的设备,每个
端口可连接一个节点。
 交换机:交换机(Switch)是用来连接多网段的中规模以上的局
域网的一种网络连接设备。
39
2.3 数据通信与计算机网络
二、局域网
局域网的特性主要涉及拓扑结构、传输媒体和媒体访问控制
(Medium Access Control, MAC)等三项技术问题,其中最重要的是媒体
访问控制方法。
1、以太网技术
传统局域网使用的就是采用上述标准的以太网技术,包括采用总线
拓扑结构、具有冲突检测的载波监听多路访问CSMA/CD的总线争用技
术。
2、快速以太网
IEEE于1995年通过了100Mbps快速以太网的100 BASE-T标准,并
正式命名为IEEE802.3u标准,作为对IEEE802.3标准的补充。
100BASE-T标准不但在最大程度上保持了IEEE802.3标准的完整
性,而且保留了核心以太网的细节规范。
40
2.3 数据通信与计算机网络
三、因特网(Internet)
因特网是一个建立在网络互联基础上的、开放的全球性网络。所有
采用TCP/IP协议的计算机都可加入Internet,实现信息共享和相互通信。
1、Internet的结构特点
Internet采用了目前最流行的客户机/服务器工作模式,凡是使用
TCP/IP协议,并能与Internet的任意主机进行通信的计算机,无论是何
种类型、采用何种操作系统,均可看成是Internet的一部分。
2、ISP接入方式
帧中继方式。
专线(DDN)方式。
ISDN方式。
41
2.3 数据通信与计算机网络
3、用户接入方式
仿真终端方式。
拨号IP方式。
局域网连接方式。
4、Internet的关键技术
 TCP/IP技术
 主机IP地址
IP地址由32位(即4字节)二进制数组成,为书写方便起见,常将
每的个字节作为一段并以十进制数来表示,每段间用“.”分隔。
例如,202.96.209.5就是一个合法的IP地址。
42
2.3 数据通信与计算机网络
IP地址由网络标识和主机标识两部分组成。常用的IP地址有A、B、
C三类,每类均规定了网络标识和主机标识在32位中所占的位数。
 A类地址:0.0.0.0~127.255.255.255,A类地址一般分配具有大
量主机的网络使用。
 B类地址:128.0.0.0~191.255.255.255,B类地址通常分配给规
模中等的网络使用。
 C类地址:192.0.0.0~233.255.255.255,C类地址通常分配给小
型局域网使用。
为了确保惟一性,IP地址由世界各大地区的权威机构 Inter NIC
( Internet Network Information Center )管理和分配。
43
2.3 数据通信与计算机网络
 域名系统和统一资源定位器
32位二进制数的IP地址对计算机来说十分有效,但用户使用和记
忆都很不方便。为此,Internet引进了字符形式的IP地址,即域名。
域名采用层次结构的基于“域”的命名方案,每一层由一个子域名
间
用“.”分隔,其格式为:
机器名.网络名.机构名.最高域名
Internet上的域名由域名系统 DNS ( Domain Name System )统
一管理。 DNS是一个分布式数据库系统,由域名空间、域名服务器
和地址转换请求程序三部分组成。
WWW上的每一个网页(Home Page)都有一个独立的地址,这些
地址称为统一资源定位器(URL),只要知道某网页的URL,便可直
接打开该网页。
44
2.3 数据通信与计算机网络
5、Internet的应用





万维网(World Wide Web,简称WWW)
电子邮件E-mail。
讨论组Usenet。
文件传输FTP(File Transfer Protocol)
远程登陆Telnet。
45