Transcript 2 技术基础
第二章 技 术 基 础 第一节 计算机硬件及软件 第二节 数据库技术 第三节 数据通信与计算机网络 1 2.1 计算机硬件及软件 一、计算机系统 1、计算机的发展史 第一代 20世纪50年代 真空电子管计算机 第二代 20世纪50年代末到60年代中 期 晶体管计算机 第三代 20世纪60年代中期至70年代 末 集成电路电子计算机 第四代 20世纪70年代末至今 大规模和超大规模集成电路电子计 算机 第五代 20世纪上世纪80年代 开始智能计算机(处于研究阶段) 2 2.1 计算机硬件及软件 2、计算机系统(强调计算机是一个系统) 类型: 大型机: 特点: 具有强有力的传输数据和处理数据能力,具有大容量的内外 存, 大型机采用专用的操作系统等。 适用范围: 大型计算机可以做联机中央计算机,批处理计算机。 在大型商场、银行、航空公司订票订票处理机构、 国民经济管理部门中,一般都需要采用大型机做 后台服用处理。我国的银河计算机。 3 2.1 计算机硬件及软件 小型机 特点: 专用操作系统,常采用多CPU结构,具有较大容量的内在和多台 大容量硬盘,数据处理功能较强,实时处理性能比较好等。 适用范围: 作为联机事务处理系统有服务器,或作为有较大数据流量的局域 网服务器。 4 2.1 计算机硬件及软件 微型计算机 按微机所适用的业务范围分为:商用机、家用机。 按外形大小分为: 台式机、便携机。 便携式分为笔记本型、掌上型 5 2.1 计算机硬件及软件 3、计算机系统功能 ( 计算机是一个系统 ) 如下图所示:计算机并非进行电子数据处理的“黑匣子”,也不是一 系列组成部分的简单集合。强调计算机是一个系统。具有系统的特征。 6 2.1 计算机硬件及软件 二、计算机硬件设备 硬件设备是计算机物理设备的总称,通常指电子的、机械的、磁性 的或光的元器件或装置。 1、中央处理器(Central Processing Unit, CPU) CPU是系统最主要的部件,它由运算器和控制器两个主要部分组成。 运算器:计算机的运算单元。主要用于完成算术运算和逻辑运算。 控制器:计算机的神经中枢,它按照主频的节拍发出各种控制信 息,以指挥整个计算机工作。 CPU运算速度是决定计算机系统性能的重要指标 7 2.1 计算机硬件及软件 2、存储器(memory) 存储器是计算机必备的主要部件,分为主存储器和辅助存储两类: 主存储器(Read Only Memory, ROM):计算机运行过程中用来 存储数据和程序指令的。计算机的主存储器主要是由半导体存储 器组成。 辅助存储器:辅助存储器又称外部存储器,简称外存,用于数据 和程序的长久保存。常用的辅助存储器有:磁盘(带)、光盘、 移动硬盘、闪存存储器:USB FLASH盘(又称优盘和闪盘) 3、输入设备 计算机键盘(Keyboard)、鼠标器(Mouse); 图文扫描 仪、条形码阅读器; 触摸屏、手写体输入 设备、语音输入设备; 磁盘(带)、A/D,D/A模块。 8 2.1 计算机硬件及软件 4、输出设备 显示器 打印机(针式/激光/喷墨) 绘图仪语音合成与输出设备 磁盘(带)、 A/D,D/A模块 5、其他设备 例如:机箱、主板、系统功能扩展卡(声卡、显卡、网卡等)、光 驱等。 9 2.1 计算机硬件及软件 三、计算机软件 计算机软件 软件分类图: 系统软件 操作系统 语言与编译系统 应用软件 数据库管理软件 通用应用软件 专用应用软件 系统软件(System Software)用于管理计算机中的CPU、存储器、 通信联接以及各种外部设备等所有系统资源的程序,其主要作用是管 理的控制计算机系统的各个部分,使之协调运行,并为各种数据处理 提供基础功能; 应用软件(Application Software)是用来完成用户所要求的数据处 理任务或实现用户特定功能的程序。系统软件和应用软件还可以进一 步分为若干个类别。 10 2.1 计算机硬件及软件 1、操作系统软件(Operation System,OS) 操作系统软件用于管理计算机中的CPU、存储器、通信联接以及 各种外部设备等所有系统资源的程序,其主要作用是管理的控制 计算机系统的各个部分,使之协调运行,并为各种数据处理提供 基础功能。 操作系统具备两大功能: 系统资源的管理者、用户与计算机之间的接口 操作系统软件的版本: 单机版:Windows9x、Windows2000、Linux、Unix…… 网络版:Novell、Windows NT…... 11 2.1 计算机硬件及软件 2、数据库管理软件(Database Management System, DBMS) 数据库管理软件是专门对数据记录进行综合管理的软件,以数据 文件结构的定义、数据记录的更新、数据记录的查询以及对数据 记录的各种运算提供全面的支持。 3、程序设计语言与编译系统 机器语言 汇编语言 高级语言 第四代语言(4GL) 面向对象的程序语言 标记语言 12 2.1 计算机硬件及软件 4、应用软件 应用软件是直接面向最终用户的具体应用软件。以操作系统为基 础,用程序设计语言编写,或用数据库管理系统构造,用于满足 用户的各种具体要求。 通用应用软件: 专用应用软件: 通用应用软件:Microsoft Office 、用友财务软件 专用应用软件:为某公司定制的人力资源管理信息系统 13 2.2 数据库技术 一、数据库概述 1、数据处理的发展 简单应用 (20世纪50年代以前)。 基本特征: 无数据管理及完全分散的手工方式。 应用背景: 硬件无外存或只有磁带外存,输入输出设备简单。 软件无操作系统,无文件管理系统,无管理数据的软件。 主要特点: 数据是程序的组成部分,数据不独立。修改数据必须修改程序。 处理时,数据随程序一道送入内存,用完后全部撤出计算机,不 能保留。数据大量重复,不能共享。 14 2.2 数据库技术 文件系统 (50年代后期到60年代中期)。 基本特征: 具有面向应用的数据管理功能,工作方式是仍然是分散、非手工 的。 应用背景: 硬件外存有了很大的发展,除了磁带机,还出现了大容量的硬盘 和灵活的软磁盘软件出现了操作系统、文件管理系统和多用户的 分时系统,专用于商业事务管理的高级语言COBOL 主要特点: 数据管理方面,实现了数据对程序的一定的独立性,数据不再是 程序的组成部分,修改数据不必修改程序,数据有结构,被组织 到文件内,存储在磁带、磁盘上,可以反复使用和保存。文件逻 辑结构向存储结构的转换由软件系统自动完成,系统开发和维护 工作得到减轻。 15 2.2 数据库技术 数据库系统 (60年代后期开始)。 应用背景: 硬件大容量磁盘已经出现、硬件价格大幅下降软件联机实时处理 业务增多、面向全组织的复杂数据结构、数据冗余度小,易于扩 充、数据与程序独立、统一的数据控制功能。 特点: 面向全组织的复杂数据结构。 数据冗余度小,易于扩充。 数据与程序独立。 统一的数据控制功能。 16 2.2 数据库技术 2、数据库DB 3、数据库管理系统(DBMS) 数据库管理系统DBMS(database management system)是指用户 与操作系统之的一层数据管理软件,它为用户应程序提供访问数据 库 的方法,包括数据库的建立、查询、更新及各种数据控制。 数据库管理系统功能包括: 定义数据库的功能。 管理数据库的功能。 维护数据库的功能。 数据通信的功能。 17 2.2 数据库技术 4、数据库系统(DBS) 数据库系统 DBS (database system) 是实现有组织、动态在存储尤 其是关联数据、方便多用户访问的计算机软件、硬件和数据资源组 成 的系统,即它是采用了数据库技术的计算机系统。 数据库系统构成: 硬件 软件(主要包括:操作系统、数据库管理系统(DBMS)、应用 软件包和应用程序 ) 人员(主要包括:系统分析员、系统程序员应用程序员、数据库 管理员(DBA) ) 18 2.2 数据库技术 二、数据描述 数据描述是数据处理中的一个重要环节,从事物的特性到计算机中 的具体表示,实际上经历了三个领域:现实世界、信息世界和机器 世界。 1、基本术语 信息世界的 数据描述的 主要工具E-R图 19 2.2 数据库技术 实体(entity): 是指明客观存在并相互区别的事物。实体可以是具体对象,例如 一本书、一个工厂、一种材料等。也可以是抽象的概念和联系, 例如学生的一次选课、一次借书等。 实体集(entity set): 具有相同性质的同类实体的集合。例如所有教师、所有选课等。 属性(attribute): 实体具有许多特性,每一个特性称为属性。每个属性有一个联欢 会范围,即值域。例如学生的实体可由学号、姓名、性别、年龄、 系别等属性组成。性别的取值范围是“男”或“女”。 主键(key): 惟一标识实体的属性集称为主键。例如学生实体的学号可作为学 生实体的主键。 20 2.2 数据库技术 实体间的联系: 现实世界中,事物是相互联系的。这种联系必然在信息世界中体 现出来,即实体是相互关联的。两个不同实体集的实体间的联系, 它有以下三种情形: 一对一联系,记为1:1。例如工厂与厂长之间,科研任务与课题 组长之间都是1:1联系。 一对多联系,记为1:N。例如一个学校有若干学生,而每个学生 都在一个学校学习,学校与学生之间是一对多的联系。 多对多联系,记为M:N。例如课程与学生之间,一个学生可选多 门课程,而每一门课程可有多个学生选修,课程与学生之间是多 对多的联系。 21 2.2 数据库技术 2、数据模型 数据模型是从计算机系统的观点对数据建模,主要用于数据库管理系 统的实现,它主要包括层次模型、关系模型、网状模型和面向对象模 型等。DB的分类是依据数据模型进行的。 层次模型:用树型结构表示。 A A1 A11 A12 A2 A13 A21 A22 22 2.2 数据库技术 网状模型:用有向图结构表示。 S2 T1 S2 T2 T3 W1 T4 W2 T5 W3 关系模型:用二维表结构表示。 结算编码 合同号 数量 金额 J0012 HT1008 2 000 50 000 J0043 HT1109 600 13 000 J0033 GT1123 2 300 6 000 23 2.2 数据库技术 面向对象模型:用对象和类来表示实体类型和实体间联系的数据 模型 。 姓名 性别 年龄 姓名 性别 年龄 班级 特长 类 中学生 类 学生 姓名 性别 年龄 系别 专业 类 大学生 数据模型的要素: 数据模型一般由下列三要素组成:一组对象及其结构、一组操作和 一组(关于对象与操作的)约束。 24 2.2 数据库技术 三、关系数据库 关系数据库是以二维表作为数据模型的数据库系统。 1、关系模型组成 关系模型由三部分组成:数据结构(即关系)、关系操作、关系的 完整性。 单一的数据结构——关系:在关系模型中,无论是实体还是实体 之间的联系均由单一的类型结构——关系来表示。 关系操作:基本操作有并、交、差、笛卡尔乘积、限制、投影、 连接、除。关系操作可以用两种方式表示:代数方式即关系代数, 逻辑方式即关系演算。信息在机器世界中是以数据形式存储的, 其数据描述需要用到以下术语: 字段(field)、记录(record)、文件(file)、主键(key): 25 2.2 数据库技术 数据描述需要用到的术语: 字段(field): 标记实体属性的命名单位称为字段(数据项)。它是可以命名的 最小信息单位。例如学生、姓名、性别、年龄、系别等字段。 记录(record): 字段的有序集合称为记录(相当于前面提到的数据元素)。一般 用一个记录描述一个实体。例如一个学生记录,由有序的字段集 组成:(2003、秦阳、男、25、管理系)。 文件(file): 同一类记录的汇集称为文件。文件是描述实体集的。例如所有学 生记录组成了一个学生文件。 主键(key): 能惟一标识文件中每个记录的字段集,称为文件的主键。例如学 号可以作为学生记录的主键。 26 2.2 数据库技术 关系模型的三类完整性: 实体完整性: 若属性A是基本关系R的主关键字中的属性(即主属性),则属 性A不能取空值。 参照完整性: 若基本关系R中含有另一个基本关系S的主关键字Ks所对应的属 性组F(F称为R的外部关键字),则在关系R中的每个 元组中的F 上的值必须满足:a.或取空值;b.或等于S中某 个元组的主关键字 的值。 用户定义的完整性: 用户自己对数据完整性的要求。 27 2.2 数据库技术 2、SQL SQL (Structured Query Language,结构查询语言) 是一个功能强大 的数据库语言。SQL是关系数据库管理系统的标准语言。SQL语句通 常用于完成一些数据库的操作任务,比如在数据库中更新数据,或者 从数据库中检索数据。 SQL功能可以分成以下几组: DML(Data Manipulation Language,数据操作语言):用于检 索或者修改数据。 SELECT:用于检索数据; INSERT:用于增加数据到数据库; UPDATE:用于从数据库中修改现存的数据 DELETE:用于从数据库中删除数据。 28 2.2 数据库技术 DDL(Data Definition Language,数据定义语言): 用于定义 数据的结构,比如 创建、修改或者删除数据库; CREATE TABLE DROP TABLE CREATE INDEX DROP INDEX DCL(Data Control Language,数据控制语言):用于定义数据 库用户的权限。 ALTER PASSWORD 29 2.2 数据库技术 3、规范化设计理论 E.F.Codd 于1971年提出规范化理论。他定义了五种规范化模式 (Normal From,简称范式)。 范式表示的是关系模式的规范化程序,也即满足某种约束条件的关 系模式,根据满足的约束条件的不同来确定范式。 在五种范式中,通常只用到前三种: 范式 条件 第一范式(1NF) 元组中每一个分量都必须是不可分割的数据项 第二范式(2NF) 不仅满足第一范式,而且所有非主属性完全依赖于其主码 第三范式(3NF) 不仅满足第二范式,而且它的任可一个非主属性都不传递于任 何主关键字 30 2.2 数据库技术 1NF 下表不符合第一范式的关系 教师代码 姓名 职称 系 电话 1101 王一丽 教授 管理系 1102 刘 副教授 1254 李爱军 讲师 明 研究课题 研究课题号 研究课题名 3324 500 管理信息 管理系 3324 800 金融工程 投资系 3341 630 电子商务 由非1NF规范化为1NF 教师代码 姓名 职称 系 电话 研究课题号 研究课题名 1101 王一丽 教授 管理系 3324 500 管理信息 1102 刘 副教授 管理系 3324 800 金融工程 1254 李爱军 讲师 投资系 3341 630 电子商务 明 31 2.2 数据库技术 1NF转化为2NF 上表中关系满足1NF,但不满足2NF。 这种关系会引发下列问题: 数据冗余、插入异常、删除异常。 解决的方法是将一个非2NF的关系模式分解为多个2NF的关 系模式。 在本例中,可将关分解为如下三个关系: 教师关系:教师代码、姓名、职称、教师所在系、电话; 课题关系:研究课题号、研究课题名; 教师与课题关系:教师代码、研究课题号。 32 2.2 数据库技术 由2NF规范化为3NF: 教师代码 姓名 职称 系 电 话 上表符合第二范式,但是不符合第三范式 这样的关系同样存在着高度冗余和更新异常问题。消除传递 依赖关系的办法是将关系分解为如下几个3NF关系: 教师关系:教师代码、姓名、职称、系别; 系别:所在系、电话; 课题关系:研究课题号、研究课题名; 教师与课题关系:教师代码、研究课题号。 3NF消除了插入异常、删除异常、数据冗余及修改复杂等问 题,已经是比较规范的关系。 33 2.3 数据通信与计算机网络 一、计算机通信与网络概述 1、计算机网络发展 通信技术是信息技术的一个重要组成部分。数据通信是20世纪50 年代后期随着电子计算机的广泛应用而发展起来的。计算机网络是计算 机技术与通信技术紧密结合的产物。计算机网络的形成与发展经历了三 个阶段: 面向终端的计算机网络。例如50年代初美国的SAGE系统。 以资源共享为目标的计算机—计算机网络阶段。例如60年代美国 的ARPA网,IBM的SNA网,DEC的DNA网等。 开放式标准化网络阶段。例如Internet。 34 2.3 数据通信与计算机网络 2、计算机网络的典型分类 计算机网络的分类方法很多。通常按计算机网络覆盖的范围将其分 类:局域网、城域网和广域网。 局域网LAN(local area network) 城域网 MAN(metropolitan area network) 广域网WAN(wide area network) 其它分类有:交换方式、拓扑结构等。局域网、Internet是应用重点。 35 2.3 数据通信与计算机网络 3、计算机网络的组成与结构 计算机网络完成数据处理与数据传输两个任务,从结构上可分为资 源子网和通信子网两个部分。 主 机 主 机 通 信 子网 主 机 主 机 主 机 资 源 子网 主 机 图6.1 计算机网络结 构图 主 机 36 2.3 数据通信与计算机网络 4、计算机网络的拓扑结构 计算机网络的拓扑结构表示网络中的结点与通信线路之间的几何关 系,反映网络中各实体间的结构关系。 拓扑结构主要有:星形拓扑、总线拓扑、环形拓扑、树形拓扑及网 形拓扑。 37 2.3 数据通信与计算机网络 5、传输媒体 传输媒体是通信网络中发送方和接收方之间的物理通路,计算机网 络中采用的传输媒体分有线和无线两大类。 同 有线传输媒体: 双绞线(TP) 同轴电缆 轴 电 缆 光纤( 按使用的波长区的不同分为单模和多模光纤通信方式 ) 无线传输媒体 (微波通信、卫星通信、红外通信和激光通信。)他 们又统称为视线媒体 38 2.3 数据通信与计算机网络 6、常见的网络互联设备 调制解调器:在通信过程中将数据信号转换成模拟信号或者将模 拟信号转换成数据信号的设备。 网络接口卡:网络接口卡简称网卡,用来负责计算机和网络之间 的集中数据转换。 中继器:中继器是一种连接设备,用来连接两个以至于同类网络 的网段。中继器的作用是对信号进行整形,防止因线路的阻抗造 成信号的衰减和畸变,增加信息传输的距离。 集线器:集线器(HUB)是一个具有多个连接端口的设备,每个 端口可连接一个节点。 交换机:交换机(Switch)是用来连接多网段的中规模以上的局 域网的一种网络连接设备。 39 2.3 数据通信与计算机网络 二、局域网 局域网的特性主要涉及拓扑结构、传输媒体和媒体访问控制 (Medium Access Control, MAC)等三项技术问题,其中最重要的是媒体 访问控制方法。 1、以太网技术 传统局域网使用的就是采用上述标准的以太网技术,包括采用总线 拓扑结构、具有冲突检测的载波监听多路访问CSMA/CD的总线争用技 术。 2、快速以太网 IEEE于1995年通过了100Mbps快速以太网的100 BASE-T标准,并 正式命名为IEEE802.3u标准,作为对IEEE802.3标准的补充。 100BASE-T标准不但在最大程度上保持了IEEE802.3标准的完整 性,而且保留了核心以太网的细节规范。 40 2.3 数据通信与计算机网络 三、因特网(Internet) 因特网是一个建立在网络互联基础上的、开放的全球性网络。所有 采用TCP/IP协议的计算机都可加入Internet,实现信息共享和相互通信。 1、Internet的结构特点 Internet采用了目前最流行的客户机/服务器工作模式,凡是使用 TCP/IP协议,并能与Internet的任意主机进行通信的计算机,无论是何 种类型、采用何种操作系统,均可看成是Internet的一部分。 2、ISP接入方式 帧中继方式。 专线(DDN)方式。 ISDN方式。 41 2.3 数据通信与计算机网络 3、用户接入方式 仿真终端方式。 拨号IP方式。 局域网连接方式。 4、Internet的关键技术 TCP/IP技术 主机IP地址 IP地址由32位(即4字节)二进制数组成,为书写方便起见,常将 每的个字节作为一段并以十进制数来表示,每段间用“.”分隔。 例如,202.96.209.5就是一个合法的IP地址。 42 2.3 数据通信与计算机网络 IP地址由网络标识和主机标识两部分组成。常用的IP地址有A、B、 C三类,每类均规定了网络标识和主机标识在32位中所占的位数。 A类地址:0.0.0.0~127.255.255.255,A类地址一般分配具有大 量主机的网络使用。 B类地址:128.0.0.0~191.255.255.255,B类地址通常分配给规 模中等的网络使用。 C类地址:192.0.0.0~233.255.255.255,C类地址通常分配给小 型局域网使用。 为了确保惟一性,IP地址由世界各大地区的权威机构 Inter NIC ( Internet Network Information Center )管理和分配。 43 2.3 数据通信与计算机网络 域名系统和统一资源定位器 32位二进制数的IP地址对计算机来说十分有效,但用户使用和记 忆都很不方便。为此,Internet引进了字符形式的IP地址,即域名。 域名采用层次结构的基于“域”的命名方案,每一层由一个子域名 间 用“.”分隔,其格式为: 机器名.网络名.机构名.最高域名 Internet上的域名由域名系统 DNS ( Domain Name System )统 一管理。 DNS是一个分布式数据库系统,由域名空间、域名服务器 和地址转换请求程序三部分组成。 WWW上的每一个网页(Home Page)都有一个独立的地址,这些 地址称为统一资源定位器(URL),只要知道某网页的URL,便可直 接打开该网页。 44 2.3 数据通信与计算机网络 5、Internet的应用 万维网(World Wide Web,简称WWW) 电子邮件E-mail。 讨论组Usenet。 文件传输FTP(File Transfer Protocol) 远程登陆Telnet。 45