第4章文字处理软件

Download Report

Transcript 第4章文字处理软件

广西政法管理干部学院信息工程系
第四章 文字处理软件的使用
广西政法管理干部学院信息工程系
内容提要
4.1文字信息的计算机处理过程
4.2微机汉字输入法的使用
广西政法管理干部学院信息工程系
前
言
在20世纪70年代,计算机进入了办公领域,由于计算机
处理信息的高效率、高质量,而在办公自动化中起到了极其
重要的作用。西方的科技发达国家之所以较早地采用计算机
进行文字处理,其原因除了对计算机技术掌握较早、开发较
早之外,更重要的原因是他们采用拼音文字,字母少,字型
简单。
我国人口占世界人口的22%,全世界使用汉字的人数占
总人数的36%,汉字是全世界使用人数最多的文字之一。但
是,我国应用计算机处理汉字信息却要比西方发达国家用计
算机处理文字信息晚得多。
广西政法管理干部学院信息工程系
前
言
其主要原因有以下几个:
(1)汉字属象形文字,字型复杂,输入困难;
(2)汉字数量大,要在计算机中储存字模库,要求计算
机有较大的容量;
(3)为了显示和打印汉字,又要求显示器和打印机有较
高的分辨率。
除此之外,就是中英文兼容技术,所设计的汉字系统必须
和原来的西文系统兼容,既可处理中文信息,又可以充分继承
和享用英文系统下的软、硬件资源。
广西政法管理干部学院信息工程系
前
言
为了解决计算机处理中文信息的技术难题,我国于1974
年将汉字信息处理系统的研究课题“七四八”工程列为国
家重点工程,以研究汉字精密照排系统和情报检索系统。
1978年12月,召开了第一次全国汉字编码学术交流会,
提出了各种类型的汉字输入编码方案40个左右,到了1983
年各种汉字编码方案已超过400个,其中40多个方案已在各
种汉字信息处理系统得到了应用与推广,尤其是微机汉字
信息处理技术也进入了成熟的实用阶段。
广西政法管理干部学院信息工程系
4.1文字信息的计算机处理过程
计算机处理汉字的过程包括三个步骤: 信息输入、信息
加工、信息输出,即文字从键盘输入到计算机并保存、计算
机文字处理 、 从显示器/打印机上输出 。
字模库
显示器
键盘输入
文字处理软件
编辑加工
点阵信息
打印机
文字信息的计算机处理过程
广西政法管理干部学院信息工程系
4.1文字信息的计算机处理过程
4.1.1 文字信息的输入
要用计算机处理文字,必须解决如何把文字输入到计算机
并在计算机中存储起来,即信息的输入问题。这里要涉及到文
字信息的编码问题,以下几个概念需要大家了解:
1、几个概念(P12)
(1)汉字编码
为了使计算机能够处理汉字,就要解决汉字信息交换码
标准问题。在我国英文信息交换码标准GB1988 的基础上,扩
充制定了《信息交换用汉字编码字符集》,即GB2312-80,给
出了汉字编码的国家标准,该标准给出的汉字编码简称国标
码。
广西政法管理干部学院信息工程系
4.1文字信息的计算机处理过程
(2)区位码
在GB2312-80代码表中,将行号称为区号,列号称为位号,
分别有94个区和94个位,将汉字置入其中,既用区号与位号
标示汉字。区号位号都用两位十进制数表示,不足两位,前
面补0。每个汉字的区号与位号连起来,就组成了汉字的区位
码。
(3)机内码
汉字机内码是指在计算机内部实际用来表示汉字的代码。
在不同的计算机系统中,实际用来表示汉字的编码会有所不
同,但它们都以国标码为标准,与国标码存在着对应关系。
广西政法管理干部学院信息工程系
4.1文字信息的计算机处理过程
2、汉字的输入方法
(1)键盘输入法
键盘输入法又称编码输入法,是目前应用最为普遍的一
种输入方法 ,其最大的优点是可以使用标准的英文键盘输入
汉字。
目前国内外推出的汉字编码方案不下500种,可谓百花争
艳。不同的编码方案对应着不同的输入方法,各有千秋,实
际流行的汉字输入方法只有十几种。大概可以分为 :
数码:用数字对汉字进行编码。如区位码,电报码。
形码:根据汉字字形、结构进行编码。如五笔字型、徐
码、郑码、表形码。
广西政法管理干部学院信息工程系
4.1文字信息的计算机处理过程
音码:根据汉字的拼音进行编码。如全拼、双拼、智能
ABC、微软拼音。
音形码:根据汉字的拼音、字形综合编码。如自然码、
认知码。
形码的编码规则往往比较复杂,要经过较长时间的训练
才能掌握,入门难,但重码少。比较适合“看打”场合的专
业录入人员。
不论哪一种输入方法,在具体实施时都要有相应的输入
法软件的支持,将键盘输入的编码转换为国标码,再转换为
机内码储存在计算机内。
广西政法管理干部学院信息工程系
4.1文字信息的计算机处理过程
(2)通过语音
由语音转换成文字输入到计算机的技术目前还不成熟。
(3)通过光学字符阅读器(OCR)
通过光学字符阅读器将印刷体汉字作为作为图形点阵输
入,然后进行字符识别,把汉字点阵转换成对应的机内码。
目前这种技术已进入实用阶段。
广西政法管理干部学院信息工程系
4.1文字信息的计算机处理过程
4.1.2 文字信息的加工
使用文字处理软件(如Word2000)对输入的文字进行加工
处理,包括文本的增、删、改、字体、段落、颜色设置等。
经过编辑的文本仍然以汉字机内码或ASCII码表示。
4.1.3 文字信息的输出
1、汉字字模库
字模:描述一个汉字点阵信息的二进制代码串,以点阵
上的有点(表示为二进制的1)和无点(表示为二进制的0)
构成汉字字形。
广西政法管理干部学院信息工程系
4.1文字信息的计算机处理过程
字模库:所有汉字和字符的点阵信息,即字库,又分软
字库(将点阵信息存放在磁盘上)和硬字库(将点阵信息存放在
只读存贮器上)。
汉字点阵的点数越多,它表示的汉字就越清楚,但占用
的存贮空间也越大,常用的汉字点阵类型见P99表3.1,如用
64*64点阵(超精密型)表示的“梅”字见P99图3.2。使用该点
阵存放一个汉字需占用64*8=512字节的存贮空间(因为8位二
进制数为一个字节,每行有8个字节,共有64行),其它点阵
类推。
广西政法管理干部学院信息工程系
4.1文字信息的计算机处理过程
2、汉字的显示输出
汉字的显示原理见P99图3.3。
图形模式下一般用16 * 16点阵显示一个汉字,每屏显示
的汉字个数取决于显示器的分辨率和屏幕尺寸以及所选用的
字形、字体和字号。点阵类推。
3、文字的打印输出
打印输出前要先安装连接好打印机,并选择相应的打印驱
动程序。原理见P100。
广西政法管理干部学院信息工程系
内容提要
4.1文字信息的计算机处理过程
4.2微机汉字输入法的使用
广西政法管理干部学院信息工程系
4.2微机汉字输入法的使用
4.2.1 汉字输入法的安装
在不同的Windows系统中,输入法的安装会有所不同,
但操作步骤基本一致。
在Windows2000中,添加和删除输入法的步骤如下:
单击“开始”
双击
单击
单击
“设置”
“键盘”或 打开
“输入方法”
“输入法区域设置” 单击
“控制面板”
单击
“键盘属性”
“添加(D)…”或“删除”
广西政法管理干部学院信息工程系
4.2微机汉字输入法的使用
4.2.2 汉字输入法的启动与关闭
在Windows2000中,默认的输入法是英文输入法,要想进
行汉字输入,必须启动汉字输入法。
启动方法:单击“桌面”上任务栏右边的输入法指示器,
出现输入法列表,用鼠标指针移动到拟选的输入法,单击即可。
组合键应用:
<Ctrl>+空格——启动汉字输入法和关闭输入法
<Ctrl>+<Shift> ——英文和各种汉字输入法之间的轮流
切换
有些系统是使用<Alt>+<Shift>键进行汉字输入法的切换,
由用户在“键盘属性”对话框中进行设置。
广西政法管理干部学院信息工程系
4.2微机汉字输入法的使用
4.2.3 汉字输入法状态框
中/英文切换按钮
输入法名称框
半角/全角切换按钮
中/英文标点切换按钮
软键盘开关
广西政法管理干部学院信息工程系
4.2微机汉字输入法的使用
注意事项:
(1)中文输入一定是小写字母状态
(2)半角方式 —— 中西文混合方式。汉字用两个字节表示,
英文字符用一个字节表示,此时按钮位置显示半圆形状。
全角方式——纯中文方式。无论汉字还是英文字符,一律
用两个字节表示,此时按钮位置显示完整的圆球形符号.(AA)
(3)标点符号:
中文或英文状态下,很多标点符号是不一样的,如句号“。”
与“.”等,若要中文的标点符号,必须在中文标点符号状态下才
能输入,即使在全角方式下也必须按了中文标点符号按钮才行。
反过来,即使在半角状态下,如果按了中文标点符号按钮,也可
以输入中文标点符号。
广西政法管理干部学院信息工程系
4.2微机汉字输入法的使用
注意事项:
(4)由于键盘上没有“ü”键,而用“V”键代替,如输入
“女”字,就是键入“nv”两个字母;输入“绿”字,就是键
入“lv”两个字母。
(5)隔音符(’)按钮
有些由无声母的单字组成的词组,使用上述方法输入时会
因为声母和韵母连在一起,将两个或三个汉字拼成一个,出
现“答非所问”的现象。此时,若加入一个隔音符“’”
(单引号),将两个汉字分开,即可得到正确的结果。
例如:
xi’an 西安;fang’an 方案;di’er 第二