Transcript 第4章文字处理软件
广西政法管理干部学院信息工程系 第四章 文字处理软件的使用 广西政法管理干部学院信息工程系 内容提要 4.1文字信息的计算机处理过程 4.2微机汉字输入法的使用 广西政法管理干部学院信息工程系 前 言 在20世纪70年代,计算机进入了办公领域,由于计算机 处理信息的高效率、高质量,而在办公自动化中起到了极其 重要的作用。西方的科技发达国家之所以较早地采用计算机 进行文字处理,其原因除了对计算机技术掌握较早、开发较 早之外,更重要的原因是他们采用拼音文字,字母少,字型 简单。 我国人口占世界人口的22%,全世界使用汉字的人数占 总人数的36%,汉字是全世界使用人数最多的文字之一。但 是,我国应用计算机处理汉字信息却要比西方发达国家用计 算机处理文字信息晚得多。 广西政法管理干部学院信息工程系 前 言 其主要原因有以下几个: (1)汉字属象形文字,字型复杂,输入困难; (2)汉字数量大,要在计算机中储存字模库,要求计算 机有较大的容量; (3)为了显示和打印汉字,又要求显示器和打印机有较 高的分辨率。 除此之外,就是中英文兼容技术,所设计的汉字系统必须 和原来的西文系统兼容,既可处理中文信息,又可以充分继承 和享用英文系统下的软、硬件资源。 广西政法管理干部学院信息工程系 前 言 为了解决计算机处理中文信息的技术难题,我国于1974 年将汉字信息处理系统的研究课题“七四八”工程列为国 家重点工程,以研究汉字精密照排系统和情报检索系统。 1978年12月,召开了第一次全国汉字编码学术交流会, 提出了各种类型的汉字输入编码方案40个左右,到了1983 年各种汉字编码方案已超过400个,其中40多个方案已在各 种汉字信息处理系统得到了应用与推广,尤其是微机汉字 信息处理技术也进入了成熟的实用阶段。 广西政法管理干部学院信息工程系 4.1文字信息的计算机处理过程 计算机处理汉字的过程包括三个步骤: 信息输入、信息 加工、信息输出,即文字从键盘输入到计算机并保存、计算 机文字处理 、 从显示器/打印机上输出 。 字模库 显示器 键盘输入 文字处理软件 编辑加工 点阵信息 打印机 文字信息的计算机处理过程 广西政法管理干部学院信息工程系 4.1文字信息的计算机处理过程 4.1.1 文字信息的输入 要用计算机处理文字,必须解决如何把文字输入到计算机 并在计算机中存储起来,即信息的输入问题。这里要涉及到文 字信息的编码问题,以下几个概念需要大家了解: 1、几个概念(P12) (1)汉字编码 为了使计算机能够处理汉字,就要解决汉字信息交换码 标准问题。在我国英文信息交换码标准GB1988 的基础上,扩 充制定了《信息交换用汉字编码字符集》,即GB2312-80,给 出了汉字编码的国家标准,该标准给出的汉字编码简称国标 码。 广西政法管理干部学院信息工程系 4.1文字信息的计算机处理过程 (2)区位码 在GB2312-80代码表中,将行号称为区号,列号称为位号, 分别有94个区和94个位,将汉字置入其中,既用区号与位号 标示汉字。区号位号都用两位十进制数表示,不足两位,前 面补0。每个汉字的区号与位号连起来,就组成了汉字的区位 码。 (3)机内码 汉字机内码是指在计算机内部实际用来表示汉字的代码。 在不同的计算机系统中,实际用来表示汉字的编码会有所不 同,但它们都以国标码为标准,与国标码存在着对应关系。 广西政法管理干部学院信息工程系 4.1文字信息的计算机处理过程 2、汉字的输入方法 (1)键盘输入法 键盘输入法又称编码输入法,是目前应用最为普遍的一 种输入方法 ,其最大的优点是可以使用标准的英文键盘输入 汉字。 目前国内外推出的汉字编码方案不下500种,可谓百花争 艳。不同的编码方案对应着不同的输入方法,各有千秋,实 际流行的汉字输入方法只有十几种。大概可以分为 : 数码:用数字对汉字进行编码。如区位码,电报码。 形码:根据汉字字形、结构进行编码。如五笔字型、徐 码、郑码、表形码。 广西政法管理干部学院信息工程系 4.1文字信息的计算机处理过程 音码:根据汉字的拼音进行编码。如全拼、双拼、智能 ABC、微软拼音。 音形码:根据汉字的拼音、字形综合编码。如自然码、 认知码。 形码的编码规则往往比较复杂,要经过较长时间的训练 才能掌握,入门难,但重码少。比较适合“看打”场合的专 业录入人员。 不论哪一种输入方法,在具体实施时都要有相应的输入 法软件的支持,将键盘输入的编码转换为国标码,再转换为 机内码储存在计算机内。 广西政法管理干部学院信息工程系 4.1文字信息的计算机处理过程 (2)通过语音 由语音转换成文字输入到计算机的技术目前还不成熟。 (3)通过光学字符阅读器(OCR) 通过光学字符阅读器将印刷体汉字作为作为图形点阵输 入,然后进行字符识别,把汉字点阵转换成对应的机内码。 目前这种技术已进入实用阶段。 广西政法管理干部学院信息工程系 4.1文字信息的计算机处理过程 4.1.2 文字信息的加工 使用文字处理软件(如Word2000)对输入的文字进行加工 处理,包括文本的增、删、改、字体、段落、颜色设置等。 经过编辑的文本仍然以汉字机内码或ASCII码表示。 4.1.3 文字信息的输出 1、汉字字模库 字模:描述一个汉字点阵信息的二进制代码串,以点阵 上的有点(表示为二进制的1)和无点(表示为二进制的0) 构成汉字字形。 广西政法管理干部学院信息工程系 4.1文字信息的计算机处理过程 字模库:所有汉字和字符的点阵信息,即字库,又分软 字库(将点阵信息存放在磁盘上)和硬字库(将点阵信息存放在 只读存贮器上)。 汉字点阵的点数越多,它表示的汉字就越清楚,但占用 的存贮空间也越大,常用的汉字点阵类型见P99表3.1,如用 64*64点阵(超精密型)表示的“梅”字见P99图3.2。使用该点 阵存放一个汉字需占用64*8=512字节的存贮空间(因为8位二 进制数为一个字节,每行有8个字节,共有64行),其它点阵 类推。 广西政法管理干部学院信息工程系 4.1文字信息的计算机处理过程 2、汉字的显示输出 汉字的显示原理见P99图3.3。 图形模式下一般用16 * 16点阵显示一个汉字,每屏显示 的汉字个数取决于显示器的分辨率和屏幕尺寸以及所选用的 字形、字体和字号。点阵类推。 3、文字的打印输出 打印输出前要先安装连接好打印机,并选择相应的打印驱 动程序。原理见P100。 广西政法管理干部学院信息工程系 内容提要 4.1文字信息的计算机处理过程 4.2微机汉字输入法的使用 广西政法管理干部学院信息工程系 4.2微机汉字输入法的使用 4.2.1 汉字输入法的安装 在不同的Windows系统中,输入法的安装会有所不同, 但操作步骤基本一致。 在Windows2000中,添加和删除输入法的步骤如下: 单击“开始” 双击 单击 单击 “设置” “键盘”或 打开 “输入方法” “输入法区域设置” 单击 “控制面板” 单击 “键盘属性” “添加(D)…”或“删除” 广西政法管理干部学院信息工程系 4.2微机汉字输入法的使用 4.2.2 汉字输入法的启动与关闭 在Windows2000中,默认的输入法是英文输入法,要想进 行汉字输入,必须启动汉字输入法。 启动方法:单击“桌面”上任务栏右边的输入法指示器, 出现输入法列表,用鼠标指针移动到拟选的输入法,单击即可。 组合键应用: <Ctrl>+空格——启动汉字输入法和关闭输入法 <Ctrl>+<Shift> ——英文和各种汉字输入法之间的轮流 切换 有些系统是使用<Alt>+<Shift>键进行汉字输入法的切换, 由用户在“键盘属性”对话框中进行设置。 广西政法管理干部学院信息工程系 4.2微机汉字输入法的使用 4.2.3 汉字输入法状态框 中/英文切换按钮 输入法名称框 半角/全角切换按钮 中/英文标点切换按钮 软键盘开关 广西政法管理干部学院信息工程系 4.2微机汉字输入法的使用 注意事项: (1)中文输入一定是小写字母状态 (2)半角方式 —— 中西文混合方式。汉字用两个字节表示, 英文字符用一个字节表示,此时按钮位置显示半圆形状。 全角方式——纯中文方式。无论汉字还是英文字符,一律 用两个字节表示,此时按钮位置显示完整的圆球形符号.(AA) (3)标点符号: 中文或英文状态下,很多标点符号是不一样的,如句号“。” 与“.”等,若要中文的标点符号,必须在中文标点符号状态下才 能输入,即使在全角方式下也必须按了中文标点符号按钮才行。 反过来,即使在半角状态下,如果按了中文标点符号按钮,也可 以输入中文标点符号。 广西政法管理干部学院信息工程系 4.2微机汉字输入法的使用 注意事项: (4)由于键盘上没有“ü”键,而用“V”键代替,如输入 “女”字,就是键入“nv”两个字母;输入“绿”字,就是键 入“lv”两个字母。 (5)隔音符(’)按钮 有些由无声母的单字组成的词组,使用上述方法输入时会 因为声母和韵母连在一起,将两个或三个汉字拼成一个,出 现“答非所问”的现象。此时,若加入一个隔音符“’” (单引号),将两个汉字分开,即可得到正确的结果。 例如: xi’an 西安;fang’an 方案;di’er 第二