Document

Transcript Document

第四章多维数组及广义表
前几章介绍的数据结构都是线性结构，数据元素都属
于原子类型，其值不分解使用。
本章讨论的多维数组和广义表是线性结构的推广，从
整体上看它们是多个元素组成的线性表，而从局部上
看线性表中的数据元素不一定是原子类型，即数据元
素又可以具有某种数据结构。
主要内容：
§ 4．1 多维数组
多维数组的逻辑结构特征及存储方式
§ 4．2 矩阵的压缩存储
特殊矩阵和稀疏矩阵的压缩存储
§ 4．3 广义表
广义表的定义和运算
4．1 多维数组
一、多维数组的逻辑结构特征
数组中的元素具有相同类型，且下标一般具有固定的上界和
下界。
数组可以是一维的，也可以是多维的。
本章主要以二维数组为例来分析多维数组的逻辑结构特征和
存储结构。
二维数组可以看成是由多个一维数组组成的。例如，二维数
组Amn既可看成由m个行向量组成的线性表，也可看成是由n个
列向量组成的线性表。
a00
a01
a0,n-1
a10
a11
a1,n-1
Amn=
aij
am-1,0
am-1,1
am-1,n-1
（a）数组Amn 的矩阵形式
a00
a01
a0,n-1
a00
a01
a0,n-1
a10
a11
a1,n-1
a10
a11
a1,n-1
Amn=
Amn=
……
aij
am-1,0
am-1,1
am-1,n-1
（b）数组Amn的行向量组成
am-1,0
am-1,1
am-1,n-1
（c）数组Amn的列向量组成
二维数组的逻辑结构具有如下特征：
a00为开始结点，它没有直接前趋；
am-1,n-1为终端结点，它没有直接后继；
结点a0,n-1和am-1,0都有一个直接前趋和一个直接后继；
除以上四个结点外，第一行和第一列的元素都有一个
直接前趋和两个直接后继，最后一行和最后一列的元
素都有两个直接前趋和一个直接后继；
其余的非边界元素aij同时处于第i+1行的行向量中和第
j+1列的列向量中，都有两个直接前趋和两个直接后继
。
二、多维数组的存储
二维数组一般采用顺序存储。
由于内存单元是一维的线性关系，而二维数组中元素之间的
关系是非线性的，所以若要顺序存储二维数组，首先需要将二
维数组中的元素按照某种原则排列成点的线性序列，然后再依
次存放到连续的存储单元中。
通常二维数组有行优先和列优先两种排列原则。
（1）行优先原则，是指先排列二维数组的第一行中的数据元
素，再排列第二行中的数据元素，……，以此类推。
（2）列优先原则，是指先排列二维数组的第一列中的数据元
素，再排列第二列中的数据元素，……，以此类推。
数据元素的存储地址可根据数组的首地址、元素的存储空间
大小及元素的序号三个信息计算出来，从而实现随机存取。
若二维数组Amn按行优先原则排列，其线性序列为：
a00，a01，…，a0,n-1，a10，a11，…，a1,n-1，……，am-1,n-1
存储后的内存状态如图所示:
0
1
a00
a01
...
第1行
n-1
n
a0,n-1
a10
2n-2
...
第2行
a1,n-1
m×n- 1
ai,0
...
ai,j
...
ai,n-1
...
第i+1行
aij的地址为：LOC（aij）= LOC（a00）+（i×n+j） × d
a m-1,n-1
第m行
若二维数组Amn按列优先原则排列，则线性序列为：
a00，a10，…，am-1,0，a01，a11，…，am-1,1，……，am-1,n-1
存储后的内存状态如图所示:
0
1
a00
a10
...
第1列
m-1
m
am-1,0
a01
2m-2
...
第2列
am-1,1
m×n- 1
a0,j
...
ai,j
第j+1列
...
am-1,j
...
a m-1,n-1
第n列
aij的地址为：LOC（aij）= LOC（a00）+（j×m+i）× d
二维数组的逻辑特征和存储方法可以很容易地推广到多维数
组。
例如三维数组可以看成是由二维数组组成的线性表，三维数
组中的每个元素最多有三个直接前趋和三个直接后继。
同样，行优先原则和列优先原则也可以推广到多维数组，按
行优先原则时先排最右的下标，按列优先原则时先排最左的下
标。
得到行优先或列优先序列后，可以把它们依次存放在连续的
存储空间中，这就是多维数组的顺序存储，同样可实现随机存
取。
4．2 矩阵的压缩存储
计算机在处理工程问题时，通常使用二维数组来存储矩阵，
但是实际问题中的矩阵往往阶数较大，而有效数据（非零元素
）很少且分布没有规律，若用上面讨论的二维数组存储，其存
储密度小（存储了大量的零元素），浪费了存储空间。
矩阵的压缩存储通常指在存储数据元素时，只存储非零元素
，对零元素不分配空间；为多个相同的非零元素分配一个存储
空间。
下面分别讨论特殊矩阵和稀疏矩阵的压缩存储。
一、特殊矩阵
特殊矩阵是指非零元素或零元素分布有一定规律的矩阵。例
如，对称矩阵、三角矩阵（上三角阵和下三角阵）及对角矩阵
，特殊矩阵可以根据元素的分布规律来进行压缩存储。
不同的特殊矩阵中元素的分布规律不同，压缩存储的方法也
不同。
1．对称矩阵
满足aij=aji（1≤i，j≤n）的n阶方阵称为对称矩阵。
对称矩阵中的数据元素按主对角线对称，只需存储下三角或
上三角中的元素即可。上三角或下三角中的元素可按行优先或
列优先存储。由此可得四种存储方法：

行优先顺序存储下三角

列优先顺序存储下三角

行优先顺序存储上三角

列优先顺序存储上三角。
每种方法中元素的存储地址都可以通过公式计算出来，且具
有随机存取的特点。
（1）行优先顺序存储下三角
以图（a）所示的n阶方阵为例，行优先顺序存储下三角时
元素的排列顺序如图（b）所示，存储在一维数组中如图（c）
所示。
a00
a01
a0,n-1
a00 a01
a0,n-1
a10
a11
a1,n-1
a10 a11
a1,n-1
a20
a21
a22
a20 a21 a22
aij
aij
an-1,0 an-1,1
an-1,n-1
an-1,0 an-1,1
（a） n阶对称矩阵
（b）行优先顺序存储下三角
0
1
2
3
4
5
a00
a10
a11
a20
a21
a22
第1行
第2行
an-1,n-1
...
...
an-1,0
第3行
（c）对应的一维数组
n（n+1）/2-1
an-1,1
...
第n行
a n-1,n-1
设长度为n（n+1）/2的数组sa存储下三角中的元素。
设矩阵下三角中的某一个元素aij（i≥j）对应存储在一维数组
的下标变量sa[k]中，则上三角中的某一个元素aij（i<j）存储在
与aji对应的存储单元中。
下三角中任一数据元素aij （i≥j），位于第i+1行的第j+1列，
则排在它前面的i行元素共有1+2+3+……+i-1+i=i（i+1）/2个，
在第i+1行中排在它前面的元素还有j个，因此排在它前面的元
素总共有i（i+1）/2+j个元素。由于一维数组的下标从0开始，
因此元素aij在一维数组中的下标为i（i+1）/2+j。综上可得下标
k的计算公式为：
k=
i(i+1)/2+j i≥j （下三角）
j(j+1)/2+i i＜j （上三角）
同理可得其他三种方法存储时，元素aij在一维数组中
的下标计算公式：
（2）列优先顺序存储下三角
k=
j（2n-j+1）/2+i-j i≥j （下三角）
i（2n-i+1）/2+j-i i＜j （上三角）
（3）行优先顺序存储上三角
k=
i（2n-i+1）/2+j-i i≤j （上三角）
j（2n-j+1）/2+i-j i＞j （下三角）
（4）列优先顺序存储上三角
k=
j（j+1）/2+i i≤j （上三角）
i（i+1）/2+j i＞j （下三角）
2．三角矩阵
包括上三角阵和下三角阵两种。
上三角阵的主对角线以下（不包
括对角线）元素均为常数C，通常
为0。而下三角阵主对角线以上（
不包括对角线）元素均为常数C，
通常为0。
利用压缩存储的原理，只为矩阵
中下三角的相同元素C分配一个存
储单元，且当常数C为零时，不分
配存储空间。则为图中的上三角阵
定义一个长度n（n+1）/2+1的数组
，最后一个单元存储常数C。
a00
a01
a0,n-1
C
a11 a12
a1,n-1
C
C
a22
……
C
……
C
an-1,n-1
若上三角阵以行优先顺序存储，则地址公式与对称矩阵的行
优先顺序存储上三角的地址公式相似，元素的下标k为：
k=
i（2n-i+1）/2+j-i i≤j （上三角）
n（n+1）/2
i＞j （下三角）
若上三角阵以列优先顺序存储，则地址公式与对称矩阵的列
优先顺序存储上三角的地址公式相似，元素的下标k为：
k=
j（j+1）/2+i
n（n+1）/2
i≤j （上三角）
i＞j （下三角）
下三角阵的存储同理。
3．对角矩阵
所有非零元素都集中在主对角线及主对角线两侧对称的带状
区域，其余部分全部为零的n阶方阵为对角矩阵。
常见的对角矩阵有三对角阵，对角阵可以按照行优先顺序、
列优先顺序或对角线顺序来进行存储，每一种存储顺序下都存
在非零元素的下标与一维数组中下标之间的对应关系。
以行优先顺序为例，n阶三对角阵以行优先顺序存储的一维
数组如下：
0
1
2
3
4
…
12
…
3n-3
a00
a01
a10
a11
a12
…
a44
…
a n-1,n-1
排在aij前面的i行中共2+（i-1）×3=3i-1个元素；在第i+1行中
，排在它前面的还有j-（i-1）=j-i+1个元素；则排在元素aij之前
的共2i+j个元素，即下标k=2i+j。
二、稀疏矩阵
在一个矩阵中，若非零元素的个数远远小于矩阵元素的总个
数，则该矩阵称为稀疏矩阵。若m×n的矩阵中有t个非零元素，
则定义矩阵的稀疏因子为δ=t/（m×n），通常取δ≤0.05的矩阵
为稀疏矩阵。
A6×7=
0 11
0
0
0
0
0
4
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
9
0
0
0
-3
0
0
0
0
7
0
2
0
0
0
0
0
0
0
0
0
0
0
0
0
B6×7=
0
0
0
6
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
5
0
0
0
0
0
0
0
0
0
0
0
稀疏矩阵的压缩存储，通常采用只存储非零元素的方法。
由于非零元素的分布没有规律，所以在存储非零元素值的同
时，还需要存储非零元素的位置，即行号和列号。因此，矩阵
中的每一个非零元素都由一个包括非零元素所在的行、列以及
它的值构成的三元组（i，j，v）来唯一确定，这样就可以将稀
疏矩阵用非零元素三元组的线性表来表示。
稀疏矩阵A6×7的三元组表可表示为（（1，2，11），（3，
1，-3），（3，6，7），（4，4，6），（6，3，5））。
稀疏矩阵的存储就可以转化为三元组表的存储，三元组表可
以采用顺序存储或链接存储，对应稀疏矩阵的三元组顺序表和
十字链表。
若要唯一的表示一个稀疏矩阵，在存储三元组表的同时，还
需要存储该矩阵的行数和列数，同时为了运算方便，一般还要
存储非零元素的个数。
1．三元组顺序表
将三元组表中的三元组按照行优先的顺序排列成一个序列，
然后采用顺序存储方法存储该线性表，称为三元组顺序表。矩
阵A的三元组顺序表为：
A6×7=
0 11
0
0
0
0
0
4
0
0
0
0
0
0
0
0
0
-3
0
0
0
0
7
0
0 00
0 10
9 10
0 30
0 20
0 30
0 20
0 110
0 10
0 -30
0 60
0 70
0
0
0
B6×7=
i2
0
0
0
6
0
0
0
j0
0
0
0
0
0
0
0
v0
0
0
5
0
0
0
0
0
0
0
0
0
0
0
0
0
3
4
4
6
4
3
6
5
三元组顺序表存储结构的C语言描述如下：
#define MAX 16 /*大于非零元素个数的一个常数*/
typedef int DataType;
typedef struct
{ int i,j;
/*非零元素所在的行、列*/
DataType v;
/*非零元素值*/
}Node;
/* 三元组类型 */
typedef struct
{ int m,n,t;
Node data[MAX];
}Matrix;
Matrix A,B;
/* 矩阵的行、列及非零元素的个数 */
/* 三元组表 */
/* 三元组顺序表的存储类型 */
下面以矩阵加法为例，分析在三元组顺序表上的算法实现。
设有同构的两个稀疏矩阵A和B，求矩阵Q=A+B。三个矩阵
都用三元组顺序表存储。该算法的具体思想如下：
（1）分别从矩阵A和B中取出编号最小的两个非零元素，并
比较二者编号。
（2）若两个编号相等（行号、列号都相等），则求两个非
零元素的和v，若v不等于零，则存入Q。
（3）若A中当前元素的编号较小（行号较小，或行号相等
列号较小），则将A中当前元素存入Q；否则将B中当前元素存
入Q。
（4）若A、B其中一个矩阵中的元素全部存入Q，则将另外
一个矩阵中剩余元素依次存入Q中。
2．十字链表
十字链表是稀疏矩阵的一种链接存储结构，在插入、删除操
作时，不需要移动元素，效率较高。
十字链表存储稀疏矩阵的基本思想是：将稀疏矩阵中的每个
非零元素都用一个包含五个域的结点来表示，存储非零元素所
在行的行号域i，存储非零元素所在列的列号域j，存储非零元
素值的值域v，以及行指针域right和列指针域down，分别指向
同一行中的下一个非零元素结点和同一列中的下一个非零元素
结点，其结点结构如图所示。
i
down
j
v
right
在十字链表中，同一行中的非零元素通过right域链接在一个
单链表中，同一列中的非零元素通过down域也链接在一个单
链表中，每个非零元素既处于某行链表中，也处于某列链表中
，就形成了交叉的十字链表。
通常，为方便运算，稀疏矩阵中每一行的非零元素结点按其
列号从小到大顺序由right域链成一个带表头结点的循环链表，
同样每一列中的非零元素按其行号从小到大顺序由down域也
链成一个带表头结点的循环链表。行列链表共用一个头结点。
为了方便地找到每一行或每一列，将每行（列）的头结点链
接起来，因为头结点的值域空闲，所以用头结点的值域作为连
接各头结点的链域，即第i行（列）的头结点的值域指向第i+1
行（列）的头结点，依此类推，形成一个循环链表。这个循环
链表又设一个头结点，这个头结点就是总头结点，总头结点的i
和j域存储矩阵的行数和列数。
A=
HA
H1
0 0
5 6
0 11
0
0
0
0
0
0
0
0
0
0
-3
0
0
0
0
7
0
0
0
6
0
0
0
0
0
0
0
4
H1
H2
H3
H4
H5
H6
0 0
0 0
0 0
0 0
0 0
0 0
0 0
1 2 11
0 0
H2
H3
0 0
0 0
3 1 -3
3 6 7
4 4 6
H4
H5
0 0
H6
0 0
5 6 4
因为非零元素结点的值域是DataType类型，而表头结点中
此域是指针类型，为了使整个结构的结点一致，该域用一个共
用体类型来表示。十字链表结点的存储结构C语言描述如下：
typedef int DataType; /*非零元素值的类型*/
typedef struct Node
{ int i,j;
/*非零元素所在的行、列*/
struct Node *down , *right; /*行指针域和列指针域*/
union v_next
/*非零元素结点的值域*/
{
DataType v;
struct node *next;
}
}MNode，*MLink;/*十字链表中结点和结点指针的类型*/
4．3 广义表
广义表是线性表的推广，它放松了对线性表中的元素必须是
原子的限制，允许表中的元素具有结构。
广义表（General List），也称为列表（Lists）是n（n≥0）
个元素a1， a2， …，ai，…， an的有限序列，元素ai可以是原
子或者是子表（子表亦是广义表）。数据元素的个数n为广义
表的长度。n＝0时称为空表，即表中不含任何元素。通常将非
空的广义表（n>0）记为：
LS =（a1， a2， …，ai，…， an）
其中，LS是广义表的名字。a1为广义表的第一个元素，ai 为
广义表的第i个元素。显然，广义表是一种递归的数据结构，因
为广义表中的数据元素还可以是广义表。当广义表中的所有元
素都是原子时，此广义表就是线性表。
下面是一些广义表的例子：
（1）A=（）
A是一个空表，其长度为0。
（2）B=（a，b）
B是一个长度为2的广义表，它的两个元素都是原子，因此它就
是一个线性表。
（3）C=（c，B）=（c，（a，b））
C是长度为2的广义表，第一个元素是原子c，第二个元素是子
表B。
（4）D=（B，C，d）=（（a，b），（c，（a，b）），d）
D是长度为3的广义表，第一个元素和第二个元素都为子表，第
三个元素为原子d。
（5）E=（a，E）=（a，（a，（a，（…）））
E是长度为2的广义表，第一个元素是原子，第二个元素是E自
身，它是一个无限递归的广义表。
广义表还有其他的表示方法，如：
（1）带名字的广义表表示：在每个表的前面冠以该表的名字
A（）
B（a，b）
C（c，B（a，b））
D（ B（a，b），C（c，（a，b）），d）
E（a，E（a，E（a，E（…）））
（2）广义表的图形表示
用非分支结点表示原子，用分支结点表示广义表（空表除外
，空表中不含元素，所以也用非分支结点表示）。
A
B
a
C
b
D
c
B
a
C
B
b
E
a
b
c
d
a
广义表分为：线性表、纯表、再入表和递归表四种。
当广义表中的元素全部都是原子时，广义表就是线性表
，因此也可以说线性表是广义表的一种特殊形式。上图中
的广义表B就是一个线性表。
若广义表中既包含原子，又包含子表，但没有共享和递

归，如广义表C，则此时的广义表就是一棵树（将在第五
章讨论），称这种广义表为纯表。
允许结点的共享但不允许递归的广义表为再入表，上图
中的广义表D，子表B为共享结点，它既是表D的一个元素
，又是子表C的一个元素。这样的广义表与数据结构的图
形结构对应（将在第六章讨论）。
允许递归的表称为递归表，上图中的广义表E为递归表
，表E是其自身的子表。
递归表、再入表、纯表、线性表之间的关系满足：
递归表  再入表  纯表  线性表
广义表可以兼容线性表、树和图等各种经典的数据结构，广
义表的大部分运算都与经典数据结构的运算类似。
四个特殊的运算：取表头Head（LS）、取表尾Tail（LS）
、求表深、求表长。
广义表的表头（Head）为广义表的第一个元素，广义表的
表尾（Tail）为广义表中除第一个元素外，剩下所有的元素组
成的广义表。
对广义表LS =（a1， a2， ……， an）来说，取表头、取表
尾的运算定义为： Head（LS） =a1，Tail（LS） = （a2，
……， an ）。
例如：
Head（（a，b））= a
Tail（（a，b））=（b）
Head（（a））= a
Tail（（a，b），c，（a，b）））=（ c，（a，b）））
任何一个非空广义表LS =（a1， a2， ……， an）均可分解
为表头和表尾两个部分。反之，一对表头和表尾也可唯一确定
一个广义表。根据表头、表尾的定义可知：任何一个非空广义
表的表头是表中第一个元素，它可以是原子，也可以是子表，
但表尾必定是子表。
广义表（）和（（））不同。前者是长度为0的空表，而后
者是长度为l的非空表，其表头和表尾均是空表（）。
广义表是一个多层次的结构，广义表的元素可以是子表，子
表的元素仍可以是子表。若将广义表的子表展开成全部由原子
组成，则可将广义表的深度定义为表中所含括号的最大层数；
而广义表的长度为表中包含的元素个数。

Document

Transcript Document

Directory