第九章 查找

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 . R型 的处理(单向右型)
如图1所示,在A的左孩子B上插入一个左孩子结点C,使 A的平衡因子由1变成了2,成为不平衡的二叉树序树。这时的 平衡处理为:将A顺时针旋转,成为B的右子树,而原来B的 右子树则变成A的左子树,待插入结点C作为B的左子树。(注: 图中结点旁边的数字表示该 结点的平衡因子)
s i 1
i

b 1 2
s 1 2

1 (n 2s
s) 1
(2)用折半查找确定所在块:ASLbs

log
2
(
n s
1)
s 2
查找方法比较
顺序查找 ASL(平均查找长度)最大
折半查找 最小
分块查找 两者之间
表结构 有序表、无序表 有序表
分块有序表
存储结构 顺序存储结构 顺序存储结构 顺序存储结构
ci为找到表中第i个元素所需比较次数
平均查找长度ASL(Average Search Length):为确定 记录在表中的位置,需和给定值进行比较的关键字的 个数的期望值叫查找算法的~
§9.1 顺序查找
查找过程:从表的一端开始逐个进行记录的关键 字和给定值的比较
算法描述
找64
例 0 1 2 3 4 5 6 7 8 9 10 11 64 5 13 19 21 37 56 64 75 80 88 92
low
mid
high
1 2 3 4 5 6 7 8 9 10 11
5 13 19 21 37 56 64 75 80 88 92
low mid high 1 2 3 4 5 6 7 8 9 10 11 5 13 19 21 37 56 64 75 80 88 92
low high mid
1 2 3 4 5 6 7 8 9 10 11 5 13 19 21 37 56 64 75 80 88 92
初始时,令low=1,high=n,mid=(low+high)/2 让k与mid指向的记录比较
若k==r[mid].key,查找成功 若k<r[mid].key,则high=mid-1 若k>r[mid].key,则low=mid+1
重复上述操作,直至low>high时,查找失败

n i 1
pi ci

1 n
n
i
i 1

1 n(n 1) n2

n 1 2
对查找概率不等的查找表,先对查找概率进行排序 优点:算法简单,适用面广 缺点:平均查找长度较大。
§9.2 折半查找
查找过程:每次将待查记录所在区间缩小一半 适用条件:采用顺序存储结构的有序表
算法实现
设表长为n,low、high和mid分别指向待查元素所在 区间的上界、下界和中点,k为给定值
high low
1 2 3 4 5 6 7 8 9 10 11 5 13 19 21 37 56 64 75 80 88 92
判定树: 3
6 9
1
4 7 10
2
5 8 11
描述折半查找过程的判定树及查找21的过程
算法评价
判定树:描述查找过程的二叉树叫~
有n个结点的判定树的深度为log2n+1
{NODE *p;
p=root;
while(p!= =NULL)
{ if (p->key= =k) return(p);
//查找成功
else if (p->key>k) p=p->lch ; //进入左子树查找
else p=p->rch ;
//进入右子树查找
} return(NULL);
}
五、二叉排序树查找的性能分析
例2:对例1给定的关键字序列4,5,7,2,1,3,6,试用二叉排序树和平衡 二叉树两种方法查找,给出查找6的次数及成功的平均查找长度。
分析:由于关键字序列的顺序己经确定,故得到的二叉排序树 和平衡二叉树都是唯一的。得到的平衡二叉树见图1,得到的二叉 排序树见图2。
4
2
5
1
3
7
6 图 2 由关键字序列 4,5,7,2,1 ,3,6 生成的二叉排序树
值与待查值进行比较,若相等,则查找成功,若根结点 值大于待查值,则进入左子树重复此步骤,否则,进入 右子树重复此步骤,若在查找过程中遇到二叉排序树的 叶子结点时,还没有找到待找结点,则查找不成功。
2 . 二叉排序树查找的算法实现
NODE * search(int k, NODE *root)
//在以root为根指针的二叉排序树中查找关键值为k的结点
9.3 .1平衡二叉树查找
一、平衡二叉树的概念
平衡二叉树(balanced binary tree) 是由阿德尔森一维尔斯和兰迪斯 (Adelson-Velskii and Landis)于1962年 首先提出的,所以又称为AVL树。
若一棵二叉树中每个结点的左、右子树的深度之差的绝 对值不超过1,则称这样的二叉树为平衡二叉树。将该结点的 左子树深度减去右子树深度的值,称为该结点的平衡因子 (balance factor)。也就是说,一棵二叉排序树中,所有结点 的平衡因子只能为0、1、-1时,则该二叉排序树就是一棵平 衡二叉树,否则就不是一棵平衡二叉树。
我们希望二叉排序树都是AVL树,因为它的深度和log2n 是同数量级的,则平均查找长度也和log2n同数量级
二、非平衡二叉树的平衡处理
若一棵二叉排序树是平衡二叉树,插入某个结点后,可能会变 成非平衡二叉树,这时,就可以对该二叉树进行平衡处理,使其变 成一棵平衡二叉树。处理的原则应该是处理与插入点最近的、而平 衡因子又比1大或比-1小的结点。下面将分四种情况讨论平衡处理。
在二叉排序树查找中,成功的查找次数不会超过二叉 树的深度,而具有n个结点的二叉排序树的深度,最好为 log2n,最坏为n。因此,二叉排序树查找的最好时间复杂度 为O(log2n),最坏的时间复杂度为O(n),一般情形下,其时 间复杂度大致可看成O(log2n),比顺序查找效率要好,但比 二分查找要差。
折半查找法在查找过程中进行的比较次数最多不超过 其判定树的深度
折半查找的ASL
设表长n 2h 1, h log 2 (n 1),即判定树是深度为h的满二叉树
设表中每个记录的查找概率相等pi

1 n
则:ASL
n i 1
pi ci

1 n
n
ci
i 1

1 n
h j 1
-2 A
-1 B
wenku.baidu.com
平衡处理
0C
图3
L 型平衡处理
0B 0A 0C
4 . RL型的处理(右左型)
如图4所示,在A的右孩子B上插入一个左孩子C,使A的平 衡因子由-1变成-2,成为不平衡的二叉排序树。这时的平衡 处理为:将C变到A与B之间,使之成为RR型,然后按第3种 情形RR型处理。
-2 A
-2 A
1 B 旋转 -1 C
第九章 查找
查找——也叫检索,是根据给定的某个值,在表 中确定一个关键字等于给定值的记录或数据元素
关键字——是数据元素中某个数据项的值,它可
以标识一个数据元素
查找方法评价
查找速度 占用存储空间多少 算法本身复杂程度
n
对含有n个记录的表,ASL pici i 1
n
其中:pi为查找表中第i个元素的概率, pi 1 i 1
监视哨 Ch7_1.c
ii
比较次数:
查找第n个元素: 1
查找第n-1个元素:2
……….
查找第1个元素: n
查找第i个元素: n+1-i
查找失败:
n+1
iii 比较次数=5
顺序查找方法的ASL
n
对含有n个记录的表, ASL pici i 1
设表中每个元素的查找
概率相等 pi

1 n
则ASL
算法描述
找21 例 1 2 3 4 5 6 7 8 9 10 11
5 13 19 21 37 56 64 75 80 88 92
low
mid
123456 7 5 13 19 21 37 56 64
high
8 9 10 11 75 80 88 92
low
mid
high
1 2 3 4 5 6 7 8 9 10 11
RL 型
04
02
06
01 03 17
01 03 05 07
06
(g)
插入 6
图 1 平衡二叉树的生成过程
三、平衡二叉树的查找及性能分析
平衡二叉树本身就是一棵二叉排序树,故它的查找与二 叉排序树完全相同。但它的查找 性能优于二叉排序树,不像 二叉排序树一样,会出现最坏的时间复杂度O(n),它的时间复 杂度与二叉排序树的最好时间复杂相同,都为O(log2n)。
平衡处理
1C
0C 0B
图 2 LR 型平衡处理
0C
0B
0A
3 . L型的处理(单向左型)
如图3所示,在A的右孩子B上插入一个右孩子C,使A的 平衡因子由-1变成-2,成为不平衡的二叉排序树。这时的平 衡处理为:将A逆时针旋转,成为B的左子树,而原来B的左 子树则变成A的右子树,待插入结点C成为B的右子树。
线性链表
线性链表
9.3 .1二叉排序树查找
一、概念
二叉排序树(Binary Sorting Tree),它或者是一棵空树, 或者是一棵具有如下特征的非空二叉树:
若它的左子树非空,则左子树上所有结点的关键字均 小于根结点的关键字;
若它的右子树非空,则右子树上所有结点的关键字均 大于等于根结点的关键字;
分块查找方法评价
ASLbs Lb Lw 其中:Lb — —查找索引表确定所在块的平均查找长度
Lw — —在块中查找元素的平均查找长度 若将表长为n的表平均分成b块,每块含s个记录,并设表中每个记录的
查找概率相等,则:
(1)用顺序查找确定所在块:ASLbs

1 b
b j 1
j

1 s
向本块第一个结点的指针
算法描述
Ch7_3.c
最大关键字 起始地址
索引表 22 48 86 1 7 13
查38
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 22 12 13 8 9 20 33 42 44 38 24 48 60 58 74 57 86 53
平衡处理
B
0C
图 4 RL 型平衡处理N
0C 0A 0B
例1:给定一个关键字序列4,5,7,2 ,1,3,6,试生成一棵平衡二叉树。
分析:平衡二叉树实际上也是一棵二叉排序树,故可以按建立 二叉排序树的思想建立,在建立的过程中,若遇到不平衡,则进 行相应平衡处理,最后就可以建成一棵平衡二叉树。具体生成过 程见图。
-2 4
-1 4
R型
-1 5
05
04
05
07
04
07
(a)插入 4
(b)插入 5
(c)插入 7
15 14 07 02
(d)插入 2
25 2 4 0 7 R型 12
01
(e)插入 1
15 02 07 01 04
2
5
-1
2
07 01
14
03
LR 型
04
0 2 -1 5
01 03
07
(f)插入 3
-1 4 0 2 -2 5
2A
1B
平衡外理
0C
图 1 R 型平衡外理
0B 0C 0A
2 . LR型的处理(左右型)
如图2所示,在A的左孩子B上插入一个右孩子C,使的A的 平衡因子由1变成了2,成为不平衡的二叉排序树。这是的平衡 处理为:将C变到B与A 之间,使之成为LL型,然后按第1种情 形LL型处理。
2A
旋转
-1 B
2A
左、右子树本身又都是一棵二叉排序树。
二、二叉排序树的数据类型描述
和第六章类似,可以用一个二叉链表来描述一棵二叉 排序树,具体为:
struct node
{ int key;
//代表关键字

struct node *lch,*rch; //代表左、右孩子
};
三、二叉排序树上的查找
1 . 二叉排序树的查找思想 若二叉排树为空,则查找失败,否则,先拿根结点
从图2的二叉排序树可知,查找6需4次,平均查找长度 ASL=(1+2+2+3+3+3+4)/7=18/7≈2.57。 从图1的平衡二叉树可知,查找6需2次,平均查找长度 ASL=(1+2+2+3+3+3+3) /7=17/7≈2.43。
5 13 19 21 37 56 64 75 80 88 92
Ch7_2.c
low mid high
找70 例 1 2 3 4 5 6 7 8 9 10 11
5 13 19 21 37 56 64 75 80 88 92
low
mid
123456 7
5 13 19 21 37 56 64
high 8 9 10 11 75 80 88 92
j 2 j1

n
n
1
log
2
(n

1)

1

log
2
(n

1)

1
当n值较大时(n>50), 有次近似结果)
§9.3 分块查找(索引顺序表的查找)
查找过程:将表分成几块,块内无序,块间有序; 先确定待查记录所在块,再在块内查找
适用条件:分块有序表 算法实现
用数组存放待查记录,每个数据元素至少含有关键字域 建立索引表,每个索引表结点含有最大关键字域和指
相关文档
最新文档