第九章查找3哈希表

合集下载

哈希表查找方法原理

哈希表查找方法原理

哈希表查找方法原理哈希表查找方法什么是哈希表•哈希表是一种常见的数据结构,也被称为散列表。

•它可以提供快速的插入、删除和查找操作,时间复杂度在平均情况下为O(1)。

•哈希表由数组组成,每个数组元素称为桶(bucket)。

•存储数据时,通过哈希函数将数据映射到对应的桶中。

哈希函数的作用•哈希函数是哈希表的核心部分,它将数据转换为哈希值。

•哈希函数应该具备以下特点:–易于计算:计算哈希值的时间复杂度应尽量低。

–均匀分布:哈希函数应能将数据均匀地映射到不同的桶中,以避免桶的过度填充或者空闲。

–独特性:不同的输入应该得到不同的哈希值,以尽量减少冲突。

哈希冲突及解决方法•哈希冲突指两个或多个数据被哈希函数映射到同一个桶的情况。

•常见的解决哈希冲突的方法有以下几种:–链地址法(Chaining):将相同哈希值的数据存储在同一个桶中,通过链表等数据结构来解决冲突。

–开放地址法(Open Addressing):当发生冲突时,通过特定的规则找到下一个可用的桶来存储冲突的数据,如线性探测、二次探测等。

–再哈希法(Rehashing):当发生冲突时,使用另一个哈希函数重新计算哈希值,并将数据存储到新的桶中。

哈希表的查找方法•哈希表的查找方法分为两步:1.根据哈希函数计算数据的哈希值,并得到对应的桶。

2.在桶中查找目标数据,如果找到则返回,否则表示数据不存在。

哈希表的查找性能•在理想情况下,哈希表的查找时间复杂度为O(1)。

•然而,由于哈希冲突的存在,查找时间可能会稍微增加。

•如果哈希函数设计得不好,导致冲突较多,可能会使查找时间复杂度接近O(n)。

•因此,选择合适的哈希函数和解决冲突的方法对于提高哈希表的查找性能非常重要。

总结•哈希表是一种高效的数据结构,适用于快速插入、删除和查找操作的场景。

•哈希函数的设计和解决冲突的方法直接影响哈希表的性能。

•在实际应用中,需要根据数据特点选择合适的哈希函数和解决冲突的方法,以提高哈希表的查找性能。

数据结构教程 第5版 第9章-查找

数据结构教程 第5版 第9章-查找
4/51
4、影响查找的因素
采用何种查找方法? 使用哪种数据结构来表示“表”,即表中记录是按何种方式组织的? 表中关键字的次序。是对无序集合查找还是对有序集合查找?
5/51
5. 查找方法的性能指标
查找运算时间主要花费在关键字比较上,通常把查找过程中执行的关键字平均 比较个数(称为平均查找长度)作为衡量一个查找算法效率优劣的标准。
int BinSearch(RecType R[],int n,KeyType k)
{
int low=0,high=n-1,mid;
while (low<=high)
//当前区间存在元素时循环
{ mid=(low+high)/2;
if (R[mid].key==k) //查找成功返回其逻辑序号mid+1
1
1
4
2
3
3
2
姓名 张三 李四 王五 刘六
存储
姓名 张三 李四 王五 刘六
学 生 表
学号 1 4 3 2
地址 0 1 2 3
索引表
学号 1 2 3 4
地址 0 3 2 1
提取
排序
38/51
存储地址
0 1 2 3
主数据表
学号 1 4 3 2
姓名 张三 李四 王五 刘六
索引表
学号 1 2 3 4
地址 0 3 2 1
36/51
9.2.3 索引存储结构和分块查找 1、索引存储结构
索引存储结构 = 主数据表 + 索引表
索引表中的每一项称为索引项,索引项的一般形式是: (关键字,地址)
关键字唯一标识一个记录,地址作为指向该关键字对应记录的指针,也可以 是相对地址。

第九章 查找

第九章 查找

} // Search_Seq

例:在顺序查找表中查找key=8的关键字 ST.elem
0 8 1 100 2 10 3 0 4 8 i 5 1 6 3 7 7
查找成功 i=4
9.1.1 顺序表的查找性能分析

等概率下查找成功的平均查找长度:Pi=1/n;Ci=n-i+1,
1 ASLSS n
(n i 1)
9.1.2 有序表的查找的性能分析
•判定树:用二叉树描述折半查找过程,树中每个结点表示一个 记录,结点值为该记录在表中的位臵,结点所在的层次表示查找 该值需要进行的比较次数。则有如下的表:
位臵 0 1 2 3 4 5 6 7 8 9 10 11
05 13 19 21 37 56 64 75 80 88 92
} // Search_Seq

例:在顺序查找表中查找key=8的关键字 ST.elem
0 8 1 100 2 10 3 0 4 8 5 1 6 3 i 7 7
9.1.1 顺序表的查找

适用场合:以顺序表表示静态查找表,表内元素无序。
思想:从表中最后一条记录起,逐个比较记录关键字与给定值, 若相等查找成功;反之,直至与第一条记录不等,查找不成功 int Search_Seq( SSTable ST, KeyType key ) { ST.elem[0]. key = key;//哨兵 for ( i = ST.length ; ! EQ(ST.elem[i]. key, key ) ; - - i ); return i;
比较次数 0 3 4 2 3 4 1 3 4 2 3 4
查找的定义和术语(2)
“特定的”数据元素 关键字(Key):数据元素中某个数据项的值,用以标识一个 数据元素 主关键字(Primary Key):可以唯一标识一个记录的关键 字 次关键字(Secondary Key):用以识别若干记录的关键 字 查找(Searching):根据给定值,在查找表中确定一个其关 键字等于给定值的数据元素或记录. 查找成功(Searching Success):若存在这一记录,给 出该记录信息或指示该记录在表中的位臵 查找不成功(Searching Failed):若查找表中不存在这 一记录,给出“空记录”或“空指针”。

习题第九章查找答案

习题第九章查找答案

第九章查找一、选择题1.若查找每个记录的概率均等,则在具有n个记录的连续顺序文件中采用顺序查找法查找一个记录,其平均查找长度ASL为( C )。

【北京航空航天大学 2000 一、8 (2分)】A. (n-1)/2 B. n/2 C. (n+1)/2 D. n2. 对N个元素的表做顺序查找时,若查找每个元素的概率相同,则平均查找长度为( A ) 【南京理工大学1998一、7(2分)】A.(N+1)/2 B. N/2 C. N D. [(1+N)*N ]/23. 下面关于二分查找的叙述正确的是 ( D ) 【南京理工大学 1996 一、3 (2分)】A. 表必须有序,表可以顺序方式存储,也可以链表方式存储 C. 表必须有序,而且只能从小到大排列B. 表必须有序且表中数据必须是整型,实型或字符型 D. 表必须有序,且表只能以顺序方式存储4. 对线性表进行二分查找时,要求线性表必须( B )【燕山大学 2001 一、5 (2分)】A.以顺序方式存储B.以顺序方式存储,且数据元素有序C.以链接方式存储D.以链接方式存储,且数据元素有序5.适用于折半查找的表的存储方式及元素排列要求为( D ) 【南京理工大学 1997 一、6 (2分)】A.链接方式存储,元素无序 B.链接方式存储,元素有序C.顺序方式存储,元素无序 D.顺序方式存储,元素有序6.当在一个有序的顺序存储表上查找一个数据时,即可用折半查找,也可用顺序查找,但前者比后者的查找速度( C ) A.必定快 B.不一定 C. 在大部分情况下要快 D. 取决于表递增还是递减【南京理工大学 1997 一、7 (2分)】7.当采用分快查找时,数据的组织方式为 ( B ) 【南京理工大学 1996 一、7 (2分)】A.数据分成若干块,每块内数据有序B.数据分成若干块,每块内数据不必有序,但块间必须有序,每块内最大(或最小)的数据组成索引块C. 数据分成若干块,每块内数据有序,每块内最大(或最小)的数据组成索引块D. 数据分成若干块,每块(除最后一块外)中数据个数需相同8. 二叉查找树的查找效率与二叉树的( (1)C)有关, 在 ((2)C)时其查找效率最低【武汉交通科技大学1996 一、2(4分)】(1): A. 高度 B. 结点的多少 C. 树型 D. 结点的位置(2): A. 结点太多 B. 完全二叉树 C. 呈单枝树 D. 结点太复杂。

数据结构(C语言版)9-12章练习 答案 清华大学出版社

数据结构(C语言版)9-12章练习 答案 清华大学出版社

数据结构(C语言版)9-12章练习答案清华大学出版社9-12章数据结构作业答案第九章查找选择题1、对n个元素的表做顺序查找时,若查找每个元素的概率相同,则平均查找长度为( A )A.(n+1)/2 B. n/2 C. n D. [(1+n)*n ]/2 2. 下面关于二分查找的叙述正确的是 ( D )A. 表必须有序,表可以顺序方式存储,也可以链表方式存储B. 表必须有序且表中数据必须是整型,实型或字符型 C. 表必须有序,而且只能从小到大排列 D. 表必须有序,且表只能以顺序方式存储3. 二叉查找树的查找效率与二叉树的( (1)C)有关, 在 ((2)C )时其查找效率最低 (1): A. 高度 B. 结点的多少 C. 树型 D. 结点的位置(2): A. 结点太多 B. 完全二叉树 C. 呈单枝树 D. 结点太复杂。

4. 若采用链地址法构造散列表,散列函数为H(key)=key MOD 17,则需 ((1)A)个链表。

这些链的链首指针构成一个指针数组,数组的下标范围为 ((2)C) (1) A.17 B. 13 C. 16 D. 任意(2) A.0至17 B. 1至17 C. 0至16 D. 1至16判断题1.Hash表的平均查找长度与处理冲突的方法无关。

(错) 2. 若散列表的负载因子α<1,则可避免碰撞的产生。

(错)3. 就平均查找长度而言,分块查找最小,折半查找次之,顺序查找最大。

(错)填空题1. 在顺序表(8,11,15,19,25,26,30,33,42,48,50)中,用二分(折半)法查找关键码值20,需做的关键码比较次数为 4 .算法应用题1. 设有一组关键字{9,01,23,14,55,20,84,27},采用哈希函数:H(key)=key mod7 ,表长为10,用开放地址法的二次探测再散列方法Hi=(H(key)+di) mod 10解决冲突。

要求:对该关键字序列构造哈希表,并计算查找成功的平均查找长度。

数据结构第九章--查找-习题及答案

数据结构第九章--查找-习题及答案

第九章查找一、选择题1。

若查找每个记录的概率均等,则在具有n个记录的连续顺序文件中采用顺序查找法查找一个记录,其平均查找长度ASL为( )。

A. (n—1)/2 B. n/2 C。

(n+1)/2 D。

n2. 下面关于二分查找的叙述正确的是( )A。

表必须有序,表可以顺序方式存储,也可以链表方式存储 C. 表必须有序,而且只能从小到大排列B。

表必须有序且表中数据必须是整型,实型或字符型 D. 表必须有序,且表只能以顺序方式存储3. 用二分(对半)查找表的元素的速度比用顺序法( )A.必然快 B. 必然慢 C. 相等 D. 不能确定4. 具有12个关键字的有序表,折半查找的平均查找长度( )A. 3。

1 B。

4 C. 2。

5 D. 55.当采用分块查找时,数据的组织方式为 ( )A.数据分成若干块,每块内数据有序B.数据分成若干块,每块内数据不必有序,但块间必须有序,每块内最大(或最小)的数据组成索引块C。

数据分成若干块,每块内数据有序,每块内最大(或最小)的数据组成索引块D. 数据分成若干块,每块(除最后一块外)中数据个数需相同6。

二叉查找树的查找效率与二叉树的( (1))有关, 在((2))时其查找效率最低(1): A。

高度 B。

结点的多少 C. 树型 D. 结点的位置(2): A。

结点太多 B. 完全二叉树 C。

呈单枝树 D. 结点太复杂。

7. 对大小均为n的有序表和无序表分别进行顺序查找,在等概率查找的情况下,对于查找失败,它们的平均查找长度是((1)) ,对于查找成功,他们的平均查找长度是((2))供选择的答案:A。

相同的 B。

不同的9.分别以下列序列构造二叉排序树,与用其它三个序列所构造的结果不同的是()A.(100,80, 90, 60, 120,110,130) B。

(100,120,110,130,80, 60, 90) C。

(100,60, 80, 90, 120,110,130) D。

查找-数据结构

查找-数据结构

平均查找长度:为确定记录在查找表中 的位置,需和给定值进行比较的关键字 个数的期望值称为查找算法在查找成功 时的平均查找长度,简称ASL。
对于含有n个记录的表,查找成功时的平 均查找长度为: n ASL PiCi i 1
其找到中表:中Pi为其查关找键表字中与第给i定个值记相录等的的概第率,i个C记i为 录时和给定值已进行过比较的关键字个数。
(1)若*p 为叶子结点,直接删除即可。
45
45
12
3
37
53
f
100
24
p
61
60
90
12
53
3
删除24
f->lchild = null; delete p;
37
100
61
60
90
78
78
(2)若*p结点只有左子树PL或只有右子树PR,此 时只要令PL或PR直接成为*f的左子树即可
f
F
f
F
p
P
p
二叉排序树的插入
基本思想:
若二叉排序树为空,则待插结点作为根结点插入 到空树中;
若待插结点的关键字值和根结点的关键字值相等, 则说明树中已有此结点,无需插入;
若待插结点的关键字值小于根结点的关键字值, 则将待插结点插入到根的左子树中;
若待插结点的关键字值大于根结点的关键字值, 则将待插结点插入到根的右子树中;
mid low
mid low
mid low
mid low
mid
mid
mid
mid
6
3
9
1
47
10
2
58
11
由此可见,二分查找过程恰好是走了一条从判 定树的根到被查结点的路径,比较的关键字个 数恰为该结点在判定树中的层数。

数据结构.第9章.查找.4.哈希表

数据结构.第9章.查找.4.哈希表

§9.3 哈希表
开放地址法
例:关键码集为 {47,7,29,11,16,92,22,8,3}, 设:哈希表表长为m=11; 哈希函数为Hash(key)=key mod 11; 拟用线性探测法处理冲突。建哈希表: 0 1
11 22
2
3
4
5
6
3
7
7
8
29
9
8
10
47 92 16
§9.3 哈希表
开放地址法
选用关键字的某几位组合成哈希地址。
选用原则应当是:各种符号在该位上出现的频率大致
相同。
适于关键字位数比哈希地址位数大,且可能出现的关 键字事先知道的情况。
§9.3 哈希表
数字分析法
例:有一组(例如80个)关键码,其样式如下: 讨论: 3 4 7 0 5 2 4 ① 第1、2位均是“3和4”,第3位也只有 3 4 9 1 4 8 7 3 4 8 2 6 9 6 “ 7、8、9”,因此,这几位不能用,余 3 4 8 5 2 7 0 下四位分布较均匀,可作为哈希地址选用。 3 4 8 6 3 0 5 ② 若哈希地址取两位(因元素仅80个), 3 4 9 8 0 5 8 则可取这四位中的任意两位组合成哈希地 3 4 7 9 6 7 1 址,也可以取其中两位与其它两位叠加求 3 4 7 3 9 1 9 和后,取低两位作哈希地址。 位号:① ② ③ ④ ⑤ ⑥ ⑦
拟用二次探测法处理冲突。建哈希表如下: Hi = ( H(K)+di ) mod m 其中di =12, -12, 22,-22,…, j2, -j2 ( j≤m/2)。
0 1
11 22
2
3
3
4
5
6
7

9.3 哈希表

9.3 哈希表
6/28/2020
9.3.3、处理冲突的方法法 1. 开放定址法
为产生冲突的地址 H(key) 求下一个哈希地址,如果该地址还 冲突,则再给出下一个地址,由此得到一个地址序列:
H0, H1, H2, …, Hs 1≤ s≤m-1
其中:H0 = H(key)
Hi = ( H(key) + di ) MOD m i=1, 2, …, s
1
3
条件:表长 m 应为形如 4j+3 的素数
(如: 7, 11, 19, 23, … 等)
Hi = ( H(key) + di ) MOD m, i=1, 2, …, s 3) 随机探测再散列
di 是一组伪随机数列 或者
di=i×H2(key) (又称双散列函数探测)
例如: 关键字集合
{ 19, 01, 23, 14, 55, 68, 11, 82, 36 }
ADT HashTable is
Data
HashTable;
Operations
initiate()
初始化Hash表
hash(key) Hash函数
search(key) 查找key
insert(key) 插入key
delete(key) 删除key
reCreate(size) 重建Hash表, 新表空间大于旧表, 旧表中的元素按新表的Hash函数插入新表中
设定哈希函数 H(key) = key MOD 11 ( 表长=11 )
6/28/2020
1 直接定址法 取关键字或关键字的某个线性函数作哈希地址,
即H(key)=key 或 H(key)=a·key+b(a,b为常数) 特点:直接定址法所得地址集合与关键字集合大小

数据结构 第9章 查找4-哈希表

数据结构 第9章 查找4-哈希表

7、随机数法 Hash(key) = random ( key ) (random为伪随机函数)
适用于:关键字长度不等的情况。造表和查找都很方便。
小结:构造哈希函数的原则:
① ② ③ ④ ⑤ 执行速度(即计算哈希函数所需时间); 关键字的长度; 哈希表的大小; 关键字的分布情况; 查找频率。
三、冲突处理方法
14 H(14)=14%7=0
6个元素用7个 地址应该足够!
1
2
23 9
3
4
39 25 11
5
6
H(25)=25%7=4 H(11)=11%7=4
有冲突!
在哈希查找方法中,冲突是不可能避免的,只能 尽可能减少。
所以,哈希方法必须解决以下两个问题:
1)构造好的哈希函数
(a)所选函数尽可能简单,以便提高转换速度; (b)所选函数对关键码计算出的地址,应在哈希地址集中 大致均匀分布,以减少空间浪费。
讨论:如何进行散列查找?
根据存储时用到的散列函数H(k)表达式,迅即可查到结果! 例如,查找key=9,则访问H(9)=9号地址,若内容为9则成功; 若查不到,应当设法返回一个特殊值,例如空指针或空记录。
缺点:空间效率低!
若干术语
哈希方法 (杂凑法)
选取某个函数,依该函数按关键字计算元素的存储位置, 并按此存放;查找时,由同一个函数对给定值k计算地址, 将k与地址单元中元素关键码进行比较,确定查找是否成 功。
3. 乘余取整法
4. 数字分析法
5. 平方取中法
常用的哈希函数构造方法有:
6. 折叠法
7. 随机数法
1、直接定址法
(a、b为常数) 优点:以关键码key的某个线性函数值为哈希地址, 不会产生冲突. 缺点:要占用连续地址空间,空间效率低。

数据结构-第9章 查找

数据结构-第9章 查找

静态查找表 对查找表的查找仅是以查询为 目的,不改动查找表中的数据。 动态查找表 在查找的过程中同时插入不存 在的记录,或删除某个已存在的记录。
查找成功 查找表中存在满足查找条件的记 录。 查找不成功 查找表中不存在满足查找条件 的记录。
内查找 整个查找过程都在内存中进行。 外查找 在查找过程中需要访问外存。 平均查找长度ASL——查找方法时效的度量 为确定记录在查找表中的位置,需和给定值 进行比较的关键字个数的期望值。 n 查找成功时的ASL计算方法: ASL pici
3. 在二叉排序树上的操作
1)查找
[例] Key=28 f 24 12 T
45
53 28 90
Key=32 T 45 24 53 12 f 28 90 32
[算法描述]
2) 插入
[算法描述]
3) 生成
查找算法
返回
BiTree SearchBST(BiTree T,KeyType key){
//在根指针T所指二叉树中递归地查找某关键字等于 //key的数据元素,若查找成功,则返回指向该数据元 //素结点的指针,否则返回空指针
图9.1 用折半查找法查找12、50的过程 其中mid=(low+high)/2,当high<low时,表 示不存在这样的子表空间,查找失败。
成功! 位 置 1 2 3 4 5 6 7 8 9 10 11

6 12 15 18 22 25 28 35 45 58 60
low hign mid mid hign mid low mid (a) 用折半查找法查找12的过程
[性能分析] • 空间:一个辅助空间。 • 时间: 查找成功时的平均查找长度 设表中各记录查找概率相等 n ASLs(n)= PiCi =(1+2+ ... +n)/n =(n+1)/2 i 1 [算法特点] • 算法简单,对表结构无任何要求 • n很大时查找效率较低 • 改进措施:非等概率查找时,可将查找概率高 的记录尽量排在表后部。

DS_第九章查找

DS_第九章查找
如果元素总数有 1024 个, 不可能把所有元素的数据一次都读入内存。 无论是顺序查找或对分查找,都需要多次读取外存记录。
如果在索引表中每一个索引项占4个字节, 每个索引项索引一个职工对 象,则 1024 个索引项需要 4k 字节, 在内存中可以容纳所有的索引项。
这样只需从外存中把索引表读入内存,经过查找索引后确定了职工对 象的存储地址,再经过 1 次读取元素操作就可以完成查找。
1)

n 1. 2
5
9.1.2 有序表的查找(折半查找)
设n个元素存放在一个有序顺序表中,并按其关键字从小到大排好 了序。
采用折半查找时,先求位于查找区间正中的元素的下标mid,用其 关键字与给定值x比较: elem[mid].key = x,查找成功; elem[mid].key > x,把查找区间缩小到表的前半部分,再继续进 行折半查找; elem[mid].key < x,把查找区间缩小到表的后半部分,再继续进 行折半查找。
n
( pi 1 ) i 1
• 在顺序查找情形,ci = n-i+1, i = 1, 2, , n,因此
n
ASLsucc pi (n i 1)
i 1
• 在等概率情形,pi = 1/n, i = 1, 2, , n。
ASLsucc

n i 1
1 (n i n
第九章 查找
9.1 静态查找表 9.2 动态查找表 9.3 哈希表
1
查找(Search)的概念
所谓查找,就是在数据集合中寻找满足某种条件的数据元素。 查找的结果通常有两种可能:
查找成功,即找到满足条件的数据元素。查找结果可为该元素在 结构中的位置,还可进一步给出该元素中的具体信息。 查找不成功,或查找失败。查找结果为一些指示信息,如失败标 志、失败位置等。

数结_8查找j1

数结_8查找j1

32 26 12 19 29 39 34 44 46 中序序列:12,19,26,29,32,34,39,44,46, 48,56 48 56
二叉排序树的一个重要性质:中序序列是一个有序序列
9.2.2二叉排序树的查找
26 12 19 29
bt
32 48 39 34 44 46 56
给定值K, K < bt->key: 在bt的左子树上继续查找 K > bt->key: 在bt的右子树上继续查找 K==bt->key: 查找成功
n=13的折半查找判定树
7 1. 3 .6 1 1. .2 2 4. 5 .6 4 6 8 8. .9 9 10 8. .13 11.12 .13 11 13
折半查找判定树是一棵理想平衡树 树的高度为 H=log2(n+1) 或 H=log2n+1 树的形态取决于n值
查找 • 静态查找表 • 折半查找
查找 • 静态查找表 • 顺序查找
查找效率:
查找成功时的ASL:
1 n +1 ASL = ∑ × Pi = ∑(n −i +1) × = Ci n 2 i=1 i=1
n n
查找失败时的ASL: ASL=n+1 平均:ASL=3(n+1)/4
查找 • 静态查找表 • 顺序查找
顺序查找小结:
最朴素的查找方法 对表的限制最少 不仅适用于顺序存储结构,而且适用于链式存 储结构 时间性能最差,O(n) 等概情况下查找成功时ASL=(n+1)/2
0 1 2 3 n
ST
R1 R2 R3
...
...
Rn
int Search(SSTable ST, KeyType K) { //从表尾开始,顺序查找, 查找成功返回元素的位置下标 //查找失败,返回0 int i=ST.length; while( i>0 && ST.elem[ i ].key !=K) i - - ; return i ;

第九章哈希表

第九章哈希表

对增量 di 有三种取法:
• 1) • 2) • 3) • 线 平 随 性 方 机 探 探 探 测 测 测 再 再 再 散 散 散 列 列 列 di = c× i 最简单的情况 c=1 di = 12, -12, 22, -22, …, di 是一组伪随机数列 或者 伪随机数列 di=i×H2(key) (又称双散列函数探测 又称双散列函数探测) 又称双散列函数探测
二、构造哈希函数的方法 构造哈希函数的方法
对数字 数字的关键字可有下列构造方法: 数字
1. 直接定址法 2. 数字分析法 3. 平方取中法
4. 折叠法 5. 除留余数法 6. 随机数法
若是非数字关键字 非数字关键字,则需先 需先对其进行 进行 非数字关键字 需先 数字化处理。 数字化处理
1. 直接定址法
注意: 应具有“完备性” 注意:增量 di 应具有“完备性”
即:产生的 Hi 均不相同,且所产生的 s(m-1)个 Hi 值能覆盖 覆盖哈希表中所有 个 覆盖 地址。则要求: ※ 平方探测时的表长 m 必为形如 4j+3 的素数(如: 7, 11, 19, 23, … 等); ※ 随机探测时的 m 和 di 没有公因子。
示例: 示例: 有一个关键码 key = 962148,散列表大小 , m = 25,即 HT[25]。取质数 p= 23。散列函数 , 。 。 hash ( key ) = key % p。则散列地址为 。
hash ( 962148 ) = 962148 % 23 = 12。 12。
6.随机数法 随机数法
例如:为每年招收的 1000 名新生建立
一张查找表,其关键字为学号,其值的 范围为 xx000 ~ xx999 (前两位为年份)。 若以下标为 以下标为000 ~ 999 的顺序表 的顺序表表示之。 以下标为 则查找过程可以简单进行:取给定值 (学号)的后三位,不需要经过比较 不需要经过比较便 不需要经过比较 可直接从顺序表中找到待查关键字。

数据结构第九章--查找-习题及答案

数据结构第九章--查找-习题及答案

第九章查找一、选择题1.若查找每个记录的概率均等,则在具有n个记录的连续顺序文件中采用顺序查找法查找一个记录,其平均查找长度ASL为( )。

A. (n-1)/2 B. n/2 C. (n+1)/2 D. n2. 下面关于二分查找的叙述正确的是 ( )A. 表必须有序,表可以顺序方式存储,也可以链表方式存储 C. 表必须有序,而且只能从小到大排列B. 表必须有序且表中数据必须是整型,实型或字符型 D. 表必须有序,且表只能以顺序方式存储3. 用二分(对半)查找表的元素的速度比用顺序法( )A.必然快 B. 必然慢 C. 相等 D. 不能确定4. 具有12个关键字的有序表,折半查找的平均查找长度()A. 3.1B. 4C. 2.5D. 55.当采用分块查找时,数据的组织方式为 ( )A.数据分成若干块,每块内数据有序B.数据分成若干块,每块内数据不必有序,但块间必须有序,每块内最大(或最小)的数据组成索引块C. 数据分成若干块,每块内数据有序,每块内最大(或最小)的数据组成索引块D. 数据分成若干块,每块(除最后一块外)中数据个数需相同6. 二叉查找树的查找效率与二叉树的( (1))有关, 在 ((2))时其查找效率最低(1): A. 高度 B. 结点的多少 C. 树型 D. 结点的位置(2): A. 结点太多 B. 完全二叉树 C. 呈单枝树 D. 结点太复杂。

7. 对大小均为n的有序表和无序表分别进行顺序查找,在等概率查找的情况下,对于查找失败,它们的平均查找长度是((1)) ,对于查找成功,他们的平均查找长度是((2))供选择的答案:A. 相同的B.不同的9.分别以下列序列构造二叉排序树,与用其它三个序列所构造的结果不同的是( ) A.(100,80, 90, 60, 120,110,130) B.(100,120,110,130,80, 60, 90)C.(100,60, 80, 90, 120,110,130)D. (100,80, 60, 90, 120,130,110)10. 在平衡二叉树中插入一个结点后造成了不平衡,设最低的不平衡结点为A,并已知A的左孩子的平衡因子为0右孩子的平衡因子为1,则应作( ) 型调整以使其平衡。

哈希表的查找

哈希表的查找


1
2 3
4
2)算法思想: 设n 个记录存放在一个有序顺序表 L 中,并按其关键 码从小到大排好了序。查找范围为l=0, r=n-1; 求区间中间位置mid=(l+r)/2; 比较: L[mid].Key = x,查找成功,返回mid,结束; L[mid].Key > x,r=mid-1; L[mid].Key < x,l=mid+1; 若l<=r 转2,否则查找失败,返回 0;
对查找表常用的操作有哪些?
查询某个“特定的”数据元素是否在表中; 查询某个“特定的”数据元素的各种属性; 在查找表中插入一元素; 从查找表中删除一元素。
9.1 基本概念
如何评估查找方法的优劣? 查找的过程就是将给定的值与文件中各记录的关 键字逐项进行比较的过程。所以用比较次数的平均值 来评估算法的优劣,称为平均查找长度(ASL: average search length)。i 1 i Ci ASL P
考虑对单链表结构如何折半查找? ——无法实现!
2)算法实现:
int Search_Bin ( SSTable ST, KeyType key ) { // 在有序表ST中折半查找其关键字等于key的数据元素。 // 若找到,则函数值为该元素在表中的位置,否则为0。 low = 1; high = ST.length; // 置区间初值 while (low <= high) { mid = (low + high) / 2; if (key == ST.elem[mid].key) return mid; // 找到待查元素 else if ( key < ST.elem[mid].key) high = mid - 1; // 继续在前半区间进行查找 else low = mid + 1; // 继续在后半区间进行查找 } return 0; // 顺序表中不存在待查元素 } // Search_Bin

严蔚敏版数据结构C语言版PPT第九章

严蔚敏版数据结构C语言版PPT第九章

度较大,特别不适用于表长较大的查找表。

据 结
若以有序表表示查找表,则查找过程
构 可以基于“折半”进行。
折半查找只适用于有序表,且限于顺序存储结构
13
第 9 章 查找 9.2 基于线性表的查找 ②折半查找
基本思想: 数 1.首先确定查找表的中间位置;

结 2.然后将待查的值与中间位置的值进行比较, 构 若相等,则查找成功并返回此位置,否则须
50 -2 60 1
80 0 (a)一棵平衡二叉排序树
58 0 (b)一棵失去平衡的二叉排序树
30
第 9 章 查找
9.4 计算式查找法—哈希表
哈希表是什么?
以上两节讨论的表示查找表的各种结构的

共同特点:


1.记录在表中的位置和它的关键

字之间不存在一个确定的关系;
2.查找的过程为给定值依次和关 键字集合中各个关键字进行比较;
23
第 9 章 查找 9.3 基于树的查找 ①二叉排序树
例如: 50

30
80
据 结
20
40
90

10 25 35
66 85
23
88
不 是二叉排序树。
24
第 9 章 查找
9.3 基于树的查找 ①二叉排序树 查找算法
若二叉排序树为空,则查找不成功;
否则,
数 1. 若给定值等于根结点的关键字,则查找成功;
线性表的三种查找方法比较
顺序查找 折半查找 分块查找

据 表的结构 有序、无序
有序
表间有序

构 表的存储 顺序、链式
顺序
顺序、链式
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

解决方案:可采用二次探测法或伪随机探测法,以 改善‚堆积‛问题。
9.3
三.处理冲突的方法
哈希表
例2:设哈希表长为11,哈希函数 H(key)=key MOD 11, 试用开放定址法中二次探测再散列解决冲突 Hi(key)=(H(key)+di) MOD 11 (di=12,-12,22,-22,…,k2,-k2 ), 试对下列关键字序列(19,13,33,02,16,29,24) 构造哈希表HT。
9.3
哈希表
0
1 BAI 2 CHEN
例:假设在例2的记录集合中添 加关键字{DAI,ZHOU,…}。 4、冲突 对不同的关键字可能得到同一 哈希地址的现象叫做冲突。
……
3 DIAO
… 6 GAO … 18 SUN 19 TANG
关 键 码 集 合

22 WU 23 XIAO 24 YI 25 ZHAO
9.3
三.处理冲突的方法
3.链地址法
哈希表
9.3
三.处理冲突的方法
1.开放定址法 2.再哈希法
哈希表
3.链地址法(拉链法) 4.建立公共溢出区
P258
9.3
三.处理冲突的方法
例:关键码集合 {47, 7, 29, 11, 16, 92, 22, 8, 3},散列 函数为H(key)=key mod 11,用公共溢 出区法处理冲突, 构造的散列表为:
哈希表
二.哈希函数的构造方法
1、直接定址法 思想:哈希函数为关键字的某个线性函数
H(key)= a.key+b 或 H(key)=key
适应情况:事先知道关键码,关键码集合不是 很大且连续性较好。 优点:不会产生冲突
缺点:占用连续空间,空间效率低
9.3
哈希表
二.哈希函数的构造方法
2、平方取中法 思想:取关键字平方后的中间几位为哈希地址 例:设哈希表长为1000,则可取关键字平方值的 中间3位 2
移位叠加
+
间界叠加
H(key)=6092
9.3
3、折叠法
哈希表
二.哈希函数的构造方法
思想:将关键字分割成位数相同的几部分,然 后取叠加和(舍去进位)作为哈希地址。 适应情况:事先不知道关键码的分布,且关键 码的位数很多。
9.3
哈希表
二.哈希函数的构造方法
4、除留余数法 思想: H(key)= key MOD p
H(key)= a.key+b 或 H(key)=key
例1: 1949-2000年某地区人口统计表
哈希函数 H(key)=key-1948
1 年份 1949 人数 2000 2 1950 2100 3 1951 2200 51 1999 4400 52 2000 4420
9.3
哈希表
二.哈希函数的构造方法
9.3
哈希表
四.散列查找的性能分析
1.散列函数是否均匀 2.处理冲突的方法 3.散列的装填因子
表 中填 入 的 记录 数 哈 希表 的 长 度
越大,表中记录数越多,说明表装得越满,发生冲突的 可能性就越大,查找时比较次数就越多。
9.3

哈希表
四.散列查找的性能分析
ASL 1 2 1 1 ASL (1 ) 2 1 1 ASL ln(1 ) (拉 链 法 ) (线 性 探 测 法 ) (随 机 探 测 法 )
3.能否不用比较,通过关键码直接确定存储位置?
在存储位置和关键码之间建立一个确定的对应关系 例1 假设有一个含有80个记录的查 找表,记录的关键字均为两位 的十进制数,则设有存储记录 的数组为: ElemType hashtable[100]; 并令关键字为key的记录存 在数组的第i个分量 hashtable[i]中。
9.3
哈希表
二.哈希函数的构造方法
5、数字分析法 思想:使用该方法前应事先知道关键字的集 合,然后选取关键字的若干位来构成哈 希函数值。 例:关键码为8位十 进制数,散列地址 为2位十进制数
①②③④⑤⑥⑦⑧ 8 1 3 4 6 5 3 2 8 1 3 7 2 2 4 2 8 1 3 8 7 4 2 2 8 1 3 0 1 3 6 7 8 1 3 2 2 8 1 7 8 1 3 3 8 9 6 7
0 1 2 3 … 01 02 03
56
57 58 … 99
56
57 58 99
i=f1(key)=key
3.能否不用比较,通过关键码直接确定存储位置?
在存储位置和关键码之间建立一个确定的对应关系 例2 假设一组记录的关键字,则设 有存储记录的数组为: ElemType hashtable[26]; 并令关键字为key的记录存 在数组的第i个分量 hashtable[i]中。
9.3
哈希表
二.哈希函数的构造方法
6、随机数法 思想:取关键字的随机函数为哈希地址,即 H(key)=random(key)。
9.3
三.处理冲突的方法
1.开放定址法 2.再哈希法
哈希表
3.链地址法(拉链法) 4.建立公共溢出区
P258
9.3
三.处理冲突的方法
1.开放定址法
哈希表
思想: 用函数Hi(key)=(H(key)+di) MOD m
第九章
查找
9.1 静态查找表 9.2 动态查找表 9.3 哈希表
1.查找操作要完成什么任务? 待查值k 确定k在存储结构中的位置
2.我们学过哪些查找技术?这些查找技术的共性?
顺序查找、折半查找、二叉排序树查找等。 这些查找技术都是通过一系列的给定值与关键码 的比较,查找效率依赖于查找过程中进行的给定 值与关键码的比较次数。
3.链地址法(拉链法) 4.建立公共溢出区
9.3
三.处理冲突的方法
3.链地址法(拉链法)
哈希表
所谓“链地址法”,即是把具有相同散列地 址的关键字记录(它们都是同义词)用一个单链 表链接在一起,组成同义词链表,每个同义词链 表的表头指针被集中存放在一个一维数组里,以 此方法来解决散列过程中出现的冲突问题。
ki kj
H(ki) H(kj)
ri ……
9.3
哈希表
0
1 BAI 2 CHEN
例:假设在例2的记录集合中添 加关键字{DAI,ZHOU,…}。 5、同义词 具有相同函数值的关键字对该 哈希函数来说称作同义词。
……
3 DIAO
… 6 GAO … 18 SUN 19 TANG
关 键 码 集 合

22 WU 23 XIAO 24 YI 25 ZHAO
其中,H(k为发生冲突的记录再求一个存储位置。
若di=1,2,3,…,m-1 称为线性探测再散列 若di=12,-12,22,-22,…,k2,-k2 (k<=m/2) 称为二次探测再散列 若di是一个随机序列,称为随机探测再散列
关键字 1234 2143 4132 3214 (关键字) 1522756 4592449 17073424 10329796
哈希函数值 227 924 734 297
9.3
哈希表
二.哈希函数的构造方法
2、平方取中法 思想:取关键字平方后的中间几位为哈希地址 适应情况:事先不知道关键码的分布,且关键
例: p =21=3×7
关键码 哈希地址 14 14 21 0 28 7 35 14 42 14 49 7 56 14
如何选取合适的 p,产生较少同义词?
9.3
哈希表
二.哈希函数的构造方法
4、除留余数法 思想: H(key)= key MOD p
技巧:一般情况下,选p为小于或等于表长(最 好接近表长)的素数. 缺点:连续的关键码映射成连续的散列值,虽然 能保证连续的关键码不发生冲突,但也意味着要 占据连续的数组单元,可能导致散列性能的降低
9.3
三.处理冲突的方法
例:
哈希表
Hi(key)=(H(key)+di) MOD 11 ( d1=1,d2=2,d3=3,…), 删除13,再插入02。
0 1 2 3 4 5 6 7 8 9 10
33
13 02 24 16
29 19
02
9.3
三.处理冲突的方法
1.开放定址法 2.再哈希法
哈希表
P258
0
1
2
3
4
5
6
7
8
9
10
33 24 13 02 02 24
16
29 19
9.3
三.处理冲突的方法
哈希表
开放定址法优点:思路清晰,算法简单
开放定址法缺点:
1.溢出处理要另编程序;
2.开放定址法建立的哈希表不容易进行删除操
作,若删除则对该存储单元进行特殊标记, 否则将找不到具有相同哈希函数值的后续记 录。
0 1 2 3 4 5 6 7 8 9 10
33
13 02 24 16
29 19
02 24 24 堆积:在处理冲突的过程中出现的非同义词之间对同一个散列 地址争夺的现象。
9.3
三.处理冲突的方法
哈希表
线性探测法的优点:只要哈希表未被填满,保证能 找到一个空地址单元存放有冲突的元素; 线性探测法的缺点:可能使第i个哈希地址的同义词 存入第i+1个哈希地址,这样本应存入第i+1个 哈希地址的元素变成了第i+2个哈希地址的同 义词,因此,可能出现很多元素在相邻的哈希 地址上‚堆积‛起来,大大降低了查找效率。

应尽量选择一个合适的, 以降低ASL的长度
练习1
给定关键字序列11,78,10,1,3,2,4, 21,试分别用顺序查找、二分查找、二叉排序 树查找、散列查找(用线性探测法和拉链法)来 实现查找,试画出它们的对应存储形式(顺序 查找的顺序表,二分查找的判定树,二叉排序 树查找的二叉排序树及两种散列查找的散列 表),并求出每一种查找的成功平均查找长度。 散列函数H(k)=k%11。
相关文档
最新文档