数据结构《第4章 串存储与基本操作的实现》
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章串存储与基本操作的实现
本章学习要点
◆熟悉串的相关概念以及串与线性表的关系
◆重点掌握串的定长存储、堆分配存储的表示方法与基本操作的实现
◆了解串的各种存储结构,能根据需要合理选用串的存储结构解决实际问题
“串”(string),是字符串的简称,它是一种特殊的线性表,其特殊性在于组成线性表的数据元素是单个字符。字符串在计算机处理实际问题中使用非常广泛,比如人名、地名、商品名、设备名等均为字符串。同样在文字编辑、自然语言理解和翻译、源程序的编辑和修改等方面,都离不开对字符串的处理。
4.1串的基本概念
4.1.1串的概念
1.串的定义
串(string)是由n个字符组成的有限序列,记为:S=”a0a1a2…a n-1” (n≥0)。
其中,S是串的名字,字符序列a0a1a2…a n-1是串的值,a i(0≤i≤n-1)可以是字母、数字或其他字符元素;由于在C语言系统中数组元素的下标是从0开始的,所以串中所含元素的序号等于该元素的下标值加1;串中所含字符的个数n称为该串的长度,长度为0的字符串称为空串(null string)。
从串的定义可以看出,串实际上是数据元素为字符的特殊的线性表。
例如:
(1)A=“X123” (长度为4的串)
(2)B=“12345654321” (长度为11的串)
(3)C=“Bei Jing” (长度为8的串)
(4)D=“” (长度为0的空串)
(5)E=“This is a string” (长度为16的串)
(6)F=“ is a ” (长度为6的串)
2.子串、主串和位置
串中任意连续的字符组成的子序列称为该串的子串;相应地,包含子串的串称为主串。串中的字符在串序列中的序号称为该字符在该串中的位置;子串的第一个字符在主串中的位置称为子串在主串中的位置。显然,串为其自身的子串,并规定空串为任何串的子串。显然,在不考虑空子串的情况下,一个长度为n的字符串具有n(n+1)/2个子串。
例如:
在上例的(6)中串F就是(5)中串E的子串,且子串F在主串E中的位置是5。由于空格符也是一个字符,所以在串G=“abc defghne”中包含有子串“c def”,而串“cdef”不是串G的子串。串G中第一个字符…e‟的位置是6,第二个字符…e‟的位置是11。
3.串的比较
如果两个串的长度相等且对应位置上的字符相同,则称这两个串相等。两个串A、B的比较过程是:从前往后逐个比较对应位置上的字符的ASCII码值,直到不相等或有一个字符串结束为止,此时的情况有以下几种:
(1)两个串同时结束,表示A等于B;
(2)A中字符的ASCII码值大于B中相应位置上字符的ASCII码值或B串结束,表示A大于B;(3)B中字符的ASCII码值大于A中相应位置上字符的ASCII码值或A串结束,表示A小于B。
例如:
“abc”=“abc”,“abc”<“abcd”,“abxy”>“abcdefg”,“132”>“123456”
“ABab”<“abAB”,“3+2”>“2+3”。
4.空格串
由一个或多个空格字符组成的串称为空格串,空格串的长度为串中所含空格字符的个数。在串操作中不要将空格串和空串混淆。
4.1.2串的基本操作
尽管串的定义和线性表极为相似,但是串的基本操作和线性表有很大差别。在线性表的基本操作中,大多以单个元素作为操作对象,比如对线性表的查找、访问、插入、删除和排序等;而在串的基本操作中,通常以串整体或串的一部分(子串)作为操作对象,比如子串的查找、截取子串、删除一个子串、插入子串和子串替换等操作。
串的基本操作主要有:
(1)StrAssign(&T,chars)—由字符串常量chars生成字符串T的操作。
(2)StrCopy(&T,S)—由串S复制生成串T的操作。
(3)StrCompare(S,T)—若S=T返回0,S>T返回正数,S (4)StrLength(S)—返回串S的长度。 (5)Concat(&T,S1,S2)—将串S1和S2连接起来生成串T的操作。 (6)SubString(&Sub,S,pos,len)—以串S中pos位置开始的len个字符生成子串Sub的操作。 (7)Index(S,T,pos)—返回子串T在S中pos个字符以后出现的位置。 (8)Replace(&S,T,V)—将串S中所有不重叠子串T替换为串V的操作。 (9)StrInsert(&S,pos,T)—在串S中第pos个字符前插入串T的操作。 (10)StrDelete(&S,pos,len)—删除串S中第pos个字符开始的len个字符的操作。 4.2串的存储表示与实现 既然串是线性表的特例,所以线性表的两种存储结构对于串也是适用的。在应用中具体选用何种存储结构与串的操作有关,比如对串进行插入和删除操作运算时选用链存储结构较好,对串进行查找和求子串运算时选用顺序存储结构较好。 本章主要介绍串的3种存储表示方法: (1)串的定长顺序存储表示法 (2)串的堆分配存储表示法 (3)串的块链式存储表示法 4.2.1串的定长顺序存储表示 串的定长顺序存储表示是用一组地址连续的存储单元来存储串中的字符序列。在串的定长顺序存储表示中,按照预定义的大小,为每个定长的串变量分配一个固定长度的存储区,所以可以用定长字符数组来表示。 1.定长顺序存储结构 在C++运行环境中,定长顺序结构定义为: #include"iostream.h" #include"stdio.h" #define MAXLEN 255 //定义串的最大长度为255 typedef char SString[MAXLEN+1]; //定义定长顺序存储类型SString