《数据结构教程》第一章 绪论
数据结构第1章绪论
例
n 阶矩 阵相乘的算法
矩阵相乘的基本运算:乘法 加法;
For ( i = 1; i<=n; i++ ) For (j = 1; j<=n; j++ )
{ c[ i ][ j ] = 0 ; For (k = 1; k<= n; k++ ) c[ i ][ j ] += a[ i ][ k ] * b[ k ] [ j ] } O(n3) 称为矩阵相乘算法时间复杂度; O(n3)表示矩阵相乘算法执行时间与n3成正比, 即O(n3)与n3 同一数量级 ; 乘法 加法
◆设计 求解问题的方法
◆ 编程 main ( )
{
int len, wide ,area ; scanf (“%d %d%\n”, &l,&w); area=len*wide ; printf (“area=%d”,area);
}
1.1 本课程研究的问题
2)非数值问题
例 2 已知某级学生情况 , 要求分班按入学成绩排列顺序。 学号 00201 00102 00202 00301 姓名 性别 杨润生 男 石磊 男 李梅 女 马耀先 男 出生日期 82/06/01 83/12/21 83/02/23 82/07/12 籍贯 入学成绩 所在班级 广州 561 00计算机2 汕头 512 00计算机1 阳江 532 00计算机2 广州 509 00计算机3
数据结构基本操作的实现: 基本操作在计算机上的实现(方法)
1.3 数据结构的分类及表示
一 常用的数据结构
例
某班学生基本情况登记表,记录了每个学生的学号 姓名 专业 1) 集合 政治 面貌 ,表中的记录是按学生的学号顺序排列的。
大学《数据结构教程》(第5版) 李春葆 清华大学出版社课件第1章 绪论
一般情况下,对一个问题(或一类算法)只需选 择一种基本操作来讨论算法的时间复杂度即 可
【例1-7】
++x; s=0;
时间复杂度为O(1)。
没有循环语句,其基本运算次数与问题规 模无关,称为常数阶,记作O(1)。
【例1-8】
for(i =1;i<=n;++i) {
1.1.1 数据结构的研究内容
数据结构主要研究非数值计算问题。 (多种复杂的具有一定结构关系的数 据)
非数值计算问题:
例1-1 电话号码查询问题: 电话号码薄(a1,b1)(a2,b2)…..(an,bn) 其中:ai为某人姓名,bi为该人的电话号码; 要求:设计一个算法,给定一个姓名时能查出 此人的电话号码?
数据结构的形式定义为一个二元组: Data_Structure =(D,R)
其中,D是数据元素的有限集,R是D上 关系的有限集。
数据结构包括数据的逻辑结构和数据的 存储结构。
逻辑结构
(a)集合结构
(b)线性结构
(c)树结构
(d)图结构
【例1-3】
有一数据结构采用二元组描述为D_S=(D,R), 其中:
同样的数据对象,用不同的数据结构来表示, 运算效率可能有明显的差异。
程序设计的实质是对实际问题选择一个好的数 据结构,加之设计一个好的算法。而好的算法 在很大程度上取决于描述实际问题的数据结构。
1.1.2 基本概念和术语(学籍信息表)
• 数据(Data):是信息的载体,能够被计算机识别、 存储和加工处理。
存储结构
3)索引存储结构 P8 4)哈希(或散列)存储结构 P8
数据运算
数据的运算主要有修改、插入、删 除、查找、排序。
《数据结构教程》第一章 绪论
《数据结构教程》第一章绪论数据结构教程第一章绪论数据结构是计算机科学中的重要概念之一,它是计算机程序设计的基础。
本教程的第一章将介绍数据结构的基本概念和作用。
一、什么是数据结构?在计算机科学中,数据结构用于存储和组织数据,以便在计算机程序中进行高效的操作。
数据结构可以分为两种基本类型:线性数据结构和非线性数据结构。
1.1 线性数据结构线性数据结构是最简单的数据结构之一,它将数据元素按照线性顺序组织,可以使用一对一的关系连接数据元素。
常见的线性数据结构有数组、链表和栈。
1.2 非线性数据结构非线性数据结构是指数据元素之间存在多对多的关系,不是简单的一对一关系。
常见的非线性数据结构有树和图。
二、数据结构的作用数据结构的设计和选择对于程序的效率和性能具有重要影响。
合理选择数据结构可以提高算法的执行速度,降低计算机资源的占用。
2.1 提高数据的存储效率通过选择适当的数据结构可以减少内存的占用,提高数据的存储效率。
例如,链表数据结构可以动态地分配内存空间,减少内存的浪费。
2.2 提高数据的访问效率不同的数据结构在数据的访问效率上有所差异。
例如,对于需要频繁插入和删除操作的场景,链表数据结构比数组数据结构更加高效。
2.3 优化算法的执行速度数据结构和算法是相辅相成的,通过选择合适的数据结构可以优化算法的执行速度。
例如,在查找操作中使用二叉搜索树可以降低时间复杂度。
三、数据结构的分类根据数据结构的存储方式和操作特性,可以将数据结构分为线性数据结构和非线性数据结构。
3.1 线性数据结构线性数据结构是最常用的数据结构之一,它将数据元素按照线性顺序排列,每个元素有一个直接前驱和直接后继。
常见的线性数据结构有数组、链表和栈。
3.1.1 数组数组是一种最简单的数据结构,它将数据元素存储在连续的内存空间中。
数组的访问速度很快,但是插入和删除操作的效率较低。
3.1.2 链表链表是一种动态数据结构,它通过指针将数据元素链接在一起。
《数据结构》第一章重点知识梳理
第一章 绪论
求绝对值 abs(表达式) 求不足整数值 floor(表达式) 求进位整数值 ceil(表达式) 判定文件结束 eof(文件变量) (10)逻辑运算 与运算&&:对于A&&B,当A的值为0时,不在对B求值。 或运算||:对于A||B,当A的值为非0时,不在对B求值。 四、算法和算法分析 1.算法 (1)算法的定义
由于算法的时间复杂度考虑的只是对于问题规模n的增长率,因此在难以精确计算基本操作 执行次数(或语句频度)的情况下,只需求出它关于n的增长率或阶即可。 4.算法的存储空间需求
类似于算法的时间复杂度,以空间复杂度(spacecomplexity)作为算法所需存储空间的量 度,记作S(n)=O(f(n))其中n为问题的规模。
18
的表示。
①元素的表示。计算机数据元素用一个由若干位组合 起来形成的一个位串表示。
图1-1四类基本结构的关系图。
5
第一章 绪论
②关系的表示。 计算机中数据元素之间的关系有两种不同的表示方法:顺序映象和非顺序映象。 并由这两种不同的表示方法得到两种不同的存储结构:顺序存储结构和链式存储结构。 a.顺序映象的特点是借助元素在存储器中的相对位置来表示数据元素之间的逻辑关系。 b.非顺序映象的特点是借助指示元素存储地址的指针(pointer)表示数据元素之间的逻辑
数据元素(dataelement)是数据的基本单位,在计算机程序中通常作为一个整体进行考 虑和处理。
3
第一章 绪论
3.数据对象 数据对象(dataobject)是性质相同的数据元素的集合,是数据的一个子集。
4.数据结构 数据结构(datastructure)是相互之间存在一种或多种特定关系的数据元素的集合。 (1)数据结构的基本结构 根据数据元素之间关系的不同特性,通常有下列四类基本结构: ①集合。数据元素之间除了“同属于一个集合”的关系外,别无其它关系。 ②线性结构。数据元素之间存在一个对一个的关系。 ③树形结构。数据元素之间存在一个对多个的关系。 ④图状结构或网状结构。数据元素之间存在多个对多个的关系。
数据结构 第一章概论
注意:常用DataType表示抽象元素类型。
H
13
1.3 算法和算法分析
数据的运算是通过算法描述的。
1.算法----求解一个特定任务的指令的有限序列。
例.求a[0..n-1]中n个数的平均值(假定n>0)。
float average(float a[ ],int n)
{ int i;float s=0.0; //累加器赋初值
8. }
其中:f(m,n)=1+m+2*m*n+m=2mn+2m+1
当m=n时,f(n)=2n2+2n+1
T(n)=O(f(n))=O(2n2+2n+1)=O(n2) 平方阶。
对嵌套层次的循环结构,时间的复杂度T(n)由最内 层循环体语句的频度f(n)决定。
H
22
例4 分析下面的算法
1. void sum(int n)
其中:D1,D3是有穷集,D2是无穷集。
5.抽象数据对象
ElemSet={某种同类型的数据元素}
H
8
6.数据结构(data structure)----
数据之间的相互关系,即数据的组织形式。 内容包括:数据逻辑结构、数据存储结构和数据运算。
数据逻辑结构:数据元素之间的逻辑关系。 数据存储结构:数据元素及其关系在存储器中的存储表示。 数据运算:定义在数据逻辑结构上的操作。如:查询,插入,
(4)
for (k=0;k<n;k++)
n2(n+1)
(5)
c[i][j]=c[i][j]+a[i][k]*b[k][j]; n3
}
}
算法所消耗的时间就是所有语句频度之和T(n):
李春葆《数据结构教程》(第4版)课后习题-第一章至第十二章(圣才出品)
第二部分课后习题第1章绪论1.简述数据与数据元素的关系与区别。
答:凡是能被计算机存储、加工的对象统称为数据,数据是一个集合。
数据元素是数据的基本单位,是数据的个体。
数据与元素之间的关系是元素与集合之间的关系。
2.数据结构和数据类型有什么区别?答:数据结构是互相之间存在一种或多种特定关系的数据元素的集合,一般包括三个方面的内容,即数据的逻辑结构、存储结构和数据的运算。
而数据类型是一个值的集合和定义在这个集合上的一组运算的总称,如C语言中的int数据类型是由-32768~32767(16位机)的整数和+、-、*、/、%等运算符组成。
3.设3个表示算法频度的函数f、g和h分别为:f(n)=100n3+n2+1000g(n)=25n3+5000n2h(n)=n1.5+5000nlog2n求它们对应的时间复杂度。
答:f(n)=100n3+n2+1000=O(n3),g(n)=25n3+5000n2=O(n3),当n→∞时,√n>log2n,所以h(n)=n1.5+5000nlog2n=O(n1.5)。
4.用C/C++语言描述下列算法,并给出算法的时间复杂度。
(1)求一个n阶方阵的所有元素之和。
(2)对于输入的任意三个整数,将它们按从小到大的顺序输出。
(3)对于输入的任意n个整数,输出其中的最大和最小元素。
答:(1)算法如下:本算法的时间复杂度为O(n2)。
(2)算法如下:本算法的时间复杂度为O(1)。
(3)算法如下:本算法的时间复杂度为O(n)。
5.设n为正整数,给出下列各种算法关于n的时间复杂度。
(1)(2)(3)答:(1)设while循环语句执行次数为T(n),则:(2)算法中的基本运算语句是if(b[k]>b[j])k=j,其执行次数T(n)为:(3)设while循环语句执行次数为T(n),则:则6.有以下递归算法用于对数组a[i..j]的元素进行归并排序:求mergesort(a,0,n-1)的时间复杂度。
数据结构第一章--绪论(严蔚敏版)
解 T = (D, R ) D={A,B,a,b,c }
R是D上的关系的集合 是 上的关系的集合
A
B
a R={ P1,P2 } P1 ={<A,a>, <A,b>, <A,c>} P2 ={<B,a>, <B,b>, <B,c>}
b
c
写出一个复数的数据结构 例3 写出一个复数的数据结构 Complex= (C , R) 解 一个复数可以表示为 a+bi 一个复数可以表示为 复数 C={a,b}
也可以表示成一个有序对 <a, b>
∴这里存在一种关系 P ={<a,b>} (只有一个有序对 只有一个有序对) 只有一个有序对
而R是C上的关系的集合 R={ P } 是 上的关系的集合
写出一个复数的数据结构 例3 写出一个复数的数据结构 Complex= (C , R) 解 一个复数的数据结构为 Complex= (C , R) 其中, 其中, C={a,b} R={ P } P ={<a,b>}
a b c
解 其数据结构可描述为 d e T = (D, R ) D是数据元素的集合 D={a,b,c,d,e} 是数据元素的集合
R是D上的关系的集合 R={ P } 是 上的关系的集合
P ={<a,b>,<a,c>,<b,d>,<b,e>}
例2
一小组有a,b,c 三个学生,一个导师A 一小组有a,b,c 三个学生,一个导师A 和一个辅导员B 和一个辅导员B,此小组的数据结构如图:
48
ADT 抽象数据类型名 { 数据对象: 数据对象:〈数据对象的定义〉 数据关系: 数据关系:〈数据关系的定义〉 基本操作: 基本操作:〈基本操作的定义〉 } ADT 抽象数据类型名 其中基本操作的定义格式为: 基本操作名(参数表) 基本操作名 初始条件:〈初始条件描述〉 初始条件: 操作结果:〈操作结果描述〉 操作结果
数据结构教程:第1章 绪论(2学时)
数据元素:是数据(集合)中的一个“个体”,是数据的基本 单位。
数据对象:是具有相同性质的若干个数据元素的集合。
例,200913班为一个学生数据对象,“张三”是一个数据元素。
数据结构:是指数据以及数据元素相互之间的联系。可以
看作是相互之间存在着某种特定关系的数据元素的 集合。可以把数据结构看成是带结构的数据元素的
1.1 什么是数据结构
1.1.1 数据结构的定义 1.1.2 逻辑结构类型 1.1.3 存储结构类型 1.1.4 数据结构和数据类型
14
1.1.2 逻辑结构类型
(1) 线性结构 (2) 树形结构(层次结构) (3) 图形结构
(1) 线性结构 结点之间关系:一对一。 特点:开始结点和终端结点都是惟一的,除了开始结 点和终端结点以外,其余结点都有且仅有一个前驱结点, 有且仅有一个后继结点。顺序表就是典型的线性结构。
14 34 66 85 100 key 0 5 10 15 20 link
8 14 6 9 10 22 34 18 19 31 40 38 54 66 46 71 78 68 80 85 100 94 88 96 87 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
} Stud[7]={{1,“张斌”,“男”,“0901”},…, 正好在Stud[i]之后。
{5,"王萍","女",“0901"}};
Stud[0]
Stud[6]
1 张斌 男 0901 … 5 王萍 女 0901
Stud数组起始地址
7
2)链表的结点类型StudType定义为:
《数据结构教学》cha(2)
{ 其它省略 }
.
1.3 算法和算法的衡量
一、算法 二、算法设计的原则 三、算法效率的衡量方法和准则 四、算法的存储空间需求
.
应用例子
栈和队列的应用——迷宫问题 树的应用——哈夫曼编码 链表的应用——约瑟夫游戏 文件系统大都采用B-Tree或其变种 B+Tree作为索引结构。
.
1.1 数据结构讨论的范畴 1.2 基本概念 1.3 算法和算法的量度
.
1.1 数据结构讨论的范畴
Niklaus Wirth:
Algorithm + Data Structures = Programs
// 返回复数 Z 的实部值 float Getimag( cpmplex Z ); // 返回复数 Z 的虚部值 void add( complex z1, complex z2,
complex &sum ); // 以 sum 返回两个复数 z1, z2 的和
.
// -----基本操作的实现
void add( complex z1, complex z2, complex &sum ) {
则在数据元素 a1、a2 和 a3 之间存在着
“次序”关系 a1,a2、a2,a3
3214,6587,9345 ≠ 6587,3214,9345
a1 a2 . a3
a2 a1 a3
数据结构:带结构的数据元素的集合
又例,在2行3列的二维数组{a1, a2, a3, a4, a5, a6}
数据结构(C语言版)——第1章绪论
正确性 可读性 健壮性 高时间效率 高空间效率
算法分析
• • 算法执行所耗费的时间,与该算法中所 有语句的执行总次数成正比 。 语句频度:算法中的所有语句的执行的 总次数 ,记为:T(n) 。 时间复杂度:把T(n)表示成同数量级函 数的形式:T(n)=O(g(n)),则O(g(n))称 为算法的时间复杂度 。描述了当n充分 大的时候算法的语句频度的数量级。
数据结构(C语言版)
第1章 绪论
本章主要知识点
• 数据结构的常用术语及基本概念
• 集合、线性结构、树型结构、图型结构 的逻辑特点 • 抽象数据类型 • 算法、算法描述及算法分析
常用术语和基本概念
• 数据:人们利用文字符号、数字符号以及其他规 定的符号对客观现实世界的事物及其活动所做的 抽象描述。 • 数据元素:表示一个事物的一组数据 ,是数据的 基本单位 。 • 数据项:数据的最小单位。 • 数据对象:性质相同的数据元素的集合。 • 数据类型:一组性质相同的值的集合以及定义在 这个集合上的一组操作的总称。
•
• 常见的时间复杂度有O(1), O(log n) , O(n),O(n2),O(n3), O(2n),分别称为常量 阶、对数阶、线性阶、平方阶、立方阶 和指数阶。 • O(1)<O(log n)<O(n)<O(n2)<O(n3)<O(2n)
• •
空间复杂度:在算法执行过程中需要
的辅助空间数量,记为:S(n) = O(f(n)) 。
常用术语和基本概念
• 数据基本结构: • 集合结构:数据元素之间无任何关系。 • 线性结构:元素之间存在一对一的线线 关系。 • 树形结构:数据元素之间存在着一对多 的关系。 • 图形结构:数据元素之间存在多对多的 关系。
数据结构 第一章 绪论
三、算法和算法分析
1、算法的特性
有穷性
算法在执行有穷步后结束,且每步可在有穷时间内完成 确定性 算法中指令无二义性,且在任何条件下执行路径唯一
可行性
算法中各操作可通过已实现的基本运算执行有限次完成
1、算法的特性
输入
零或多个 输出 一或多个
2、算法设计的要求
正确性
算法应能满足具体问题的需求 可读性 算法应易于阅读和理解
健壮性
输入数据非法时,算法也能适当作出反应或进行处理 高效性 算法执行时间短,占用存储空间少
3、算法的时间复杂度
算法执行效率主要与所用计算机软、硬件及问题规模有
关。 衡量算法效率时,通常在算法中选择一种不可再分解的 基本操作,该操作的重复执行次数应与算法的执行时间成正
比,一般为问题规模n的函数f(n),此时可记算法的时间量
S(n)=O(f(n)),其中 n 为问题的规模。 分析算法空间复杂度时,一般只考虑执行算法所需辅助 空间,但若输入数据所占空间与算法本身有关,则也应计算
在内。
若算法执行所需空间与输入数据有关,则可求最坏情况 下的空间复杂度。
课程说明
1、教学日历 2、成绩评定 平时(50%)=实验(30%)+作业(15%)+考勤(5%) 期末考试:50%
读者信息: 读者编号 姓名
所借图书登录号 002 001
9001 9002
李红 张小林
2、数据元素
数据的基本单位,程序中常作为一个整体考虑和处理。
举例——图书借阅管理系统 图书信息: 登录号 001 002 书名 理论力学 高等数学 借阅者编号 9002 9001
读者信息: 读者编号 姓名
所借图书登录号 002 001
第1章-绪论-数据结构教程课件
本课程讲述的主要内容 本课程将分别讲述数据结构的基本概念、线性表、栈 和队列、串和数组、树形结构、图结构、查找、排序等 内容。
学习本课程的基本方法 上课认真听讲; 仔细阅读教材中的大量例题,从而体会并最终掌握
数据结构中的基本概念; 认真上机实习,独立完成每个章节后面的练习题。
课堂提问
1. 简述逻辑结构﹑存储结构的定义,常见的逻辑结构
和存储结构有哪些? 2. 一个算法的时间复杂度为(3n2+2nlog2n+4n-7)/(5n),
其时间复杂度为( )
3. A.O(n) B.O(nlog2n) c.O(n2 ) D.O(log2n)
3、for(i=1;i<=n;++i)
for(j=1;j<=n;++j) {
c6 c11
图 1-2 计算机专业必修课程开设先后关系
特点
课程之间的先后关系用图结构描述; 通过实施创建图结构,按要求将图结构中的顶点 进行线性排序。
结论
计算机的操作对象的关系更加复杂,操作形式不 再是单纯的数值计算,而更多地是对这些具有一定关 系的数据进行组织管理,我们将此称为非数值性处理。 要使计算机能够更有效地进行这些非数值性处理,就 必须弄清楚这些操作对象的特点,在计算机中的表示 方式以及各个操作的具体实现手段。这些就是《数据 结构》这门课程研究的主要内容。
常见的存储结构
顺序存储结构:逻辑上相邻的元素存储在物理位 置相邻的存储单元中.通常借助于程序设计语言中的数 组来实现.
链式存储结构:逻辑上相邻的元素不要求其物理位 置相邻,元素间的相邻关系借助于指示数据元素地址的 指针来实现。
逻辑结构(线性结构、树、图、集合)
数据结构(一)绪论
1.3 算法和算法分析 1.3.1 算法:
是对特定问题求解步骤的一种描述,是指令的有限序列,其中 每一条指令表示一个或多个操作。 算法具有以下五个特性: (1)有穷性 一个算法必须总是在执行有穷步之后结束,且每 一步都在有穷时间内完成。 (2)确定性 算法中每一条指令必须有确切的含义。不存在二义 性。 (3)可行性 一个算法是可行的。即算法描述的操作都是可以通 过已经实现的基本运算执行有限次来实现的。 (4)输入 一个算法有零个或多个输入,这些输入取自于某个特 定的对象集合。 (5)输出 一个算法有一个或多个输出,这些输出是同输入有着 某些特定关系的量。
数据元素:
是数据(集合)中的一个“个体” 是数据结构中讨论的基本单位
数据结构主要指逻辑结构和物理结构 数据之间的相互关系称为逻辑结构。通常 分为四类基本结构: 一、集合 结构中的数据元素除了同属于一 种类型外,别无其它关系。 二、线性结构 结构中的数据元素之间存在一 对一的关系。 三、树型结构 结构中的数据元素之间存在一 对多的关系。 四、图状结构或网状结构 结构中的数据元素 之间存在多对多的关系。
求整数n(n>=0)阶乘的算法如下,其时间复杂度, int fact(int n) {if (n<=1) return 1; return n*fact(n-1); }
A ) O(log2 n) B) O(n)
C)
O(n (2分)
作业:
1. 计算时间复杂度 sum=1; for(i=0;sum<n;i++) sum+=i; 2.设给定若干n值,比较两函数n2和50nlog2n的增长 趋势,并确定在什么范围内,函数n2的值大于
例4 for(i=1;i<=n;++i) for(j=1;j<=n;++j) {++x;s+=x;} 语句频度为:n2 其时间复杂度为:O(n2) 即时间复杂度为平方阶。
数据结构讲义第一章绪论
注:一个抽象数据类型确定了一个模型,但将模型的实 现细节隐藏起来;它定义了一组运算,但将运算 的实现过程隐藏起来。
用抽象数据类型的概念来指导问题的求解过程:
数学模型 非形式算法
抽象数据模型 伪语言程序
数据结构 可执行程序
§ 1.3 抽象数据类型
ADT的定义格式 ADT <ADT名> { 数据对象:<数据对象的定义> 结构关系:<结构关系的定义> 基本操作:<基本操作的定义> }ADT <ADT名>
初始化数据结构;
Destroy( )
销毁数据结构;
Get (i )
查找第 i 个元素;
Insert (i , b ) 在第 i 个位置插入元素 b ;
Delete( i )
删除第 i 个元素;
Traverse( )
遍历整个数据结构
§ 1.3 抽象数据类型
用C语言实现抽象数据类型ADT 用标准C语言表示和实现ADT描述时,主要
§ 1.2 数据结构的基本概念
数 据:描述客观事物的数字、字符以及一切 能够输入到计算机中,并且能够被计 算机程序处理的符号的集合。
数据是一个广义的概念,可以指普通的数据 (可参加算术运算),也可以指符号(源程序、 产品名称等)或数字化了的声音、图形、图像等。
§ 1.2 数据结构的基本概念
数据元素:数据(集合)中的一个个"个体",是组 成数据的"基本单位"。
a2 d4 d1
a1 d1 d2
list
a1
a2
a4 d5 d3
a3 d3 … d4
a3
…
a30 ∧
§ 1.3 抽象数据类型
数据结构教程(章 (1)
第1章 绪论
图1-3 求最大公约数的算法
第1章 绪论
例1.2 对两个正整数m和n,给出求它们最大公因子的 算法。
数据的存储结构是指数据的逻辑结构在计算机存储器中的映 像表示,即在能够反映数据逻辑关系的前提下数据在存储器中的 存储方式。
数据的运算是在数据上所施加的一系列操作,称为抽象运算, 它只考虑这些操作的功能,而暂不考虑如何完成,只有在确定了 存储结构后,才会具体实现这些操作。也即,抽象运算是定义在 逻辑结构上的,而实现则是建立在存储结构上的。最常用的运算 有:检索、插入、删除、更新以及排序等。
第1章 绪论 例1.1 一个学生信息(数据)表如表1.2所示,请指出表中 的数据、数据元素及数据项,并由此得出三者之间的关系。
姓名 刘小平 王红 吕军
马文华
表 1.2 学生信息表
性别
年龄
专业
男
21
计算机
女
20
数学
男
20
经济
女
19
管理
其他 … … …
…
第1章 绪论
【解】表1.2中是全部学生信息数据。表中的每一行即 为记录一个学生信息的数据元素,而该行中的每一项则为一个 数据项。数据、数据元素和数据项实际上反映了数据组织的三 个层次,数据可以由若干个数据元素构成,而数据元素则又可 以由若干数据项构成。
(2) 链式存储结构:在数据元素上附加指针域,并借助指 针来指示数据元素之间的逻辑关系。链式存储结构通常是利用 程序语言中的指针类型来描述的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
float GetReal( cpmplex Z );
// 返回复数 Z 的实部值
float Getimag( cpmplex Z ); // 返回复数 Z 的虚部值
void add( complex z1, complex z2, complex &sum ); // 以 sum 返回两个复数 z1, z2 的和
一个特定算法的“运行工作量”
的大小,只依赖于问题的规模
(通常用整数量n表示),或者说, 它是问题规模的函数。
假如,随着问题规模 n 的增长, 算法执行时间的增长率和 f(n) 的增长 率相同,则可记作:
T (n) = O(f(n))
称T (n) 为算法的(渐近)时间复杂度。
如何估算 算法的时间复杂度?
和定义在此集合上的
一组操作
的总称。
三、抽象数据类型
(Abstract Data Type 简称ADT)
是指一个数学模型以及 定义在此数学模型上的一
组操作。
例如,抽象数据类型复数的定义:
ADT Complex {
数据对象: D={e1,e2|e1,e2∈RealSet } 数据关系:
R1={<e1,e2> | e1是复数的实数部分
最大存储空间,两者都与问题的规模
有关。
三、算法效率的
衡量方法和准则
通常有两种衡量算法效率的方法:
事后统计法
缺点:1.必须执行程序 2.其它因素掩盖算法本质
事前分析估算法
和算法执行时间相关的因素:
1.算法选用的策略
2.问题的规模 3.编写程序的语言
4.编译程序产生的机器代码的质量
5.计算机执行指令的速度
抽象数据类型可用(D,S,P)三元组表示。
其中:D 是数据对象;
S 是 D 上的关系集;
P 是对 D 的基本操作集。
ADT 抽象数据类型名 { 数据对象:〈数据对象的定义〉 数据关系:〈数据关系的定义〉 基本操作:〈基本操作的定义〉 } ADT 抽象数据类型名 其中基本操作的定义格式为:
基本操作名(参数表) 初始条件:〈初始条件描述〉 操作结果:〈操作结果描述〉
即为用户期望的结果
z3 = z1 + z2
ADT 有两个重要特征:
强调的是其本质的特征、其所能完成的 功能以及它和外部用户的接口(即外界 使用它的方法)。
数据抽象 用ADT描述程序处理的实体时,
数据封装 将实体的外部特性和其内部
实现细节分离,并且对外部用户隐藏 其内部实现细节。
抽象数据类型的描述方法
其中:D 是数据元素的有限集,
S 是 D上关系的有限集。
数据的存储结构
—— 逻辑结构在存储器中的映象
“数据元素”的映象 ? “关系”的映象 ?
数据元素的映象方法:
用二进制位(bit)的位串表示数据元素
(321)10 = (501)8 = (101000001)2 A = (101)8 = (001000001)2
行的次序关系:
row = {<a1,a2>,<a2,a3>,<a4,a5>,<a5,a6>}
列的次序关系:
col = {<a1,a4>,<a2,a5>,<a3,a6>}
a1 a3 a5 a2 a4 a6
a1 a2 a3 a4 a5 a6
带结构的数据元素的集合 数据结构:
再例,在一维数组 {a1, a2, a3, a4, a5, a6}
| e2 是复数的虚数部分 }
基本操作: AssignComplex( &Z, v1, v2 )
操作结果:构造复数 Z,其实部和虚部 分别被赋以参数 v1 和 v2 的值。 DestroyComplex( &Z)
操作结果:复数Z被销毁。 GetReal( Z, &realPart ) 初始条件:复数已存在。 操作结果:用realPart返回复数Z的实部值。
void mult(int a[], int b[], int& c[] ) {
// 以二维数组存储矩阵元素,c 为 a 和 b 的乘积
for (i=1; i<=n; ++i) for (j=1; j<=n; ++j) { c[i,j] = 0; for (k=1; k<=n; ++k) c[i,j] += a[i,k]*b[k,j]; } //for 基本操作: 乘法操作 } //mult 时间复杂度: O(n3)
抽象数据类型需要通过固有数据
类型(高级编程语言中已实现的数据 类型)来实现。
例如,对以上定义的复数。
// -----存储结构的定义
typedef struct { float realpart; float imagpart; }complex;
// -----基本操作的函数原型说明 void Assign( complex &Z, float realval, float imagval ); // 构造复数 Z,其实部和虚部分别被赋以参数 // realval 和 imagval 的值
y
x
在不同的编程环境中,
存储结构可有不同的描述方法。 当用高级程序设计语言进行编程时,
通常可用高级编程语言中提供的数据 类型描述之。
例如: 以三个带有次序关系的整数表示 一个长整数时,可利用 C 语言中
提供的整数数组类型。 定义长整数为:
typedef int Long_int [3]
二、数据类型
{ 其它省略 }
1.3 算法和算法的衡量
一、算法
二、算法设计的原则 三、算法效率的衡量方法和准则 四、算法的存储空间需求
一、算法
算法是为了解决某类问题而规定的 一个有限长的操作序列。一个算法必须
满足以下五个重要特性:
1.有穷性 2.确定性
3.可行性
4.有输入
5.有输出
1.有穷性 对于任意一组合法输入值, 在执行有穷步骤之后一定能结束,即: 算法中的每个步骤都能在有限时间内完成。 2.确定性 对于每种情况下所应执行的 操作,在算法中都有确切的规定,使算法 的执行者或阅读者都能明确其含义及如何 执行。并且在任何条件下,算法都只有一 条执行路径。
符号表示形式。
数据元素:
是数据(集合)中的一个“个体” 是数据结构中讨论的基本单位
数据项: 是数据结构中讨论的最小单位
数据元素可以是数据项的集合
例如:描述一个运动员的数据元素可以是
姓名 俱乐部名称 出生日期 参加日期 职务 业绩
年月日
称之为组合项
带结构的数据元素的集合 数据结构:
假设用三个 4 位的十进制数表示一个含 12 位 数的十进制数。 例如: 3214,6587,9345 ─ a1(3214),a2(6587),a3(9345)
GetImag( Z, &ImagPart ) 初始条件:复数已存在。 操作结果:用ImagPart返回复数Z的虚部值。
Add( z1,z2, &sum ) 初始条件:z1, z2是复数。 操作结果:用sum返回两个复数z1, z2 的 和值。
} ADT Complex
假设:z1和z2是上述定义的复数 则 Add(z1, z2, z3) 操作的结果
3.可行性 算法中的所有操作都必须足 够基本,都可以通过已经实现的基本操作 运算有限次实现之。
4.有输入 作为算法加工对象的量值, 通常体现为算法中的一组变量。有些输入 量需要在算法执行过程中输入,而有的算 法表面上可以没有输入,实际上已被嵌入 算法之中。
5.有输出 它是一组与“输入”有
确
定关系的量值,是算法进行信息加 工后得到的结果,这种确定关学模型(非数值计 算)及其上的操作在计算机中如何
表示和实现”的学科。
1.2
基本概念
一、数据与数据结构 二、数据类型 三、抽象数据类型
一、数据与数据结构
数据:
所有能被输入到计算机中,且能被
计算机处理的符号的集合。
是计算机操作的对象的总称。 是计算机处理的信息的某种特定的
c.程序对于精心选择的、典型、苛刻且 带有刁难性的几组输入数据能够得出满足 要求的结果;
d.程序对于一切合法的输入数据都能得 出满足要求的结果;
通常以第 c 层意义的正确性作为衡
量一个算法是否合格的标准。
2. 可读性
算法主要是为了人的阅读与交流,
其次才是为计算机执行,因此算法应该易 于人的理解;另一方面,晦涩难读的程序
为算法的功能。
二、算法设计的原则
1.正确性 2. 可读性
设计算法时,通常应考虑达到以下目标:
3.健壮性 4.高效率与低存储量需求
1.正确性
首先,算法应当满足以特定的“规格 说明”方式给出的需求。 其次,对算法是否“正确”的理解可 以有以下四个层次: a.程序中不含语法错误;
b.程序对于几组输入数据能够得出 满足要求的结果;
赋值参数 只为操作提供输入值。 引用参数 以&打头,除可提供输入值外, 还将返回操作结果。
初始条件 描述了操作执行之前数据结构 和参数应满足的条件,若不满足,则操 作失败,并返回相应出错信息。
操作结果 说明了操作正常完成之后,数 据结构的变化状况和应返回的结果。若 初始条件为空,则省略之。
抽象数据类型的表示和实现
的数据元素之间存在如下的次序关系:
{<ai, ai+1>| i=1, 2, 3, 4, 5}
可见,不同的“关系”构成不同的“结构” 或者说,数据结构是相互之间存在着某 种逻辑关系的数据元素的集合。
数据的逻辑结构可归结为以下四类: