信息技术导论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 若以e为底时单位是“奈特”(nat—nature unit的缩写); • 若以10为底时单位是“哈特”(Hart — Hartley的缩写)。
1 I loga loga P( x) P ( x)
• 通常采用“比特”作为信息量的实用单位,这时有
1 I log 2 log 2 P( x) P( x)
A
3 3 4 2 0 1 0
1 B
E
B
2 C 3 D 4 E
C
D
DFS:
0
a
a
1
b
6
g
c
2
c
3
d
4
e
5
f d
h
k f e
7
h
8
k
0
1
2
3
4
5
6
7
8
访问标志:
T F T F T F T F T F T T F F T F T F
a c h d k f e b g
访问次序:
广度优先搜索遍历图
1 1 I log 2 log 2 log 2 M P 1/ M
( b)
若M是2的整幂次,即 M = 2k,则有
I log2 2k k (b)
当M = 4时,即4进制波形,I = 2比特,
当M = 8时,即8进制波形,I = 3比特。
一.信息度量的方法(重点)
对于非等概率情况:
3.2 查准率(Precision ratio)
检索出的相关信息资源 量 a P 100% 100% 检索出的信息资源总量 ab
i 1 M
(1.4 6)
由于H(x)同热力学中的熵形式相似,故称它为信息源的熵
二、分辨率
分辨率的表示法
在图像显示应用中的图像分辨率表示法
物理尺寸:每毫米线数(或行数) 行列像素:像素/行×行/幅,如640像素/行×480行/幅 像素总数:如数码相机上标的500万像素 单位长度上的像素:如像素每英寸(pixels per inch,PPI) 线对(line pair)数:以黑白相邻的两条线为一对,如5对线 通常用多少点每英寸(dots per inch,DPI)表示,如300 DPI 分辨率越高,图像质量就越高,像素就越多,要求存储容量 就越大
I [ P( x1 ) P( x2 )] I [ P( x1 )] I [ P( x2 )]
-信息量的定义
1 I loga loga P( x) P ( x)
一.信息度量的方法(重点)
• 上式的单位由对数底的取值决定。 • 若对数以2为底时单位是“比特”(bit — binary unit的缩写);(现阶段我们主要采用这个单位)
数据结构的图示
一般用示意图表示数据结构。用小圆圈代表数据元 素,用小圆圈之间的连线代表小圆圈对应的数据元 素具有的关系,如果强调关系的方向性,可用带箭 头的线段表示关系。具体地讲,若d1和d2表示两个数 据元素,它们具有关系<d1,d2>,则表示为如图6-3 所示的结构。
图中表示的只是一个抽象关系,不代表具体意义。 对于具体的应用,也可以表示家族关系中的父子关 系。例如,<d1,d2>可代表d1是d2的父亲。
一.信息度量的方法(重点)
即,一条信息发生的概率越小,信息量越大;概率越
大(一种极端情况是“必然的事情”信息量为0)则信 息量越小 于是,对于一条信息x,人们用下列公式表示其信息量 I (书上用了先验概率和后验概率这两个术语)
1 I loga loga p ( x) p( x)
(式1-4-1)
对于以下动画所示的二叉树, 它的结点先序序列是:ABDEGCF;后序序列是:DGEBFCA;
中序序列是:DBGEACF。
2、图的定义、术语
有向图与无向图:任意图中的边有方向性就称为有向图,
反之则是无向图.{本节主要讨论有向图的操作} 出度与入度:就有向图而言任一顶点发射的边的数量称 为该顶点的出度,而所接收的边的数量称为该顶点的入 度. 源点与汇点:入度为0的点称为源点,出度为0的点称为 汇点.(通常这两种特殊顶点分别代表工程的始、终)
Huffman编码过程
信源符号 概率 编码过程
0 1 1 0 0 1 0 1 0 1 1
Huffman码
a1 a2 a3 a4 a5 a6 a7
0.20 0.19 0.18 0.17 0.15 0.10 0.01
0.39 0.35
0
0.61
0.26
0.11
10 11 000 001 010 0110 0111
设:一个离散信源是由M个符号组成的集合,其中每个符号xi (i = 1, 2, 3, …, M)按一定的概率P(xi)独立出现,即 x1 , x2 , , xM M P x , P x , , P x P ( x ) 1 i 1 2 M 且有
8.1.2 信息系统的结构 8.2 信息系统的分类 8.5 EDI/MRPII/ERP 8.6 业务流程、需求分析在信息系统中的地位 8.7 信息系统的生命周期法
3.1 查全率(Recall ratio)
检索出的相关信息资源 量 a R 100% 100% 系统中相关的信息资源 量 ac
一.信息度量的方法(重点)
【例】 设一个二进制离散信源,以相等的 概率发送数字“0”或“1”,则信源每个输出 的信息含量为
1 I (0) I (1) log 2 log 2 2 1 (b) 1/ 2
在工程应用中,习惯把一个二进制码元称 作1比特
一.信息度量的方法(重点)
若有M个等概率波形(P = 1/M),且每一个波 形的出现是独立的,则传送M进制波形之一的 信息量为
对连通图,从起始点V到其余各顶点必定存在路径。 w2 w1 V w7 w6 w3
其中,V->w1,
V->w2, V->w8 的路径长度为1;
w8 w5
w4
V->w7, V->w3, V->w5 的路径长度为2; V->w6, V->w4 的路径长度为3。
遍历思想
从图中的某个顶点V0出发,并在访问此顶点之后依次
有结点,使每一个结点都被访问一次,而且只被访问一次。 由于二叉树的基本组成部分是:根(N),左子树(L),右 子树(R),因此可以有NLR、LNR、LRN、RNL、NRL、 RLN六种遍历次序。通常使用前三种,即:限定先左后右 这三种次序的递归定义如下:
先序遍历(NLR):先访问根,先序遍历左子树,先序遍历右子 树。 后序遍历(LRN):后序遍历左子树,后序遍历右子树,访问根。 中序遍历(LNR):中序遍历左子树,访问根,中序遍历右子树。
在图像数字化和打印应用中的图像分辨率表示法
课堂练习
存储介质的分类(现状)
磁存储介质 光存储介质 半导体存储介质
存储介质一般分为光存储(CD,DVD等)、磁存储
(硬盘,磁带等)和半导体(电)存储(内存条、U盘 等)。 闪存(Flash ROM),是一种采用集成电路的可多次擦 写的存储器,广泛用于U盘、数码设备的存储卡等领域。 有体积小便于携带,不怕震动,不磨损,保存时间长等 优点。和其他存储设备相比主要缺点是速度慢,容量小。 随着科技的进步,这些缺点也在逐渐被克服,高端的闪 存容量已经达到4GB以上,擦写速度也达到每秒钟几十 兆。
集合:数据元素间除了 “ 同属于一个集合 ” 外,别无其 它关系。 线性结构:数据元素间存在一个对一个的关系。 树形结构:数据元素间存在一个对多个的关系。 图或网状结构:数据元素间存在多个对多个的关系。
2、树结构
二叉树的遍历
所谓遍历二叉树,就是按一定的规则和顺序走遍二叉树的所
i 1
则x1 , x2, x3,…, xM 所包含的信息量分别为
log2 P( x1 ) , log2 P( x2 ) , , log2 P( xM )
于是,每个符号所含平均信息量为
H ( x) P( x1 )[ log 2 P( x1 )] P( x2 )[ log 2 P( x2 )] P( xM )[ log 2 P( xM )] P( xi )lo g 2 P( xi ) (比特 / 符号)
访问V0的所有未被访问过的邻接点,之后按这些顶点
被访问的先后次序依次访问它们的邻接点,直至图中
所有和V0有路径相通的顶点都被访问到。 若此时图中尚有顶点未被访问,则另选图中一个未 曾被访问的顶点作起始点,重复上述过程,直至图中 所有顶点都被访问到为止。
第八章 重要知识点
8.1.1 信息系统的定义
之所以取对数是由于信息量的“累加性”决定的两个消 息加在一起的总信息量等于每个信息各自信息量之和, 即:. Log(m1•m2)=Logm1+Logm2 …
一.信息度量的方法(重点)
• 度量信息量的方法来自百度文库
• 设:P(x) - 消息发生的概率, I - 消息中所含的信息量, • 则 P(x) 和 I 之间应该有如下关系: • I 是 P(x) 的函数: I =I [P(x)] • P(x) ,I ; P(x) ,I ; P(x) = 1时,I = 0; P(x) = 0时,I = ; • • 满足上述3条件的关系式如下:
二、图的存储
有向图的邻接矩阵表示法: A B C D E
A
B
E
C
D
A B C D E
0 0 0 1 0
1 0 0 1 0
0 1 0 0 1
0 0 1 0 0
1 0 0 0 0
有向图的邻接表
A B
1 2 3 0 1 4
0 1 2 3 4
A
B
E
C
D
C
D
E
2
有向图的逆邻接表
在有向图的逆邻接表中,对每个顶点,链 接的是指向该顶点的弧 0 A
三、常见的几种数据结构
至此,我们已经知道数据结构是想要解决非数值计
算问题的求解,我们也知道了数据结构应该包含两 层含义,即数据的逻辑结构和物理结构。但是,非 数值计算的问题可能是五花八门 计算机科学家对这类问题研究后发现:非数值计算 问题,虽然在确定数据元素时,每一个具体问题都 各不相同,但数据的逻辑结构可以归结为以下四种 基本类型:
1 I loga loga P( x) P ( x)
• 通常采用“比特”作为信息量的实用单位,这时有
1 I log 2 log 2 P( x) P( x)
A
3 3 4 2 0 1 0
1 B
E
B
2 C 3 D 4 E
C
D
DFS:
0
a
a
1
b
6
g
c
2
c
3
d
4
e
5
f d
h
k f e
7
h
8
k
0
1
2
3
4
5
6
7
8
访问标志:
T F T F T F T F T F T T F F T F T F
a c h d k f e b g
访问次序:
广度优先搜索遍历图
1 1 I log 2 log 2 log 2 M P 1/ M
( b)
若M是2的整幂次,即 M = 2k,则有
I log2 2k k (b)
当M = 4时,即4进制波形,I = 2比特,
当M = 8时,即8进制波形,I = 3比特。
一.信息度量的方法(重点)
对于非等概率情况:
3.2 查准率(Precision ratio)
检索出的相关信息资源 量 a P 100% 100% 检索出的信息资源总量 ab
i 1 M
(1.4 6)
由于H(x)同热力学中的熵形式相似,故称它为信息源的熵
二、分辨率
分辨率的表示法
在图像显示应用中的图像分辨率表示法
物理尺寸:每毫米线数(或行数) 行列像素:像素/行×行/幅,如640像素/行×480行/幅 像素总数:如数码相机上标的500万像素 单位长度上的像素:如像素每英寸(pixels per inch,PPI) 线对(line pair)数:以黑白相邻的两条线为一对,如5对线 通常用多少点每英寸(dots per inch,DPI)表示,如300 DPI 分辨率越高,图像质量就越高,像素就越多,要求存储容量 就越大
I [ P( x1 ) P( x2 )] I [ P( x1 )] I [ P( x2 )]
-信息量的定义
1 I loga loga P( x) P ( x)
一.信息度量的方法(重点)
• 上式的单位由对数底的取值决定。 • 若对数以2为底时单位是“比特”(bit — binary unit的缩写);(现阶段我们主要采用这个单位)
数据结构的图示
一般用示意图表示数据结构。用小圆圈代表数据元 素,用小圆圈之间的连线代表小圆圈对应的数据元 素具有的关系,如果强调关系的方向性,可用带箭 头的线段表示关系。具体地讲,若d1和d2表示两个数 据元素,它们具有关系<d1,d2>,则表示为如图6-3 所示的结构。
图中表示的只是一个抽象关系,不代表具体意义。 对于具体的应用,也可以表示家族关系中的父子关 系。例如,<d1,d2>可代表d1是d2的父亲。
一.信息度量的方法(重点)
即,一条信息发生的概率越小,信息量越大;概率越
大(一种极端情况是“必然的事情”信息量为0)则信 息量越小 于是,对于一条信息x,人们用下列公式表示其信息量 I (书上用了先验概率和后验概率这两个术语)
1 I loga loga p ( x) p( x)
(式1-4-1)
对于以下动画所示的二叉树, 它的结点先序序列是:ABDEGCF;后序序列是:DGEBFCA;
中序序列是:DBGEACF。
2、图的定义、术语
有向图与无向图:任意图中的边有方向性就称为有向图,
反之则是无向图.{本节主要讨论有向图的操作} 出度与入度:就有向图而言任一顶点发射的边的数量称 为该顶点的出度,而所接收的边的数量称为该顶点的入 度. 源点与汇点:入度为0的点称为源点,出度为0的点称为 汇点.(通常这两种特殊顶点分别代表工程的始、终)
Huffman编码过程
信源符号 概率 编码过程
0 1 1 0 0 1 0 1 0 1 1
Huffman码
a1 a2 a3 a4 a5 a6 a7
0.20 0.19 0.18 0.17 0.15 0.10 0.01
0.39 0.35
0
0.61
0.26
0.11
10 11 000 001 010 0110 0111
设:一个离散信源是由M个符号组成的集合,其中每个符号xi (i = 1, 2, 3, …, M)按一定的概率P(xi)独立出现,即 x1 , x2 , , xM M P x , P x , , P x P ( x ) 1 i 1 2 M 且有
8.1.2 信息系统的结构 8.2 信息系统的分类 8.5 EDI/MRPII/ERP 8.6 业务流程、需求分析在信息系统中的地位 8.7 信息系统的生命周期法
3.1 查全率(Recall ratio)
检索出的相关信息资源 量 a R 100% 100% 系统中相关的信息资源 量 ac
一.信息度量的方法(重点)
【例】 设一个二进制离散信源,以相等的 概率发送数字“0”或“1”,则信源每个输出 的信息含量为
1 I (0) I (1) log 2 log 2 2 1 (b) 1/ 2
在工程应用中,习惯把一个二进制码元称 作1比特
一.信息度量的方法(重点)
若有M个等概率波形(P = 1/M),且每一个波 形的出现是独立的,则传送M进制波形之一的 信息量为
对连通图,从起始点V到其余各顶点必定存在路径。 w2 w1 V w7 w6 w3
其中,V->w1,
V->w2, V->w8 的路径长度为1;
w8 w5
w4
V->w7, V->w3, V->w5 的路径长度为2; V->w6, V->w4 的路径长度为3。
遍历思想
从图中的某个顶点V0出发,并在访问此顶点之后依次
有结点,使每一个结点都被访问一次,而且只被访问一次。 由于二叉树的基本组成部分是:根(N),左子树(L),右 子树(R),因此可以有NLR、LNR、LRN、RNL、NRL、 RLN六种遍历次序。通常使用前三种,即:限定先左后右 这三种次序的递归定义如下:
先序遍历(NLR):先访问根,先序遍历左子树,先序遍历右子 树。 后序遍历(LRN):后序遍历左子树,后序遍历右子树,访问根。 中序遍历(LNR):中序遍历左子树,访问根,中序遍历右子树。
在图像数字化和打印应用中的图像分辨率表示法
课堂练习
存储介质的分类(现状)
磁存储介质 光存储介质 半导体存储介质
存储介质一般分为光存储(CD,DVD等)、磁存储
(硬盘,磁带等)和半导体(电)存储(内存条、U盘 等)。 闪存(Flash ROM),是一种采用集成电路的可多次擦 写的存储器,广泛用于U盘、数码设备的存储卡等领域。 有体积小便于携带,不怕震动,不磨损,保存时间长等 优点。和其他存储设备相比主要缺点是速度慢,容量小。 随着科技的进步,这些缺点也在逐渐被克服,高端的闪 存容量已经达到4GB以上,擦写速度也达到每秒钟几十 兆。
集合:数据元素间除了 “ 同属于一个集合 ” 外,别无其 它关系。 线性结构:数据元素间存在一个对一个的关系。 树形结构:数据元素间存在一个对多个的关系。 图或网状结构:数据元素间存在多个对多个的关系。
2、树结构
二叉树的遍历
所谓遍历二叉树,就是按一定的规则和顺序走遍二叉树的所
i 1
则x1 , x2, x3,…, xM 所包含的信息量分别为
log2 P( x1 ) , log2 P( x2 ) , , log2 P( xM )
于是,每个符号所含平均信息量为
H ( x) P( x1 )[ log 2 P( x1 )] P( x2 )[ log 2 P( x2 )] P( xM )[ log 2 P( xM )] P( xi )lo g 2 P( xi ) (比特 / 符号)
访问V0的所有未被访问过的邻接点,之后按这些顶点
被访问的先后次序依次访问它们的邻接点,直至图中
所有和V0有路径相通的顶点都被访问到。 若此时图中尚有顶点未被访问,则另选图中一个未 曾被访问的顶点作起始点,重复上述过程,直至图中 所有顶点都被访问到为止。
第八章 重要知识点
8.1.1 信息系统的定义
之所以取对数是由于信息量的“累加性”决定的两个消 息加在一起的总信息量等于每个信息各自信息量之和, 即:. Log(m1•m2)=Logm1+Logm2 …
一.信息度量的方法(重点)
• 度量信息量的方法来自百度文库
• 设:P(x) - 消息发生的概率, I - 消息中所含的信息量, • 则 P(x) 和 I 之间应该有如下关系: • I 是 P(x) 的函数: I =I [P(x)] • P(x) ,I ; P(x) ,I ; P(x) = 1时,I = 0; P(x) = 0时,I = ; • • 满足上述3条件的关系式如下:
二、图的存储
有向图的邻接矩阵表示法: A B C D E
A
B
E
C
D
A B C D E
0 0 0 1 0
1 0 0 1 0
0 1 0 0 1
0 0 1 0 0
1 0 0 0 0
有向图的邻接表
A B
1 2 3 0 1 4
0 1 2 3 4
A
B
E
C
D
C
D
E
2
有向图的逆邻接表
在有向图的逆邻接表中,对每个顶点,链 接的是指向该顶点的弧 0 A
三、常见的几种数据结构
至此,我们已经知道数据结构是想要解决非数值计
算问题的求解,我们也知道了数据结构应该包含两 层含义,即数据的逻辑结构和物理结构。但是,非 数值计算的问题可能是五花八门 计算机科学家对这类问题研究后发现:非数值计算 问题,虽然在确定数据元素时,每一个具体问题都 各不相同,但数据的逻辑结构可以归结为以下四种 基本类型: