第10讲 数据的统计分析与描述资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2
1 若 F~ F(n1 ,n2 ) ,则 ~ F ( n 2 , n1 ) F
F分布F(10,50)的密度函数曲线
0.1 0 0 0.5 1 1.5 2 2.5 3
返回
2018/12/21 10
第二节 参数估计
无论总体 X 的分布函数 F(x; 1 , 2 ,, k )的类型已知 或未知,我们总是需要去估计某些未知参数或数字特征, 这就是参数估计问题.即参数估计就是从样本(X1,X2,…, Xn) 出发, 构造一些统计量 ˆi ( X1, X2, …, Xn) (i=1, 2, …, k) 去估计总体 X 中的某些参数 (或数字特征) 2, …, ( i i=1, k).这样的统计量称为估计量. 1. 点估计:构造(X1,X2,…,Xn)的函数 ˆi ( X1,X2,…, Xn)作为参数 i 的点估计量,称统计量 ˆi 为总体 X 参数 i 的点估计量. 2. 区间估计: 构造两个函数 i1 ( X1, X2, …, Xn) 和 i 2 ( X1, X2,…,Xn)做成区间, ( i1 , i 2 )即为参数 i 的区间估计.
2
( xm )2
x
e
( y m )2 2s 2
dy
标准正态分布:N(0,1)
0.4 0.35 0.3 0.25 0.2 0.15
密度函数
j ( x)
1
2p
e
x2 2
分布函数
F ( x)
1
2p
x
e
y 2
2
0.1
,
-2 0 2 4 6
dy
0.05 0 -4
2018/12/21
0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -6
-4
-2
0
2
4
源自文库
6
2018/12/21
9
4.
F 分布 F(n1 ,n2 ) 2 2 若 X~ (n1 ) ,Y~ (n2 ) ,且相互独立,则随机变量
X n1 F Y n2
服从自由度为(n1 ,n2 )的 F 分布,记作 F~ F(n1 ,n2 ). 由 F 分布的定义可以得到 F 分布 的一个重要性质:
1
它是各个数据与均值偏离程度的度量. 方差:标准差的平方. 极差:样本中最大值与最小值之差.
2018/12/21
4
3. 表示分布形状的统计量—偏度和峰度
1 偏度:g1 3 s
3 ( X X ) i i 1 n
1 峰度:g 2 4 s
4 ( X X ) i i 1
n
偏度反映分布的对称性, g1 >0 称为右偏态, 此时数据 位于均值右边的比位于左边的多; g1 <0 称为左偏态, 情况 相反;而 g1 接近 0 则可认为分布是对称的. 峰度是分布形状的另一种度量,正态分布的峰度为 3,若 g2 比 3 大很多,表示分布有沉重的尾巴,说明样本 中含有较多远离均值的数据,因而峰度可用作衡量偏离正 态分布的尺度之一. 4.
1 n k k 阶原点矩: Vk X i n i 1 1 n k 阶中心矩: U k ( X i X ) k n i 1
5
2018/12/21
二、分布函数的近似求法
得
1、整理资料: 把样本值 x1,x2,…,xn 进行分组,先将它们依大小次序排列,
* * * * * x1 x2 xn [ x1 , xn ] 的区间[a,b]内插入一些等分点: .在包含 ' ' a x1' x 2 xn b, 注意要使每一个区间 ( xi' , xi' 1 ] (i=1,2,…,n-1)
频率直方图.
2018/12/21 6
fi ' ' ' x x x 的矩形, i i 1 i , i 1, 2, , n 1 , 即得 ' xi
三、几个在统计中常用的概率分布
1.正态分布 N ( m , s )
2
1 1 2s e 密度函数: p( x) 分布函数: F ( x) 2p s 2p s 2 其中 m 为均值,s 为方差, x .
7
2、 分布 (n) 若随机变量 X1,X2,… Xn 相互独 立,都服从标准正态分布 N(0,1) ,则随机 变量
2 2 2 2 服从自由度为 n 的 分布,记为 Y~ (n).
2 2 2 X X X 1 2 n Y=
Y 的均值为 n,方差为 2n.
0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0
0
5
10
15
20
2018/12/21
8
3、 t 分布 t(n) 若 X~N (0 , 1 ) ,Y~ ( n ) ,且相互 独立,则随机变量
2
T
X Y n
服从自由度为 n 的 t 分布,记为 T~t(n). t 分布 t(20)的密度函数曲线和 N(0,1)的 曲线形状相似.理论上 n 时,T~t(n) N(0,1).
内都有样本观测值 xi (i=1,2,…,n-1)落入其中.
( xi , xi 1 ] 中出 2、求出各组的频数和频率:统计出样本观测值在每个区间
现的次数ni ,它就是这区间或这组的频数.计算频率 f i
' '
'
'
ni . n
'
x1 , x 2 , , x n 各点,分别以 3、作频率直方图:在直角坐标系的横轴上,标出 ( xi' , xi' 1 ] 为底边,作高为
数学建模与数学实验
数据的统计描述和分析
后勤工程学院数学教研室
2018/12/21
1
实验目的
1、直观了解统计基本内容。
2、掌握用数学软件包求解统计问题。
实验内容
1、统计的基本理论。 2、用数学软件包求解统计问题。
3、实验作业。
数 据 的 统 计 描 述 和 分 析
2018/12/21
统计的基本概念
参数估计
假设检验
方差分析
3
第一节 统计的基本概念
一、统计量
1、表示位置的统计量—平均值和中位数
1 n 平均值(或均值,数学期望) : X Xi n i 1
中位数:将数据由小到大排序后位于中间位置的那个数值. 2、表示变异程度的统计量—标准差、方差和极差
1 n 标准差: s [ ( X i X )2 ]2 n 1 i 1
1 若 F~ F(n1 ,n2 ) ,则 ~ F ( n 2 , n1 ) F
F分布F(10,50)的密度函数曲线
0.1 0 0 0.5 1 1.5 2 2.5 3
返回
2018/12/21 10
第二节 参数估计
无论总体 X 的分布函数 F(x; 1 , 2 ,, k )的类型已知 或未知,我们总是需要去估计某些未知参数或数字特征, 这就是参数估计问题.即参数估计就是从样本(X1,X2,…, Xn) 出发, 构造一些统计量 ˆi ( X1, X2, …, Xn) (i=1, 2, …, k) 去估计总体 X 中的某些参数 (或数字特征) 2, …, ( i i=1, k).这样的统计量称为估计量. 1. 点估计:构造(X1,X2,…,Xn)的函数 ˆi ( X1,X2,…, Xn)作为参数 i 的点估计量,称统计量 ˆi 为总体 X 参数 i 的点估计量. 2. 区间估计: 构造两个函数 i1 ( X1, X2, …, Xn) 和 i 2 ( X1, X2,…,Xn)做成区间, ( i1 , i 2 )即为参数 i 的区间估计.
2
( xm )2
x
e
( y m )2 2s 2
dy
标准正态分布:N(0,1)
0.4 0.35 0.3 0.25 0.2 0.15
密度函数
j ( x)
1
2p
e
x2 2
分布函数
F ( x)
1
2p
x
e
y 2
2
0.1
,
-2 0 2 4 6
dy
0.05 0 -4
2018/12/21
0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -6
-4
-2
0
2
4
源自文库
6
2018/12/21
9
4.
F 分布 F(n1 ,n2 ) 2 2 若 X~ (n1 ) ,Y~ (n2 ) ,且相互独立,则随机变量
X n1 F Y n2
服从自由度为(n1 ,n2 )的 F 分布,记作 F~ F(n1 ,n2 ). 由 F 分布的定义可以得到 F 分布 的一个重要性质:
1
它是各个数据与均值偏离程度的度量. 方差:标准差的平方. 极差:样本中最大值与最小值之差.
2018/12/21
4
3. 表示分布形状的统计量—偏度和峰度
1 偏度:g1 3 s
3 ( X X ) i i 1 n
1 峰度:g 2 4 s
4 ( X X ) i i 1
n
偏度反映分布的对称性, g1 >0 称为右偏态, 此时数据 位于均值右边的比位于左边的多; g1 <0 称为左偏态, 情况 相反;而 g1 接近 0 则可认为分布是对称的. 峰度是分布形状的另一种度量,正态分布的峰度为 3,若 g2 比 3 大很多,表示分布有沉重的尾巴,说明样本 中含有较多远离均值的数据,因而峰度可用作衡量偏离正 态分布的尺度之一. 4.
1 n k k 阶原点矩: Vk X i n i 1 1 n k 阶中心矩: U k ( X i X ) k n i 1
5
2018/12/21
二、分布函数的近似求法
得
1、整理资料: 把样本值 x1,x2,…,xn 进行分组,先将它们依大小次序排列,
* * * * * x1 x2 xn [ x1 , xn ] 的区间[a,b]内插入一些等分点: .在包含 ' ' a x1' x 2 xn b, 注意要使每一个区间 ( xi' , xi' 1 ] (i=1,2,…,n-1)
频率直方图.
2018/12/21 6
fi ' ' ' x x x 的矩形, i i 1 i , i 1, 2, , n 1 , 即得 ' xi
三、几个在统计中常用的概率分布
1.正态分布 N ( m , s )
2
1 1 2s e 密度函数: p( x) 分布函数: F ( x) 2p s 2p s 2 其中 m 为均值,s 为方差, x .
7
2、 分布 (n) 若随机变量 X1,X2,… Xn 相互独 立,都服从标准正态分布 N(0,1) ,则随机 变量
2 2 2 2 服从自由度为 n 的 分布,记为 Y~ (n).
2 2 2 X X X 1 2 n Y=
Y 的均值为 n,方差为 2n.
0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0
0
5
10
15
20
2018/12/21
8
3、 t 分布 t(n) 若 X~N (0 , 1 ) ,Y~ ( n ) ,且相互 独立,则随机变量
2
T
X Y n
服从自由度为 n 的 t 分布,记为 T~t(n). t 分布 t(20)的密度函数曲线和 N(0,1)的 曲线形状相似.理论上 n 时,T~t(n) N(0,1).
内都有样本观测值 xi (i=1,2,…,n-1)落入其中.
( xi , xi 1 ] 中出 2、求出各组的频数和频率:统计出样本观测值在每个区间
现的次数ni ,它就是这区间或这组的频数.计算频率 f i
' '
'
'
ni . n
'
x1 , x 2 , , x n 各点,分别以 3、作频率直方图:在直角坐标系的横轴上,标出 ( xi' , xi' 1 ] 为底边,作高为
数学建模与数学实验
数据的统计描述和分析
后勤工程学院数学教研室
2018/12/21
1
实验目的
1、直观了解统计基本内容。
2、掌握用数学软件包求解统计问题。
实验内容
1、统计的基本理论。 2、用数学软件包求解统计问题。
3、实验作业。
数 据 的 统 计 描 述 和 分 析
2018/12/21
统计的基本概念
参数估计
假设检验
方差分析
3
第一节 统计的基本概念
一、统计量
1、表示位置的统计量—平均值和中位数
1 n 平均值(或均值,数学期望) : X Xi n i 1
中位数:将数据由小到大排序后位于中间位置的那个数值. 2、表示变异程度的统计量—标准差、方差和极差
1 n 标准差: s [ ( X i X )2 ]2 n 1 i 1