数据的统计分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

峰度是分布形状的另一种度量,正态分布的峰度为 3,若 g2 比 3 大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数
据,因而峰度可用作衡量偏离正态分布的尺度之一.
4.
k 阶原点矩:Vk
1 n
n i 1
X
k i
k 阶中心矩:U k
1 n
n
(Xi
i 1
X )k
2020/4/24
5
二、分布函数的近似求法
数学建模与数学实验
数据的统计描述和分析
2020/4/24
后勤工程学院数学教研室
1
实验目的
1、直观了解统计基本内容。 2、掌握用数学软件包求解统计问题。
实验内容
1、统计的基本理论。 2、用数学软件包求解统计问题。 3、实验作业。
数 据 的 统 计 描 述 和 分 析
2020/4/24
统计的基本概念 参数估计 假设检验
1、整理资料: 把样本值 x1,x2,…,xn 进行分组,先将它们依大小次序排列,

x1*
x
* 2
xn* .在包含[x1* , xn* ] 的区间[a,b]内插入一些等分点:
a x1' x2' xn' b, 注意要使每一个区间(xi' , xi'1 ] (i=1,2,…,n-1)
内都有样本观测值 xi(i=1,2,…,n-1)落入其中.
X2,…,Xn)(i=1,2,…,k)去估计总体 X 中的某些参数(或数字特
征)i (i=1,2,…,k).这样的统计量称为估计量.
1. 点估计:构造(X1,X2,…,Xn)的函数ˆi ( X1,X2,…,Xn) 作为参数i 的点估计量,称统计量ˆi 为总体 X 参数i 的点估计量.
2. 区间估计:构造两个函数 i1 ( X1,X2,…,Xn)和 i2 ( X1,X2,…, Xn)做成区间,把这( i1 , i2 )作为参数i 的区间估计.
3
一、统计量
1、表示位置的统计量—平均值和中位数
平均值(或均值,数学期望): X
1 n
n i 1
Xi
中位数:将数据由小到大排序后位于中间位置的那个数值.
2、表示变异程度的统计量—标准差、方差和极差
标准差: s
[ 1 n 1
n i 1
(Xi
1
X )2]2
它是各个数据与均值偏离程度的度量.
方差:标准差的平方.
T X Y
n
服从自由度为 n 的 t 分布,记为 T~t(n). t 分布 t(20)的密度函数曲线和 N(0,1)的
曲线形状相似.理论上 n 时,T~t(n) N(0,1).
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-6
-4
-2
0
2
4
6
2020/4/24
9
4. F 分布 F(n1,n2)
频率直方图.
2020/4/24
6
三、几个在统计中常用的概率分布
1.正态分布N (m,s 2 )
密度函数: p(x)
1
( xm )2
e 2s 2 分布函数:F (x)
2p s
其中 m 为均值,s 2 为方差, x .
1
e dy x
( ym)2 2s 2
2ps
标准正态分布:N(0,1)
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.5
1
1.5
2
2.5
3
2020/4/24
返回
10
无论总体 X 的分布函数 F(x;1, 2 , , k )的类型已知或未知,
我们总是需要去估计某些未知参数或数字特征,这就是参数估计问题.即
参数估计就是从样本(X1,X2,…,Xn)出发,构造一些统计量ˆi ( X1,
极差:样本中最大值与最小值之差.
2020/4/24
4
3. 表示分布形状的统计量—偏度和峰度
偏度: g1
1 s3
n
(Xi
i 1
X )3
峰度: g 2
1 s4
n
(Xi
i 1
X )4
偏度反映分布的对称性,g1 >0 称为右偏态,此时数据位于均值 右边的比位于左边的多;g1 <0 称为左偏态,情况相反;而 g1 接近 0 则可认为分布是对称的.
2020/4/24
12
(二)极大似然估计法
极大似然法的想法是: 若抽样的结果得到样本观测值 x1,x2,…,xn, 则我们应当这样选取参数
i 的 值 , 使 这 组 样 本 观 测 值 出 现 的 可 能 性 最 大 . 即 构 造 似 然 函 数 :
2020/4/24
11
一、点估计的求法
(一)矩估计法
假设总体分布中共含有 k 个参数,它们往往是一些原 点矩或一些原点矩的函数,例如,数学期望是一阶原点矩, 方差是二阶原点矩与一阶原点矩平方之差等.因此,要想估计
总体的某些参数i (i=1,2,…k),由于 k 个参数一定可以
表为不超过 k 阶原点矩的函数,很自然就会想到用样本的 r 阶原点矩去估计总体相应的 r 阶原点矩,用样本的一些原点 矩的函数去估计总体的相应的一些原点矩的函数,再将 k 个 参数反解出来,从而求出各个参数的估计值.这就是矩估计法, 它是最简单的一种参数估计法.
若 X~ 2 (n1),Y~ 2 (n2),且相互独立,则随机变量 X
F n1 Y
n2
服从自由度为(n1,n2)的 F 分布,记作 F~ F(n1,n2).
由 F 分布的定义可以得到 F 分布 的一个重要性质:
1 若 F~ F(n1,n2),则 F ~ F (n2 , n1 )
F分布F(10,50)的密度函数曲线
2、求出各组的频数和频率:统计出样本观测值在每个区间( xi'
,
x' i 1
]
中出
现的次数ni
,它就是这区间或这组的频数.计算频率
fi
ni n
.
3、作频率直方图:在直角坐标系的横轴上,标出x1' , x2' , , xn' 各点,分别以
(
xi'
,
xi'1
]
Βιβλιοθήκη Baidu
为底边,作高为
fi xi'
的矩形, xi' xi'1 xi' , i 1,2, , n 1 ,即得
密度函数
j(x)
1
x2
e2
2p
分布函数
F(x)
1
x
y2
e 2 dy
2p
0.4
0.35
0.3
0.25
0.2
0.15

0.1
0.05
0
-4
-2
0
2
4
6
2020/4/24
7
2、 2 分布 2 (n)
若随机变量 X1,X2,… Xn 相互独 立,都服从标准正态分布 N(0,1),则随机
变量
Y=
X
2 1
X
2 2
X
2 n
服从自由度为 n 的 2 分布,记为 Y~ 2 (n).
Y 的均值为 n,方差为 2n.
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
2020/4/24
8
3、 t 分布 t(n)
若 X~N(0,1),Y~ 2 (n),且相互
独立,则随机变量
相关文档
最新文档