第10讲数据的统计分析与描述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数估计就是从样本(X1,X2,…,Xn)出发,构造一些统计量ˆi ( X1,X2,…,
Xn)(i=1,2,…,k)去估计总体 X 中的某些参数(或数字特征) i(i=1,
2,…,k).这样的统计量称为估计量.
1. 点估计:构造(X1,X2,…,Xn)的函数ˆi ( X1,X2,…,Xn) 作为参数 i 的点估计量,称统计量ˆi 为总体 X 参数 i 的点估计量.
据,因而峰度可用作衡量偏离正态分布的尺度之一.
4.
k 阶原点矩:Vk
1 n
n i 1
X
k i
k 阶中心矩:U k
1 n
n
(Xi
i 1
X )k
二、分布函数的近似求法
1.整理资料: 把样本值 x1,x2,…,xn 进行分组,先将它们依大小次序排列,

x1*
x2*
x
* n
.在包含
[
x1*
,
xn*
]
1 n
n i 1
Xi
中位数:将数据由小到大排序后位于中间位置的那个数值.
2. 表示变异程度的统计量—标准差、方差和极差.
标准差: s
[ 1 n 1
n i1
(Xi
1
X )2 ]2
它是各个数据与均值偏离程度的度量.
方差:标准差的平方.
极差:样本中最大值与最小值之差.
3. 表示分布形状的统计量—偏度和峰度
的区间[a,b]内插入一些等分点:
a
x1'
x2'
xn'
b,
注意要使每一个区间
(
x
' i
,
xi'
1
]
(i=1,2,…,n-1)
内都有样本观测值 xi(i=1,2,…,n-1)落入其中.
2.求出各组的频数和频率:统计出样本观测值在每个区间
(
xi'
,
x' i 1
]
中出
现的次数 ni ,它就是这区间或这组的频数.计算频率
0.15
0.1
0.05
0
-4
-2
0
2
4
6
ຫໍສະໝຸດ Baidu
2. 2 分布 2 (n)
若随机变量 X1,X2,…,Xn 相互独立,都 服从标准正态分布 N(0,1),则随机变量
Y=
X
2 1
X
2 2
X
2 n
服从自由度为 n 的 2 分布,记为 Y~ 2 (n).
Y 的均值为 n,方差为 2n.
0.16
0.14
0.12
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-6
-4
-2
0
2
4
6
4. F 分布 F(n1,n2)
若 X~ 2 (n1),Y~ 2 (n2),且相互独立,则随机变量
X
F n1 Y
n2
服从自由度为(n1,n2)的 F 分布,记作 F~ F(n1,n2).
由 F 分布的定义可以得到 F 分布的 一个重要性质:
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
3. t 分布 t(n)
若 X~N(0,1),Y~ 2 (n),且相互独
立,则随机变量
T X Y
n
服从自由度为 n 的 t 分布,记为 T~t(n). t(20)分布的密度函数曲线和 N(0,1)的
曲线形状相似.理论上 n 时,T~t(n) N(0,1).
若 F~ F(n1,n2),则
1 F
~
F (n2 , n1 )
F(10,50)分布的密度函数曲线
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.5
1
1.5
2
2.5
3
返回
无论总体 X 的分布函数 F(x;1, 2 ,, k )的类型已知或未知,我
们总是需要去估计某些未知参数或数字特征,这就是参数估计问题.即参
n
p(x1,1, ,k ) p( x2 ,1, ,k ) p( xn ,1, ,k ) p( xi ,1, ,k ) i 1
数学建模与数学实验
数据的统计描述和分析
实验目的
1.直观了解统计基本内容. 2.掌握用数学软件包求解统计问题.
实验内容
1.统计的基本理论. 2.用数学软件包求解统计问题. 3.实验作业.


统计的基本概念



参数估计



假设检验


一、统计量
1. 表示位置的统计量—平均值和中位数.
平均值(或均值,数学期望): X
偏度: g1
1 s3
n
(Xi
i 1
X )3
峰度: g2
1 s4
n
(Xi
i 1
X)4
偏度反映分布的对称性,g1 >0 称为右偏态,此时数据位于均值 右边的比位于左边的多;g1 <0 称为左偏态,情况相反;而 g1 接近 0 则可认为分布是对称的.
峰度是分布形状的另一种度量,正态分布的峰度为 3,若 g2 比 3 大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数
1
( xm )2
e 2s 2 分布函数:F (x)
2p s
其中 m 为均值,s 2 为方差, x .
1
e dy x
( ym)2 2s 2
2ps
标准正态分布:N(0,1)
密度函数
j(x)
1
x2
e2
2p
分布函数
F(x)
1
x
y2
e 2 dy
2p
0.4
0.35
0.3
0.25
0.2
fi
ni n
.
3.作频率直方图:在直角坐标系的横轴上,标出
x1'
,
x
' 2
,
,
x
' n
各点,分别以
(
xi'
,
x' i 1
]
为底边,作高为
fi xi'
的矩形, xi'
xi'1 xi' , i 1,2,, n 1,即得
频率直方图.
三、几个在统计中常用的概率分布
1.正态分布N (m,s 2 )
密度函数:p(x)
2. 区间估计:构造两个函数 i1 ( X1,X2,…,Xn)和 i2 ( X1,X2,…, Xn),把( i1 , i2 )作为参数 i 的区间估计.
一、点估计的求法
(一)矩估计法
假设总体分布中共含有 k 个参数,他们往往是一些原 点矩或一些原点矩的函数,例如,数学期望是一阶原点矩, 方差是二阶原点矩与一阶原点矩平方之差等.因此,要想估计
总体的某些参数 i (i=1,2,…,k),由于 k 个参数一定可以
表为不超过 k 阶原点矩的函数,很自然就会想到用样本的 r 阶原点矩去估计总体的 r 阶原点矩,用样本的一些原点 矩的函数去估计总体的相应的一些原点矩的函数,再将 k 个 参数反解出来,从而求出各个参数的估计值.这就是矩估计法, 它是最简单的一种参数估计法.
(二)极大似然估计法
极大似然法的想法是: 若抽样的结果得到样本观测值 x1,x2,…,xn, 则我们应当选取参数 i 的
值,使这组样本观测值出现的可能性最大.即构造似然函数:
L(1, 2 ,, k ) P( X1 x1, X 2 x2 ,, X n xn ) P( X1 x1 )P( X 2 x2 )P( X n xn )
相关文档
最新文档