统计学参数估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本均值(标准差/比例)称为总体均值(标准差 /比例)的点估计量(point estimator);
样本均值(标准差/比例)的具体数值称为总体均 值(标准差/比例)的点估计值(point estimate)。
5-6
三大推断分布
1 2分布
2 t 分布 3 F 分布
5-7 2分布(2 distribution)
令t
X Y /n
,则t服从自由度为n的t分布。
3. 随着自由度的增大,分布也逐渐趋于正态 分布 。
5-13
t 分布图示
标准正态分布
标准正态分布
t (df = 13)
t 分布
x
t 分布与标准正态分布的比较
t (df = 5)
z
t
不同自由度的t分布
5-14
2、性质
——关于y轴呈对称分布;当 n 时,近似于 N(0,1)分布。
5-3
参数估计的一般问题(例子)
例:某大公司要整理2500个职工的档案。其中一项内容是 考察这些职工的平均年薪及参加过公司培训计划的比例。
总体:2500名职工(population ), 如果上述情况可由每个人的个人档案中得知,可容易地测
出这2500名职工的平均年薪及标准差。
已经得到了如下的结果: 总体均值: =51800
——α分位点
对于给定的α,0< α<1,称满足 t1 (n) t (n)
P{t t (n)}
f (t)dt
t (n)
的点 t (n) 为t分布的α分位点。
5-15
F分布(F distribwk.baidu.comtion)
1. 由统计学家费希尔(R.A.Fisher) 提出的, 以其姓氏的第一个字母来命名
2. 设若U为服从自由度为n1的2分布,即 U即~V~2(n21()n,2),V且为U服和从V相自互由独度立为,n则2的称F2分为布服,
5-1
描述统计与推断统计的关系
概率论
(包括分布理论、大数定律 和中心极限定理等)
反映客观 现象的数

样本数据
描述统计
(统计数据的搜集、整
总体数据 理、显示和分析等)
推断统计
(利用样本信息和概率 论对总体的数量特征进
行估计和检验等)
总体内在的 数量规律性
5S-2tatistics
参数估计
5
通过本章的学习,我们应该知道: 1. 统计推断的基本问题、概念与原理 2. 参数点估计的方法与评价 3. 正态总体均值、方差的区间估计 4. 一般总体的均值、成数的区间估计 5. 参数估计所需的样本容量的确定
x xi / n 1554420/ 30 51814.00
s (xi x)2 /(n 1) 325009260 / 29 3347.72
p 19 / 30 0.63
5-5
则可用上述结果分别代表2500名职工的平均年 薪、年薪的标准差及受训比例。
上述估计总体参数的过程被称为点估计(point estimation);
为F分布的α分位点。
——
F1 (n1, n2 )
F
1 (n2 , n1)
教材上对统计量抽样分布的归纳 P109
1 单个正态总体
2 两个正态总体
3 一般总体
5-18
一、有关正态总体的几个主要结果
iid
1、若 X1, X 2, ,X n ~ N (, 2 ) 则
U
X
~
N (0, 1)
证明
X
1 n
n i 1
2
(3) X 与S2独立
5-20
3、设(X1,X2,…,Xn)是正态总体N(μ,σ2)的样
本,则 X ~ t(n 1)
Sn
证明 (X1,X2,…,Xn)是正态总体N(μ,σ2)的样本, 则由分布定理1、2可知
5-11
(2) 分位点
若对于给定的 ,0<<1,存在使得
则称点P2{(n2)为 2分2(n布)} 的上2 (n) 分f (x位)dx点, 如图所示。
5-12
t 分布
1. 高 塞 特 (W.S.Gosset) 于 1908 年 在 一 篇 以 “Student”(学生)为笔名的论文中首次提出
2. 设X~N(0,1), Y ~ 2 (n)
2
5-10
2分布(性质和特点)
1. 分布的变量值始终为正 2. 分布的形状取决于其自由度n的大小,通常为不
对称的右偏分布,但随着自由度的增大逐渐趋 于对称
3. E(2)=n,D(2)=2n 4. 可加性:若U和V为两个独立的2分布随机变量,
U~2(n1),V~2(n2),则U+V这一随机变量服从自 由度为n1+n2的2分布
总体参数
总体标准差: =4000
同时,有1500人参加了公司培训,则 参加公司培训计划的比例为: =1500/2500=0.60
5-4
在上例中,假如随机抽取了一个容量为30的样本:
平均年薪
是否参加培训
49094.3

53263.9

49643.5



根据该样本求得的年薪样本平均数、标准差及参加过 培训计划人数的比例分别为:
1. 由阿贝(Abbe) 于1863年首先给出,后来由海尔墨
特(Hermert)和卡·皮尔逊(K·Pearson) 分别于1875年
和1900年推导出来
2.
设X ~ N (, 2 ) ,则 z X ~ N(0,1)
令 Y z2 ,则 Y 服从自由度为1的2分布,即
Y ~ 2 (1)
3. 当总体X ~ N (, 2,) 从中抽取容量为n的样本,则
从自由度n1和n2的F分布,记为
F U n1 V n2
F ~ F (n1, n2 )
5-16
F分布(图示) 不同自由度的F分布
(1,10)
(5,10)
(10,10)
F
5-17
——α分位点 对于给定的α,0< α<1,称满足
P{F F (n1, n2)}
f (y)dy
F (n1,n2 )
Xi
是n
n
个独立的正态随机变量的线性
组合,故服从正态分布。
E(X )
1 n
n i 1
E( X i )
D(X )
1 n2
n
2
D(Xi )
i 1
n
X ~ N(, 2 )
n
U
X
~
N (0, 1)
n
5-19
2、设(X1,X2,…,Xn)是正态总体N(μ,σ2)的样本, 则
(1)
X
~
N
,
2
n
(2) (n 1)S 2 ~ 2 (n 1)
n
(xi x )2
i 1
2
~ 2 (n 1)
5-8
2分布(图示)
总体
选择容量为n 的 简单随机样本 计算样本方差S2
计算卡方值
2 = (n-1)S2/σ2
计算出所有的
2值
不同容量样本的抽样分布
n=1 n=4 n=10 n=20
2
5-9
2分布(图示)
n=1 n=4 n=10 n=20
不同容量样本的抽样分布
相关文档
最新文档