总体均数的估计PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

其通式为
单侧:P( t≤-t, )=或P(t≥t,)= 双侧:P(t≤-t/2,)+P(t≥t/2, )=
图中非阴影部分面积的概率为,
P(-t/2,<t<t/2,)=1-
附表2,t分布表的特点
附表2只列出正值,若计算的t值 为负值时,可用其绝对值查表 。
总体均数的估计
总体 推断
随机抽样
变化时,就可以得到不同的t分布 曲线,如图6.4:
0.4
0.35
0.3
5
0.25
0.2
0.15
1
0.1
0.05
0
-5 -4 -3 -2 -1
0
1
2
3
4
5
图6.4自由度分别为1、5、∞的t分布
t分布的特征
t分布是一簇曲线。
t分布以0为中心,左右对称。
其形态变化与自由度的大小有关。自由度 越小,则t值越分散,曲线越低平;自由度
X X
t
s X
sn
如果抽取例数n=5的样本1000个,每 个样本又都可以按下式计算出一个t 值,可将1000个t值编制成频数表, 作出直方图,则可得到一条光滑的 曲线。
t X X (式6.3 )
s X
sn
同 理 , 如 果 抽 取 例 数 n=15 时 , 仍
能得到一条t分布曲线,因此,当n
逐渐增大时,t分布逐渐逼近u分布(标准正
态分布);当=∞时,t分布即为u分布。
t分布曲线下面积规律
t分布曲线下总面积仍为1或100% t分布曲线下面积以0为中心左右
对称。
t分布曲线下面积规律
由于t分布是一簇曲线,故t分布 曲线下面积固定面积 (如95%或 99%)的界值不是一个常量,而是 随自由度的大小而变化,如P439 附表3 。
➢点估计 ➢区间估计
区间估计
概念:即按预先给定的概率估计参 数所在的范围。
该范围亦称可信区间(confidence interval, CI) 。
区间估计
结合样本均数和标准误可以确定一个具 有较大可信度的包含总体均数的区间,
该区间称为总体均数的1-可信区间。 一般取0.05或0.01
可信区间的计算
即使是从偏态分布总体抽样,只 要n足够大,样本均数的分布也 近似正态分布。
数理统计的中心极限定理
样本均数的总体均数仍为, 样本均数的标准差为 X 。
标准误(standard error)
样本均数的标准差称标准误,是说
明均数抽样误差大小的指标, X 大,抽样误差大;反之, 小,
X
抽样误差小 。
模拟试验1
从均数为4.5,标准差为0.2的正态总体中 作随机抽样。当样本量为20时,随机抽 取100个样本,其样本均数、标准差及其 总体均数的95%置信区间见表6.1 。
可见:各样本均数未必等于总体均数; 样本均数之间存在差异
样本均数的频数分布见表6.2
可见: 样本均数的分布很有规律,围绕着总体 均数4.5,中间多、两边少,左右对称。
模拟试验1
从均数为4.5,标准差为0.2的正态总体中 作随机抽样,规定样本含量分别为5、10、 20、50,每种样本含量均重复抽取1000 次,结果可得到4个不同样本含量的样本 均数的抽样分布图 如图6.1。
可见:得到的样本均数的分布仍然近似 服从正态分布。
数理统计的中心极限定理
从 正 态 分 布 N(,2) 中 , 以 固 定 n
单侧t, =1.697
当=30时,双侧概率P =0.05时
双侧t/2, =2.042
example
单侧: P( t≤-t0.05,30=-1.697 )=0.05 P(t≥t0.05,30 =1.697 )=0.05 双侧: P(t≤-t0.05/2,30)+P(t≥t0.05/2,30 )=0.05
标准误
标准误 的计算:
X
n
标准误 的估计值
s X
s n
影响标准误大小的因素
X 的大小与成正比
X 与样本含量n的Βιβλιοθήκη Baidu方根成反比
抽样误差越小,表明样本均数与 总体均数越接近,即用样本均数 估计总体均数的可靠性越大;反 之,抽样误差越大,则用样本均 数估计总体均数的可靠性越小。
P74 例6.1,6.2
附表3,t分布表的特点
附表3的横标目为自由度,纵标目为
概率P。一侧尾部面积称为单尾概率, 两侧尾部面积之和称为双尾概率表中
数字表示 和 确 定时,对应的t界
值,记作t, 。
附表2,t分布表的特点
单尾概率对应的t界值用t, 表示 双尾概率对应的t界值用t/2, 表示
example
当=30时,单侧概率P =0.05时
第六章 总体均数的估计
均数的抽样误差与标准误 t分布 总体均数的估计
为什么进行抽样?
总体 推断
随机抽样
样本
抽样误差
概念:由个体变异引起的,抽样 造成的样本统计量与总体参数之 间的差异称为抽样误差(sampling error) 。
均数的抽样误差
均数的抽样误差:抽样引起 的样本均数与总体均数的差 异称为均数的抽样误差。
样本
统计分析
统计推断
参数估计 假设检验
统计描述
参数估计
用样本指标估计总体指标称为参 数估计,是统计推断的一个重要 方面。
总体均数估计的两种方法
➢点估计 ➢区间估计
点估计
➢是直接用样本统计量直接作为
总体参数的估计值.
点估计的缺点
没有考虑抽样误差,无法评价估计 值与真实值之间的差距
总体均数估计的两种方法
抽取样本,样本均数的分布仍服 从正态分布。
模拟试验2
从非正态总体中抽样,观察其样本均数 的抽样分布。非正态总体的分布如图6.2 所示。
规定样本含量分别为5、10、20、50,每 种样本含量均重复抽取1000次,结果也 可得到4个不同样本含量的样本均数的抽 样分布图(图6.3)。
数理统计的中心极限定理
t分布
t分布的由来 t分布的特征 t分布曲线下的面积
t分布的由来
中心极限定理
总体
X ~ N(,2)
变量变换 z X
标准正态分布
z ~ N(0,1)
样本均数
X ~ N(,X2)
变量变换
z X
X
未知 X t
s X
t分布
英国 W.S.Gosset 于1908年以 “student”笔名发表论文,证明它服 从自由度为n-1的t分布
总体标准差未知时
正态总体N(,2)的样本均数 的t变换结果服从t
分布:
t X X
s X
sn
若“砍去”t分布双侧尾部面积=
0.05=5%,则有95%的t值满足
相关文档
最新文档