第4讲抽样误差与t分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
标准误 sx 统计量的抽样误差
•用途 正常值范围 总体均数的可信区间
•
(x±1.96s) ( x±t , s x)
•与n关系 n s趋于稳定 n sx趋于 0
PPT文档演模板
第4讲抽样误差与t分布
3rew
演讲完毕,谢谢听讲!
再见,see you again
PPT文档演模板
2020/11/26
第4讲抽样误差与t分布
• 从任意总体中随机抽样,当样本含量足够大 时,其样本均数的分布逐渐逼近正态分布;
• 样本均数之均数的位置始终在总体均数的附 近;
• 随着样本含量的增加,样本均数的离散程度 越来越小,表现为样本均数的分布范围越来 越窄,其高峰越来越尖。
PPT文档演模板
第4讲抽样误差与t分布
•中心极限定理
•从正态总体中随机抽取例数为n的样本, 样本均数x也服从正态分布,即使从偏态总 体中抽样,只要样本例数足够大,如n>50, 样本均数x也近似正态分布。
n=10 5.00 0.50 5.00
n=30 5.00 0.50 5.00
均数标准差
0.2212 0.1580 0.0920
0.2236 0.1581 0.0913
PPT文档演模板
第4讲抽样误差与t分布
3个抽样实验结果图示
PPT文档演模板
第4讲抽样误差与t分布
非正态分布抽样
• 分别从各总体中抽取10000个样本含量为 n的样本,计算每个样本的均数,并绘制 频数分布图。
PPT文档演模板
第4讲抽样误差与t分布
•图中非阴影部分面积的概率为:
•
P(-α/2,ν<t< tα/2,ν)=1-α
•从附表2中还可以看出,双侧概率P为单侧 概率的两倍,如双侧t0.10/2,30=单侧 t0.05,30=1.697
PPT文档演模板
第4讲抽样误差与t分布
•标准误与标准差的关系
•区别 标准差 s •意义 个体变异
•从均数为 ,标准差为s的正态总体中随
机抽取例数为n的样本,样本均数的总体均
数为 ,标准差为sx
PPT文档演模板
第4讲抽样误差与t分布
PPT文档演模板
•中心极限定理
第4讲抽样误差与t分布
标准误的定义
•样本统计量(如均数)也服从一定的分布。
•与描述观测值离散趋势的指标类似,样本 统计量的标准差就反映了从某个总体中随机 抽样所得样本之均数分布的离散程度。
•用样本的信息去推断总体特征,这种分析方法 称为统计推断。
•基本手段
•直接推断(参数估计) •间接推断(假设检验)
PPT文档演模板
第4讲抽样误差与t分布
总体参数的估计
• 均数的抽样误差 • t分布 • 总体均数的估计
PPT文档演模板
第4讲抽样误差与t分布
抽样误差的定义
• 假如事先知道某地七岁男童的平均身高为119.41cm。为了 估计七岁男童的平均身高(总体均数),研究者从所有符 合要求的七岁男童中每次抽取100人,共计抽取了三次。
•用样本统计量的标准差来反映抽样误差的大 小。又称标准误(standard error)。
PPT文档演模板
第4讲抽样误差与t分布
•sx •标准误 •sx•= s/ n •sx•= s / n
PPT文档演模板
第4讲抽样误差与t分布
标准误的意义
•反映了样本统计量(样本均数,样本率)分布的 离散程度,体现了抽样误差的大小。
第4讲抽样误差与t分布
•用途:
•(1)衡量样本均值的可靠性 •(2)估计总体均值的可信区间 •(3)用于均数的假设检验
PPT文档演模板
第4讲抽样误差与t分布
t分布
•随机变量X
•N(,s2
•u变
) •均数
换
PPT文档演模板
•t变换
•标准正态分 布
•N(0,12)
•标准正态分 布
••NS(tu0d,en1t2)t分
•标准误越大,说明样本统计量(样本均数,样本 率)的离散程度越大,即用样本统计量来直接估计 总体参数越不可靠。反之亦然。
•标准误的大小与标准差有关,在例数n一定时,从 标准差大的总体中抽样,标准误较大;而当总体一 定时,样本例数越多,标准误越小。说明我们可以 通过增加样本含量来减少抽样误差的大小。
PPT文档演模板
•各种参数估计都有抽样误差,这里我们以 均数为研究对象
PPT文档演模板
第4讲抽样误差与t分布
抽样误差产生的条件
• 抽样研究 • 个体变异
PPT文档演模板
第4讲抽样误差与t分布
•
•样本均数和
抽
总体均数间
样
的差别
误
差
的
表
•样本均数和
现
样本均数间
的差别
•抽样误差是不可避免的,可以通过保证总体 的同质性及增大样本含量来缩小抽样误差。
•如果没有抽样研究…… •No Random sampling!
•No Sampling Error!
PPT文档演模板
第4讲抽样误差与t分布
• 三次抽样得到了不同的结果,原因何在?
•不同男童 的身高不同
•每次抽到 的人几乎不
同
•个体变异
•随机抽样
PPT文档演模板
•抽样误差
第4讲抽样误差与t分布
•【定义】由于个体变异的存在,在抽 样研究中产生样本统计量和总体参数 之间的差异,称为抽样误差 (sampling error)。
第4讲抽样误差与t分布
PPT文档演模板
2020/11/26
第4讲抽样误差与t分布
•统计推断
•总体
•抽取部分观察单位
•样本
•参 数
•统计推断
•统计量
•如:总体均数 • 总体标准差 •
•如:样本均数 • 样本标准差S •
PPT文档演模板
第4讲抽样误差与t分布
•在医疗卫生实践和医学研究中,往往难以对所 要研究的总体进行全部观察,通常从总体中随机 抽取样本进行观察,然后由样本的信息去推断总 体特征,这种研究方法叫做抽样研究方法。
• n分别取2、4、10、25。
PPT文档演模板
第4讲抽样误差与t分布
偏三角分布抽样
•
•
•
•
PPT文档演模板
第4讲抽样误差与t分布
均匀分布
PPT文档演模板
第4讲抽样误差与t分布
指数分布
PPT文档演模板
第4讲抽样误差与t分布
双峰分布
PPT文档演模板
wenku.baidu.com第4讲抽样误差与t分布
• 从正态总体中随机抽样,其样本均数服从正 态分布;
PPT文档演模板
第4讲抽样误差与t分布
t分布曲线下面积规律
• t分布曲线下总面积仍为1或100% • t分布曲线下面积以0为中心左右对称 • 由于t分布是一簇曲线,故t分布曲线下面积固定
面积(如95%或99%)的界值不是一个常量,而是 随自由度的大小而变化
PPT文档演模板
第4讲抽样误差与t分布
• 其通式为
PPT文档演模板
第4讲抽样误差与t分布
•抽样误差的规律 性—正态分布抽样
• 从正态分布总体N(5.00,0.502)中,每 次随机抽取样本含量n=5,并计算其均数与
标准差;重复抽取1000次,获得1000份样本 ;计算1000份样本的均数与标准差,并对 1000份样本的均数作直方图。
• 按上述方法再做样本含量n=10、样本 含量n=30的抽样实验;比较计算结果。
•μ=119.41cm •σ= 4.38cm
PPT文档演模板
第4讲抽样误差与t分布
三次抽样得到了不同的结果!!!! 原因何在????
PPT文档演模板
第4讲抽样误差与t分布
•No Variation! •No Sampling Error!
如果没有个体变异……
PPT文档演模板
第4讲抽样误差与t分布
• =∞(标准正态曲线) • =5 • =1
•0.2
•0.1
PPT文档演模板
•-4 •-3 •-2 •-1 •0 •1 •2 •3 •4
第4讲抽样误差与t分布
•t分布的特征:
•①t分布为一簇单峰分布曲线。
•②t分布以0为中心,左右对称。
•③t分布与自由度ν有关,自由度越小,t分布 的峰越低,而两尾越高;自由度逐渐增大时,t 分布逐渐逼近标准正态分布;当自由度为无穷 大时,t分布就是标准正态分布。
PPT文档演模板
第4讲抽样误差与t分布
抽样试验(n=5)
PPT文档演模板
第4讲抽样误差与t分布
抽样试验(n=10)
PPT文档演模板
第4讲抽样误差与t分布
抽样试验(n=30)
PPT文档演模板
第4讲抽样误差与t分布
1000份样本抽样计算结果
总体的 总体标 均数的 均数 准差s 均数
n=5 5.00 0.50 4.99
•t 界值表
• 横标目:自由度, υ • 纵标目:尾端概率, p, 即曲线下阴影部分的面积; • 表中的数字:相应的 |t | 界值。
PPT文档演模板
第4讲抽样误差与t分布
附表2,t分布表的特点
• 附表2的横标目为自由度,纵标目为概率P,表
中数值为其相应的t界值,记作t, 。
• 附表2只列出正值,若计算的t值为负值时,可用 其绝对值查表 。
布
•自由度ν=n-1
第4讲抽样误差与t分布
•由W.S. Gosset提出
PPT文档演模板
第4讲抽样误差与t分布
•
•x-
t=
•s/
n
•对于不同的n,有不同的t分布曲线。
•(n-1)称为 •t分布的自由度
PPT文档演模板
第4讲抽样误差与t分布
•自由度分别为1、5、 ∞时的 t 分布
• f(t)
•0.3
单侧:P(t≤-t,)=或P(t≥t,)= 双侧:P(t≤-t/2,)+P(t≥t/2,)=
• 图中非阴影部分面积的概率为,
P(-t/2,<t<t/2,)=1-
PPT文档演模板
第4讲抽样误差与t分布
•t分布的界值
•t,
•自由度
•检验水准 •(尾端概率)
• 在t 检验中很重要
PPT文档演模板
第4讲抽样误差与t分布
• 附表2右上附图的阴影部分表示t,以外尾部面积 的概率 。
PPT文档演模板
第4讲抽样误差与t分布
•单侧t0.05,30=1.697,表示ν=30时,t≥1.697的 概率或t≤-1.697的概率为0.05,记作P(t ≤1.697)=0.05或P(t ≥1.697)=0.05;
•双侧t0.05,30=2.042,表示ν=30时, t≥2.042的 概率和t≤-2.042的概率之和为0.05,记作P(t ≤-2.042)+ P(t ≥2.042)=0.05