第四章抽样误差与假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A.样本标准差s越大
B.样本标准差s越小
C.总体均数的95%可信区间越窄 D.总体均数的95%可信区间越宽
E. 样本标准差s越小,总体均数的95%可信区间越窄
3、在同一总体随机抽样,样本含量n固定时,α越小,总体 均数可信区间_______。
A.越宽
B.越窄
C.宽窄不变
D.宽窄还与β有关
E.以上说法都不对
精密度:即区间的宽度,区间愈窄愈好。当样 本含量为定值时,上述两者互相矛盾。
在可信度确定的情况下,增加样本含量可减小 区间宽度。
二、总体均数可信区间的计算
计算方法:
σ已知,按u分布。 σ未知,但n足够大,按u分布。 σ未知,且n较小,按t分布。
1.σ已知时,总体均数双侧可信区间为 :
2.σ未知但n较大时,按u分布计算总体 均数的可信区间
3.σ未知且n较小时,按t分布计算总 体均数的可信区间
•双 侧
•可信区间为:
思考
总体均数可信区间与 参考值范围的区别和联系?
第三节 t 分布
,标准正态分布与U统计量
实际研究中未知,用样本的标准差S作为
的一个近似值(估计值)代替,得到变换后的 统计量并记为
• 自由度v较小时,t分布与标准正态分布相差较 大,并且t分布曲线的尾部面积大于标准正态分 布曲线的尾部面积
• 当自由度 。
时,t分布逼近于标准正态分布
t分布的界值
给定自由度v,t分布曲线的双侧尾部面积为时 对应的t值,记为 并称其为t的双侧界值
单侧界值 :一侧尾部面积为时对应的t值 对称性得:单侧曲线下面积=2双侧曲线下面积 给定曲线下面积对应的界值与自由度有关 同样的尾部面积,t分布的界值要大于标准正态
由于实际 往往未知,需要用样本 来估 计 ,样本均数标准误的估计式:
注意区别:
• 第二节 总体均数的估计
•参数的估 计
•点估计:将样本统计量作为 • 总体参数的估计
•区间估计:按预先给定的概率确 定一个包含未知总体参数的范围, 称为参数的可信区间或置信区间 (confidence interval,CI)
三、简答题
习题
1、标准差与标准误的区别与联系? 2、标准正态分布与t分布有何不同? 3、均数的可信区间与参考值范围有何不同?
习题
四、计算分析题
某地随机抽样调查了部分健康成人的红细胞数和 血红蛋白量,结果如下表1:请就该资料: (1)说明女性的红细胞数与血红蛋白的变异程度 何者为大? (2)计算男性两项指标的抽样误差。 (3)试估计该地健康成年女性红细胞数的均数。
•n=30
•… ….
•二、抽 样 误 差
若从正态总体
抽样得到1000个样本,将1000个
样本均数看成新变量,构成新的分布:
二、抽 样 百度文库 差
•Mean=155.426 Std=0.966
二、抽 样 误 差
样本均数的分布特点:
• 各样本均数不一定等于总体均数 • 样本均数间存在差异
• 样本均数的分布为中间多,两边少,围绕总体 均数上下波动,左右基本对称。
•一、可信区间的有关概念
可信度:
事先给定的概率(1)称为置信度或可信度 ,常 取95% 或99% ; 估计总体均数可信区间时,可能估计错误,错 误概率为 ;
估计正确的概率为(1),
可信区间的上下界为可信限:
较小的称为下限(lower limit,L) 较大的称为上限(upper limit,U)
•一、可信区间的有关概念
可信区间的含义:
95%可信区间表示该区间总含总体均数 μ
的 概率为95%; 若作100次抽样算得100个可信区间,平均 有 95个可信区间包含μ,有5个可信区间不包 含 μ,即估计错误。
•一、可信区间的有关概念
可信区间估计的优劣:
准确度:即可信度1,愈接近1愈好,如99% 的可信度比95%的可信度要好;
• 样本均数的变异较之原变量的变异大大减小。
二、抽 样 误 差
抽样误差(Sampling error)
• 由抽样引起的样本统计量与总体参数间(或 各统计量之间)的差异
• 抽样误差不可避免 • 抽样误差有一定的规律性
•三、标准误
中心极限定理:
若个体资料 服从正态总体 也服从正态分布:
,则样本均数
•三、标准误
标准误的大小:
n一定时,标准误与标准差呈正比; 标准差一定,标准误与n的平方根成反比 增加样本含量可减少抽样误差
•三、标准误
标准误主要用途:
衡量抽样误差大小,SE越小,样本均数可信度 越高
结合标准正态分布和t分布曲线下的面积规律, 估计总体均数的置信区间
应用于假设检验
•三、标准误
第四章抽样误差与假设 检验
2020年7月11日星期六
第一节 均数的抽样误差与标准误
一、抽 样 研 究
按照随机化原则 采用正确的抽样方法 从总体中抽取有代表性的一部分
组成样本 用样本信息推断总体特征的研究
•统计推断
二、抽 样 误 差
已知k市初中女生身高总体均数 为155.4cm ,标准差为 为5.3cm的正态分布,从总体中 随机抽样。样本大小为30
分布的界值
t分布的界值
• t分布界值示意图,表示阴影的面积
习题
一、名词解释
1.抽样误差 2.均数标准误 3.置信区间
习题
二、最佳选择题
1、( )小,表示用该样本均数估计总体均数的可靠性大 。
A、CV B、S C、 D、R E、四分位间距
2、在同一总体随机抽样,其他条件不变,样本含量越大, 则______。
个体资料 服从偏态分布,当样本量n较大时, 样本均数 近似服从正态分布:
三、标准误
样本均数的标准差 ,称为样本均数的标准误 (standard error of mean),简称标准误(SE) 。
标准误意义:反映样本均数抽样误差的大小,SE越 大,均数的抽样误差越大,说明样本均数与总体均
数间的变异越大。
•第三节t分布
英国统计学家W. S. Gosset(1908)设 ,称统计量t的分布规律为t分布,自由度为v:
每个自由度v对应一个分布,因此t分布是一簇分布
•第三节 t分布
三条t分布密度曲线
•v=∞
•v=5
•v=1
t分布的图形特征
分布特征
n t分布曲线是单峰的
n 关于t = 0对称
t分布与正态分布的关系