第06章 抽样误差与假设检验

合集下载

统计学原理-第六章 抽样调查(复旦大学第六版)

统计学原理-第六章  抽样调查(复旦大学第六版)
全体。其单位数用N来表示。
2.样本总体:简称样本,是从全及总体中随机
抽取出来,代表全及总体部分单 位的集合体。单位数用n表示。
5
二.全及指标和抽样指标
(一)全及指标
X 总体平均数: X N 总体成数:P
2
XF 或X F Q=
2 2
N1 N N
(X-X) 总体方差: = 总体标准差:= (X-X)
(一)考虑顺序的不重复抽样数目
N! A N ( N 1)(N 2) ( N n 1) ( N n)! 4 3 2 1 2 例如A4 12 2 1
n N
(二)考虑顺序的重复抽样数目
B N
n N 2 4
n 2
例如 B 4 16
10
(三)不考虑顺序的不重复抽样数目
Ex X
28

2、一致性 当抽样单位数充分大时,抽样指标和未知 的总体指标之间的绝对离差为任意小的可能性 也趋于必然性。
x X 任意小
3、有效性
即用抽样指标估计总体指标,要求作为优良估 计量方差应该比其他估计量的方差小。

2
x X f
2
f

2
x X f
x
x E ( x)
2
18
说明:根据数理统计理论,在重复抽样条件下, 抽样平均误差与全及总体的标准差成正比例关系。 与抽样总体单位平方根成反比关系。
19
在不重复抽样情况下,抽样平均误差计算公式如下:
x x

N n 250 4-2 ( )= ( ) =9.13(件) n N 1 2 4-1
2
N
X X F 或 F X X F 或 F

第六章 假设检验2006

第六章 假设检验2006

第六章参数假设检验假设检验(test of hypothesis)亦称显著性检验(test of statistical significance),就是先对总体的参数或分布做出某种假设,如假设两个总体均数相等,总体服从正态分布或两总体分布相同等,然后用适当的统计方法计算某检验统计量,根据检验统计量的大小来推断此假设应当被接受或拒绝,它是统计推断的另一重要方面。

假设检验可以分为两类:一类是已知总体分布类型,对其未知总体参数的假设作假设检验,称为参数检验(parametric test),主要讨论总体参数(均值、方差、总体率等)的检验;另一类是对未知总体分布类型的总体假设作假设检验,称为非参数检验(non-parametric test),主要包括总体分布形式的假设检验、随机变量独立性的假设检验等。

本章主要介绍有关总体参数(均值、方差、总体率等)的参数检验问题。

第一节假设检验的基本概念一、假设检验问题及基本原理(一)假设检验问题我们先来看个具体的例子。

例6.1某药厂用自动包装机包装葡萄糖,按规定每袋葡萄糖的标准重量为500克,若已知包装机包装的每袋葡萄糖重量服从正态分布,且按以往标准知总体方差σ2=6.52,某日开工后,为检验包装机工作是否正常,随机抽取6袋葡萄糖,测得其平均重量x=504.5(克),问该日自动包装机包装的平均重量是否还是500克?某日随机抽取的6袋葡萄糖的平均重量x=504.5(克),与标准重量500克相比差4.5克,造成该差异的原因有两种可能:①这日自动包装机工作正常,其包装的总体平均重量μ=500克,此6袋葡萄糖的平均重量这一样本均值与总体均值不同,是随机抽样误差造成的;②这日自动包装机工作不正常,其包装的总体平均重量μ≠500克,故从此总体中随机抽取的6袋葡萄糖的平均重量与标准重量存在实质性差异,而不仅仅是抽样误差造成的。

上述两种可能是相互对立的、互不相容的,究竟哪一种可能是对的,可用假设检验的方法来判断。

抽样误差与假设检验(ppt 43页)

抽样误差与假设检验(ppt 43页)
认为治疗前后有差别。
假设检验的基本思想—利用反证法的思想
利用小概率反证法思想,从问题的对立面(H0)出发间 接判断要解决的问题(H1)是否成立。然后在H0成立的条
件下计算检验统计量,最后获得P值来判断。当P小于或等 于预先规定的概率值α,就是小概率事件。根据小概率事件
的原理:小概率事件在一次抽样中发生的可能性很小,如果 他发生了,则有理由怀疑原假设H0,认为其对立面H1成立
判断观察对象的某
项指标正常与否
• 某地调查100人得收缩压均数为18.62kPa, 标准差为1.33kPa。试估计:
• 该地95%的人收缩压在什么范围? • 该地所有人收缩压的均数可能在什么范围?
假设检验的意义和步骤
(Hypothesis Test)
要求: 掌握:假设检验的基本思想和基本步
骤,样本均数与总体均数的比较,配对 资料的比较,两个样本均数的比较,假 设检验应注意的问题。
4 .7, 7 S0 .3, 8 n 140
下限: X - u /2 . S X 4 . 7 1 . 9 7 0 . 3 6 /1 8 4 . 7 ( 1 0 1 1 /L 2 0 ) 上限: X u / 2 . S X 4 . 7 1 . 9 7 0 . 3 6 /1 8 4 . 8 ( 1 0 3 1 / L 2 0 )
24
1.711 2.064 2.492 2.797
25
1.708 2.060 2.485 2.787
2①6 自由度1相.7同06时,2│.0t5│6值越2.4大79,概2率.77P9越小;
2②7 t值相同1.时70,3 t0.025/.20,2522= t02.0.2457,223=2.20.7747。1

第六章假设检验基础PPT课件

第六章假设检验基础PPT课件

❖假设检验的原理: 假设检验的基本思想是反证法和小
概率的思想
❖反证法思想:首先提出假设(由于未经检验是否成立,
所以称为无效假设),用适当的统计方法确定假设
成立的可能性大小,如果可能性小,则认为假设不
成立,拒绝它;如果可能性大,还不能认为它不成立
❖小概率思想:是指小概率事件在一次随机试验中认为
基本上不会发生
一、一组样本资料的t 检验(one sample/group t-test)
现有取自正态总体N(μ,σ2)的、容量为n 的一份 完全随机样本。 目的:推断该样本所代表的未知总体均数µ与已知总体 均数µ0是否相等已知总体均数µ0是指标准值,理论值 或经大量观察所得的稳定值。
n136135
3. 确定P值
指从H0规定的总体中随机抽得等于及 大于(或等于及小于)现有样本获得
的检验统计量值的概率。
4. P值的意义:如果总体状况和H0一致,统计量获 得现有数值以及更不利于H0的数值的可能性(概率) 有多大。
5.
t0 .2 (3 5 ) 50 .68 t 2 t0 .2 (3 5 ) 5得 P 0 .25
H0一般设为某两个或多个总体参数 相等,即认为他们之间的差别是由 于抽样误差引起的。H1的假设和H0 的假设相互对立,即认为他们之间 存在着本质的差异。H1的内容反映 出检验的单双侧。
单双侧的确定: 一是根据专业知识,已知东北某县囱
门月龄闭合值不会低于一般值; 二是研究者只关心东北某县值是否高
于一般人群值,应当用单侧检验。 一般认为双侧检验较为稳妥,故较为
目的要求选用不同的检验方法。
4、确定P值: P值是指由H0所规定的总体中做随机抽
样,获得等于及大于(或等于及小于)现 有统计量的概率。当求得检验统计量的值 后,一般可通过特制的统计用表直接查出P 值。

统计学第六章 抽样法

统计学第六章  抽样法
31
第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80

x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数

概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计

总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。

卫生统计学课件_第六章_假设检验

卫生统计学课件_第六章_假设检验
16
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。

经济应用统计学-第六章抽样推断

经济应用统计学-第六章抽样推断

非参数检验优缺点总结
• 易于理解和实现:非参数检验方法通常基于直观和易于理解的思想,计算和实现相对简单。
非参数检验优缺点总结
检验效能较低
与参数检验方法相比,非参数检 验方法的检验效能通常较低,即 当原假设为真时,非参数检验方 法更容易犯第二类错误(接受原 假设)。
对数据信息的利用不 充分
非参数检验方法通常只利用数据 的部分信息(如排序信息),而 忽略了数据的其他有用信息(如 数值大小),因此可能无法充分 利用数据信息。
两配对样本非参数检验
包括Wilcoxon 符号秩次检验、McNemar 检验 等方法,用于比较同一总体内两个配对样本的差 异是否显著。
两独立样本非参数检验
包括Mann-Whitney U 检验、Kruskal-Wallis H 检验等方法,用于比较两个独立样本所来自的 总体的分布位置或分布形状是否存在差异。
考虑样本量大小
在选择置信水平时,应充分考虑样本量的大小。当样本量较小时,应选择较低的置信水平以避免过大的估计误差;当 样本量较大时,可以选择较高的置信水平以获得更精确的估计结果。
参考相关文献或行业标准
在选择置信水平时,可以参考相关领域的文献或行业标准,了解通常采用的置信水平及其依据。这有助 于确保研究结果的可比性和可靠性。
04
假设检验原理与步骤
假设检验基本概念阐述
原假设与备择假设
原假设通常是研究者想要推翻的 假设,而备择假设则是研究者希 望证实的假设。
检验统计量与拒绝域
检验统计量是根据样本数据计算出 的用于检验原假设的统计量,而拒 绝域则是根据显著性水平和检验统 计量的分布确定的,当检验统计量 落入拒绝域时,我们拒绝原假设。
单侧检验
当研究者对备择假设的方向有明确预期时,即备择假设只可能大于或小于原假设时,应选择单侧检验 。例如,在比较两种药物疗效的研究中,如果研究者预期新药疗效优于旧药,则应选择单侧检验。

预防医学抽样误差与假设检验.pptx

预防医学抽样误差与假设检验.pptx
• 样本统计量与总体参数间的差别 • 不同样本统计量间的差别
第4页/共46页
抽样试验
➢ 假设一个已知总体,从该总体中抽样,对每个 样本计算样本统计量(均数、方差等),观察样本 统计量的分布规律--抽样分布规律。
➢ 考察:
不同的分布 不同的样本含量
第5页/共46页
从正态分布总体N(5.00,0.502)中,每 次随机抽取样本含量n=5,并计算其均数与标
第36页/共46页
假设检验
——通过对假设作出取舍抉择来达到解决问题的目的
A.山区男子脉搏的总体均数与一般成年男子的脉搏均数
相等
无差异假设、零假设 H0(null hypothesis)
B.山区男子脉搏的总体均数与一般成年男子的脉搏均数 不相等 对立假设、备择假设H1(alternative hypothesis)
第20页/共46页
t分布曲线
0.4 f( t) 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0.0 -4 -3 -2 -1 0 1
t
自由度为1的t分布 自由度为9的t分布 标准正态分布
234
t 分布有如下性质:
①单峰分布,曲线在t=0 处最高,并以t=0为中心
左右对称
②与正态分布相比,曲线 最高处较矮,两尾部翘得 高(见绿线)
第12页/共46页
标准误的概念(standard error)
样本均数的标准差称为均数的标准误。 ➢ 均数的标准误表示样本均数的变异度。 ➢ 当总体标准差未知时,用样本方差代替,
第13页/共46页
标准误的概念
抽样的样本量越大,标准误就越小; 原来总体变异度小,标准误就越小。 标准误反映了样本均数间的离散程度,也反映了样本均 数与总体均数之间的差异。当标准误大时,用样本均数 对总体均数的估计的可靠程度就小;反之亦然。

抽样误差与假设检验

抽样误差与假设检验
预防医学
Preventive Medicine
预防医学教研室 2004.06
第十五章 数值变量的统 计推断
蔡泳
均数的抽样误差和标准误
一、 均数的抽样误差 抽样研究的目的就是要用样本信
息来推断总体特征。由于存在变异, 样本均数往往不等于总体均数,因 此抽样后各个样本均数也往往不等于 总体均数,且各个样本均数间也不一 定都相等。这种由抽样造成的样本均 数与总体均数的差异或各样本均数之 间的差异称为抽样误差,抽样误差是 不可避免的。
一般情况下未知,常用 SX
估计抽样误差的大小。SX 作为 X
的估计值。
总体均数的 可信区间
参数估计(parameter estimation) 是指用样本指标(统计量)估计总体指标 (参数),有两种常用方法:点估计和区 间估计。 1.点估计(point estimation):样本均数 就是总体均数的点估计值。
2. 选定检验方法和计算统计量 要根据研究设计的类型、统计
推断的目的,选用适当的统计量。 如成组设计的两样本均数比较选用 t检验,大样本时可选用近似的u检 验。不同的检验统计量有不同的公 式。
3. 确定检验用的临界值:如t α
4. 用算得的统计量与相应的界值 作比较,作出判断结论
根据P值大小作出拒绝或不拒绝 H0的结论。P值是指由H0所规定的 总体作随机抽样,获得等于及大于 (或等于及小于)现有统计量的概率。
2.由于环境条件的影响,两个均数间 有本质差异,即山区男子脉搏总体 均数与一般男子的脉搏总体均数不 同。现在所得样本均数74.2与总体 均数72的有本质性差别,不完全是 抽样误差的原因。为了判断可能性 是第一种还是第二种,或者说为了 判断差别是否本质性的,必须通过 假设检验来回答这个问题。假设检

医学统计学总体均数的估计和假设检验

医学统计学总体均数的估计和假设检验

3.106
3.055
3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.750 2.704 2.678 2.626
2.58
3.497
3.428
3.372 3.326 3.286 3.252 3.222 3.197 3.174 3.153 3.030 2.971 2.937 2.871 2.8070
t x
sX
统计量是t的分布就是t分布。
t分布的特征: ① 以0为中心,左右对称呈单峰分布; ② t分布是一簇曲线,分布参数为自由度υ。 ③ t分布的形状与样本例数n有关,高峰比正态分
布略低,两侧尾部翘得比正态分布略高。越大, 曲线越近正态分布,当ν=∞时,t分布即为z分布。 由于t分布是一簇曲线,为了便于应用,统计学 家编制了表4-4-1 t界值表。
3)与例数的关系不同:当样本含量足够大时,标准 差趋向稳定。而标准误随例数的增大而减小,甚至趋 向于0。若样本含量趋向于总例数,则标准误接近于0。
联系;二者均为变异指标,如果把总体中各样本均 数看成一个变量,则标准误可称为样本均数的标准差。 当样本含量不变时,均数的标准误与标准差成正比。 两者均可与均数结合运用,但描述的内容各不相同。
活量的95%的可信区间。
本例n=5, =4,t0.05,4=2.776
x t0.05sx =2.44±2.776×0.33/ 5 =2.03~2.85(L)
该地17岁女中学生肺活量均数的95%可信区间为2.03L~2.85L。
例4-4-3 由例4-2-1 101名30~49岁健康男子血清总 胆固醇 X 4.735mmol·L-1,S=0.88 mmol·L-1,求该 地健康男子血清总胆固醇值均数的95%可信区间。

抽样误差与假设检验

抽样误差与假设检验
抽样误差与假设检验
抽样分布与参数估计
南昌大学公共卫生学院 李悦
南昌大学公共卫生学院卫生统计学教研室
2020年11月24日星期二
抽样误差与假设检验
抽样分布与抽样误差
总体
随机抽取部分观察单位 样本
?
推断
X
抽样研究的目的是用样本信息推断总体特
征,即用样本统计量推断总体参数。
常用的统计推断方法有:参数估计和假设检验
南昌大学公共卫生学院卫生统计学教研室
2020年11月24日星期二
抽样误差与假设检验
抽样误差
三、标准误(Standard Error)
样本均数的标准差称为标准误。样本均数
的变异越小说明估计越精确,因此可以用标准
误表示抽样误差的大小:
X
n
实际中总体标准差往往未知,故只能求
s 得样本均数标准误的估计值:
南昌大学公共卫生学院卫生统计学教研室
2020年11月24日星期二
抽样误差与假设检验
抽样误差
抽样误差:由抽样引起的样本统计量与总体参数间的差异。 两种表现形式:
样本统计量与总体参数间的差异 样本统计量间的差异
通过研究样本均数的分布来研究抽样误差的大小。
南昌大学公共卫生学院卫生统计学教研室
2020年11月24日星期二
(随机变量)也服从正态分布,即总体均数仍为 ,样
本均数的标准差为 / n 。
抽样分布
抽11月24日星期二
抽样误差与假设检验
抽样分布
中心极限定理: 当样本含量很大的情况下,无论原始测量变量
服从什么分布,X 的抽样分布均近似正态分布。
抽样分布
合计
南昌大学公共卫生学院卫生统计学教研室

卫生统计学04抽样误差与假设检验

卫生统计学04抽样误差与假设检验
假设的设定应基于已有的知识和 研究目的,并确保假设具有可操 作性。
假设检验的限制与局限性
样本量限制
假设检验的准确性受到样本量大 小的影响,样本量过小可能导致 结果不准确。
无法考虑其他影响因素
假设检验只能考虑设定的假设因 素,无法考虑其他潜在的影响因 素。
假设检验的局限性
假设检验只能对提出的假设进行 验证,无法对未提出的假设进行 推断。
02
点估计的优点是简单、直观,能够快速地给出总体参
数的近似值。
03
点估计的缺点是它只提供了总体参数的一个单一的估
计值,而没有给出估计的不确定性或误差范围。
区间估计
区间估计是基于样本数据, 给出总体参数的一个可能 的取值范围。
区间估计的优点是能够提供估 计的不确定性或误差范围,从 而更好地了解估计的可靠性。
例子
比较两个不同地区成年男性的平均身高是否相 等。
步骤
1. 提出原假设和备择假设;2. 确定检验水准;3. 计算样本统计量和临界值;4. 做出推断结论。
配对样本假设检验
01
目的
检验两个相关样本的参数是否相 等。
02
03
例子
步骤
比较某地区同一家庭内成年男女 身高差是否为0cm。
1. 提出原假设和备择假设;2. 确 定检验水准;3. 计算样本统计量 和临界值;4. 做出推断结论。
通过方差可以估计抽样误 差的大小,方差越小,抽 样误差越小。
STEP 03
置信区间
通过置信区间可以估计总体 参数的可能范围,置信区间 越窄,抽样误差越小。
标准误差是衡量样本统计量与 总体参数之间差异的指标,标 准误差越小,抽样误差越小。
Part
02

《统计学》课件第6章抽样推断

《统计学》课件第6章抽样推断

01
定义
抽样推断是一种通过从总体中随 机抽取部分样本,并利用这些样 本数据来推断总体特性的统计方 法。
02
03
04
代表性
样本应具有代表性,能够反映总 体的特征和规律。
抽样推断的重要性
01
02
03
节省成本
通过抽样可以减少所需的 数据量,降低调查成本。
提高效率
通过快速收集样本数据, 能够快速获得总体信息, 提高调查效率。
对数据进行核查,确保 数据的准确性,及时纠
正错误或异常值。
分类与编码
对数据进行适当的分类 和编码,以便进行后续
的数据分析。
数据清理
删除或修正不准确、不 完整或重复的数据,提
高数据质量。
数据分析与解释
描述性统计
使用描述性统计方法,如平均 数、中位数、众数、标准差等
,对数据进行初步分析。
推断性统计
根据调查目的,选择合适的推 断性统计方法,如回归分析、 方差分析、卡方检验等,对总 体进行推断。
非参数假设检验的步骤
确定数据特征、提出假设、构造检验统计量、确定临界值、作出推 断结论。
非参数假设检验的优缺点
优点是适用范围广、灵活性高;缺点是计算较为复杂,需要更多的 样本数据支持。
05
样本量的确定
影响样本量的因素
总体标准差
总体标准差越大,需要的样本量 也越大,以减小估计误差。
置信水平置信水平越Biblioteka ,所需样本量也越 大,以减小估计误差。
《统计学》课件第6章抽样 推断
目录
• 抽样推断概述 • 抽样方法与技术 • 参数估计 • 假设检验 • 样本量的确定 • 实例分析
01
抽样推断概述
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
均数均数均数14
抽样分布示意图
71
54
95
36
57
77
33
92
74
15
3.
12
4.
4.
5.
5.
5.
98
4.
3.
4.
5.
4.
5.
6.
19
15
标准误的用途

t 分布

t分布
随机变量X
u X
衡量抽样误差的大小,标准误越小,样本均数与 总体均数越接近,样本均数的可信度越高 结合标准正态分布与t分布曲线下面积分布规律, 估计总体均数的可信区间 用于假设检验

23
总体均数95%可信区间为: x 1 .96 x , x 1 .96 x 同理,99%可信区间为: x 2.58 x , x 2.58 x
24
22
σ 未知
可用其估计值S 代替,但 ( X ) /( S / n ) 已不再服从标准正态分布, 而是服从 t 分布。
71
12
33
74
95
15
36
57
77
98
19
3. 71 3. 92 4. 12 4. 33 4. 54 4. 74 4. 95 5. 15 5. 36 5. 57 5. 77 5. 98 6. 19
3.
4.
3.
4.
4.
4.
4.
5.
5.
5.
5.
5.
6.
11
中心极限定理: • 实际研究中σ未知,以样本标准差S作为σ的估计值 计算标准误:
统计推断 statistical inference
内容:1、参数估计(estimation of parameters) 包括:点估计与区间估计 2、假设检验(test of hypothesis)
第一节 样本均数的标准误
一、均数的抽样误差和标准误
抽样试验
从正态分布总体N(5.00,0.502)中,每次 随机抽取样本含量n=5,并计算其均数与标 准差;重复抽取1000次,获得1000份样本; 计算1000份样本的均数与标准差,并对1000 份样本的均数作直方图。 按上述方法再做样本含量n=10、样本含量 n=30的抽样实验;比较计算结果。
99%可信区间
X t 0.01 / 2, S X , X t 0.01 / 2, S X
*
宽 小(0.01)
29
*
*
*
*
30
第三节 假设检验的意义和步骤
(Hypothesis Test) 统计推断的另一个重要内容,目的是通过 样本数据比较总体参数之间有无差别。
例4.4 使用黑加仑油软胶囊治疗高脂血症,30名高脂血 症患者治疗前后血清甘油三酯检测结果的差值为 1.38±0.76 (g/L),问治疗后血清甘油三酯是否有所改 善?
各样本均数未必等于总体均数 样本均数之间存在差异 样本均数的分布很有规律,围绕着总体均数左右 基本对称,也服从正态分布 样本均数的变异较原变量的变异大大缩小
450 400 350 300
频数
s
450 400 350 300
频数
400 350 300
频数
抽样分布
S X S / n 0.38 / 140 0.032
问: 总体均数≠样本均数的原因是什么?
5
抽样试验(n =5)
抽样试验(n =10)
抽样试验(n =30)
7
8
9
3个抽样实验结果图示
450 400 350 300
450 400
1000份样本抽样计算结果
总体均 数 总体标 准差s 0.50 0.50 0.50 均数的 均数 4.99 5.00 5.00 均数的标准差
/f?kw=yfyxx#
预防医学系 卫生统计学教研室
大学精品课程网站→教学资源→(ppt、wmv)
/eol/jpk/course/layout/default/index.jsp?courseId=1204
2 3
• 抽样误差在抽样研究中不可避免 • 均数的抽样误差(sampling error) : 由于样本的随机性所造成的导致来自同一总 体的样本均数之间及样本均数与总体均数间 的差异。
均数
n=10 n=30
450 400 350
n 30 ; S X 0 .0920
300
频数
250 200 150 100 50 0

N(0,12)
Student t分布
x
17
X X , v n1 SX S n
自由度:n-1
18
t分布曲线
0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 -4 -3 -2 0.0 -1 0 1 2 3 4
t分布曲线下面积(附表2)
t 分布有如下性质:
自由度为1的t分布 自由度为9的t分布 标准正态分布
ab
21
t
单侧:tα, v 双侧:tα/2,v
可信区间的两个要素
在估计总体均数的可信区间时: 估计错误的概率:α 估计正确的概率:1-α,也称为可信度,常用 95%或99% 可信区间:根据一定概率估计得到的区间 95%(CI) ; 99%(CI)

总体均数的可信区间的估计
1、σ已知, 正态曲线下有95%的u值在±1.96间,
第三节
假设检验的意义和步骤
差值不为零的原因是什么?
① 抽样误差造成的; ② 本质差异造成的。 假设检验的目的——就是判断差别是由哪 种原因造成的。
32 33
一、假设检验的基本思想 小概率反证法
① 抽样误差造成的:
d= 1.38
μd = 0
② 本质差异造成的:
差值=1.38 μ前>μ后
① 抽样误差造成的:H0 d= 1.38,μd = 0
总体均数μ的95%可信区间为:
x t 0.05 / 2 S x
,
,
x t 0.05 / 2 S x
x t 0.01 / 2 S x
26
总体均数μ的99%可信区间为:
不同自由度的 t 分布图
25
x t 0.01 / 2 S x
27
例4.3 试计算例4.1中该地成年男子红细胞总 体均数的95%可信区间。 本例属于大样本,可采用正态近似的方法计 算可信区间。因为
33
74
36
77
92
4. 12
5. 1
5. 5
5. 9
3.
4.
4.
4.
4.
5.
5.
3.
均数
6.
10
19
71
95
54
5
7
8
• 抽样误差的大小可以用样本均数的标准差 来描述 X / n • 通常将统计量的标准差称标准误(Standard Error) 又称样本均数的标准差
X
12
X
92
54
20
①单峰分布,曲线在t=0 处 最高,并以t=0为中心左右 对称 ②与正态分布相比,曲线最 高处较矮,两尾部翘得高( 见绿线) ③ 随自由度增大,曲线逐渐 接近正态分布;分布的极限 为标准正态分布。
19
点估计:由样本统计量 参数的估计
X、 S、 p
直接估计 总体参数 、 、 区间估计:在一定置信度(Confidence level) 下,估计未知总体均数的可能范围
P29
二、样本均数的抽样分布特点

当样本含量很大的情况下,无论原始测量变量服从 什么分布, X 的抽样分布均近似正态。
SX S /
n
例4.1 在某地随机抽查成年男子140人,测得红细胞 数均数为4.77×102 /L,标准差0.38 ×102 /L ,试计算 其抽样误差的大小:
450
四 总体均数的估计
总体均数的点估计(point estimation) 与区间估计(interval estimation)
f( t)
双侧t0.05/2,9=2.262 =单侧t0.025,9 单侧t0.05,9=1.833 双侧t0.01/2,9=3.250 =单侧t0.005,9 单侧t0.01,9=2.821 双侧t0.05/2,∞=1.96 =单侧t0.025,∞ 单侧t0.05,∞ =1.64
4 . 77 , 0 . 38 , n 140
可信区间的涵义
总体均数95%可信区间:该区间包含总体均数的概率为95%。 从总体中作随机抽样,作100次抽样,每个样本可算得一个可 信区间,得100个可信区间,平均有95个可信区间包括μ(估 计正确),只有5个可信区间不包括μ(估计错误)。
1.准确度(accuracy):反映在可信度的大 小,即可行区间包含总体均数的概率大小
1 . 96 u 1 . 96 x 1 . 96 1 . 96
x
x 1 . 96 x x 1 . 96 x


2.精密度(precision):反映在区间的长度, 区间宽度越小,精密度越高
三、模拟实验
模拟抽样成年男子红细胞数。设定: μ=4.75,σ=0.39,n=140 产生100个随机样本,分别计算其95%的可信区间,结果用图 示的方法表示。从图可以看出:绝大多数可信区间包含总体 参数μ=4.75,只有6个可信区间没有包含总体参数(用星号标 记)。
*
μ

则95%可信区间为:
下限: 上限:
② 本质差异造成的:H1 μ前>μ后,差值=1.38
治疗前 治疗前 治疗前 治疗后 治疗后
相关文档
最新文档