第四讲总体均数的参数估计

合集下载

第四讲参数估计PPT课件

第四讲参数估计PPT课件
0.50
均数 的均 数
4.99
5.00
均数标准差
0.2212 0.1580
5.00 0.0920
n
0.2236 0.1581 0.0913
由表1可见,从同一总体中随机抽取样本含 量n=10的若干样本,各样本算得的样本均 数并不等于相应的总体均数,且各样本均 数也不完全相同。这种由于随机抽样而造 成的来自同一总体的样本均数之间及样本 均数与相应的总体均数之间的差异,称之 为均数的抽样误差。
总体均数可信区间的计算
Hale Waihona Puke 总体均数可信区间的计算 需考虑: (1)总体标准差 是否已知, (2)样本含量n的大小 通常有两类方法: (1)t分布法
(2)u分布法
1. 单一总体均数的可信区间 (1) 未 知 : 按 t 分 布 。
双 侧 1 可 信 区 间 则 为 :
X t 2 , S X < X t 2 , S X ( X t S 2 , X , X t 2 , S X )
由于样本均数与相应的总体均数之间存在着 差异,由数理统计推理可知:从正态总体中 随机抽取样本含量为n的样本,每抽取一个 样本可计算一个样本均数,重复100次抽样可 得到100个样本均数。
这些样本均数服从均数为
,方差为
2 x
的正态分布.其中 x 为样本均数的总
体标准差,计算公式为: / n X
2. 两总体均数之差的可信区间: 从相 等,但 不等的两个正态总体 N(1, 2)和 N(2, 2)进行随机抽样。则两总体均数之差
( 1 2 )的双侧1 可信区间为
(X 1X2)t/2,SX1X2
( n 1 1 ) ( n 2 1 ) n 1 n 2 2
S X1X 2

总体均数的估计和t检验

总体均数的估计和t检验

它不受样本大小和样本变异性的影响,是衡量数据分布中心位
03
置的重要参数。
总体均数的点估计
点估计(Point Estimation):使用 样本统计量来估计总体参数的方法。
样本均数(Sample Mean):作为总 体均数的点估计量,它是从样本数据 中计算得出的平均值。
总体均数的区间估计
要点一
区间估计(Interval Estimation)
根据t统计量的显著性,得出配对观测值之 间是否存在显著差异的结论。
配对样本t检验的应用
01
比较同一受试者在不同时间点的生理指标或心理指 标是否存在显著差异。
02
比较同一受试者在不同条件下的行为表现是否存在 显著差异。
03
比较不同治疗方法的效果是否存在显著差异。
04
CHAPTER
两独立样本t检验
两独立样本t检验的概念
它适用于在实验设计时将观测值配对的情况,例如同一受试者在不同时间 点或不同条件下获得的观测值。
配对样本t检验的目的是检验两组配对观测值的均值是否存在显著差异。
配对样本t检验的步骤
1. 数据收集
收集两组配对观测值的数据,确保数据来源可靠、准确。
2. 数据整理
将数据整理成适合进行t检验的表格形式,包括配对观测值的编 号、观测值、差值等。
两独立样本t检验是用来比较 两个独立样本的总体均数是否
有显著差异的统计方法。
它适用于两个独立样本,且 每个样本的观察值相互独立,
不受其他因素的影响。
两独立样本t检验的前提假设 是:两个样本的总体均数相等, 且每个样本的观察值服从正态
分布。
两独立样本t检验的步骤
01
02
03

总体均数的估计ppt课件

总体均数的估计ppt课件
11

1. 样本均数的均数μ 与个体观察值的均数μ相等 x μ =μ x
2. 样本均数间存在变异(抽样误差),其变异程度 较个体值的小
σ σ=
xn
3. 来自正态分布总体的样本均数满足正态分布
x~N μ ,σ 2 xx
12
13
样本均数的均数为m证明*
E
x

E

x n

样本号
样本含量(n=10)
1 161.1 173.7 173.7 167.3 162.2 162.2 166.6 166.6 157.4 157.4 164.82
2 166.8 159.1 159.1 166.1 173.3 173.3 169.1 169.1 165.2 165.2 166.63
3 157.4 174.0 172.3 175.8 166.6 182.1 163.1 159.4 159.4 177.3 168.74
xi
27
t分布的概率密度函数*
若随机变量t满足以下概率密度函数,则称
t满足自由度为v的t分布:
f (t)
(v -1)! 2
v ( v - 2
)!
1
t2 v
- v1 2

2
28
t分布曲线是单峰的,且关于t = 0对称,这一特 征与标准正态分布很相似
0.4
(标准正态分布)
为了与个体的标准差相互区别,样本均数的标准差又称 为样本均数的标准误,简称标准误或理论标准误
反映了样本均数间的离散程度,如果标准误很大,则不 同的样本均数间参差不齐,同时样本均数的分布范围较 大,也反映了样本均数与总体均数间的差异可能较大, 因而标准误反映均数抽样误差的大小

医学统计学总体均数的估计和假设检验

医学统计学总体均数的估计和假设检验

3.106
3.055
3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.750 2.704 2.678 2.626
2.58
3.497
3.428
3.372 3.326 3.286 3.252 3.222 3.197 3.174 3.153 3.030 2.971 2.937 2.871 2.8070
t x
sX
统计量是t的分布就是t分布。
t分布的特征: ① 以0为中心,左右对称呈单峰分布; ② t分布是一簇曲线,分布参数为自由度υ。 ③ t分布的形状与样本例数n有关,高峰比正态分
布略低,两侧尾部翘得比正态分布略高。越大, 曲线越近正态分布,当ν=∞时,t分布即为z分布。 由于t分布是一簇曲线,为了便于应用,统计学 家编制了表4-4-1 t界值表。
3)与例数的关系不同:当样本含量足够大时,标准 差趋向稳定。而标准误随例数的增大而减小,甚至趋 向于0。若样本含量趋向于总例数,则标准误接近于0。
联系;二者均为变异指标,如果把总体中各样本均 数看成一个变量,则标准误可称为样本均数的标准差。 当样本含量不变时,均数的标准误与标准差成正比。 两者均可与均数结合运用,但描述的内容各不相同。
活量的95%的可信区间。
本例n=5, =4,t0.05,4=2.776
x t0.05sx =2.44±2.776×0.33/ 5 =2.03~2.85(L)
该地17岁女中学生肺活量均数的95%可信区间为2.03L~2.85L。
例4-4-3 由例4-2-1 101名30~49岁健康男子血清总 胆固醇 X 4.735mmol·L-1,S=0.88 mmol·L-1,求该 地健康男子血清总胆固醇值均数的95%可信区间。

第九章第四节总体均数估计

第九章第四节总体均数估计

置信区间的数值是随样本观察值而变化的, 它们能否包含总体均数是个随机事件,例 如建立100个置信区间,若有95个包含总体 均数,我们则称全部区间包含总体均数的 概率为95%。
置信区间有两个要素
• 准确度:反映在置信度(1-)的大小上,即可信区间
包含总体均数的理论概率,从准确度的角度看,愈 接近1愈好,如可信度99%比95%好。 • 精密度:反映在置信区间的长度上,即长度愈小愈 好。 在样本含量固定的情况下,二者是相互矛盾的,若 提高了置信度,准确性就增强,置信区间势必变宽, 精密度下降。
第九章
第四节 总体参数估计与假设检验
参数估计:指用样本指标(统计量)估计总体指标 (参数)。
参数估计: 点估计(point estimation) 区间估计(interval estimation)
点估计:用样本统计量直接作为总体参数的点估计值。
例如:用 、 直x 接作s为 、 的估计值。
方法虽然简单,没有考虑抽样误差,当抽取的样 本不同时对总体参数的点估计值也可能不同。
P(t / 2, t t / 2, ) 1
置信度
confidence level
P(t / 2,
X
sX
t / 2, ) 1

X s

t
/ 2,

t
/ 2,
之间的概率为1-
X
t / 2,
X
sX
t / 2,
t /2, sX X t /2, sX
X t /2, sX X t /2, sX
例 11名18岁男大学生身高均数资料得,
=1X72.25cm, S=3.31cm,试估计
该地18岁男大学生身高总体均数?

总体均数的估计

总体均数的估计

总体均数的估计
总体
随机抽样
推断
样本
参数估计 统计推断 统计分析 统计描述 假设检验
参数估计
用样本指标估计总体指标称为参
数估计,是统计推断的一个重要 方面。
总体均数估计的两种方法
点估计 区间估计
点估计
是直接用样本统计量直接作为
总体参数的估计值.
点估计的缺点
没有考虑抽样误差,无法评价估计
-1
0
1
2
3
4
5
图6.4自由度分别为1、5、∞的t分布
t分布的特征

t分布是一簇曲线。 t分布以0为中心,左右对称。 其形态变化与自由度的大小有关。自由度 越小,则t值越分散,曲线越低平;自由度 逐渐增大时, t 分布逐渐逼近 u 分布 ( 标准正 态分布);当=∞时,t分布即为u分布。
标准误
标准误
的计算:
X

n
标准误
的估计值
s sX n
影响标准误大小的因素

X 的大小与成正比
X 与样本含量n的平方根成反比
抽样误差越小,表明样本均数与
总体均数越接近,即用样本均数 估计总体均数的可靠性越大;反 之,抽样误差越大,则用样本均 数估计总体均数的可靠性越小。
X X t sX s n
(式6.3 )
同理,如果抽取例数 n=15 时,仍 能得到一条t分布曲线,因此,当n 变化时,就可以得到不同的 t 分布 曲线,如图6.4:
0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -5

5
1
-4
Hale Waihona Puke -3-2 附表3的横标目为自由度,纵标目为

第四章总体均数的估计和t检验

第四章总体均数的估计和t检验
——并不是做一次抽样求得可信区间包括μ 并不是做一次抽样求得可信区间包括μ的概率是0.95 的概率是0.95,对一次抽样而言 0.95,对一次抽样而言
只有两种可能,要么可信区间包含μ 只有两种可能,要么可信区间包含μ,要么不包含μ ,要么不包含μ。
95%可信区间 95%可信区间
X 公式 区间范围 估计错误的概率 ± t 0 .05 / 2 ,ν S x
本次试验结果:95%的概率保证区间 包含了µ ,有5% 的可能区间未包含µ
12
总体均值的置信区间
(σ2已知) 已知)
1.假定条件
总体服从正态分布,且总体方差(σ2)已知 如果不是正态分布,可以由正态分布来近似 (n>30)
2.使用正态分布统计量u
x−µ u= ~ N ( 0 ,1) σ n
3.总体均值 µ 在95%置信水平下的置信区间为
18
可信区间的解释
95%可信区间 95%可信区间: %可信区间:从总体中作随机抽样,例如 作100次抽样 100次抽样,每个样本可算出一个可信区间, 次抽样,每个样本可算出一个可信区间, 得100个可信区间 100个可信区间,平均有 个可信区间,平均有95 ,平均有95个可信区间包括 95个可信区间包括μ (估计正确) 估计正确),只有5 ,只有5个可信区间不包括μ(估计 错误) 错误)。
α/2
Pa/2
σ xx
1-α
α/2
µ
P1-
X
a/2
9
正态曲线下的面积规律
95% 2.5% 2.5%
µ-1.96σ
µ
µ+1.96σ
10
中心极限定理
中心极限定理:设从均数为 中心极限定理:设从均数为µ,方差为σ 2的一个任 意总体中抽取容量为 n 的样本,当 n 充分大时,样 本均数的抽样分布近似服从均数为 μ 、方差为 σ2/n的正态分布 σ σx = n 一个任意分

4-总体均数的估计

4-总体均数的估计

x1 , s1
7
x2 , s2 x3 , s3
…………
x 1 , x 2 , x 3 ,...... x k ~ N ( µ ,
《医学基础统计》第四章总体均数的估计
σ
2
x k , sk
)
2010.09.21
n
1.1
抽样误差 sampling error
o 由于个体差异的存在,在抽样过程中产 生的样本统计量与相应的总体参数之间的 差异称为抽样误差; o 由于生物间的个体差异客观存在,故在 抽样研究中抽样误差无法避免; o 数理统计表明,抽样误差有规律可循。
2010.09.21
2.2
U值-标准正态变换
前提条件为,当σ x已知, u =
U值 ≥1.64 ≥1.96 ≥2.58 & & & ≤-1.64 ≤-1.96 ≤-2.58
x −μ
σx
正态分布曲线下面积 10% 5% 1%
P425,附表1 标准正态分布曲线下面积的分布表
21
《医学基础统计》第四章总体均数的估计
o总体均数的点估计为:104.89 o总体均数的95%可信区间为: 以 95 %的把握保证总 体 均 值 在 104.26 ~ 104.89 ± 1.980 × 0.32 105.52之间 = (104.26,105.52)
以 99 %的把握保证总 o总体均数的99%可信区间为: 体 均 值 在 104.05 ~ 104.89 ± 2.617 × 0.32 105.73之间 = (104.05,105.73)
30
《医学基础统计》第四章总体均数的估计 2010.09.21
四、总体均数估计的SAS编程
31
《医学基础统计》第四章总体均数的估计

总体均数估计ppt课件46页PPT

总体均数估计ppt课件46页PPT

0
0
50
50
100
100
150
150
200
200
频数 频数
250
250
400
0.2212 350
400
n5;SX
350
n10 ;S 0.1580 X
300
300
450
450
3个抽样实验结果图示
样本均数的抽样分布具有如下特点
① 各样本均数未必等于总体均数; ② 各样本均数间存在差异; ③ 样本均数的分布为中间多,两边少,左右基本 对称。 ④ 样本均数的变异范围较之原变量的变异范围大 大缩小。
25
1.点估计(point estimation)
用相应样本统计量直接作为其总体参数的估计值。
如x用 代 、S替 , 估计s代 用s替
其方法虽简单,但未考虑抽样误差的大小。
26
2.区间估计(interval estimation):
按预先给定的概率(1)所确定的包含
未知总体参数的一个范围。 总体均数的区间估计:按预先给定的
n=30 5.00 0.50 5.00
均数标准差
Sn
0.2212
0.1580
0.0920
sn
0.2236 0.1581 0.0913
5
均数
6
0
50
100
频数
3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
150
200
250
n30 ;SX 0.0920
350 300
400
450
均数
均数

总体均数的估计

总体均数的估计

均数的抽样误差
1.抽样误差的概念:由个体变异产生的,随机抽样 引起的样本指标与总体指标之间,样本指标与样本 指标之间的差异。 2.抽样误差产生的原因:个体变异 3.抽样误差的特点:随机,不可避免,有规律可 循。 4.在大量重复抽样的情况下,可以展示其规律性 5.度量指标:标准误(standard error,SE)
了解
2.样本均数的抽样分布规律
3.t分布的概念,t分布图形与曲线下面积的分布规律,t界值
4.区间估计的准确度和精确度
均数的抽样 误差与标准 误
从总体N(6.0, 1.52)中进行随机抽样 – 样本例数n分别为10、30、50、100 – 每种样本含量下进行100次抽样
– 计算样本X均数 和标准差S
4.为了解某市女婴出生体重的情况,随机得到该市区120名新生女
婴的平均出生体重为3.10kg,标准差为1200.50kg。用算式
3.10±1.96X0.50/
计算得到的区间,可以解释为
A 此范围包含该市女婴平均出生体重,但可信的程度为95%
B 95%的可能性认为此范围包含了该市女婴的出生体重
C 该市95%的女婴出生体重在此范围内
精密度:反映在可信区间的长度上,长度愈 小愈好
在抽样误差确定的情况下,二者是相互矛盾 的。若提高准确度,即提高可信度,可信区 间势必增大,精密度下降。若提高精密度, 可信区间势必减小,即可信度下降,准确度 下降 一般情况下,同时兼顾准确度与精密度,常 用95%可信区间。
可信区间与医学参考值范围的区别
0,1)
样本均数X
~
N
(
,

2 X
)
Z X n
标准正态分布
N(0,1)

统计学课件-总体均数的估计与t检验

统计学课件-总体均数的估计与t检验

配對的變數
配對差值
t值 自由度 P值 結論:因為t=1.517,P=0.164>0.05,所有尚不能認為新藥和常規藥降低 血清總膽固醇的效果不同。
假設檢驗的注意事項
➢ 假設檢驗的P值不能反映總體均數差別的大小。 P值越小,越有理由(越有把握)認為兩總體均數不相等。
➢ 假設檢驗的結論具有概率性。
(三)配對t檢驗
可分為自身配對比較和實驗配對比較,目的是推斷某種 處理有無作用或兩種處理結果有無差別。 由於配對設計資料可以有效地控制個體差異對結果的影
響,故配對t檢驗的檢驗效率比成組t檢驗要高。
t d 0 , = n – 1 sd / n
例: 為比較某新藥與常規藥降血脂的效果,將性別相同、血 清總膽固醇水準相近的高血脂患者配成對子。每對中隨機抽 取一人服用新藥,另一人服用常規藥。服用一段時間後,測 得血清總膽固醇含量(mmol/L)如下(見數據檔 p196.sav)。問新藥與常規藥降血清總膽固醇效果是否相同?
常規藥:6.57 7.04
新藥: 6.00 7.00
6.46 6.68 6.83 6.03
6.27 7.42 5.97 7.22
6.89 7.28
6.21 6.30
7.61 6.64
7.60 7.38
SPSS操作步驟:
變數說明:X1:常規藥的血清總膽固醇, X2:新藥的血 清總膽固醇。
配對樣本 t檢驗
檢驗假設: H0:無效假設 H1:備擇假設
假設檢驗的目的 推斷兩個總體均數是否相等(雙側檢驗:μ1 = μ2?,單 側檢驗: μ1 >μ2? 或者μ1 < μ2? )
(一)樣本均數與總體均數的比較的t檢驗
又稱為單樣本t檢驗。已知的“總體均數”一般為理論值、

第04章 总体均数的估计

第04章  总体均数的估计

二、总体均数置信区间的计算
未知,且 n较小,按t分布
已知,或未知但n足够大,按Z分布
1. 单一总体均数的置信区间
2. 两总体均数的置信区间
(一)单一总体均数的置信区间
0.4 0.3
0.2
0.1
面积: 100(1 )%
0
X t / 2, S X
X
X t / 2, S X
图4-1 随机抽样所得100个样本均数的分布
100个样本均数的抽样分布特点:
① 4.83 X 4.8276 ② 100个样本均数中,各样本均数间存在差异, 但各样本均数在总体均数周围波动。 ③样本均数的分布曲线为中间高,两边低, 左右对称,近似服从正态分布。 ④样本均数的标准差明显变小:
0.52 0.52 S X 0.1772 0.1644 X 10
标准误(standard error, SE)
即样本均数的标准差,可用于衡量抽样误 差的大小。
X
因通常σ 未知,计算标准误采用下式:
n
SX
S n
通过增加样本 含量n来降低抽
样误差。
表4-1计算了100个样本的标准差S,由此可 计算每一样本的抽样误差大小。
t 界值表
(P406,附表2)
ν =1 举例:
t
1.812 -2.228 2.228
① 10,单 =0.05, t , t0.05,10 1.812 ,则有
P(t 1.812) 0.05 或 P(t 1.812) 0.05
率的标准误小,说明抽样误差较小,表示样本率对 总体率的代表性好;反之,率的标准误大,样本率对 总体率的代表性差。
二、 总体率的可信区间

生物统计课件:总体参数的估计

生物统计课件:总体参数的估计

准确度和精度关系
ˆ <θ <θ ˆ ) → max P(θ 1 2 ˆ → min ˆ − θ θ 1 2
例. 一个人的年龄
置信区间的求法
• 求什么参数的置信区间?置信水平? • 寻找未知参数的一个良好估计 • 寻找一个待估参数和估计量的函数, 要求其分布为已知 • P(θ ˆ <θ <θ ˆ ) = 1−α ⇒ θ ≤ θ ≤ θ
常用的标准

无偏性 • 有效性 • 一致性
无偏性
估计量是随机变量,对于不同的样本 值会得到不同的估计值. 我们希望估计值在未知参数真值附近 摆动,而它的期望值等于未知参数的 真值.
ˆ 为 θ 的点估计量. 定义:设 θ 为未知参数, θ
如果
ˆ) = θ E (θ
ˆ 为 θ 的无偏估计量. 则称 θ
2
S S P( X − tα (n − 1) < µ < X + t α (n − 1)) = 1 − α n 2 n 2 S S Interval : ( X − tα (n − 1) , X + t α (n − 1)) n 2 n 2
例.药品重量X~N(μ, σ2) n=6: 1.46 1.51 1.49 1.48 1.52 1.51 求μ的置信度为95%的置信区间.
无偏性-没有系统性的偏差
ˆ) = θ E (θ
这种偏差随机地在0的周围波动,对 同一 统计 问题大 量重 复 使用 不会产 生系统偏差 .
例. 如果X1, …, Xn来自总体X, 其均值为μ. 证明:样本的加权均数 无偏估计.
∑c X
i =1 i
n
为μ的
i
其中ci是不全为0的实数, 并且

第六章总体均数的估计(4讲)

第六章总体均数的估计(4讲)

2
第一节
均数的抽样误差与标准误
一、样本均数的抽样分布 在医学科学研究中,往往采取抽样研究(sampling study) 的方法,即从研究的总体中随机抽取部分观察单位作为样本, 然后根据样本信息来推论总体特征,即为统计推断 (statistical inference)。然而,由于总体的变量值存在
t , 的意义, │t│≥
tP ,则 ≤α , ; 反之,│t│<

t , 则P>α。
2019/3/11 16
第三节 总体均数的估计
用样本指标(统计量)估计总体指标(参数)称为参数 估计,是统计推断的一个重要方面。观察样本均数的目的之 一,是为了估计总体均数。估计总体均数的方法有两种,即 点值估计(point estimation )和区间估计(interval estimation)。
1 2
1
1
(X X ( 1 2) 1 2) z
X X
1
~N( 0 , 1 )
2
总体均数差值的(1-α)置信区间为:
( X X ) Z 1 2 / 2 X X 1 2
但在实践工作中,总体标准差σ是未知的,只能用样 本标准差S来代替, 两均数之差的标准误估计值为:
2019/3/11 8
X
,
SX
S n
例6.1 随机抽取某地正常成年男性200名,测得其血清胆固 醇的均数为3.64mmmol/L,标准差为1.2mmol/L,试估计其均
数的标准误。
No Image
2.均数标准误的应用 ⑴表示抽样误差的大小,从而说明样本均数的可靠性。 ⑵ 进行总体均数的区间估计。 ⑶进行均数的t检验。
X
2019/3/11

【学习课件】第四章总体均数的估计

【学习课件】第四章总体均数的估计
标准误可用于计算总体均数的可信区间,也是进行 假设检验的基础。
10
2021/7/13
标准差和标准误的区别
意义:
– 标准差描述个体值间的变异程度,即观察值间的离
散度,标准差小,表示观察值围绕均数的波动较小。
当观察值呈正态或近似正态分布时,可将均数及标
准差同时写出,如
x 。s
– 标准误描述统计量的抽样误差的大小,即样本统计 量与总体参数的接近程度。标准误小,表示抽样误 差小,则统计量较稳定,与参数较接近。
用更一般的表示法为
– 单侧:P(t≤-tα,ν)=α,或P(t≥tα,ν)=α – 双侧:P(t≤-tα,ν)+P(t≥tα,ν)=α
反之 P(-tα,ν<t<tα,ν)=1-α
18
2021/7/13
总体均数的估计
参数估计是通过样本指标(统计量)来估计总体指标 (参数)。它包括两种方法:
– 点(值)估计(point estimation):即把样本统计 量直接作为总体参数的估计值,如用样本均数来估计 总体均数。这种方法虽然很简单,但是未涉及随机误 差,而随机误差在抽样研究中是不可忽视的。
无穷大时,双侧t0.05=1.96,单侧t0.05,=1.645,即为u 分布的界值。
17
2021/7/13
如由表查出单侧t0.05,10=1.812,表示从正态总体 作样本例数为11的随机抽样,其t 值服从=n-1=111=10的t 分布,理论上
P(t≤-1.812)=0.05,或P(t≥1.812)=0.05
21
2021/7/13
区间估计
设有一正态总体N(μ,2),现从中随机抽取一个 样本,该样本的均数和标准差分别用 和s表示,样

4总体均数的估计ppt课件

4总体均数的估计ppt课件

• 点值估计〔point estimation )
• 区间估计〔interval estimation)
(一)、点值估计
• 点值估计:是直接用样本均数作为总体 均数的估计值。
• 此法计算简便,但由于存在抽样误差, 通过样本均数不可能准确地估计出总体 均数大小,也无法确知总体均数的可靠 程度 。
(二)、区间估计
按α=0.05的水准,拒绝H0,接受H1, 差异无统计学意义。
结论:即根据本资料可以认为此山区健 康成年男子脉搏数与一般健康成年男子不 同。
下结论时的注意点:
• P ≤α ,拒绝H0,不能认为H0肯定不成立, 因为虽然在H0成立的条件下出现等于及大于现 有统计量的概率虽小,但仍有可能出现;
• 同理,P >α ,不拒绝H0,更不能认为H0肯定 成立。由此可见,假设检验的结论是具有概率 性的,无论拒绝H0或不拒绝H0,都有可能发生 错误,即第一类错误或第二类错误
实例:如某年某市120名12岁健康男孩,已求得 均数为143.07cm,标准差为5.70cm,按公式计算, 则标准误为:
5.70 S 0.52
X 120
标准误的应用
• 1.表示抽样误差的大小,也是说明样本 • 均数估计总体均数可靠程度的指标 • 2.进行总体均数的区间估计; • 3.进行均数的假设检验等 。
• 95%的可信区间为 143.07±1.96×0.52 即〔142.05,144.09)。
• 99%的可信区间为 143.07±2.58×0.52, 即〔141.73,144.41)。
注意点
➢标准误愈小,估计总体均数可信区间的范 围也愈窄,说明样本均数与总体均数愈接 近,对总体均数的估计也愈精确;
例3.3 根据大量调查,已知健康成年男子脉搏的 均数为72次/分钟,某医生在一山区随机测量了100 名健康成年男子脉搏数,求得其均数为73.8次/分 钟,标准差为6.6次/分钟,能否认为该山区成年男 子的脉搏数与一般健康成年男子的脉搏数不同?
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

推断统计的基本原理(A)
抽样分布
三种分布: 总体分布:总体内个体数值的频数分布 样本分布:样本内个体数值的频数分布 抽样分布:某一种统计量的概率分布 例子: 将某市600名学生数学竞赛的分数作为一个总体,其600个考分的 频数分布是___;若从中随机抽出40个考分为样本,这40个考 分的频数分布是____;若将所抽到的40个考分计算其均数及 标准差后还回总体,再随机抽40个考分,计算其均数及标准 差……这样反复进行下去,就获得n=40的一切可能样本的平均 数与标准差,若将这一切可能个样本的平均数及标准差分别进行 频数分布,就形成一个实验性的平均数抽样分布及标准差的抽样 分布。

估计量

参数估计中,把要估计参数称为待估参数 ,把用来 估计参数的统计量称为估计量,用 表示;把计算出 来的值作为估计量的值,称为估计值,也用 表示。 于是,参数估计就成了待估参数、估计量和估计值之 间的关系。用数学语言来概括,就是:设总体X服从F (x),该总体有参数 ,现根据自该总体的样本 (X1,X2,…Xn)构造出一个估计量 去估计 ,估计 值 由样本的一组观察计算得出。
该总体的一个容量为n的简单随机样本,则样本 均数 X 亦服从正态分布,且总体均数与样本均数、 总体方差与样本均数的方差之间存在以下关系:
X
2 X


n
2
定理3
设总体X具有总体均数μ与方差σ 2,当样本容量n趋于无
穷大时,则样本均数 X 的分布趋于正态分布,且样本的
数学期望(即均数) X ,样本均数的方
X / n
例:
某类产品的强度服从正态分布,其总体均数
为100,总体标准差为5。现从该总体中抽取 一个容量为25的简单随机样本,求这一样本 的样本均数介于99-101的概率。
解:根据定理3,当 X 99 时
Z X 99 100 5/ 25 1
/
n
当 X 101 时, Z X 101 100 5/ 25 1
推断统计的基本原理
例示:
假设某次心理学测验中5名被试的得分分别是120
分,125分,130分,135分和140分。若将这5名 被试看作是一个总体,从中抽取2名被试作为样 本,则样本均数的抽样分布如何?
____________________________ 被试编号 1 2 3 4 5 测验得分(Xi) 120 125 130 135 140 次数(f) 1 1 1 1 1 概率(P) .20 .20 .20 .20 .20
心理与教育统计学
第四讲 推断统计 席居哲
内容提要
推断统计的基本原理
抽样分布
参数估计 假设检验
总体均数的参数估计与假设检验
总体均数之差的参数估计与假设检验 总体方差及比例的参数估计与假设检验
推断统计的基本原理
问题:
若要了解全国15岁青少年的智力发展状况,该如
何做?
(1)全测? (2)猜测? (3)部分施测?估计?
/
n
查表 3 得: P {99 X 101 } P { 1 X 1} 2 . 34134 . 68268
有限总体修正系数
在不放回抽样(不重复抽样)时,比如检验
灯泡 定理4:
设总体X的总体平均数为μ,方差σ 2,
(X1,X2,…,Xn)是以不放回的抽样形式从该总体 中抽取的一个容量为n的简单随机样本,则样本 均数 X 的平均数与方差分别为(在n/N≥.05时才 需要;若n/N<.05则可以省略该系数):
点估计:用某一样本统计量的值来估计相应总体参数
的值叫总体参数的点估计。(无偏性,有效性,一致 性) 区间估计:以样本统计量的抽样分布(概率分布)为 理论依据,按一定概率的要求,由样本统计量的值估 计量估计总体参数的所在范围,称为总体参数的区间 估计
参数估计

参数估计和假设检验是统计推断的基本任务
X
2 X

N n N 1


n
2
例:
某公司2000个产品的强度服从正态分布,其
总体均数为100,总体标准差为5。现从该总 体中不放回地抽取400个产品作为样本,求样 本均数的均数和方差。
推断统计的基本原理(B)
参数估计
在解决实际问题时,往往没有条件事不需要计算
出总体的参数,这就需要研究者根据样本资料进 行合理的分析,对总体参数作出科学的估计 根据样本统计量对相应总体参数所作的估计叫总 体参数估计。总体参数估计分点估计与区间估计。
差x
2


2
n
, 即 X N ( , / n )。这个定理又称为中心极限定理。
2
要指出的是,在小样本的情况下,中心极限定理不一定
成立,不能保证抽自非正态分布总体的样本均数服从正 态分布。 在样本均数服从正态分布的情况下,我们可以用下
面的公式将转换成标准正态分布 Z X X X
当总体σ 未知,总体呈正态分布,样本容量无论
大小时,或者当总体σ 未知,总体虽不呈正态分 布,但样本容量较大(n>30)时,样本平均数与 总体平均数离差统计量均呈t分布。总体平均数 的置信区间可按t分布,用σ 的估计值计算。
Z分布
这里是 自由度 (df)
S为总体标准差的估计值 同等的表示还有:

参数估计的基本思想是:

设总体X服从分布F(x),该总体有参数 ,自总 体中抽取一个样本(X1,X2,…,Xn),此时可 以根据以下两种方法估计 :

(1)根据样本的观察值计算出一个与 相应的 估计值,用这个估计值直接作为对参数 这种方法称为参数的点估计 的估计。

(2)根据样本的观察值计算出两个估计量
__________________________________________
则:

2
X
N

120 125 130 135 140 5 X
2
130

X
50
N
(1)抽样分布与统计量
不难发现:样本均数的均数
X 正好等于总体平均数 , 样本均数的方差 X 等于总体方差
区间估计小结
区 间 估 计 小 结
练习
P.115
参数的区间估计
设总体X有待估参数θ ,(X1,X2,…,Xn)是
抽自该总体的一个容量为n的简单随机样本。 现建立两个统计量
ˆ1和 ˆ2,且 ˆ1 ˆ2, 为一给定概率,称作显
1 为置信水平,若关系式 而称区间( 著性水平, P {ˆ1 ˆ2 } 1 成立,
t X
x/
n 1
x 为样本的标准差
等等
利用t分布进行参数区间估计的通式
例子
从某小学三年级随机抽取12名学生阅读能力
得分为28,32,36,22,34,30,33,25, 31,33,29,26。试估计该校三年级阅读能 力总体均数在95%和99%的置信区间。
提示:要先查t(11).05和t(11).01的值。
ˆ1 , ˆ2)为参数 的置信水平 1 下的区间 ˆ1和 ˆ2 分别称为置信区间的下

估计或置信区间。 信限和上置信限。
以总体均 数为例说 明总体参 数区间估 计做法
即1- α , 置信水平 (.95); 而α为 显著性水平 (.05)
参数的区间估计(1)

σ已知条件下总体平均数的区间估计
当总体σ 为已知,总体呈正态分布,样本容量n
无论大小时,或者当总体σ 已知,虽总体不呈正 态分布,但样本容量大(n>30)时,样本均数与 总体均数的离差统计量均呈正态分布。总体均数 可按Z分布,用已知σ 计算
例:σ 已知时总体均数的区间估计
某小学10岁全体女童身高历年来标准差为
6.25cm,现从该校随机抽25名10岁女童,平 均身高为134.2cm,试估计该校10岁全体女 童平均身高的95%和99%的置信区间。
可表示为:Zα/2
通式为: P { X Z /
2
n X Z /
2
n}
即总体均数在 X Z / 2
1 的置信水平下的置信区 n , X Z /
2
间为
n
参数的区间估计(2)
σ未知条件下总体均数的区间估计

(4)充分性:一个估计量充分地利用了样本提供的所有 有关待估参数的信息,就称其为充分估计量
点估计


点估计有许多具体的方法,如矩法、最大似然法、最 小平方法和贝叶斯估计法等。下面以最简单的矩法为 例。 矩法的基本思想就是用样本统计量直接作为相对应的 总体参数的估计量 [例]从总体X中抽取一个容量为5的样本,其观察值是: 100,120,105,122,111。求总体平均数与总体方差的点估 计值。
2

2
1 n
我们就得到如下定理:
定理1
设总体X服从分布F(x),(X1,X2,…,Xn)是抽自
该总体的一个简单随机样本,则总体均数μ 与样 本均数 X 、总体方差σ 2(或标准差σ )与样本均 2 数的方差 (或标准差 X <又称标准误>)之间存 X 在下述关系:
X X
2,用区间( 1, 2)作为参数
1和
可能的取值范围,
并指出参数落在这一区间的概率。即区间估计
判断估计量的优劣标准

(1)无偏性

根据抽样分布原理,样本平均数的数学期望 (即平均数) ,故 作为总体平均数的 估计量时,是一个无偏估计量。但样本方差S2n 却是一个有偏估计量,若要使其无偏,则须用 其另一种算法S2,有时标记为S2n-1即:
相关文档
最新文档