第五章参数估计基础(7版1)_PPT幻灯片
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
右对称。 2)t来自百度文库布的形状与样本例数n有关。自由度越
小,则 S X 越大,t 值越分散,曲线的峰部越矮,尾部
翘的越高。
3) 当 n→∞时,则S逼近σ,t分布逼近标准
正态分布。 t分布不是一条曲线,而是一簇曲线。
21
22
第二节 t 分布
与单侧概率相对应的t值用 t , 表示,与双侧概率相对
应的t值用 t / 2, 表示。
为σ的正态分布N(µ,σ2)转变为µ=0,σ=1的标准正态分布,
即将正态变量值X用
Z X来代 替。
X 也服从正态分布,X
X
服从标准正态分布N(0,1)
z X X
SX
X
t X
SX
服从ν=n-1的t分布
19
第二节 t 分布
20
第二节 t 分布
二、t 分布的图形和t 分布表
t分布曲线特点: 1) t分布曲线是单峰分布,它以0为中心,左
1)从正态总体N(µ,σ2)中,随机抽取例数为n的多
个样本,样本均数 X服从正态分布;即使是从偏态
总体中随机抽样,当n足够大时(如n>50), X 也近 似正态分布。
2)从均数为µ,标准差为σ的正态或偏态总体中抽 取例数为n的样本,样本均数的标准差即标准误 X 。
X
/
n
12
第一节 抽样分布与抽样误差
二、置信区间的计算
(一)总体均数的置信区间
24
第三节 总体均数及总体概率的估计
1.点估计: 用样本统计量直接作为总体参数的估计值。
例如 于2000年测得某地27例健康成年男性血红蛋白量 的样本均数为125g/L,试估计其总体均数。
X ,即认为2000年该地所有健康成年男性血红 蛋白量的总体均数为125g/L 。
例5-1 2000年某研究所随机调查某地健康成 年男子27人,得到血红蛋白的均数为125g/L,标 准差为15g/L 。试估计该样本均数的抽样误差。
S X S / n 1/5 2 7 2 .8g /9 l
15
第一节 抽样分布与抽样误差
二 、样本频率的抽样分布与抽样误差
从同一总体中随机抽出观察单位相等的多个样本, 样本率与总体率及各样本率之间都存在差异,这种差 异是由于抽样引起的,称为频率的抽样误差。
13
X / n(标准误的理论值)
标准误的大小与σ的大小成正比,与n的平方根成 反比,而σ为定值,说明可以通过增加样本例数来减 少标准误,以降低抽样误差。
σ未知,用样本标准差S来估计总体标准差σ。
SX S/ n (标准误的估计值)
用 S X 来表示均数抽样误差的大小。
14
第一节 抽样分布与抽样误差
1.各样本均数未必等于总体均数; 2.样本均数之间存在差异; 3.样本均数的分布很有规律,围绕着总体均数,中 间多,两边少,左右基本对称,也服从正态分布。 4.样本均数的变异较之原变量的变异大大缩小。
8
9
第一节 抽样分布与抽样误差
10
11
第一节 抽样分布与抽样误差
数理统计推理和中心极限定理表明:
表示频率的抽样误差大小的指标叫频率的标准误。
16
第一节 抽样分布与抽样误差
据数理统计的原理,率的标准误用 P 表示
P
1
n
π :总体率,n:样本例数。
当π未知时,p π(当样本含量足够大,且
p和1-p不太小)
公式为:
P1P
SP
n
S P :率的标准误的估计值,p:样本率。
17
第一节 抽样分布与抽样误差
表8-2 100个样本均数的频数表与标准误的计算表
身高组段 频数 组中值 fx
fx2
152.6~
1
153.2~
4
153.8~
4
154.4~
22
155.0~
25
155.6~
21
156.2~
17
156.8 ~
3
157.4 ~
2
158.0 ~
1
合计
100
152.9 153.5 154.1 154.7 155.3 155.9 156.5 157.1 157.7 158.3
由于t分布是以0为中心的对称分布,表中只列出 了正值,故查表时,不管t值正负只用绝对值表示。
23
第三节 总体均数及总体概率的估计
一、参数估计的概念
统计推断包括参数估计和假设检验。参数估计就 是用样本指标(统计量)来估计总体指标(参数)。
参数估计
点估计(point estimation) 区间估计(interval estimation)
同理,例5-2中776名50岁以上的中老年妇女骨质疏松症的样本 患病率作为总体患病率的点值估计值,即认为该市所有50岁以 上的中老年妇女骨质疏松症的总体患病率约为41.5%。
25
第三节 总体均数及总体概率的估计
例5-2 某市随机调查了50岁以上的中老年妇女 776人,其中患有骨质疏松症者322人,患病率为 41.5%,试计算该样本频率的抽样误差。
P 1 P 0 .41 1 0 .4 515
S P
n
0 .01 1 .7 7 % 7 7 776
18
第二节 t 分布
一、t分布的概念
在统计应用中,可以把任何一个均数为µ,标准差
学习要点
一、抽样分布与抽样误差 掌握标准误的概念和计算
二、t 分布 掌握 t 分布的图形特征及 t 值表的使用
三、总体均数及总体概率的估计 掌握置信区间的计算方法、决定置信区间
优劣的两个要素。
1
第一节 抽样分布与抽样误差
统计分析:统计描述和统计推断 统计推断(statistical inference )——从总体中随 机抽取一个样本,通过样本信息了解总体特征或参 数,这种方法叫统计推断。 统计推断:参数估计和假设检验 参数估计( estimation of parameter ) ——样本指 标值(统计量)估计总体指标值(参数)的过程。
2
第一节 抽样分布与抽样误差
参数估计:点值估计和区间估计
点值估计(Point estimation ):就是用相应样本统 计量直接作为其总体参数的估计值。
区间估计(Confidence interval CI):按预先给定 的概率(1-α)估计总体参数的可能范围,该范围就称 为总体参数的1-α置信区间。
3
抽样实验:假定从13岁女学生身高总体均数 15.45(cm ) , 总体标准差 5.3(cm ) 的正态总体中进行随机抽样。
6
抽样实验:假定从13岁女学生身高总体均数 15.45(cm ) , 总体标准差 5.3(cm ) 的正态总体中进行随机抽样。
7
第一节 抽样分布与抽样误差
❖样本均数的分布特点:
小,则 S X 越大,t 值越分散,曲线的峰部越矮,尾部
翘的越高。
3) 当 n→∞时,则S逼近σ,t分布逼近标准
正态分布。 t分布不是一条曲线,而是一簇曲线。
21
22
第二节 t 分布
与单侧概率相对应的t值用 t , 表示,与双侧概率相对
应的t值用 t / 2, 表示。
为σ的正态分布N(µ,σ2)转变为µ=0,σ=1的标准正态分布,
即将正态变量值X用
Z X来代 替。
X 也服从正态分布,X
X
服从标准正态分布N(0,1)
z X X
SX
X
t X
SX
服从ν=n-1的t分布
19
第二节 t 分布
20
第二节 t 分布
二、t 分布的图形和t 分布表
t分布曲线特点: 1) t分布曲线是单峰分布,它以0为中心,左
1)从正态总体N(µ,σ2)中,随机抽取例数为n的多
个样本,样本均数 X服从正态分布;即使是从偏态
总体中随机抽样,当n足够大时(如n>50), X 也近 似正态分布。
2)从均数为µ,标准差为σ的正态或偏态总体中抽 取例数为n的样本,样本均数的标准差即标准误 X 。
X
/
n
12
第一节 抽样分布与抽样误差
二、置信区间的计算
(一)总体均数的置信区间
24
第三节 总体均数及总体概率的估计
1.点估计: 用样本统计量直接作为总体参数的估计值。
例如 于2000年测得某地27例健康成年男性血红蛋白量 的样本均数为125g/L,试估计其总体均数。
X ,即认为2000年该地所有健康成年男性血红 蛋白量的总体均数为125g/L 。
例5-1 2000年某研究所随机调查某地健康成 年男子27人,得到血红蛋白的均数为125g/L,标 准差为15g/L 。试估计该样本均数的抽样误差。
S X S / n 1/5 2 7 2 .8g /9 l
15
第一节 抽样分布与抽样误差
二 、样本频率的抽样分布与抽样误差
从同一总体中随机抽出观察单位相等的多个样本, 样本率与总体率及各样本率之间都存在差异,这种差 异是由于抽样引起的,称为频率的抽样误差。
13
X / n(标准误的理论值)
标准误的大小与σ的大小成正比,与n的平方根成 反比,而σ为定值,说明可以通过增加样本例数来减 少标准误,以降低抽样误差。
σ未知,用样本标准差S来估计总体标准差σ。
SX S/ n (标准误的估计值)
用 S X 来表示均数抽样误差的大小。
14
第一节 抽样分布与抽样误差
1.各样本均数未必等于总体均数; 2.样本均数之间存在差异; 3.样本均数的分布很有规律,围绕着总体均数,中 间多,两边少,左右基本对称,也服从正态分布。 4.样本均数的变异较之原变量的变异大大缩小。
8
9
第一节 抽样分布与抽样误差
10
11
第一节 抽样分布与抽样误差
数理统计推理和中心极限定理表明:
表示频率的抽样误差大小的指标叫频率的标准误。
16
第一节 抽样分布与抽样误差
据数理统计的原理,率的标准误用 P 表示
P
1
n
π :总体率,n:样本例数。
当π未知时,p π(当样本含量足够大,且
p和1-p不太小)
公式为:
P1P
SP
n
S P :率的标准误的估计值,p:样本率。
17
第一节 抽样分布与抽样误差
表8-2 100个样本均数的频数表与标准误的计算表
身高组段 频数 组中值 fx
fx2
152.6~
1
153.2~
4
153.8~
4
154.4~
22
155.0~
25
155.6~
21
156.2~
17
156.8 ~
3
157.4 ~
2
158.0 ~
1
合计
100
152.9 153.5 154.1 154.7 155.3 155.9 156.5 157.1 157.7 158.3
由于t分布是以0为中心的对称分布,表中只列出 了正值,故查表时,不管t值正负只用绝对值表示。
23
第三节 总体均数及总体概率的估计
一、参数估计的概念
统计推断包括参数估计和假设检验。参数估计就 是用样本指标(统计量)来估计总体指标(参数)。
参数估计
点估计(point estimation) 区间估计(interval estimation)
同理,例5-2中776名50岁以上的中老年妇女骨质疏松症的样本 患病率作为总体患病率的点值估计值,即认为该市所有50岁以 上的中老年妇女骨质疏松症的总体患病率约为41.5%。
25
第三节 总体均数及总体概率的估计
例5-2 某市随机调查了50岁以上的中老年妇女 776人,其中患有骨质疏松症者322人,患病率为 41.5%,试计算该样本频率的抽样误差。
P 1 P 0 .41 1 0 .4 515
S P
n
0 .01 1 .7 7 % 7 7 776
18
第二节 t 分布
一、t分布的概念
在统计应用中,可以把任何一个均数为µ,标准差
学习要点
一、抽样分布与抽样误差 掌握标准误的概念和计算
二、t 分布 掌握 t 分布的图形特征及 t 值表的使用
三、总体均数及总体概率的估计 掌握置信区间的计算方法、决定置信区间
优劣的两个要素。
1
第一节 抽样分布与抽样误差
统计分析:统计描述和统计推断 统计推断(statistical inference )——从总体中随 机抽取一个样本,通过样本信息了解总体特征或参 数,这种方法叫统计推断。 统计推断:参数估计和假设检验 参数估计( estimation of parameter ) ——样本指 标值(统计量)估计总体指标值(参数)的过程。
2
第一节 抽样分布与抽样误差
参数估计:点值估计和区间估计
点值估计(Point estimation ):就是用相应样本统 计量直接作为其总体参数的估计值。
区间估计(Confidence interval CI):按预先给定 的概率(1-α)估计总体参数的可能范围,该范围就称 为总体参数的1-α置信区间。
3
抽样实验:假定从13岁女学生身高总体均数 15.45(cm ) , 总体标准差 5.3(cm ) 的正态总体中进行随机抽样。
6
抽样实验:假定从13岁女学生身高总体均数 15.45(cm ) , 总体标准差 5.3(cm ) 的正态总体中进行随机抽样。
7
第一节 抽样分布与抽样误差
❖样本均数的分布特点: