应用统计学第四章推断统计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(一般指不小于30,且 np, n(1 p) 都大于5),
样本比率的抽样分布近似正态分布。设总体比率为P ,
则有
近似
p
~
P(1 P)
N ( P,
)
n
比率的检验统计量为
Z pP p(1 p) n
第四章 统计推断
例5:某公司为了分析新产品的电视广告效果,随机访问了100名 用户,了解到其中有36人是通过电视广告了解该产品的。试 以0.05的显著性水平作出判断,此项调查结果是否支持全部用 户有一半以上是通过电视广告了解该产品的假定是否正确?
解 此问题即要检验
检验统计量
H0 : 0 1000 ; H1 : 0
t x 0
s/ n
而由已知可得, x 950, s, 10,0 0 10,00n=25,计算得到
t 2.5
备择假设为“<” ,则是左侧检验,拒绝域为 t t (n 1) 。
查表求得 t (n 1) t0.05 (24) 1.7,10可9 知
S/ n
第四章 统计推断
例1 某厂生产某种型号的内胎,从长期的生产经验知道 其扯断强力服从均值0 =1380(N/㎝),标准差 =50 (N/㎝)的正态分布。 该厂为提高产品的质量,改变 了原来的配方进行现场生产试验。设新配方生产的内胎 其扯断强力仍服从正态分布。由于在试验中除配方外, 其他条件都保持不变,因此可以认为新配方未改变此型 号内胎扯断强力的方差。 采用新配方的5 次试验,测得 内胎扯断强力为(单位:N/㎝):1450,1460,1360, 1430,1420,试问采用新配方,是否能提高内胎的扯 断强力?
主
第一节 参数估计
要
内
第二节 假设检验
容
第四章 统计推断
一、 概念 1、参数估计:在抽样分布及抽样分布的基础上,据样 本统计量来推断总体参数的统计方法。
2、 估计量:用来估计总体参数的统计量的名称; 估计值:计算得到的样本估计量的具体数值
第四章 统计推断
点估计: 用样本估计量直接作为总体参数估计值 3、
例3:从某公司生产的一批瓶装产品中,随机抽取10罐产品, 测得每罐的重量分别为318、320、322、321、321、323、319、 320、320、324(克),以95%的置信度求该公司这批产品平 均重量的置信区间。(产品重量服从正态分布)
第四章 统计推断
复习:设 X1, X 2, , X来n 自正态总体 N (, 的2 ) 样本, X , S 2 分别为样本的均值和方差。则 X ~ N (, 2 );
则有
近似
p
~
P(1 P)
N ( P,
)
n
对于置信度1 ,P的置信区间为
p(1 p)
p(1 p)
( p z / 2
n , p z / 2
) n
第四章 统计推断
由样本比率的抽样分布可以知,当样本容量n 足够
(一般指不小于30,且 np, n(1 p) 都大于5),
样本比率的抽样分布近似正态分布。设总体比率为P ,
第四章 统计推断
例2:某食品生产企业以生产袋装食品为主,每天的产量为 8000袋左右,按照规定每袋的重量应为100克,为对产品质量 进行监测,企业质检部门从某天生产的一批产品中随机抽取 了64袋,测得该样本的均值为105.36克,标准差为10克,试 估计该批产品平均重量的置信区间为多少?(置信度为95%)
第四章 统计推断
(三)有效性
是指估计量与总体参数的离散程度应该很小,即估计 量的方差应该很小,这样才能保证估计量的取值集中 在被估计的总体参数的附近,对总体参数的估计和推 断更可靠。
第四章 统计推断
引题:大样本(n 30 ),由中心极限定理可知,不论总体服从什么分布,X ~ N(, 2 ) ,
例6:一家制造厂仅当原材料的抗强度方差不超过5时,方予接 受材料,今从一批新到的原材料中抽出24个样本,测得方差 为7,这个数据能否为制造厂拒绝这批原材料提供充分依据? (ɑ=0.05)
例5:某城市要估计下岗职工中女性所占的比例,随机抽取 了100个职工,其中65人为女性。对于置信度95%,试求 该城市下岗职工中女性所占的比例的置信区间为多少?
第四章 统计推断
一、 假设检验的基本问题
1、假设检验:在总体的分布函数已知,但参数未知时, 先对总体分布中的未知参数(均值、比率、方差)提 出假设,利用样本提供的信息来检验这个假设,即接 受此假设还是拒绝此假设。
第四章 统计推断
解:第一步:提出假设 H0 : 0; H1 : 0
第二步:计算检验统计量
z x 0 / n
解得 x 1424, =50,0 =1380,求得 z 1.97
Βιβλιοθήκη Baidu
第三步:确定拒绝域,备择假设为“>”,则为右侧检验,拒绝
域为 Z> Z , =0.05, Z = z0.05 1.645
t t (n 1)
故拒绝原假设,认为这批元件不合格。
第四章 统计推断
例3:有人说某学院学生平均每天锻炼时间至少为30分 钟, 随机在该学院抽取100名学生,测得他们每天的 平均锻炼时间为31分钟,标准差为12分钟,试在显著 性水平为0.05时,检验该人的说法是否可信?
例4:某停车场管理员认为,该停车场每辆车平均停车 时间不会超过30分钟,现从该停车场随机抽取16辆汽 车进行观测,测得平均停车时间为28分钟,标准差为 5.3分钟,试在ɑ=0.05时,检验该管理人员的说法是否 可信?(车辆的停车时间服从正态分布)
n
(n 1)S 2
2
~
2 (n 1);
样本来自正态总体,则总体方差 2 的置信区间为
(n 1)S 2 (n 1)S 2
(
2 /2
(n
1)
,
2 1
/2
(n
) 1)
第四章 统计推断
由样本比率的抽样分布可以知,当样本容量n 足够
(一般指不小于30,且 np, n(1 p) 都大于5),
样本比率的抽样分布近似正态分布。设总体比率为P ,
第四步:由 z 1.97,可知Z > Z ,落在拒绝域,拒绝原假设。
第四章 统计推断
2 2 2
X ~ t(n 1) S/ n
t X 0
S/ n
Z X 0 / n
第四章 统计推断
例2 某种元件,按照标准其使用寿命不低于1000(小时),现从生产 出的一批元件中随机抽取25件,测得其平均寿命为950(小时),样本 标准差为100(小时)。 假设该种元件寿命服从正态分布,对于置信度 95%,试问这批元件是否可以认为合格?
的概率,记为 P{ } 1 ,则总体参数真值
有 100(1)% 的可能性落在置信区间 ( , ) 内。
其中 为事先给定的概率值,称为显著性水平。
第四章 统计推断
(一) 无偏性
样本估计量的均值等于该样本统计量所估计的总体参 数的真实值,则称该估计量为无偏估计量。
(二)一致性 也称为相合性,当样本容量n增加时,如果估计量越来 越接近总体参数的真实值,则称这个估计量为一致估 计量。
则有
近似
p
~
P(1 P)
N ( P,
)
n
对于置信度1 ,P的置信区间为
p(1 p)
p(1 p)
( p z / 2
n , p z / 2
) n
第四章 统计推断
例4:对某种奶粉进行检查,从中随机抽取20袋,测得样本 的平均重量为250.8克,标准差为1.25克,已知其重量服从 正态分布,求总体方差在置信度为90%时的置信区间为多 少?
X
S/ n
~ t(n 1)
,求总体均值 的置信度为1 的置信区间。
第四章 统计推断
例1 现从一批灯泡中随机地取16只,测的其使用寿命(以小时为单位) 如下表所示。
1510 1520 1480 1500 1450 1480 1510 1520
1480 1490 1530 1510 1460 1460 1470 1470
6、检验统计量:据样本观测计算得到的,并据此对原假设和备择假设 做出决策的某个样本统计量
7、 假设检验的类型及拒绝域的决定: 双侧检验,备择假设为“≠”,拒区域位于临界值两侧; 右侧检验,备择假设为“>”,拒区域位于临界值右侧; 左侧检验,备择假设为“<”,拒区域位于临界值左侧;
第四章 统计推断
第一步:根据实际问题的要求,提出原假设和备择假设; 第二步: 给定显著性水平以及样本容量; 第三步:确定检验统计量及其分布,并由原假设的内容
第四章 统计推断
x
Z
X
Z
1
x
第四章 统计推断
第四章 统计推断
“弃真”错误:原假设为真时, 我们却作出拒绝的错 误决策, 称这类为第一类错误。该错误发生的概率
为 。
“取伪”错误:当原假设为假时, 我们却接受了原假设, 称这类错误为第二类错误。
第四章 统计推断
第四章 统计推断
5、拒绝域:拒绝原假设的统计量所有可能取值组成的集合。
简写成
X
n
z
2
X
n
z , X
2
n
z
2
第四章 统计推断
1、一个总体均值 的置信区间:
(1)大样本(n ≥ 30)时,总体均值的置信区间为:
①方差
2已知时: (X
n
z / 2 , X
n
z / 2 )
②方差 2未知时: (X
S n z /2 , X
S n
z /2 )(用
S2 代替
2)
补充:当样本来自非正态总体时,应将样本容量增加到30 以上,再进行抽样和区间估计,均值的置信区间同上面推 导的大样本(n ≥ 30)的情况。
第四章 统计推断 N(, 2)
复习:设 X1, X 2, , X来n 自正态总体 N (,的2 ) 样本, 分别为样本的均值和方差。则 X ~ N(, 2 );
n (n 1)S 2 ~ 2(n 1);
2
X,S2
方差的检验统计量为: 2 (n 1)S 2
2 0
第四章 统计推断
由样本比率的抽样分布可以知,当样本容量n足够大
n
为未知,设 X1, X2, , Xn 是来自总体 X 的样本,求 的置信度为1 的置信区间。
解:
因X
~
N
(,
2 n
)
,则令
Z=
X
/
n
~
N (0,1)
P (z Z z ) 1
2
2
P z 2
X / n
z 1
2
PX
n
z<< X
2
n
z
2
1
第四章 统计推断
这样,我们就得到了 的一个置信度为1 的置信区间
设灯泡的使用寿命近似地服从正态分布,试求灯泡的平均使用寿命95%的 置信区间 。
解 :总体的方差未知,故总体均值的置信区间为:
(X
S n
t
/2 (n
1),
X
S n
t
/
2
(n
1))
而,经过计算得, x 1490, s 24.77,又查表得, t0.025 (15) 2.1315
故所求的置信区间为(1476.8, 1503.2)。
第四章 统计推断
(2)样本来自正态总体 N (, 2 )
样本容量为小样本即(n < 30)时,总体均值的置信区间为:
①
2
已知时,
(X
n
z / 2 , X
n
z / 2 )
② 2 未知时,
(X
S n
t / 2 (n
1),
X
S n
t
/2
(n
1))
第四章 统计推断
2
推导:设 方差,则
X1, X2,L , Xn 来自正态总体 N(, 2) 的样本, X , S 2 分别为样本的均值和
确定拒绝域的形式(构建统计量);
第四步: 由 P {拒绝 H0|H0为真}= 求出拒绝域;
第五步;根据样本观测值计算检验统计量的具体值; 第六步;作出拒绝还是接受原假设的统计判断。
第四章 统计推断
X ~ N(, 2 ) n
2 2
X ~ N(0,1) / n
Z X 0 / n
2
Z X 0
区间估计:在点估计基础上,依照一定的概率保证度 用样本估计值估计出总体参数取值的区间 范围。
4、置信区间:
由样本统计量所构造的总体参数的估计区间,用
( , )来表示,即(置信下限,置信上限)。
第四章 统计推断
5、置信水平也称为置信度用 (1表) 示
(1 ) 表示置信区间 ( , ) 包括总体参数真值