数理统计假设检验(2015)2剖析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

K0
{ 2

2 1
(r
1)}
二、卡方拟合检验
2. 分布的卡方拟合检验
设样本X1,K , X n来自总体F (x), H0 : F (x) F0 (x), H1 : F (x) F0 (x)
不妨设X为连续,将X的取值区间[a, b]进行m等分,a0, a1,..., am
统计区间[ai, ai+1)上的样本频数vi , 表示实际频数,又计算
设Ai中实际频数为vi, 在H0下,理论频数为npi, 在H0下,实际频数vi与理论频数npi应相差不大。
皮尔逊提出如下统计量:
2 = r(vi npi )2
i 1
npi
并且, 2 = r(vi npi )2 ~ 2 (n 1)
i 1
npi
(在H 0下)
H0的拒绝域为:
首先对参数p进行估计。
矩估计:X 10 pˆ
列表计算:
pˆ X 10



1 10
1 100
100 i 1
xi
1 10 1000 i0 ivi 0.1
次品数 0
1
2 >=3
p0 0.910 0.3487
频数 35 40 18 7
p1 10 0.1 0.99 0.3874
另一方面,02.95(2)=5.991
结论:接受H0,认为次品数X服从二项分布B(10,0.1).
问题2 问每周需求量是否服从正态分布?
需求量 (件/周) 10~20 20~30 30~40 40~50 50~60 60~70 70~80 80~90 90~100
品尝者 1
23 4
56
7
8
9 10
A饮料 10 8 6 8
75
1
3
9
7
B饮料 6 5 2 2
46
4ห้องสมุดไป่ตู้
5
9
8
问两种饮料评分是否有显著差异?
H0 : F1(x) F2 (x), H1 : F1(x) F2 (x)
归纳问题:
(1) H0 : X ~ F0 (x), H1 : X 不服从分布F0 (x) (2) H0 : X 与Y独立, H1 : X 与Y不独立 (3) H0 : F1(x) F2 (x), H1 : F1(x) F2 (x)
二、卡方拟合检验
1. 分类数据的卡方检验 收集分类数据的目的是分析在各类中数据的分布。 以问题1为例。设矿泉水品牌为X,
1 2 3
X
~

p1
p2
p3

问题的提出:假设某项指标X被分成r类: A1, A2,..., Ar
H0 : Ai类所占的比例为pi ,i 1, 2,..., r
二、卡方拟合检验
二、卡方拟合检验
注意: 1. 卡方统计量的另一种表达式:
m
2=
vi2
n
i1 npi
2. 卡方拟合检验主要用于大样本场合,要求各类的观测
频数不小于5,因此往往需要把一些相邻类合并达到
要求。
3. 区间的划分具有人为性。
问题1 问顾客对这三种矿泉水的喜好是否存在差异?
H0
:
p1

p2

p3

1, 3
pi P{ai X ai1} 在H0下 F0 (ai1) F0 (ai )
在H0下,理论频数为npi, 构造统计量 2 = m(vi npi )2
i 1
npi
并且, 2 = m(vi npi )2 ~ 2 (n 1 l)
i 1
npi
其中,l为分布F0 (x)中未知参数个数。
工作表现 不满意 满意 很满意 合计 地 东北 21 121 58 200 西北 18 133 49 200 区 东南 10 147 43 200 西南 18 138 44 200 合计 67 539 194 800
H0 : 工作表现与地区独立, H1 : 工作表现与地区不独立
问题4 某饮料厂家采用两种不同配方推出两种新的饮料,现 抽取了10位消费者,让他们分别品尝两种饮料并加以评分, 从不喜欢到喜欢,其分数表示为1~10,评分结果如下:
H1
:
至少一个比例超过
1 3
品牌 1 2 3
实际频数 人数 61 53 36
理论频数 50 50 50
(vi npi )2 121 9 196
2 = 121 9 196 =2.42 0.18 3.92 6.52
50 50 50
另一方面,02.95(2)=5.991
结论:拒绝H0,顾客的喜爱存在差异。
第7章 假设检验(2)
—— 非参数检验
问题的提出:
1. 推断一组数据的分布; 2. 两组数据是否相关,是否独立; 3. 两组数据是否有显著差异; ……
一、某些实际问题
问题1 某超市为了调查顾客对三种品牌矿泉水的喜好比 例,以便为下一次进货提供决策,随机观察了150名 购买者,并记录下他们所买的品牌,统计数据如下:
例2 检查产品质量时,每次抽取10个产品检验,共 抽取100次。得下表:
次品数X 0 1 2 3 4 5 6 7 8 9 10 频数 35 40 18 5 1 1 0 0 0 0 0
问次品数是否服从二项分布?( =0.05)
H0 : X ~ B(10, p), H1 : X 不服从B(10, p)
品牌 1 2 3 人数 61 53 36
问顾客对这三种矿泉水的喜好是否存在显著差异?
H0
:
p1

p2

p3

1, 3
H1
:
至少一个比例超过
1 3
问题2 某超市的库存管理员需要掌握商品的库存规律, 以便制定某商品的库存计划。为此,库存管理员统计 了一年中每周需求量:
需求量 (件/周) 10~20 20~30 30~40 40~50 50~60 60~70 70~80 80~90 90~100
周数
2
1
6
8
17 12
5
0
1
问每周需求量是否服从正态分布?
H0 : X ~ N (, 2 ), H1 : X 不服从正态分布
问题3 某教育研究部门想研究大学生毕业后参加工作的表现
是否与上学的地区有关,为此调查了毕业一年后工作的大学
生800人。按东南、西南、西北、东北四个地区各200人进行
调查,然后请工作单位对它们的表现给予评价:
理论频数 34.87 38.74 19.37 5.74 p2 C120 0.12 0.98 0.1937
vi2
35.13 41.3 16.73 8.54
p3 1 p0 p1 p2 0.0574
npi
4
2=
vi2 100
101.7 100 1.7
i1 npi
相关文档
最新文档