应用统计-卡方检验与方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用统计
第七章:卡方检验与方差分析
卡方检验
• 【非参数统计 】对总体的具体形式不必作任何的 限制性假设和不以总体参数具体数值估计为目的 的推断统计。
– 能用于定性变量(即定名测定和序列测定的变量) ; – 方法直观,易于理解,运算比较简单。 – 缺点是检验的功效不如参数检验方法。
• 主要方法: χ 2检验、曼—惠特尼U检验、等级相 关检验、成对比较检验、游程检验、多个样本的 检验。
Байду номын сангаас
2
( f0 fe)2 fe
2拟合优度检验
(例题1分析)
步骤三:取 0.05。由于 拟 2合优度检验是单边检验,
因为零的 表明2 分布是一致的。与零的任何偏差都
是正的,这是因为 是由 2 平方和确定的, 永远 2不会
是负值。在此题中,由于k=4,所以k-1=3,即 自 由度为3,在 0.0的5 条件下,临界值为
拟合优度检验的步骤
检验步骤
(1)对总体分布建立假设 H0:总体服从某种理论分布 H1:总体不服从该理论分布
(2)抽样并对样 本资料编成频数 分布(f0)
(3)以“原假设H0 为真”导出一组 期望频数(fe)
(4)计算检验统计量 χ2=∑(f0-fe)2/fe
(5)χ2=∑(f0-fe)2/fe 给 定的α查χ2表,得到临 界值
– 例如,航空业官员也许在理论上认为机票购买者的年 龄服从某种特殊的分布。为了接受或拒绝该分布,随 机选取机票购买者年龄的真实样本,使用拟合优度检 验比较观察值与期望值。
– 在皮鞋制造业,生产商可以使用拟合优度检验确定一 年当中对其商品的需求是否服从均匀分布。
2拟合优度检验
• 2拟合优度检验中用来对假设进行检验的检验 统计量的形式如下:
2 ( f0 fe )2 df k 1 c fe
其中:f
观察值频数;
0
f:e 期望值频数;k
:类别总数;
c:样本数据中的参数数量。
– 因为期望频数的总数必须等于观察频数的总数,因此该检验丢失 了一个自由度,即来自样本的的观察总数被作为期望频数总数的 总数。
– 另外,在有些情况下,总体有参数。用样本数据估计,以确定期 望值的概率分布。每次进行估计,就丢失一个自由度。
(6)比较χ2值与临界值 作出检验判断
注意事项
(1)各组理论 频数fe不得小于5 ,如不足5,可 合并组;
(2)为使组数 不致太少,总频 数n>50;
(3)根据具 体情况确定自 由度。
2拟合优度检验
(例题分析)
【例1】有四家生产同种类型的产品在过去的一年里, 市场份额稳定在A公司47%,B公司34%,C公司11%, D公司8%. 最近各家公司都开发了各自“新型和改进 型”的产品代替当前在市场的产品。因此A公司市场 营销部门想知道这种新产品是否改变了市场份额。于
2检验
• 2检验是运用 2分布作为理论工具,在非参数统
计中可用于对总体的分布或随机变量的独立性进 行的检验。
• 2检验是1900年由英国统计学家卡•皮尔生
(K.Person)提出的,称为皮尔生定理。 • 当我们研究 K (K>2) 个事件时,可以测定 K 个
观察值与相应的理论值之间的差异,为此而构造
是聘请了一家专门搞市场份额评估的公司。该评估公
司组织进行一个抽样调查:随机选择了该城市各大超 市购物的207个消费者,以了解他们会选择哪种产品。 结果选用A、B、C、D公司产品的消费者比例如下:
公司 比例
A 109/207
B 62/207
C 15/207
D 21/207
从抽样结果判断市场份额有没有发生变化?
的统计量称为2 统计量。
2检验
• 皮尔生定理说明,当样本容量充分大时,样本
分成 K 类,每类实际出现的次数用f0表示,其理
论次数为fe,则2 统计量为
2 K f0 fe 2 且服从分布 2 (K 1)
i 1
fe
(f0-fe)比较小时,χ2值也较小;(f0-fe)比较大时,
期望频数( fe ) (0.47)(207)=97.29 (0.34)(207)=70.38 (0.11)(207)=22.77
D
8%
(0.08)(207)=16.56
2拟合优度检验
(n)
2检验的功效
• 拟合优度检验
– 利用样本信息对总体分布作出推断,检验总体 是否服从理论分布(正态分布或二项分布)。
• 独立性检验
– 用于判断2组或多组的资料是否彼此关联。
2拟合优度检验
• 拟合优度检验主要是比较总体变量的期望或理论 频数与分布的观察或实际的频数,确定期望值与 观察值之间是否存在差异。
• 分布的变量值始终为正
• 分布的形状取决于其自由度n的大小,通常为不 对称的正偏分布,但随着自由度的增大逐渐趋
于对称,一般当k≥30时,χ2分布可用正态分
布近似计算
2分布
(图示)
不同容量样本的抽样分布
n=1 n=4 n=10 n=20
2
2分布的使用
P{ 2
2
1
(n)}
2 1
χ2也较大。当χ2值大到按χ2分布超过设定的临界值时,
即为小概率事件,就可以认为实际结果与理论假设
不一致。
2检验
(χ2) 0
k=4 α=0.05
χ2 0.05(4)
χ2
=9.488
2分布
(2 distribution)
• 由阿贝(Abbe) 于1863年首先给出,后来由海尔 墨特(Hermert)和卡·皮尔逊(K·Pearson) 分别于 1875年和1900年推导出来
2拟合优度检验
(例题1分析)
步骤一:建立如下假设:
H0 : 1 47%, 2 34%,3 11%, 4 8%
即各公司的市场份额没有发生变化
H1 :1 47%,2 34%,3 11%,4 8%至少有一个不成立
即各公司的市场份额发生了变化
步骤二:使用的检验统计量
2 0.05
(3)
7.815
决策规则:如果计算得到的样本检验统计量的值大于 7.815,则拒绝原假设。
2拟合优度检验
(例题1分析)
步骤四:由样本计算样本检验统计量的值,分以 下几步完成:
(1)计算期望值(理论频数,见表) 表:公司份额期望频数的计算
公司 A B C
期望比例 47% 34% 11%
第七章:卡方检验与方差分析
卡方检验
• 【非参数统计 】对总体的具体形式不必作任何的 限制性假设和不以总体参数具体数值估计为目的 的推断统计。
– 能用于定性变量(即定名测定和序列测定的变量) ; – 方法直观,易于理解,运算比较简单。 – 缺点是检验的功效不如参数检验方法。
• 主要方法: χ 2检验、曼—惠特尼U检验、等级相 关检验、成对比较检验、游程检验、多个样本的 检验。
Байду номын сангаас
2
( f0 fe)2 fe
2拟合优度检验
(例题1分析)
步骤三:取 0.05。由于 拟 2合优度检验是单边检验,
因为零的 表明2 分布是一致的。与零的任何偏差都
是正的,这是因为 是由 2 平方和确定的, 永远 2不会
是负值。在此题中,由于k=4,所以k-1=3,即 自 由度为3,在 0.0的5 条件下,临界值为
拟合优度检验的步骤
检验步骤
(1)对总体分布建立假设 H0:总体服从某种理论分布 H1:总体不服从该理论分布
(2)抽样并对样 本资料编成频数 分布(f0)
(3)以“原假设H0 为真”导出一组 期望频数(fe)
(4)计算检验统计量 χ2=∑(f0-fe)2/fe
(5)χ2=∑(f0-fe)2/fe 给 定的α查χ2表,得到临 界值
– 例如,航空业官员也许在理论上认为机票购买者的年 龄服从某种特殊的分布。为了接受或拒绝该分布,随 机选取机票购买者年龄的真实样本,使用拟合优度检 验比较观察值与期望值。
– 在皮鞋制造业,生产商可以使用拟合优度检验确定一 年当中对其商品的需求是否服从均匀分布。
2拟合优度检验
• 2拟合优度检验中用来对假设进行检验的检验 统计量的形式如下:
2 ( f0 fe )2 df k 1 c fe
其中:f
观察值频数;
0
f:e 期望值频数;k
:类别总数;
c:样本数据中的参数数量。
– 因为期望频数的总数必须等于观察频数的总数,因此该检验丢失 了一个自由度,即来自样本的的观察总数被作为期望频数总数的 总数。
– 另外,在有些情况下,总体有参数。用样本数据估计,以确定期 望值的概率分布。每次进行估计,就丢失一个自由度。
(6)比较χ2值与临界值 作出检验判断
注意事项
(1)各组理论 频数fe不得小于5 ,如不足5,可 合并组;
(2)为使组数 不致太少,总频 数n>50;
(3)根据具 体情况确定自 由度。
2拟合优度检验
(例题分析)
【例1】有四家生产同种类型的产品在过去的一年里, 市场份额稳定在A公司47%,B公司34%,C公司11%, D公司8%. 最近各家公司都开发了各自“新型和改进 型”的产品代替当前在市场的产品。因此A公司市场 营销部门想知道这种新产品是否改变了市场份额。于
2检验
• 2检验是运用 2分布作为理论工具,在非参数统
计中可用于对总体的分布或随机变量的独立性进 行的检验。
• 2检验是1900年由英国统计学家卡•皮尔生
(K.Person)提出的,称为皮尔生定理。 • 当我们研究 K (K>2) 个事件时,可以测定 K 个
观察值与相应的理论值之间的差异,为此而构造
是聘请了一家专门搞市场份额评估的公司。该评估公
司组织进行一个抽样调查:随机选择了该城市各大超 市购物的207个消费者,以了解他们会选择哪种产品。 结果选用A、B、C、D公司产品的消费者比例如下:
公司 比例
A 109/207
B 62/207
C 15/207
D 21/207
从抽样结果判断市场份额有没有发生变化?
的统计量称为2 统计量。
2检验
• 皮尔生定理说明,当样本容量充分大时,样本
分成 K 类,每类实际出现的次数用f0表示,其理
论次数为fe,则2 统计量为
2 K f0 fe 2 且服从分布 2 (K 1)
i 1
fe
(f0-fe)比较小时,χ2值也较小;(f0-fe)比较大时,
期望频数( fe ) (0.47)(207)=97.29 (0.34)(207)=70.38 (0.11)(207)=22.77
D
8%
(0.08)(207)=16.56
2拟合优度检验
(n)
2检验的功效
• 拟合优度检验
– 利用样本信息对总体分布作出推断,检验总体 是否服从理论分布(正态分布或二项分布)。
• 独立性检验
– 用于判断2组或多组的资料是否彼此关联。
2拟合优度检验
• 拟合优度检验主要是比较总体变量的期望或理论 频数与分布的观察或实际的频数,确定期望值与 观察值之间是否存在差异。
• 分布的变量值始终为正
• 分布的形状取决于其自由度n的大小,通常为不 对称的正偏分布,但随着自由度的增大逐渐趋
于对称,一般当k≥30时,χ2分布可用正态分
布近似计算
2分布
(图示)
不同容量样本的抽样分布
n=1 n=4 n=10 n=20
2
2分布的使用
P{ 2
2
1
(n)}
2 1
χ2也较大。当χ2值大到按χ2分布超过设定的临界值时,
即为小概率事件,就可以认为实际结果与理论假设
不一致。
2检验
(χ2) 0
k=4 α=0.05
χ2 0.05(4)
χ2
=9.488
2分布
(2 distribution)
• 由阿贝(Abbe) 于1863年首先给出,后来由海尔 墨特(Hermert)和卡·皮尔逊(K·Pearson) 分别于 1875年和1900年推导出来
2拟合优度检验
(例题1分析)
步骤一:建立如下假设:
H0 : 1 47%, 2 34%,3 11%, 4 8%
即各公司的市场份额没有发生变化
H1 :1 47%,2 34%,3 11%,4 8%至少有一个不成立
即各公司的市场份额发生了变化
步骤二:使用的检验统计量
2 0.05
(3)
7.815
决策规则:如果计算得到的样本检验统计量的值大于 7.815,则拒绝原假设。
2拟合优度检验
(例题1分析)
步骤四:由样本计算样本检验统计量的值,分以 下几步完成:
(1)计算期望值(理论频数,见表) 表:公司份额期望频数的计算
公司 A B C
期望比例 47% 34% 11%