列联表和方差检验分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
普通啤酒 40 30 70
黑啤酒 20 10 30
合计 80 70 150
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
建立假设和检验的思路
H0: 啤酒的偏好与饮酒者的性别独立; H1: 啤酒的偏好与饮酒者的性别有关; 检验思路:
如果原假设是正确的,那么各单元 的观测频数与期望频数之差不会太大。 问题:如何计算各单元的期望频数?
3)抽样分布是什么? 4)拒绝域的形状? 5)注意的问题。
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
使用EXCEL解决我们的问题
关于市场份额的调查问题; 关于方差的检验问题。
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
回顾与展望
回忆两个变量的描述方法; 研究两个变量之间的关系; 更多的变量。
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
变量的类型与变量之间的关系 —回忆下面的表
性别 是否锻炼 男 非常喜欢 女 喜欢 女 一般 男 不太喜欢 男 很讨/12/77 03/21/78 09/30/80 02/12/81 06/21/77 08/20/76 10/11/79 02/12/83
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
我们的思路
这40个人起薪的差异可能是有什么原因 造成的? 专业不同可能是一个因素(如果原假设 为真的时候);专业之外的其它偶然因 素。 如何刻画这些差异性?
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
总变差的分解
•2000年12月
身高 170 175 165 179 153 180 172 167
体重 65 60 61 70 45 65 55 52
对这一个数据文件,可以提什么统计问题?
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
后面的内容
研究两个变量之间的关系: 两个变量有关系吗? 关系的强度是多少?
两个品质变量之间的关系: 列联表检验;
一个品质变量和一个数量变量之间的关系: 方差分析;
两个数量变量之间的关系: 相关与回归分析。
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
第六讲
列联表和方差分析
•2000年12月
2000年12月
•北京大学光华管理学院 王明进 陈奇志
阿尔伯特酿酒厂的啤酒
阿尔伯特酿酒厂生产三种类型的啤酒:淡啤酒、普通啤酒和
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
使用模型描述我们的问题
四个专业MBA的起薪分别服从正态分布 四个总体的方差是相等的。 检验假设:
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
使用双样本t检验?
能否分别对四个专业两两进行双样本的t 检验来完成对H0的检验? 犯第一类错误的概率是多少? 降低显著水平可以弥补吗?
第五讲复习(续)
正态总体方差的检验问题: 1)单个总体方差的双边检验; 2)单个总体方差的单边检验; 3)两个总体方差的双边检验; 4)两个总体方差的单边检验; 5)F分布。
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
第五讲复习(续)
拟合优度检验: 1)检验的思路什么? 2)检验的统计量:
70
黑啤酒 16 14 30
合计 80 70 150
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
检验统计量和拒绝域
检验统计量:
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
计算的结果
更深入的话题:
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
MBA的起薪与专业有关吗?
•北京大学光华管理学院 王明进 陈奇志
One-Factor ANOVA Partitions of Total Variation
Total Variation SST
= Variation Due to Treatment SSTR
+ Variation Due to Random Sampling SSE
Commonly referred to as: ▪ Sum of Squares Among, or ▪ Sum of Squares Between, or ▪ Sum of Squares Model, or ▪ Among Groups Variation
黑啤酒。在一次对三种啤酒的市场份额的分析中,公司市场研究 小组提出了男女饮酒者对三种啤酒的偏好是否有差异的问题,从 而帮助厂家针对不同的目标市场采取不同的广告策略。
他们抽样调查了150名饮酒者,每个人对三种啤酒的偏好汇 总如下表。他们需要判断性别与对啤酒的偏好是否有关系。
男性 女性 合计
淡啤酒 20 30 50
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
计算期望频数
一个饮酒者喜欢三种啤酒的概率分别是多少?
既然与性别独立,那么按照这种概率分布在调查的这 些男性中应该喜欢三种不同啤酒的人数是多少?女性 中呢?
H0成立时的期望频数:
男性 女性 合计
淡啤酒 26.67 23.33
50
普通啤酒 37.33 32.67
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
对数据的初步认识...
根据这些汇总,你的印象是什么?
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
了解几个术语
因变量或者响应变量(response variable); 自变量或者因子(factor); 因子的水平或处理(treatment); 单因子和多因子; 一般单因子方差分析问题的数据结构。 独立地采样的情况。
列联表和方差检验分析
2020/3/22
第五讲复习
请你举一个具体的例子说明方差作为一 个指标是有它的实际含义的。 如何估计总体的方差? 为了对方差作区间估计,需要样本方差 的抽样分布,我们使用的抽样分布是什 么?对任何类型的总体都可以使用该种 抽样分布吗?
•2000年12月
•北京大学光华管理学院 王明进 陈奇志
一家关于MBA报考、学习、就业指导的网站希望 了解国内MBA毕业生的起薪是否与各自所学的专业有 关,为此,他们在已经在国内商学院毕业并且获得学 位的MBA学生中按照专业分别随机抽取了10人,调查 了他们的起薪情况,数据如下表所示(单位: 万元) ,根据这些数据他们能否得出专业对MBA起薪有影响 的结论?