卡方检验案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卡方检验案例
某医院进行了一项研究,调查了男性和女性的偏好口味。
根据样本数据,男性有150人,其中有80人喜欢咸味的食品,70人喜欢甜味的食品;女性有200人,其中有100人喜欢咸味的食品,100人喜欢甜味的食品。
现在我们想要了解男性和女性的口味偏好是否存在差异。
步骤1:建立假设。
-零假设H0:男性和女性偏好口味的分布相同。
-备择假设H1:男性和女性偏好口味的分布不同。
步骤2:选取显著性水平和自由度。
假设显著性水平为α=0.05(5%),自由度为1(因为只有两个样本)。
步骤3:计算期望频数。
在卡方检验中,需要计算期望频数来判断观察值(样本数据)与期望
值(假设下的预期值)之间的差异。
期望频数可以通过下面的公式计算:期望频数=总样本数×每个分类的比例。
在这个例子中,总样本数为350(150个男性和200个女性),咸味
和甜味的比例已知。
我们可以使用下面的公式计算期望频数:男性咸味期望频数=(150×0.5)×(80/150)=40。
男性甜味期望频数=(150×0.5)×(70/150)=35。
女性咸味期望频数=(200×0.5)×(100/200)=50。
女性甜味期望频数=(200×0.5)×(100/200)=50。
步骤4:计算卡方值。
计算卡方值,使用下面的公式:
卡方值 = sum [(观察值 - 期望值)^2 / 期望值]。
其中“sum”表示对所有分类的卡方值求和,即:
卡方值=[(80-40)²/40]+[(70-35)²/35]+[(100-50)²/50]+[(100-50)²/50]。
计算得到的卡方值为36.8。
步骤5:查找临界值。
根据设定的显著性水平和自由度,可以在卡方分布表中查找对应的临界值。
在这个例子中,自由度为1,显著性水平为0.05。
查表得到临界值为3.84。
步骤6:做出结论。
根据卡方分布表,当卡方值大于临界值时,拒绝原假设,即认为男性和女性的口味偏好存在差异。
在这个例子中,计算得到的卡方值为36.8,明显大于临界值3.84。
因此,我们拒绝原假设,认为男性和女性的口味偏好存在差异。
结论:根据统计分析结果,男性和女性在口味偏好上存在显著差异。