高二数学统计案例PPT教学课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 1.两分类变量之间关联关系的定性分析
• (1)分类变量:取不同的“值”表示个体所 属不同类别的变量称为分类变量.
• 说明:①对分类变量的正确理解:这里的 “变量”和“值”都应作为广义的变量和 值进行理解.如:对于性别变量,其取值 为男、女两种,所以这里的“变量”指的 是“性别”,这里的“值”指的是“男” 和“女”.故这里所说的“变量”和“值” 不一定是具体的数值.
• ②分类变量是大量存在的,如吸烟变量有 吸烟与不吸烟两种类别,而国籍变量则有 多种类别.
• (2)频率分析:通过对样本中每个分类变量 的不同类别的事件发生的频率大小比较来 分析分类变量之间是否有关联.
• (3)图形分析:利用三维柱形图及二维条形 图来分析分类变量之间是否具有关联分析, 图形的形象直观更能说明相关数据的总体 状况.
• 根据表中数据,能否在犯错误的概率不超 过0.001的前提下认为对这一问题的看法与
• [解析] 假设H0:“对这一问题的看法与 性别无关”,
• 由列联表中的数据,可以得到:
• ≈125.161>10.828 • 又P(K2≥10.828)≈0.001,
• 故在犯错误概率不超过0.001的前提下认为 对“男女同龄退休”这一问题的看法与性 别有关.
分类变量
• 1.分类变量:变量的二不维同条“形图值”三表维柱示形个图体
所属的不同类别,这类变量称为
.
• 2.在独立性检验中,常用
和
直观地反映相关数据的总体情况.
• 3.样本频数列联表:一般地,假设有两
个分类变量X和Y,它们的可能取值分别为
{x1,x2}和{y1,y2},其样本频数列联表(即 2×2列联表)为:
• 3.2 独立性检验的基本思想 及其初步应用
• 1.通过对典型案例的探究,了解独立性检 验(只要求2×2列联表)的基本思想、方法及 初步应用
• 2.通过对数据的收集、整理和分析,增强 学生的社会实践能力,培养学生分析问题、 解决问题的能力.
• 本节重点、难点:独立性检验的思想方法 与初步应用.
分类变量有关系”的方法称为两个分类变
量的独立性检验.独立性检验的基本思想
类似于反证法,要确认“两个分类变量有
关系”这一结论成立的可信程度,首先假
设该结论不成立,即假设结论“两个分类
变量没有关系”成立,在该假设下随机变
量K2应该很小.
• 如果由观测数据计算得到的K2的观测值k 很大,则在一定可信程度上说明假设不合 理.根据随机变量K2的含义,可以通过概 率P(K2≥k0)的大小来评价该假设不合理的 程度有多大,从而得出“两个分类变量有 关系”这一结论成立的可信程度有多大.
• 一般地,假设有两个分类变量X和Y,它们
的可能取值分别为{x1,x2}和{y1,y2},其 样本频率列联表(即2×2列联表)如下表:
y1 y2
总计
x1 a b
a+b
x2 c d
c+d
总计 a+c b+d
a+b+c +d
• 在三维柱形图中,主对角线上两个柱形高 度的乘积ad与副对角线上的两个柱形高度 的乘积bc相差越大,说明X与Y有关的可能 性在越二大维,条形当图a中d与,可bc以的估差计趋满足近条于件零X=时x1,的X个与体中Y
• [点评] 可以利用独立性检验来判断两个分 类变量是否有关系,具体做法是:
• 3.独立性检验的基本方法
• 一般地,假设有两个分类变量X和Y,它们 的可能取值分别为{x1,x2}和{y1,y2},其 样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+dຫໍສະໝຸດ Baidu
• 若要推总断计的结a+论c为b:+Hd1:a“+Xb与d+Yc+有关系”, 可以按如下步骤判断结论H1成立的可能性:
• (1)通过三维柱形图和二维条形图,可以粗 略地判断两个分类变量是否有关系,但是 这种判断无法精确地给出所得结论的可靠 程度.①在三维柱形图中,主对角线上两 个柱形高度的乘积ad与副对角线上的两个 柱形高度的乘积bc相差越大,H1成立的可 能性就越大.
• ①如果k≥10.828,就有99.9%的把握认为 “X与Y有关系”;②如果k≥7.879,就有 99.5%的把握认为“X与Y有关系”;③如 果k≥6.635,就有99%的把握认为“X与Y有 关系”;④如果k≥5.024,就有97.5%的把 握认为“X与Y有关系”;⑤如果k≥3.841, 就有95%的把握认为“X与Y有关系”;⑥ 如果k≥2.706,就有90%的把握认为“X与Y 有关系”;⑦如果k<2.706,就认为没有充 分的证据认为“X与Y有关系”.
y1 y2 合计
x1 a b a+b
x2 c d c+d
总 计
a+c
b+ d
a+b+c +da+b+c+d
• K2= 为样本容量).
(其中n=
• 独4.立性利检用验随机变量K2来确定是否能以一定把
握认为“两个分类变量有关系”的方法称
为两个分类变量的
.
• [例1] 某电视台联合相关报社对“男女同 龄退休”这一公众关注的问题进行了民意 调查,数据如下赞表同所示反:对 总计 男 198 217 415 女 476 109 585 总计 674 326 1000
具几 的有乎.Y=没y1有的个关体系所,占的可比以例说a+aXb与,也Y是可以相估互计独满足立条件
X=x2 的个体中具有 Y=y1 的个体所占的比例c+c d,两个比
例的值相差越大,X 与 Y 有关的可能性就越大.
• 2.独立性检验 • (1)定义:利用随机变量
• K2=
(其中n=a+b+c
+d)来确定是否能以一定把握认为“两个
• (2)如何用K2的值判断X与Y之间是否有关?
• 首先列2×2列联表,当得到的观测数据a, b,c,d都不小于5时,由2×2列联表求出 K2的观测值k.若k≥10.828,则我们有99.9% 的把握认为X与Y有关,这种判断结果出错 的可能性约为0.1%;若k≥6.635,则我们有 99%的把握认为X与Y有关,这种判断结果 出错的可能性约为1%;若k≥2.706,则我 们有90%的把握认为X与Y有关,这种判断 结果出错的可能性约为10%;若k<2.706, 则没有充分的证据显示X与Y有关,但也不 能认为X与Y无关.