高二数学统计案例PPT优秀课件

合集下载

高中数学第三章统计案例本章知识体系课件选修23高二选修23数学课件

高中数学第三章统计案例本章知识体系课件选修23高二选修23数学课件

12/9/2021
第十八页,共二十页。
规律方法 利用独立性检验,我们可以对用新药治病是否有 效作出合理的推断,避免凭主观意愿作出结论.
12/9/2021
第十九页,共二十页。
内容(nèiróng)总结
第三章
No Image
12/9/2021
第二十页,共二十页。
12/9/2021
第十七页,共二十页。
[解] 由题意可知: a=114,b=36,c=132,d=18,a+b=150,c+d=150, a+c=246,b+d=54,n=300,代入公式可得, χ2=a+bcn+add-ab+cc2b+d =3001×501×141×501×8-24366××514322≈7.317. 因为 χ2=7.317>6.635,因此我们有 99%的把握认为新措施 对防治猪白痢是有效果的.
得 z=-1.845t+11.69, 即 lny=-1.845t+11.69, 12/9/202∴1 回归方程为 y=e-1.845t+11.69.
第十四页,共二十页。
规律方法 本题是求非线性回归方程,通过换元 z=lny,则 交换后的样本点应该分布在 z=bt+a(a=lnm,b=n)的周围,这 样就可以利用线性回归模型来建立 y 和 t 之间的非线性回归方程 了.
12/9/2021
第四页,共二十页。
[例 1] 测得某国 10 对父子的身高(单位:英寸)如下表:
父亲身高 60 62 64 65 66 67 68 70 72 74
x/(英寸)
儿子身高 63 65
65 66 67 67 68 70
y/(英寸)
66
70
.6 .2
.5 .9 .1 .4 .3 .1

【课件】高二数学必修3《统计》课件

【课件】高二数学必修3《统计》课件

3.某校有行政人员、教学人员和教辅 人员共200人,其中教学人员与教辅 人员的比为101,行政人员有24人, 现采取分层抽样容量为50的样本,那 么行政人员应抽取的人数为 ( C ) A3 B4 C6 D8
教学人员和教辅人员应抽取的人数 40 和_____. 4 分别为_____
统计的基本思想方法:
(1)对总体中的个体进行编号(每个号码位数一致); (2)在随机数表中任选一个数作为开始; (3)从选定的数开始按一定的方向读下去,得到的数码 若不在编号中,则跳过;若在编号中,则取出;如果得到 的号码前面已经取出,也跳过;如此继续下去,直到取满 为止; (4)根据选定的号码抽取样本.
小结:
1.抽样无放回; 2.抽样公平性; 3.抽签法,随机数表法—简单的随机抽样.
说明:
1.Байду номын сангаас用与总体中个体有明显的层次差异,层次 分明的特点; 2.总体中个体数 N较大时,系统抽样,分层抽样 二者选其一.
以上我们学习了三种抽样方法,这些抽样方法 的特点及适用范围可归纳如下:
类别 特 点 相互联系 适用范围 共同点
简单随 从总体中逐个 机抽样 抽取 总体中 抽样 的个体个 过程中 数较少 每个个 在起始部 总体中 体被抽 的 个体 到的可 分抽样时, 采用 简 单随 个数较多 能性相 同 机抽样 总体由 差 异明 显的 几 部分组成
(2)总体容量比较大,用抽签法或随机数表法比较麻烦.由于人 员没有明显差异,且刚好32排,每排人数相同,可用系统抽样. (3)由于学校各类人员对这一问题的看法可能差异较大,故应 采用分层抽样方法.
例2.假设要考察某公司生产的500克袋状牛奶的质量是 否达标,现从800袋牛奶中抽取60袋进行检验,利用随 机数表抽样本时,先将800袋牛奶按000,001,…, 799进行编号,如果从随机表第8行第18列的数开始向 右读,请你依次写出最先检测的5牛奶的编号 (下面摘取了一随机数表的第7行至第9行)

高中数学第三章统计案例章末整合提升省公开课一等奖新名师优质课获奖PPT课件

高中数学第三章统计案例章末整合提升省公开课一等奖新名师优质课获奖PPT课件
32/60
(2)由题中数据可得 y =23.25.
由①^y=0.6x-1 求得数据如下:
^yi yi-^yi yi- y
12.8 15.2 22.4 23.6 26 28.4 29 30.8 -3.3 2.6 -1.2 2.3 1.5 -2.1 -0.8 -1.2 -13.75 -5.45 -2.05 2.65 4.25 3.05 4.95 6.35
23/60
• 典例 4 (·安徽涡阳四中月考)北京某高中举行了一次“ 喜迎五中全会”读书读报知识竞赛,参赛选手为从高一年 级和高二年级随机抽取各100名学生.图1和图2分别是高 一年级和高二年级参赛选手成绩频率分布直方图.
24/60
• (1)分别计算参加这次知识竞赛两个年级学生平均成绩;
• (2)若称成绩在68分以上学生知识渊博,试以上述数据预 计该高一、高二两个年级学生知识渊博率;
27/60
(3)补全 2×2 列联表,如下:
成绩低于 60 分人数 成绩不低于 60 分人数 总计
高一年级
80
20
100
高二年级
40
60
100
总计
120
80
200
根据表中数据得 K2 的观测值
k=20100×0×801×006×0-12200××84002≈33.33>6.635,
故在犯错误的概率不超过 0.010 的前提下,认为高一、高二两个年级学生这
(1)对变量 y 与 x 进行相关性检验; (2)如果 y 与 x 之间具有线性相关关系,求线性回归方程; (3)如果父亲的身高为 73 英寸,估计儿子的身高为多少.
• [分析] 对两变量进行相关性检验,首先利用公式求出r, 然后比较|r|与0.75大小关系,明确线性相关关系强弱,确 定回归模型,求出回归方程,再依据父亲身高预报儿子身 高.

高二数学统计学初步PPT教学课件

高二数学统计学初步PPT教学课件

年份
200 3
200 4
2005 2006 2007 2008 2009
2010
排放
试估量计
151
2004年

189.
地居1 民
194. 203. 220. 227. 232.
生8活污8水排放9 量,7并预3测
2016年生活污水排放量(单位:108 t).
【思路点拨】 要估计或预测,可考虑先剔除1999
专题二 用样本估计总体
总体估计要解决的问题主要是:运用频率分布 表、频率分布直方图、茎叶图、样本数据的平 均数、标准差等概念解决一些简单的实际问 题. 解决上述问题的关键是在表示样本数据的过程 中,学会列频率分布表、画频率分布直方图、 茎叶图,体会它们各自的特点;能根据实际问 题的需求合理选取样本,用样本的数字特征去 估计总体的数字特征.
轿车A 轿车B 轿车C 舒适型 100 150 z 标准型 300 450 600
按类用分层抽样的方法在这个月生产的轿车 中抽取50辆,其中有A类轿车10辆. (1)求z的值; (2)B类,C类轿车各应抽取多少? (3)在C类轿车中,按型号分层抽样,应各抽 取多少? 【思路点拨】 按类分层或者是按型号分层, 抽样比是相同的.
五组 20≤t<25
30
0.30
合计
100 1.00
(1)这次抽样的样本容量是多少? (2)在表中填写出缺失的数据并补全频率分布直 方图.
(3)旅客购票用时的平均数可能落在哪一小组? (4)若每增加一个购票窗口可使平均购票用时减 少5 min,要使平均购票用时不超过10 min, 那么你估计最少要增加几个窗口?
5.4
3
(2)请从四个不同的角度对这次测试进行分析: ①从平均数和方差结合分析偏离程度; ②从平均数和中位数结合分析谁的成绩好些; ③从平均数和命中9环以上的次数相结合看谁的 成绩好些; ④从折线图上两人射击命中环数及走势分析谁 更有潜力. 【思路点拨】 从折线图中列出每次射击的环 数,可填充表格,据此可估计总体情况.

统计案例PPT课件

统计案例PPT课件

结果解释与讨论
结果解释
根据数据分析结果,解释 学生成绩的整体表现和个 体差异,找出潜在的学习 问题。
结果讨论
根据结果,讨论可能影响 学生成绩的因素,提出教 学改进和学生学习的建议。
结论总结
总结案例分析的主要发现 和结论,强调统计方法在 教育领域的应用价值。
04 案例三:预测股票市场
问题描述
预测股票市场走势
讨论
探讨模型的优缺点,提出改进模 型的方法和建议,如增加特征、
优化模型参数等。
05 案例四:客户满意度调查
问题描述
总结词
明确、详细
调查目的
了解客户对公司产品和服务的满意度,识别潜在的问题和 改进点,提高客户忠诚度和满意度。
问题背景
随着市场竞争的加剧,客户满意度成为企业持续发展的重 要因素。本案例旨在调查某公司的客户满意度,分析其影 响因素,并提出相应的改进措施。

实际应用与启示
实际应用
说明案例中所采用的方法和思路在实际中的应用 情况,包括应用领域、应用效果等。
启示
从案例中得到启示,包括对数据分析的启示、对 实际应用的启示等。
未来研究方向
指出案例中存在的问题和不足,提出未来研究的 方向和展望。
THANKS FOR WATCHING
感谢您的观看
检查数据完整性,处理缺失值 和异常值,确保数据质量。
差异性分析
通过t检验或方差分析等方法, 比较不同学生群体(如性别、 班级等)的成绩差异。
数据收集
收集某班级学生的期末考试成 绩,整理成电子表格或数据库。
描述性统计分析
计算平均分、中位数、众数等 统计指标,了解学生成绩的整 体分布情况。
相关性分析

高中数学《统计与统计案例》课件

高中数学《统计与统计案例》课件
^
设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型y =99+17.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用 模型②得到的预测值更可靠.
13
考点整合
1.抽样方法 抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样, 体现了抽样的公平性,但又各有其特点和适用范围.
位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )
A.0.5
B.0.6
C.0.7
D.0.8
解析 法一 设调查的 100 位学生中阅读过《西游记》的学生人数为 x,则 x+80-60
=90,解得 x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计
值为17000=0.7.故选 C.
解 (1)由调查数据,男顾客中对该商场服务满意的比率为4500=0.8,因此男顾客对该商场
服务满意的概率的估计值为 0.8.女顾客中对该商场服务满意的比率为3500=0.6,因此女顾
客对该商场服务满意的概率的估计值为 0.6.
8
(2)K2 的观测值 k=100×5(0×405×0×207-0×303×010)2≈4.762. 由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务 的评价有差异.
^
利用模型②,该地区 2018 年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿 元).
12
(2)利用模型②得到的预测值更可靠. 理由如下: 从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y=-30.4+ 13.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型①不能很好地描述环境 基础设施投资额的变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加, 2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础

高中数学第1章统计案例本章方略总结课件a选修12a高二选修12数学课件

高中数学第1章统计案例本章方略总结课件a选修12a高二选修12数学课件

物理成绩.
12/9/2021
第九页,共三十七页。
【解析】 (1)具有较强的正相关 (2)(80,80.8) (3)将 x=60 代入方程 y=0.74x+21.6,得 y=66,所以,估计本次考试数学成绩为 60 分的学生的物理成绩为 66 分.
12/9/2021
第十页,共三十七页。
二、独立性检验
(1)研究变量 y 与 x 的相关关系时,计算得 r≈0.94,这说明 y 与 x 的相关程度是_______.
(2)求得 y 与 x 的线性回归方程之后,该方程所表示的直线一定过点__________.
(3)求得回归方程 y=0.74x+21.6 后,请估计该班本次考试数学成绩为 60 分的学生的
先假设两个分类变量无关系,再求 K2 的观测值 k 与临界值比较对照,从而确定范围
及相关无关的程度.
【例 3】 考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据
如下表所示:
种子灭菌 种子未灭菌 合计
黑穗病
26
184
210
无黑穗病
50
200
250
合计
76
384
460
试按照原试验目的作统计分析推断.
01 统计 案例 (tǒngjì)
本章方略(fānglüè)总结
12/9/2021
第一页,共三十七页。
1.回归直线方程y^ =a^ +b^ x 过( x , y )点,点( x , y )又叫样本点的中心.
12/9/2021
第二页,共三十七页。
2.样本相关系数 r 的计算公式为
n
xi- x yi- y
(ii)剔除离群值,即第 13 个数据,剩下数据的平均数为115(16×9.97-9.22)=10.02, 这条生产线当天生产的零件尺寸的均值的估计值为 10.02,

高中数学第三章统计案例课件a选修23a高二选修23数学课件

高中数学第三章统计案例课件a选修23a高二选修23数学课件
主食蔬菜 主食肉类 总计 50 岁以下 50 岁以上
总计 (3)能否在犯错误的概率不超过 0.01 的前提下认为“其亲属的饮 食习惯与年龄有关”?
第十七页,共二十五页。
【解】 (1)30 位亲属中 50 岁以上的人饮食多以蔬菜为主,50 岁以下的人饮食多以肉类为主. (2)2×2 列联表如表所示:
在考查黄烟是否经过药物处理与发生青花病 的关系时,得到如下数据:在试验的 470 株黄烟中,经过药物 处理的黄烟有 25 株发生青花病,60 株没有发生青花病;未经 过药物处理的有 185 株发生青花病,200 株没有发生青花病.试 推断经过药物处理跟发生青花病是否有关系.
第二十一页,共二十五页。
第八页,共二十五页。
【解】 (1)由散点图可以判断,y=c+d x适宜作为年销售量 y 关于年宣传费 x 的回归方程类型. (2)令 w= x,先建立 y 关于 w 的线性回归方程.
^c=―y -^d―w =563-68×6.8=100.6, 所以 y 关于 w 的线性回归方程为 y^=100.6+68w, 因此 y 关于 x 的回归方程为^y=100.6+68 x.
第九页,共二十五页。
(3)①由(2)知,当 x=49 时, 年销售量 y 的预报值^y=100.6+68 49=576.6, 年利润 z 的预报值^z=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润 z 的预报值 ^z=0.2(100.6+68 x)-x=-x+13.6 x+20.12. 所以当 x=132.6=6.8,即 x=46.24 时,^z取得最大值. 故年宣传费为 46.24 千元时,年利润的预报值最大.
第六页,共二十五页。
(1)根据散点图判断,y=a+bx 与 y=c+d x哪一个适宜作为年 销售量 y 关于年宣传费 x 的回归方程类型?(给出判断即可,不 必说明理由)

高中数学第一章统计案例本章知识体系课件选修12高二选修12数学课件

高中数学第一章统计案例本章知识体系课件选修12高二选修12数学课件
第十七页,共四十六页。
【例 2】 甲、乙 2 人各进行 1 次射击,如果 2 人击中 目标的概率都是 0.6,计算:
(1)2 人都击中目标的概率; (2)其中恰有 1 人击中目标的概率; (3)至少有 1 人击中目标的概率. 【分析】 利用公式:当 A,B 相互独立时,利用 P(A∩B) =P(A)·P(B)求解.
第三十八页,共四十六页。
【规律方法】 独立性检验在高中阶段题型单一,主 要是检验2×2列联表的独立性问题,其求解方法是先利用 公式求出χ2,再把它与三个临界值比较.
第三十九页,共四十六页。
两所学校的计算机算法语言学习小组统一测验成绩如 下.
甲校:16,20,12,15,23,8,16,19. 乙校:22,17,26,24,8,7,25,28. (1)求共同的中位数; (2)统计中位数上下的频数;
第二十八页,共四十六页。
【例 3】 已知:男人中有 5%患色盲,女人中有 0.25% 患色盲,从 100 个男人和 100 个女人中任选一人.
(1)求此人患色盲的概率; (2)如果此人是色盲,求此人是男人的概率. 【分析】 对于求概率问题,要判断是否为条件概 率.本题是条件概率可用条件概率公式计算.
第三十三页,共四十六页。
∴P(A)=23,P(B)=23,P(AB)=P(A)P(B)=49. 4
∴P(B|A共四十六页。
独立性检验
两个变量之间是否有关联,可通过 2×2 列联表用公 式 χ2=a+bcn+add-ab+cc2b+d计算,与临界值比较判断 两个变量之间的关联程度,χ2 越大,两个变量关联程度 越大.当 χ2≤2.706 时认为两个变量无关联;当 χ2>2.706 时有 90%的把握认为两个变量有关联;当 χ2>3.841 时就 有 95%的把握认为两变量有关联;当 χ2>6.635 时就有 99%的把握认为两个变量有关联.

高中数学第一章统计案例24课件选修12高二选修12数学课件

高中数学第一章统计案例24课件选修12高二选修12数学课件

当时,没有充分的证据(zhèngjù)判定变量A,B
; 有关联
当时,有
的把9握0%判定变量A,B有关联;
(guānlián)Fra bibliotek当时,有 的把握95判%定变量A,B有关联;
当时,有 的把9握9%判定变量A,B有关联.
12/9/2021
第八页,共三十四页。
[思考辨析 判断(pànduàn)正误] 1.列联表中的数据是两个分类变量的频数(pín shù).(√ ) 2.事件A与B的独立性检验无关,即两个事件互不影响.( ) × 是判断事件A与B是否相关的统计量.( ) √
体育
文娱
总计
男生
210
230
440
女生
60
290
350
总计
270
520
790
如何判定“喜欢体育还是文娱与性别是否(shì fǒu)有联系”?
答案 可通过表格与图形进行直观分析,也可通过统计分析定量(dìngliàng)判断.
12/9/2021
第五页,共三十四页。
梳理 设A,B为两个(liǎnɡ ɡè)变量,每一变量都可以取两个(liǎnɡ ɡè)值,得到表格.
A取 ,且变量A2B取
12/9/2021
时的数据B2.上表在统计中称为2×2列联表.
第六页,共三十四页。
知识点二 统计 量 (tǒngjì)
nad-bc2 χ2= a+bc+da+cb+d(其. 中(qízhōng)n=a+b+c+d为样本容量)
12/9/2021
第七页,共三十四页。
知识点三 独立性检验(jiǎnyàn)
总计 44 36 80
试问:是否有99%以上的把握认为“喜欢韩剧和性别有关系”?

高中数学 模块复习课 第1课时 统计案例课件 a选修12a高二选修12数学课件

高中数学 模块复习课 第1课时 统计案例课件 a选修12a高二选修12数学课件

12/12/2021
第十五页,共三十四页。
专题整合
专题
(zhuāntí)
归纳
高考(ɡāo
kǎo)体验
变式训练2对某校学生进行心理障碍测试(cèshì)得到如下列联表:
女生
男生
合计
焦虑
说谎
懒惰
合计
5
20
25
10
10
20
15
50
65
30
80
110
假设每个学生只存在其中一种心理障碍,试说明这三种心理障碍中哪一种
∴ =0.76x+0.4.
^
当 x=15 时, =0.76×15+0.4=11.8.
答案:B
12/12/2021
第二十页,共三十四页。
=
6.2+7.5+8+8.5+9.8
=8,
5
专题整合
专题
(zhuāntí)
归纳
高考(ɡāo
kǎo)体验
3.(2016·全国Ⅲ高考)下图是我国2008年至2014年生活(shēnghuó)垃圾无害化
积蔬菜年平均产量y(单位:t)之间的关系有如下(rúxià)数据:
x
70
74
80
78
85
92
90
95
92
108
115
123
130
138
145
y
5.1
6.0
6.8
7.8
9.0
10.2
10.0
12.0
11.5
11.0
11.8
12.2
12.5
12.8
13.0
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• (1)通过三维柱形图和二维条形图,可以粗 略地判断两个分类变量是否有关系,但是 这种判断无法精确地给出所得结论的可靠 程度.①在三维柱形图中,主对角线上两 个柱形高度的乘积ad与副对角线上的两个 柱形高度的乘积bc相差越大,H1成立的可 能性就越大.
• ①如果k≥10.828,就有99.9%的把握认为 “X与Y有关系”;②如果k≥7.879,就有 99.5%的把握认为“X与Y有关系”;③如 果k≥6.635,就有99%的把握认为“X与Y有 关系”;④如果k≥5.024,就有97.5%的把 握认为“X与Y有关系”;⑤如果k≥3.841, 就有95%的把握认为“X与Y有关系”;⑥ 如果k≥2.706,就有90%的把握认为“X与Y 有关系”;⑦如果k<2.706,就认为没有充 分的证据认为“X与Y有关系”.
分类变量
• 1.分类变量:变量的二不维同条“形图值”三表维柱示形个图体
所属的不同类别,这类变量称为

• 2.在独立性检验中,常用

直观地反映相关数据的总体情况.
• 3.样本频数列联表:一般地,假设有两
个分类变量X和Y,它们的可能取值分别为
{x1,x2}和{y1,y2},其样本频数列联表(即 2×2列联表)为:
• 3.独立性检验的基本方法
• 一般地,假设有两个分类变量X和Y,它们 的可能取值分别为{x1,x2}和{y1,y2},其 样本频数列联表(称为2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
• 若要推总断计的结a+论c为b:+Hd1:a“+Xb与d+Yc+有关系”, 可以按如下步骤判断结论H1成立的可能性:
• 3.2 独立性检验的基本思想 及其初步应用
• 1.通过对典型案例的探究,了解独立性检 验(只要求2×2列联表)的基本思想、方法及 初步应用
• 2.通过对数据的收集、整理和分析,增强 学生的社会实践能力,培养学生分析问题、 解决问题的能力.
• 本节重点、难点:独立性检验的思想方法 与初步应用.
• 1.两分类变量之间关联关系的定性分析
• (1)分类变量:取不同的“值”表示个体所 属不同类别的变量称为分类变量.
• 说明:①对分类变量的正确理解:这里的 “变量”和“值”都应作为广义的变量和 值进行理解.如:对于性别变量,其取值 为男、女两种,所以这里的“变量”指的 是“性别”,这里的“值”指的是“男” 和“女”.故这里所说的“变量”和“值” 不一定是具体的数值.
具几 的有乎.Y=没y1有的个关体系所,占的可比以例说a+aXb与,也Y是可以相估互计独满足立条件
X=x2 的个体中具有 Y=y1 的个体所占的比例c+c d,两个比
例的值相差越大,X 与 Y 有关的可能性就越大.
• 2.独立性检验 • (1)定义:利用随机变量
• K2=
(其中n=a+b+c
+d)来确定是否能以一定把握认为“两个
• 根据表中数据,能否在犯错误的概率不超 过0.001的问题的看法与 性别无关”,
• 由列联表中的数据,可以得到:
• ≈125.161>10.828 • 又P(K2≥10.828)≈0.001,
• 故在犯错误概率不超过0.001的前提下认为 对“男女同龄退休”这一问题的看法与性 别有关.
• 一般地,假设有两个分类变量X和Y,它们
的可能取值分别为{x1,x2}和{y1,y2},其 样本频率列联表(即2×2列联表)如下表:
y1 y2
总计
x1 a b
a+b
x2 c d
c+d
总计 a+c b+d
a+b+c +d
• 在三维柱形图中,主对角线上两个柱形高 度的乘积ad与副对角线上的两个柱形高度 的乘积bc相差越大,说明X与Y有关的可能 性在越二大维,条形当图a中d与,可bc以的估差计趋满足近条于件零X=时x1,的X个与体中Y
• (2)如何用K2的值判断X与Y之间是否有关?
• 首先列2×2列联表,当得到的观测数据a, b,c,d都不小于5时,由2×2列联表求出 K2的观测值k.若k≥10.828,则我们有99.9% 的把握认为X与Y有关,这种判断结果出错 的可能性约为0.1%;若k≥6.635,则我们有 99%的把握认为X与Y有关,这种判断结果 出错的可能性约为1%;若k≥2.706,则我 们有90%的把握认为X与Y有关,这种判断 结果出错的可能性约为10%;若k<2.706, 则没有充分的证据显示X与Y有关,但也不 能认为X与Y无关.
• [点评] 可以利用独立性检验来判断两个分 类变量是否有关系,具体做法是:
y1 y2 合计
x1 a b a+b
x2 c d c+d
总 计
a+c
b+ d
a+b+c +da+b+c+d
• K2= 为样本容量).
(其中n=
• 独4.立性利检用验随机变量K2来确定是否能以一定把
握认为“两个分类变量有关系”的方法称
为两个分类变量的

• [例1] 某电视台联合相关报社对“男女同 龄退休”这一公众关注的问题进行了民意 调查,数据如下赞表同所示反:对 总计 男 198 217 415 女 476 109 585 总计 674 326 1000
• ②分类变量是大量存在的,如吸烟变量有 吸烟与不吸烟两种类别,而国籍变量则有 多种类别.
• (2)频率分析:通过对样本中每个分类变量 的不同类别的事件发生的频率大小比较来 分析分类变量之间是否有关联.
• (3)图形分析:利用三维柱形图及二维条形 图来分析分类变量之间是否具有关联分析, 图形的形象直观更能说明相关数据的总体 状况.
分类变量有关系”的方法称为两个分类变
量的独立性检验.独立性检验的基本思想
类似于反证法,要确认“两个分类变量有
关系”这一结论成立的可信程度,首先假
设该结论不成立,即假设结论“两个分类
变量没有关系”成立,在该假设下随机变
量K2应该很小.
• 如果由观测数据计算得到的K2的观测值k 很大,则在一定可信程度上说明假设不合 理.根据随机变量K2的含义,可以通过概 率P(K2≥k0)的大小来评价该假设不合理的 程度有多大,从而得出“两个分类变量有 关系”这一结论成立的可信程度有多大.
相关文档
最新文档