届《创新设计》人教A版高考数学(文)大一轮复习课件 第10章统计、统计案例及概率 第3讲

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基础诊断
考点突破
课堂总结
每周平均体育运动时间与性别列联表
男生 女生 总计
每周平均体育运动时间不超过 4 小时 45 30 75
每周平均体育运动时间超过 4 小时 165 60 225
总计
210 90 300
结合列联表可算得 K2=3007×5×452×256×0-21106×5×90302=12010≈4.762
k0
2.706 3.841 6.635 7.879
基础诊断
考点突破
课堂总结
解 (1)300×145500000=90,所以应收集 90 位女生的样本数据. (2)由频率分布直方图得 1-2×(0.100+0.025)=0.75,所以该校 学生每周平均体育运动时间超过 4 小时的概率的估计值为 0.75. (3)由(2)知,300 位学生中有 300×0.75=225 人的每周平均体育 运动时间超过 4 小时,75 人的每周平均体育运动时间不超过 4 小时.又因为样本数据中有 210 份是关于男生的,90 份是关于 女生的.所以每周平均体育运动时间与性别列联表如下:
-152x+a^过点(-4,25),代入方程得 25=-152×(-4)+a^,解得
a^=757.
答案
77 5
基础诊断
考点突破
课堂总结
考点三 独立性检验 【例3】 (2014·安徽卷)某高校共有学生15 000人,其中男生10
500人,女生4 500人.为调查该校学生每周平均体育运动 时间的情况,采用分层抽样的方法,收集300位学生每周平 均体育运动时间的样本数据(单位:小时). (1)应收集多少位女生的样本数据? (2)根据这300个样本数据,得到学生每周平均体育运动时间 的频率分布直方图(如图所示),其中样本数据的分组区间 为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校 学生每周平均体育运动时间超过4小时的概率;
民点抽取了100位居民进行调查,经过计算K2≈0.99,根据
这一数据分析,下列说法正确的是
()
A.有99%的人认为该电视栏目优秀
B.有99%的人认为该电视栏目是否优秀与改革有关系
C.有99%的把握认为该电视栏目是否优秀与改革有关系
D.没有理由认为该电视栏目是否优秀与改革有关系
解析 只有K2≥6.635才能有99%的把握认为该电视栏目是否
平均气温(℃) -2 -3 -5 -6 销售额(万元) 20 23 27 30
根据以上数据,用线性回归的方法,求得 y 与 x 之间的线 性回归方程^y=b^x+a^的系数b^=-152,则a^=________.
基础诊断
考点突破
课堂总结
解析 由表中数据可得 x =-4,y =25,所以线性回归方程y^=
基础诊断
考点突破
课堂总结
(2)回归直线方程的求法——最小二乘法. 设具有线性相关关系的两个变量 x,y 的一组观察值为(xi, yi)(i=1,2,…,n),则回归直线方程^y=a^+b^x 的系数为:
其中
x
=1nn xi,
y
=1n
n
yi,(
x

y
)称为样本点的_中__心__.
i=1
i=1
基础诊断
基础诊断
考点突破
课堂总结
考点一 相关关系的判断
【例 1】 (1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2, x1,x2,…,xn 不全相等)的散点图中,若所有样本点(xi,yi)(i =1,2,…,n)都在直线 y=12x+1 上,则这组样本数据的
样本相关系数为
()
基础诊断
考点突破
课堂总结
知识梳理
1.变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另 一类是_相__关__关__系__;与函数关系不同,__相__关__关__系__是一种非 确定性关系. (2)从散点图上看,点散布在从左下角到右上角的区域内, 两个变量的这种相关关系称为_正__相__关__,点散布在左上角到 右下角的区域内,两个变量的相关关系为_负__相__关__.基础诊断来自考点突破课堂总结
3.独立性检验 (1) 分 类 变 量 : 变 量 的 不 同 “ 值 ” 表 示 个 体 所 属 的 _不__同__类_ _别__,像这类变量称为分类变量. (2)列联表:列出两个分类变量的_频__数__表__,称为列联表.假 设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和 {y1,y2},其样本频数列联表(称为2×2列联表)为
^
回归方程的关键.(2)回归直线方程y
=b^x+a^ 必过样本点中心
( x ,y ).(3)在分析两个变量的相关关系时,可根据样本数据作
出散点图来确定两个变量之间是否具有相关关系,若具有线性
相关关系,则可通过线性回归方程来估计和预测.
基础诊断
考点突破
课堂总结
【训练2】 (2014·云南检测)春节期间,某销售公司每天销售某 种取暖商品的销售额y(单位:万元)与当天的平均气温x(单 位:℃)有关.现收集了春节期间这个销售公司4天的x与y 的数据列于下表:
基础诊断
考点突破
课堂总结
第3讲 变量间的相关关系、统计案例
最新考纲 1.会作两个有关联变量的数据的散点图,会利用散 点图认识变量间的相关关系;2.了解最小二乘法的思想,能根 据给出的线性回归方程系数公式建立线性回归方程;3.了解独 立 性 检 验 ( 只 要 求 2×2 列 联 表 ) 的 基 本 思 想 、 方 法 及 其 简 单 应 用;4.了解回归分析的基本思想、方法及其简单应用.
故所求回归方程为^y=0.3x-0.4.
(2)由于变量 y 的值随 x 值的增加而增加(b^=0.3>0),故 x 与 y 之
间是正相关.
(3)将 x=7 代入回归方程可以预测该家庭的月储蓄为
y=0.3×7-0.4=1.7(千元).
基础诊断
考点突破
课堂总结
规律方法 (1)正确理解计算b^,a^的公式和准确的计算是求线性
数学成绩有关,某人数学成绩优秀,则他有 99%的可能物理
优秀.
(× )
基础诊断
考点突破
课堂总结
2.下面哪些变量是相关关系 A.出租车车费与行驶的里程 B.房屋面积与房屋价格 C.身高与体重 D.铁块的大小与质量 答案 C
()
基础诊断
考点突破
课堂总结
3.为了评价某个电视栏目的改革效果,在改革前后分别从居
基础诊断
考点突破
课堂总结
2.回归分析 对具有_相__关__关__系__的两个变量进行统计分析的方法叫回归分 析.其基本步骤是:(ⅰ)画散点图;(ⅱ)求回__归__直__线__方__程__; (ⅲ)用回归直线方程作预报. (1)回归直线:如果散点图中点的分布从整体上看大致在 _一__条__直__线__附近,就称这两个变量之间具有线性相关关系, 这条直线叫做回归直线.
基础诊断
考点突破
课堂总结
x1 x2 总计
2×2 列联表
y1
y2
总计
a
b
a+b
c
d
c+d
a+c b+d a+b+c+d
nad-bc2 构造一个随机变量 K2=___a_+___b__c_+__d__a_+__c__b_+__d__ _,其中 n
=_a_+__b_+___c+__d__为样本容量. (3)独立性检验 利用随机变量_K_2_来判断“两个分类变量_有__关__系__”的方法称为 独立性检验.
【例2】 从某居民区随机抽取10个家庭,获得第i个家庭的月收入
xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得
10
10
10
10
xi=80,yi=20,xiyi=184,x2i =720.
i=1
i=1
i=1
i=1
(1)求家庭的月储蓄y对月收入x的线性回归方程=x+;
(2)判断变量x与y之间是正相关还是负相关;
数,则
()
A.r2<r1<0
B.0<r2<r1
C.r2<0<r1
D.r2=r1
解析 对于变量Y与X而言,Y随X的增大而增大,故Y与X正
相关,即r1>0;对于变量V与U而言,V随U的增大而减 小,故V与U负相关,即r2<0,所以选C. 答案 C
基础诊断
考点突破
课堂总结
考点二 回归方程的求法及回归分析
考点突破
课堂总结
(3)相关系数 当r>0时,表明两个变量_正__相__关__; 当r<0时,表明两个变量_负__相__关__. r的绝对值越接近于1,表明两个变量的线性相关性_越__强__. r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关 关系.通常|r|大于0.75时,认为两个变量有很强的线性相关 性.
优秀与改革有关系,而既使K2≥6.635也只是对“该电视栏
目是否优秀与改革有关系”这个论断成立的可能性大小的
结论,与是否有99%的人等无关.故只有D正确.
答案 D
基础诊断
考点突破
课堂总结
4.(2014·湖北卷)根据如下样本数据
x3 4 5 6 7 8 y 4.0 2.5 -0.5 0.5 -2.0 -3.0
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
n
xiyi-n x y
附:线性回归方程^y=b^x+a^中,b^=i=1

n
x2i -n x 2
a^= y -b^
i=1
x ,其中 x , y 为样本平均值.
基础诊断
考点突破
课堂总结
解 (1)由题意知 n=10, x =n1n xi=8100=8, i=1
y =n1n yi=2100=2, i=1
10
又x2i -10 x 2=720-10×82=80,
i=1
10
xiyi-10 x y =184-10×8×2=24,
i=1
基础诊断
考点突破
课堂总结
10
xiyi-10 x y
由此得b^=i=1
10
=2840=0.3,
x2i -10 x 2
i=1
a^= y -b^ x =2-0.3×8=-0.4,
基础诊断
考点突破
课堂总结
诊断自测
1.判断正误(在括号内打“√”或“×”) 精彩 PPT 展示
(1)通过回归方程^y=b^x+a^可以估计和观测变量的取值和变
化趋势.
(√ )
(2)事件 X,Y 关系越密切,则由观测数据计算得到的 K2 的
观测值越大.
(√ )
(3)由独立性检验可知,有 99%的把握认为物理成绩优秀与
得到的回归方程为^y=b^x+a^,则
()
A.a^>0,b^<0
B.a^>0,b^>0
C.a^<0,b^<0
D.a^<0,b^>0
解析 作出散点图,由散点图可知b^<0,a^>0,故选 A.
答案 A
基础诊断
考点突破
课堂总结
5.(人教A选修1-2P13例1改编)在一项打鼾与患心脏病的调查 中,共调查了1 671人,经过计算K2的观测值k=27.63,根 据这一数据分析,我们有理由认为打鼾与患心脏病是 ________的(填“有关”或“无关”). 答案 有关
基础诊断
考点突破
课堂总结
解析 (1)所有点均在直线上,则样本相关系数最大即为1,故 选D. (2)由图(1)可知,各点整体呈递减趋势,x与y负相关;由图(2) 可知,各点整体呈递增趋势,u与v正相关. 答案 (1)D (2)C 规律方法 对两个变量的相关关系的判断有两个方法:一是根 据散点图,具有很强的直观性,直接得出两个变量是正相关或 负相关;二是计算相关系数法,这种方法能比较准确地反映相 关程度,相关系数的绝对值越接近1,相关性就越强,相关系 数就是描述相关性强弱的,相关性有正相关和负相关.
A.-1
B.0
1
C.2
D.1
基础诊断
考点突破
课堂总结
(2)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图
(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点
图(2).由这两个散点图可以判断
()
A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关
基础诊断
考点突破
课堂总结
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4 小时,请完成每周平均体育运动时间与性别列联表,并判断是
否有95%的把握认为“该校学生的每周平均体育运动时间与性 别有关”.
附:K2=a+bcn+add-ab+cc2 b+d
P(K2≥k0) 0.10 0.05 0.010 0.005
基础诊断
考点突破
课堂总结
【训练1】 变量X与Y相对应的一组数据为(10,1),(11.3,2),
(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为
(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与
X之间的线性相关系数,r2表示变量V与U之间的线性相关系
相关文档
最新文档