(湖南专用)高考数学一轮复习 第十一章概率与统计11.9回归分析与独立性检验课时作业 理
专题11 概率与统计第二十九讲 回归分析与独立性检验(解析版)
专题11 概率与统计第二十九讲 回归分析与独立性检验答案部分1.C 【解析】因为22.5x =,160y =,所以160422.570a =-⨯=,42470166y =⨯+=,选C .2.B 【解析】∵10.0x =,8.0y =,ˆ0.76b=,∴ˆ80.76100.4a =-⨯=, ∴回归方程为ˆ0.760.4yx ,把15x 代入上式得,ˆ0.76150.411.8y(万元),选B . 9.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为ˆ30.413.519226.1y=-+⨯=(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为ˆ9917.59256.5y=+⨯=(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线30.413.5y t =-+上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型ˆ9917.5yt =+可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分. 10.【解析】(Ⅰ)由折线图这数据和附注中参考数据得4=t ,28)(712=-∑=i i t t ,55.0)(712=-∑=i iy y,40.1749.32 2.89==-⨯=,99.0646.2255.089.2≈⨯⨯≈r .因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关相当高,从而可以用线性回归模型拟合y 与t 的关系.(Ⅱ)由331.1732.9≈=y 及(Ⅰ)得71721()()2.89ˆ0.10328()ii i ii tt y y b tt ==--==≈-∑∑, 92.04103.0331.1ˆˆ≈⨯-≈-=t b y a. 所以,y 关于t 的回归方程为:t y10.092.0ˆ+=. 将2016年对应的9=t 代入回归方程得:82.1910.092.0ˆ=⨯+=y. 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.11.【解析】(Ⅰ)由散点图可以判断,y c =+适宜作为年销售量y 关于年宣传费x 的回归方程类型.(Ⅱ)令w =y 关于w 的线性回归方程,由于81821()()108.8ˆ681.6()iii ii w w y y dw w ==--===-∑∑. ˆˆ56368 6.8100.6cy dw =-=-⨯=, 所以y 关于w 的线性回归方程为ˆ100.668y w =+,因此y 关于x 的回归方程为ˆ100.6y=+ (Ⅲ)(ⅰ)由(Ⅱ)知,当49x =时,年销售量y 的预报值ˆ100.6576.6y=+= 年利润z 的预报值ˆ576.60.24966.32z=⨯-=.(ⅱ)根据(Ⅱ)得结果知,年利润z的预报值ˆ0.2(100.620.12z x x=+-=-+.13.66.82==,即46.24x=时,ˆz取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。
考点11 回归分析与独立性检验(学生版)
考点11 回归分析与独立性检验概率与统计,是历年高考的必考点,尤其是新高考改革后,各卷都有考查,其主要考查内容有:数字特征与概率的计算问题、随机变量的均值与方差、回归分析与独立性检验、二项分布及其应用等。
例如:2021年全国高考乙卷(文)、(理)[17],2022年全国新高考卷Ⅱ[19],2022年全国乙卷(文)、(理)[19],2022年全国甲卷(文)[17],2022年北京高考[18]等都对数字特征与概率的计算问题进行了考查。
〔1〕回归分析的实际应用1.求回归直线方程(线性回归方程)的一般步骤 (1)画散点图; (2)求回归直线方程; (3)用回归直线方程进行预报。
2.利用回归方程进行预测,把回归直线方程看作一次函数,求函数值。
3.利用回归直线判断正、负相关,决定正相关还是负相关的是系数bˆ。
4.回归方程的拟合效果,可以利用相关系数判断,当||r 越趋近于1时,两变量的线性相关性越强。
〔2〕独立性检验的实际应用 1.独立性检验的一般步骤(1)根据样本数据列出2×2列联表;(2)计算随机变量2K 的观测值k ,查表确定临界值0k ;(3)如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过()02k K P ≥;否则,就认为在犯错误的概率不超过()02k K P ≥的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y有关系”。
2.独立性检验的应用可以利用独立性检验来推断两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度。
具体做法是: (1)根据实际问题需要的可信程度(或容许犯错误概率的上界)确定临界值0k ; (2)利用公式,由观测数据计算得到随机变量2K 的观测值k ;(3)如果0k k ≥,就说有()()%100102⨯≥-k K P 的把握认为“X 与Y 有关系”(或说在犯错误的概率不超过()2k K P ≥的前提下认为“X 与Y 有关系”),否则就说样本观测数据没有提供“X 与Y 有关系”的充分证据(或说在犯错误的概率不超过()02k K P ≥的前提下不能认为“X 与Y 有关系”)。
2023版高考数学一轮总复习11-1随机事件古典概型与几何概型课件
Ω的几何度量
考法一 古典概型概率的求法 1.求解古典概型概率的步骤
2.基本事件个数的确定方法 1)列举法:此法适合于基本事件个数较少的古典概型. 2)列表法:此法适合于从多个元素中选定两个元素的试验,也可看成坐标 法.
3)画树状图法:画树状图法是进行列举的一种常用方法,适用于有顺序的 问题及较复杂问题中基本事件个数的探求. 4)运用排列组合知识计算.
A39 7
答案 D
创新 生活中的概率问题 1.概率问题常与生活实际或数学文化相结合,主要考查学生的逻辑推 理、数据分析、数学抽象等核心素养. 2.解决这类问题的关键:①认真审题,把握信息;②弄清提供的问题情境的 意义;③抽象转化成数学问题,应用熟悉的数学知识解决.
例1 (2021湖南湘潭一模,7)德国心理学家艾宾浩斯研究发现,遗忘在学习 之后立即开始,而且遗忘的进程并不是均匀的.最初遗忘速度很快,以后逐 渐减慢.他认为“保持和遗忘是时间的函数”.他用无意义音节(由若干音 节字母组成,能够读出,但无内容意义,即不是词的音节)作为记忆材料,用 节省法计算保持和遗忘的数量,并根据试验结果绘成描述遗忘进程的曲 线,即著名的艾宾浩斯遗忘曲线(如图所示).若一名学生背了100个英语单 词,一天后,该学生在这100个英语单词中随机听写2个英语单词,以频率代 替概率,不考虑其他因素,则该学生恰有1个单词不会的概率大约为 ( )
m=5+4+3+2+1=15,则取到的整数十位数字比个位数字大的概率P= m =15
n 25
=3.
5
答案 B
考法二 几何概型概率的求法
例2 (2021辽宁辽南协作体联考,9)1876年4月1日,加菲尔德在《新英格兰 教育日志》上发表了勾股定理的一种证明方法,即在如图的直角梯形 ABCD中,利用“两个全等的直角三角形和一个等腰直角三角形的面积之 和等于直角梯形的面积”,可以简洁明了地推证出勾股定理.1881年加菲 尔德就任美国第二十任总统.后来,人们为了纪念他对勾股定理直观、易 懂的证明,就把这一证明方法称为“总统证法”.如图,设∠ECB=60°,在梯 形ABCD中随机取一点,则此点取自等腰直角△CDE(阴影部分)中的概率 是() A.2(2- 3 ) B.2- 3 C. 3 -1 D.2( 3-1)
【高考数学总复习】:回归性分析与独立性检验(知识点讲解+真题演练+详细解答)
量,例如某同学的数学成绩与化学成绩。
2.线性回归分析 (1) 散点图:将样本中的各对数据在直角坐标系中描点而得到的图形叫做散点图,它直观地 描述了两个变量之间是否有相关关系,是判断两个变量相关性的重要依据。 (2) 回归直线:散点图中点的整体分布在一条直线左右,则称这两个变量之间具有线性相关
(a b)(c d)(a c)(b d )
通过对统计量 K2 的研究,一般情况下认为:
①当 K 2 ≤3.841 时,认为变量 X 与 Y 是无关的。
②当 K 2 >3.841 时,有 95%的把握说变量 X 与 Y 有关;
④ 当 K 2 >6.635 时,有 99%的把握说变量 X 与 Y 有关;
定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。
2.分类变量的理解: 分类变量是说明事物类别的一个名称,其取值是分类数据。如“性别”就是一个分类变 量,其变量值为“男”或“女”;“行业”也是一个分类变量,其变量值可以为“零售 业”,说明 X 与 Y 无关的把握越小
6. 右表是对与喜欢足球与否的统计列联表依据表中的数据,得到( )
A. K 2 9.564 B. K 2 3.564 C. K 2 2.706 D. K 2 3.841
7. 对两个分类变量 A、B 的下列说法中正确的个数为( ). ①A 与 B 无关,即 A 与 B 互不影响;②A 与 B 关系越密切,则 K2 的值就越大;③K2
x yw
46.6 563 6.8
8
(xi x )2
i 1
高考数学一轮复习 第九章 概率与统计 第11讲 回归分析与独立性检验课时作业 理
第11讲 回归分析与独立性检验1.(2016年河南开封一模)下列说法错误的是( )A .当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在线性回归分析中,相关系数r 的值越大,变量间的相关性越强C .在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D .在回归分析中,R 2为0.98的模型比R 2为0.80的模型拟合的效果好2.(2015年湖北)已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论正确的是( )A .x 与y 负相关,x 与z 负相关B .x 与y 正相关,x 与z 正相关C .x 与y 正相关,x 与z 负相关D .x 与y 负相关,x 与z 正相关3.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机选取了60名高中项目 作文成绩优秀 作文成绩一般 合计课外阅读量较大 22 10 32课外阅读量一般 8 20 28合计 30 30 60)A .没有充足的理由认为课外阅读量较大与作文成绩优秀有关B .有0.5%的把握认为课外阅读量较大与作文成绩优秀有关C .有99.5%的把握认为课外阅读量较大与作文成绩优秀有关D .有99.9%的把握认为课外阅读量较大与作文成绩优秀有关4.(2016年重庆)已知变量xx 4 5 6y 8 6 7若y 与x 线性相关,且线性回归方程为y =b x +2,则b ^的值为( )A .1 B.32C.45D.565.甲、乙、丙、丁四名同学各自对A ,B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 甲 乙 丙 丁r 0.82 0.78 0.69 0.85m 106 115 124 103)A .甲B .乙C .丙D .丁6.(2015年福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5收入x /万元 8.2 8.6 10.0 11.3 11.9支出y /万元 6.2 7.5 8.0 8.5 9.8根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户收入为15万元的家庭年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元7.(2017年陕西西安质检)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法得回归直线方程y ^=0.68x+54.6A.68 B .C .70 D .758.(2015年北京)高三年级267名学生参加期末考试,某班37名学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图X9111,甲、乙、丙为该班三名学生.图X9111 从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.9.(2015年重庆)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民(1)求y 关于t 的回归方程y =b t +a ;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.附:回归方程y ^=b ^t +a ^中:1122211()()()n n i i i i i i n n i i i i x x y y x y nx y b x x x nx a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑10.(2017年广东广州一模)某企业生产的某种产品被检测出其中一项质量指标存在问题.该企业为了检查生产该产品的甲,乙两条流水线的生产情况,随机地从这两条流水线上生产的大量产品中各抽取50件产品作为样本,测出它们的这一项质量指标值.若该项质量指标值落在(195,210]内,则为合格品,否则为不合格品.下表是甲流水线样本的频数分布表,图X9112是乙流水线样本的频率分布直方图.乙流水线样本频率分布直方图图X9112(1)根据图X9112,估计乙流水线生产产品该质量指标值的中位数;(2)若将频率视为概率,某个月内甲、乙两条流水线均生产了5000件产品,则甲、乙两条流水线分别生产出不合格品约多少件?(3)根据已知条件完成下面2×2列联表,并回答是否有85%的把握认为“该企业生产的附:K 2=(其中n =a +b +c +d 为样本容量)第11讲 回归分析与独立性检验1.B 解析:根据相关关系的概念知A 正确;当r >0时,r 越大,相关性越强,当r <0时,r 越大,相关性越弱,故B 不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好,二是R 2越大,拟合效果越好,所以R 2为0.98的模型比R 2为0.80的模型拟合的效果好,C ,D 正确.故选B.2.A 解析:因为变量x 和y 满足关系y =-0.1x +1,其中-0.1<0,所以x 与y 成负相关.又因为变量y 与z 正相关,不妨设z =ky +b (k >0),则将y =-0.1x +1代入即可得z =k (-0.1x +1)+b =-0.1kx +(k +b ).所以-0.1k <0.所以x 与z 负相关.故选A.3.C4.A 解析:由表格,得x =5,y =7.代入线性回归方程.得7=5b ^+2.解得b ^=1.故选A.5.D 解析:在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,拟合的效果越好,只有丁的残差平方和最小,综上可知丁的试验结果体现了A ,B 两变量有更强的线性相关性.6.B 解析:由已知得x -=8.2+8.6+10.0+11.3+11.95=10(万元),y =6.2+7.5+8.0+8.5+9.85=8(万元),故a ^=8-0.76×10=0.4.所以回归直线方程为y ^=0.76x +0.4,该社区一户收入为15万元的家庭年支出为y ^=0.76×15+0.4=11.8(万元).故选B.7.A 解析:设表中有一个模糊看不清数据为m ,由表中数据,得x =30,y =m +3075, 由最小二乘法求得回归方程y ^=0.68x +54.6,将x =30,y =m +3075代入回归直线方程, 得m =68.故选A.8.(1)乙 (2)数学 解析:(1)由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙.(2)由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成绩的排名更靠前,故填数学.9.解:(1)这里n =5,t =1n 1n i i t =∑=155=3,y =1n 1i i y =∑=365=7.2. 又l nt =21n i i t=∑-n t 2=55-5×32=10,l ny =1ni i t =∑y i -n t y =120-5×3×7.2=12.从而b ^=l ny l nt =1210=1.2,a ^=y -b ^t =7.2-1.2×3=3.6. 故所求回归方程为y ^=1.2t +3.6.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元).10.解:(1)设乙流水线生产产品的该项质量指标值的中位数为x ,因为0.48=(0.012+0.032+0.052)×5<0.5<(0.012+0.032+0.052+0.076)×5=0.86, 所以(0.012+0.032+0.052)×5+0.076×(x -205)=0.5,解得x =390019. (2)由甲、乙两条流水线各抽取的50件产品可得,甲流水线生产的不合格品有15件, 则甲流水线生产的产品为不合格品的概率为p 甲=1550=310, 乙流水线生产的产品为不合格品的概率为p 乙=(0.012+0.028)×5=15, 于是,若某个月内甲、乙两条流水线均生产了5000件产品,则甲、乙两条流水线生产的不合格品件数分别为5000×310=1500,5000×15=1000. (3)2×2则K 2=50×50×75×25=3≈1.3. 因为1.3<2.072,所以没有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”.。
2019-2020学年高考数学一轮复习 第十一章概率与统计11.9回归分析与独立性检验教学案 新人教B版.doc
2019-2020学年高考数学一轮复习 第十一章概率与统计11.9回归分析与独立性检验教学案 新人教B 版考纲要求1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的回归直线方程系数公式建立回归直线方程(线性回归方程系数公式不要求记忆).3.了解独立性检验(只要求2×2列联表)的思想、方法及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用.1.相关关系与函数关系不同,相关关系是一种__________性关系. 2.散点图若点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________;若点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为________.3.回归直线 从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,就称两个变量之间具有__________关系,这条直线叫做________.4.回归直线方程(1)最小二乘法:求回归直线使得样本数据的点到它的____________的方法叫做最小二乘法.(2)回归直线方程:方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.⎩⎪⎨⎪⎧b ^= = ,a ^= .5.样本相关系数r =∑ni =1 x i -xy i -y∑n i =1x i -x2∑ni =1y i -y2=∑ni =1x i y i -n x y∑n i =1x 2i -n x2∑ni =1y 2i -n y2.(1)r 具有以下性质:|r |≤1,并且|r |越接近1,线性相关程度越强;|r |越接近0,线性相关程度越弱.(2)检验的步骤如下:①作统计假设:x 与Y 不具有线性相关关系;②根据小概率0.05与n -2在附表中查出r 的一个临界值r 0.05; ③根据样本相关系数的计算公式算出r 的值;④作统计推断.如果|r |>r 0.05,表明有95%的把握认为x 与Y 之间具有线性相关关系. 如果|r |≤r 0.05,没有理由拒绝原来的假设.这时寻找回归直线方程是毫无意义的. 6.独立性检验(1)假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为:y 1 y 2 合计 x 1 n 11 n 12 n 1+ x 2 n 21 n 22 n 2+ 合计 n +1 n +2 nχ2=____________________________(其中n =______________________为样本容量). (2)两个临界值:3.841和6.635.当χ2>________时,有95%的把握说事件A 与B 有关;当χ2>________时,有99%的把握说事件A 与B 有关;当χ2≤________时,认为事件A 与B 是无关的.1.下列两个变量之间是相关关系的是( ). A .圆的面积与半径 B .球的体积与半径 C .角度与它的正弦值D .一个考生的数学成绩与物理成绩2.已知变量x ,y 呈线性相关关系,回归方程y ^=0.5+2x ,则变量x ,y 是( ). A .线性正相关关系B .由回归方程无法判断其正负相关C .线性负相关关系D .不存在线性相关关系3.关于独立性检验的说法中,错误的是( ). A .独立性检验依据小概率原理B .独立性检验原理得到的结论一定正确C .样本不同,独立性检验的结论可能有差异D .独立性检验不是判定两类事物是否相关的唯一方法4.为了考察长头发与女性头晕是否有关系,随机抽查301名女性,得到如下列联表,试根据表格中已有数据填空.经常头晕 很少头晕 合计 长发 35 ① 121 短发 37 143 ② 合计 72 ③ ④则空格中的数据应分别为:①__________;②__________;③__________;④__________.5.已知一个线性回归方程为y ^=1.5x +45(x i ∈{1,7,5,13,19}),则y =__________.一、变量间的相关性【例1】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:零件数x /个 10 20 30 40 50 60 70 80 90 100 加工时间y /分 62 68 75 81 89 95 102 108 115 122 (1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求回归直线方程.(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少? 方法提炼1.散点图可以直观地反映两个变量间的相关关系,并且根据散点的分布规律可以判断出这两个变量是正相关还是负相关.2.求线性回归直线方程的步骤(1)作出散点图,判断两个变量是否线性相关;(2)如果是,利用公式求出a ^,b ^的值,写出回归直线方程;(3)利用求出的方程进行估计.由于求回归直线方程时的计算量较大,所以计算时要仔细、谨慎,可分层进行,避免因计算产生失误.特别注意,只有在散点图大体呈线性时,求出的回归直线方程才有意义.请做演练巩固提升4二、回归方程的求法及回归分析【例2】 某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份 2002 2004 2006 2008 2010 需求量/万吨 236 246 257 276286(1)利用所给数据求年需求量与年份之间的回归直线方程y ^=b ^x +a ^; (2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量. 方法提炼1.最小二乘法估计的一般步骤: (1)作出散点图,判断是否线性相关;(2)如果线性相关,利用公式求a ^,b ^,写出回归直线方程; (3)根据方程进行估计.2.回归直线方程恒过点(x ,y ).请做演练巩固提升2 三、独立性检验【例3】 某单位餐厅的固定餐椅经常有损坏,于是该单位领导决定在餐厅墙壁上张贴文明标语看是否有效果,并对文明标语张贴前后餐椅的损坏情况作了一个统计,具体数据如下:损坏餐椅数 未损坏餐椅数 合计文明标语张贴前 39 157 196 文明标语张贴后 29 167 196合计 68 324 392请你判断在餐厅墙壁上张贴文明标语对减少餐椅损坏数是否有效果? 方法提炼1.所谓独立性检验,就是根据所采集样本的数据,利用公式计算χ2的值,比较与临界值的大小关系,来判断事件X 与Y 是否有关的问题.2.独立性检验的思想来自于统计上的假设检验思想,它与反证法类似,它们都是先假设结论不成立,然后根据是否能推出“矛盾”来判定结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指不符合逻辑的事件发生;而假设检验中的“矛盾”是指不符合逻辑的小概率事件发生,即在结论不成立的假设下推出有利于结论成立的小概率事件的发生.请做演练巩固提升3要重视对线性回归方程意义的理解【典例】 (2012湖南高考)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( ).A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg 答案:D解析:D 选项中,若该大学某女生身高为170 cm ,则可断定其体重约为:0.85×170-85.71=58.79 kg.故D 不正确.答题指导:1.求回归方程,关键在于正确求出系数a ^,b ^,由于a ^,b ^的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意线性回归方程中一次项系数为b ^,常数项为a ^,这与一次函数的习惯表示不同.)2.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.3.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.1.(2012课标全国高考)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x+1上,则这组样本数据的样本相关系数为( ).A .-1B .0C .12D .12.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x (cm) 174 176 176 176 178 儿子身高y (cm) 175 175 176 177 177则y 对x 的线性回归方程为( ).A.y ^=x -1B.y ^=x +1C.y ^=88+12x D.y ^=1763.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +24.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:x /吨 3 4 5 6 y /吨 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归直线方程y ^=b ^x +a ^; (3)已知该厂技改前10吨甲产品的生产能耗为9吨标准煤.试根据(2)求出的回归直线方程,预测生产10吨甲产品的生产能耗比技改前降低多少吨标准煤?参考答案基础梳理自测知识梳理1.非确定 2.正相关 负相关 3.线性相关 回归直线 4.(1)离差平方和最小(2)∑n i =1(x i -x )(y i -y )∑ni =1 (x i -x )2 ∑ni =1x i y i -n x y ∑n i =1x i 2-n x 2y -b ^x 6.(1)n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2n 11+n 21+n 12+n 22(2)3.841 6.635 3.841 基础自测1.D 解析:相关关系不是确定的函数关系,这里A ,B ,C 都是确定的函数关系. 2.A 解析:因为b =2>0,所以x ,y 是正相关关系.3.B 解析:因为利用独立性原理检验时与样本的选取有关,所以得到的结论可能有失误,不是一定正确.4.①86 ②180 ③229 ④301解析:最右侧的合计是对应的行上的两个数据的和,由此可求出①和②;而最下面的合计是相应的列上两个数据的和,由刚才的结果可求得③④.5.58.5 解析:回归直线方程为y ^=1.5x +45,经过点(x ,y ),由x =9,知y =58.5.考点探究突破【例1】解:(1)作出如下散点图:显然,图中的散点大致分布在一条直线附近,因此y 与x 具有线性相关关系. (2)列出下表: i 1 2 3 4 5 6 7 8 9 10 x i 10 20 30 40 50 60 70 80 90 100 y i 62 68 75 81 89 95 102 108 115 122 xiy i 620 1 360 2 250 3 240 4 450 5 700 7 140 8 640 10 350 12 200x =55,y =91.7,∑i =110x i 2=38 500,∑i =110y i 2=87 777,∑i =110x i y i =55 950,设所求的回归直线方程为y ^=b ^x +a ^,则有b ^=∑i =110x i y i -10x y∑i =110x i 2-10x2=55 950-10×55×91.738 500-10×552≈0.668, a ^=y -b ^x =91.7-0.668×55=54.96.因此,所求的回归直线方程为y ^=0.668x +54.96. (3)当x =200时,y 的估计值为 y ^=0.668×200+54.96=188.56≈189.因此,加工200个零件所用的时间约为189分钟.【例2】 解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程.为此对数据预处理如下:年份-2006 -4 -2 0 2 4 需求量-257 -21 -11 0 19 29对预处理后的数据,容易算得x =0,y =3.2,b ^=(-4)×(-21)+(-2)×(-11)+2×19+4×2942+22+22+42=26040=6.5, a ^=y -b ^x =3.2.由上述计算结果,知所求回归直线方程为y ^-257=b (x -2 006)+a=6.5(x -2 006)+3.2.即y ^=6.5(x -2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为 6.5×(2 012-2 006)+260.2 =6.5×6+260.2=299.2(万吨) ≈300(万吨).【例3】 解:根据题中的数据,由χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2,得χ2=392×(39×167-157×29)2196×196×68×324≈1.78.因为1.78<3.841,所以我们没有理由说在餐厅墙壁上张贴文明标语对减少餐椅损坏数有效果,即效果不明显. 演练巩固提升1.D 解析:样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y =12x+1上,样本的相关系数应为1.2.C 解析:法一:由回归直线方程过样本中心(176,176),排除A ,B 答案;结合选项可得C 为正确答案.法二:将表中的五组数值分别代入选项验证,可知y ^=88+12x 最适合.3.解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500=14%.(2)由公式得χ2=500×(40×270-30×160)2200×300×70×430≈9.967.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,要先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并采用分层抽样方法比采用简单随机抽样方法更好.4.解:(1)如下图.(2)∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,x =3+4+5+64=4.5, y =2.5+3+4+4.54=3.5,∑i =1nx i 2=32+42+52+62=86.b ^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7, a ^=y -b ^x =3.5-0.7×4.5=0.35.因此所求的回归直线方程为y ^=0.7x +0.35.(3)根据回归直线方程的预测,现在生产10吨产品消耗的标准煤的数量为0.7×10+0.35=7.35,故能耗减少了9-7.35=1.65(吨).。
高考数学一轮复习 第十一章概率与统计11.9回归分析与独立性检验收尾精炼 理
2014届高考一轮复习收尾精炼: 回归分析与独立性检验一、选择题1.下面是一个 a 则表中a ,b A .94,72 B .52,50 C .52,74 D .74,522.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( ).图1 图2A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ).A .若K 2的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患有肺病B .由独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病C .若统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D .以上三种说法都不正确4.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③回归直线方程y ^=b ^x +a ^必过点(x ,y );④有一个2×2列联表中,由计算得K 2的观测值k =13.079,则有99.9%的把握认为这两个变量间有关系.其中错误的个数是( ).A .0B .1C .2D .3法分别求得相关系数r).A .甲B .乙C .丙D .丁6根据上表可得回归方程y=b x+a中的b为9.4,据此模型预报广告费用为6万元时销售额为( ).A.63.6万元B.65.5万元C.67.7万元D.72.0万元7. 设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( ).A.x和y的相关系数为直线l的斜率B.x和y的相关系数在0到1之间C.当n为偶数时,分布在l两侧的样本点的个数一定相同D.直线l过点(x,y)二、填空题8.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:已知P(K2≥3.841)≈0.05,根据表中数据,得到K2的观测值k=-223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性约为__________.9.某单位为了了解用电量y(千瓦时)与气温x(℃)之间的关系,随机统计了某4天的由表中数据得线性回归方程y=b x+a中b=-2,预测当气温为-4 ℃时,用电量约为________千瓦时.10.某市居民2007~2011年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)支出Y/万元支出有__________线性相关关系.三、解答题11.(2012辽宁高考)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?(2)5育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:K 2=n ad -bc 2a+b c .12.为了比较注射A ,200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B.下表1和表2分别是注射药物A 和药物B 后的试验结果.(疱疹面积单位:mm 2)疱疹面积 [75,图1 注射药物A 后皮肤疱疹面积的频率分布直方图图2 注射药物B 后皮肤疱疹面积的频率分布直方图(2)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.附:K2=0.001参考答案一、选择题1.C 解析:∵a +21=73,∴a =52.又a +22=b ,∴b =74. 2.C 3.C4.B 解析:一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于回归直线方程y ^=3-5x ,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y ^=b ^x +a ^必过点(x ,y ),③正确;因为K 2的观测值k =13.079>10.828,故有99.9%的把握认为这两个变量有关系,④正确.5.D 解析:丁同学所得相关系数r 最大,残差平方和m 最小,所以A ,B 两变量线性相关性更强.6.B 解析:样本中心点是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1,所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.7.D 解析:A 中,相关系数不是l 的斜率;B 中,x 和y 负相关;C 中,样本点的个数分布无规律;D 正确.二、填空题8.5% 解析:由K 2的观测值k ≈4.844>3.841,故认为选修文科与性别有关系出错的可能性约为5%.9.68 解析:x =10,y =40,∵回归方程过点(x ,y ),∴40=-2×10+a ^.∴a ^ =60.∴y ^=-2x +60.令x =-4,得y ^=(-2)×(-4)+60=68.10.13万元 正 解析:根据中位数的定义,居民家庭年平均收入的中位数是13万元,家庭年平均收入与年平均支出有正线性相关关系.三、解答题11.解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2将2×2K 2的观测值k =100×(30×10-45×15)275×25×45×55=10033≈3.030. 因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间为Ω={(a 1,a 2),(a 1,a 3),(a 2,a 3),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)}.其中a i 表示男性,i =1,2,3.b j 表示女性,j =1,2.Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.用A表示“任选2人中,至少有1人是女性”这一事件,则A={(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)},事件A由7个基本事件组成,因而P(A)=7 10 .12.解:(1)图1 注射药物A后皮肤疱疹面积的频率分布直方图图2 注射药物B后皮肤疱疹面积的频率分布直方图可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.k=100×100×105×95≈24.56,由于k>10.828,所以有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.。
湘教版高考总复习一轮数学精品课件 第11章 第5节事件的相互独立性与条件概率、全概率公式
∑ P(Ai)P(B|Ai) .此公式称为全概率公式.
i=1
常用结论
1.若事件A1,A2,…,An相互独立,那么这n(n>2)个事件同时发生的概率等于
每个事件发生的概率的积,即P(A1A2…An)=P(A1)P(A2)…P(An).
2.当P(A)>0时,事件A与B相互独立⇔P(B|A)=P(B).
1
由于 P(甲丁)=P(甲)·
P(丁)=36,根据相互独立事件的性质,知事件甲与丁相互
独立,故选 B.
(2)(多选题)甲、乙两人参加消防安全知识竞赛活动.活动共设三轮,在每轮活
动中,甲、乙各回答一题,若一方答对且另一方答错,则答对的一方获胜,否则
2
1
本轮平局.已知每轮活动中,甲、乙答对的概率分别为3 和 2,且每轮活动中甲、
如果事件A,B是两个随机事件,且 P(A)>0,则在事件A发生的条
件下事件B发生的概率叫作条件概率,记为P(B|A),且
()
()
P(B|A)=
设P(A)>0,
条件概率的 则(1)P(Ω|A)=1;
相关结论 (2)如果B和C是两个互斥事件,则P((B∪C)|A)= P(B|A)+P(C|A);
球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则( B )
A.甲与丙相互独立
B.甲与丁相互独立
C.乙与丙相互独立
D.丙与丁相互独立
1
1
5
5
6
1
解析 由已知得 P(甲)=6,P(乙)=6,P(丙)=6×6 = 36,P(丁)=6×6 = 6,
1
1
1
1
P(甲丙)=0,P(甲丁)=6×6 = 36,P(乙丙)=6×6 = 36,P(丙丁)=0.
2023新高考数学一轮复习创新课件 第11章 第6讲 事件的相互独立性、条件概率与全概率公式
1.甲射击击中目标的概率为 0.75,乙射击击中目标的概率为23,两人 是否击中目标互不影响,则当两人同时射击同一目标时,该目标被击中的
概率为( )
A.12 C.1112
B.1 D.56
答案
解析 记“甲射击击中目标”为事件 A,“乙射击击中目标”为事件 B,则 P(A)=0.75=34,P(B)=23,所以当两人同时射击同一目标时,该目标 被击中的概率为 P=1-(1-P(A))(1-P(B))=1-14×13=1112.故选 C.
门都不及格”为事件 AB,所以 P(A)=0.15,P(B)=0.05,P(AB)=0.03,P(B|A)
=PPAAB=00..0135=0.2,所以该学生数学不及格时,语文也不及格的概率为 0.2. 故选 A.
解析 答案
3.甲、乙两人同时报考某一所大学,甲被录取的概率为0.6,乙被录 取的概率为0.7,两人是否被录取互不影响,则其中至少有一人被录取的概 率为( )
A.0.12
B.0.42
C.0.46
D.0.88
解析 设“甲被录取”记为事件 A,“乙被录取”记为事件 B,则两人
至少有一人被录取的概率 P=1-P( A B )=1-(1-P(A))(1-P(B))=1-
0.4×0.3=0.88.故选 D.
解析 答案
4.有一批种子的发芽率为0.9,出芽后的幼苗成活率为0.8,在这批种
解析
(2)在一次篮球比赛中,假如运动员小明有两次投篮机会,按照以往的 比赛成绩,小明第一次投篮命中的概率是0.6,在第一次投篮命中的条件下 第二次投篮也命中的概率是0.5,则小明两次投篮都命中的概率为________.
解析
2 . 某 班 学 生 考 试 成 绩 中 , 数 学 不 及 格 的 占 15% , 语 文 不 及 格 的 占 5%,两门都不及格的占3%.已知一学生数学不及格,则他语文也不及格的 概率是( )
(湖南专用)高考数学一轮复习 第十一章概率与统计11.2古典概型教
(湖南专用)高考数学一轮复习第十一章概率与统计11.2古典概型教(湖南专用)高考数学一轮复习第十一章概率与统计11.2古典概型教学案理11.2 古典概型考纲要求1.理解古典概型及其概率计算公式.2.会用列举法计算一些随机事件所含的基本事件数及事件发生的概率.1.基本事件有如下特点:(1)任何两个基本事件是______的;(2)任何事件(除不可能事件)都可以表示成__________.2.一般地,一次试验有下面两个特征:(1)有限性,即在一次试验中,可能出现的结果只有有限个,即只有有限个不同的基本事件;(2)等可能性,每个基本事件发生的可能性是相等的,称具有这两个特点的概率模型为古典概型.判断一个试验是否是古典概型,在于该试验是否具有古典概型的两个特征:试验结果的有限性和每一个试验结果出现的等可能性.3.如果一次试验中所有可能出现的结果有n 个,而且所有结果出现的可能性都相等,那么每一个基本事件的概率都是______;如果某个事件A 包含的结果有m 个,那么事件A 的概率P (A )=______.1.从集合A ={2,3,-4}中随机选取一个数记为k ,从集合B ={-2,-3,4}中随机选取一个数记为b ,则直线y =kx +b 不经过第二象限的概率为( ).A.29B.13C.49D.592.先后抛掷两颗质地均匀的骰子,设出现的点数之和是12,11,10的概率依次是P 1,P 2,P 3,则( ).A .P 1=P 2<P 3B .P 1<P 2<P 3C .P 1<P 2=P 3D .P 3=P 2<P 13.从1,2,3,4这四个数中一次随机取两个数,则其中一个数是另一个数的两倍的概率是__________.4.盒子中共有大小相同的3个白球,1个黑球,若从中随机摸出两个球,则它们颜色不同的概率是__________.一、古典概型及其概率计算【例1】袋中有大小相同的5个白球,3个黑球和3个红球,每球有一个区别于其他球的编号,从中摸出一个球.(1)有多少种不同的摸法?如果把每个球的编号看作一个基本事件建立概率模型,该模型是不是古典概型?(2)若按球的颜色为划分基本事件的依据,有多少个基本事件?以这些基本事件建立概率模型,该模型是不是古典概型?方法提炼1.判断一个概率问题是否为古典概型,关键是看它是否同时满足两个特征:有限性和等可能性,同时满足这两个特征的概率模型才是古典概型.2.求古典概型的概率时,一般是先用列举法把试验所包含的基本事件一一列举出来,然后再找出所求事件A 所包含的基本事件的个数,利用公式P (A )=m n 即可求得事件A 的概率.请做演练巩固提升1二、古典概型的应用感谢您的阅读,祝您生活愉快。
高考数学一轮复习 第十一章概率与统计11.9回归分析与独立性检验教学案 理
11.9 回归分析与独立性检验考纲要求1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.4.了解回归分析的基本思想、方法及其简单应用.1.相关关系:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种______________.2.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两变量的关系是否可以用线性关系表示.若这些散点分布在从左下角到右上角的区域,则称两个变量______;若这些散点分布在从左上角到右下角的区域,则称两个变量______.3.回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析.在线性回归模型y =bx +a +e 中,因变量y 的值由自变量x 和随机误差e 共同确定,即自变量x 只能解释部分y 的变化,在统计中,我们把自变量x 称为________,因变量y 称为________.4.回归方程:y ^ =b ^ x +a ^ ,其中b ^=∑i =1n x i y i -n x y∑i =1nx 2i -n x 2,a ^ =y -b ^x ,它主要用来估计和预测取值,从而获得对这两个变量之间整体关系的了解.5.相关系数:r =∑i =1nx i y i -n x y∑i =1nx 2i -n x 2∑i =1n y 2i -n y 2它主要用于相关量的显著性检验,以衡量它们之间的线性相关程度.当r >0时表示两个变量正相关,当r <0时表示两个变量负相关.|r |越接近1,表明两个变量的线性相关性____;当|r |接近0时,表明两个变量间几乎不存在__________.6.列联表有两个或两个以上的分类变量的______称为列联表.一般我们只研究每个分类变量只取两个值的情况,有两个分类变量的样本频数列联表称为2×2列联表.7.独立性检验利用随机变量K 2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.K 2=__________________(n =a +b +c +d ).1.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( ). A.y ^=-10x +200B.y ^=10x +200 C.y ^=-10x -200 D.y ^=10x -2002.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数R 2如下,模型 模型1 模型2 模型3 模型4相关指数R 2 0.98 0.80 0.50 0.25A.模型1 B .模型2C .模型3D .模型43.关于独立性检验的说法中,错误的是( ).A .独立性检验依据小概率原理B .独立性检验原理得到的结论一定正确C .样本不同,独立性检验的结论可能有差异D .独立性检验不是判定两类事物是否相关的唯一方法4.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K 2的观测值k =27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是__________的(填“有关”或“无关”).5.已知一个线性回归方程为y ^=1.5x +45(x i ∈{1,7,5,13,19},i =1,2,3,4,5),则y =__________.一、利用散点图判断两个相关联变量的相关性【例1】下面是水稻产量与施化肥量的一组观测数据:施化肥量 15 20 25 30 35 40 45水稻产量 320 330 360 410 460 470 480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?方法提炼散点图是由一系列数据点构成的,对于性质不明确的两组数据可先作散点图,直观地分析它们有无关系及关系的密切程度.请做演练巩固提升1二、回归方程的求法及回归分析【例2年份 2002 2004 2006 2008 2010需求量/万吨 236 246 257 276 286(1)利用所给数据求年需求量与年份之间的回归直线方程y ^=b ^x +a ^;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.方法提炼1.最小二乘法估计的一般步骤:(1)作出散点图,判断是否线性相关;(2)如果线性相关,利用公式求a ^,b ^,写出回归直线方程;(3)根据方程进行估计.2.回归直线方程恒过点(x ,y ).请做演练巩固提升2三、独立性检验【例3】某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)内的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:分组 [29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02) [30.02,30.06) [30.06,30.10) [30.10,30.14) 频数 12 63 86 182 92 61 4分组 [29.86,[29.90,[29.94,[29.98,[30.02,[30.06,[30.10,29.90) 29.94) 29.98) 30.02) 30.06) 30.10) 30.14) 频数 29 71 85 159 76 62 18(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写下面2×2列联表,并问能否在犯错误的概率不超过0.010的前提下认为“两个分厂生产的零件的质量有差异”.甲厂 乙厂 合计优质品非优质品合计附:K 2=n ad -bc 2a +b c +d a +c b +d, P (K 2≥k ) 0.05 0.010k 3.841 6.635方法提炼独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量K 2应该很小.如果由观测数据计算得到的K 2的观测值k 很大,则在一定程度上说明假设不合理.根据随机变量K 2的含义,我们把K 2≥k 0解释为有(1-P (K 2≥k 0))×100%的把握认为“两个分类变量有关系”;把K 2<k 0解释为不能以(1-P (K 2≥k 0))×100%的把握认为“两个分类变量有关系”,或者由样本观测数据不能充分说明“两个分类变量有关系”.请做演练巩固提升3要重视对线性回归方程意义的理解【典例】 (2012湖南高考)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系.根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( ).A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg答案:D解析:D 选项中,若该大学某女生身高为170 cm ,则可断定其体重约为:0.85×170-85.71=58.79 kg.故D 不正确.答题指导:1.求回归方程,关键在于正确求出系数a ^,b ^,由于a ^,b ^的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意线性回归方程中一次项系数为b ^,常数项为a ^,这与一次函数的习惯表示不同.)2.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.3.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.1.(2012课标全国高考)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( ).A .-1B .0 C.12D .12.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x /cm 174 176 176 176 178儿子身高y /cm 175 175 176 177 177则y 对x 的线性回归方程为( ).A.y ^=x -1B.y ^=x +1C.y ^=88+12x D.y ^=176 3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的2×2列联表:男 女 总计爱好 40 20 60不爱好 20 30 50总计 60 50 110由K 2=n ad -bc 2a +b c +d a +c b +d算得, K 2的观测值k =110×40×30-20×20260×50×60×50≈7.8. 附表:P (K 2≥k ) 0.050 0.010 0.001k 3.841 6.635 10.828A .在犯错误的概率不超过0.010的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.010的前提下,认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”4.如图所示,有5组(x ,y )数据,去掉__________组数据后,剩下的4组数据具有较强的线性相关关系.参考答案基础梳理自测知识梳理1.非确定性关系2.正相关 负相关3.解释变量 预报变量5.越强 线性相关性6.频数表 7.n (ad -bc )2(a +b )(c +d )(a +c )(b +d )基础自测1.A 解析:由y 与x 负相关,排除B ,D ,而C 中y ^=-10x -200在x =0时,y ^=-200<0不符合题意.2.A 解析:相关指数R 2越大,拟合效果越好.3.B 解析:因为利用独立性原理检验时与样本的选取有关,所以得到的结论可能有误,不是一定正确的.4.有关 解析:∵k =27.63>10.828,∴在犯错误的概率不超过0.001的前提下认为打鼾与患心脏病有关.5.58.5 解析:线性回归方程为y ^ =1.5x +45经过点(x ,y ),由x =9,知y =58.5.考点探究突破【例1】 解:(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.【例2】 解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回年份-2006 -4 -2 0 2 4需求量-257 -21 -11 0 19 29对预处理后的数据,容易算得x =0,y =3.2,b ^=(-4)×(-21)+(-2)×(-11)+2×19+4×2942+22+22+42=26040=6.5, a ^=y -b ^x =3.2.由上述计算结果,知所求回归直线方程为y ^-257=b (x -2 006)+a=6.5(x -2 006)+3.2.即y ^=6.5(x -2 006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5×(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨)≈300(万吨).【例3】 解:(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500×100%=72%; 乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为 320500×100%=64%. (2)甲厂 乙厂 合计优质品 360 320 680非优质品 140 180 320合计 500 500 1 000k =1 000×(500×500×680×320≈7.35>6.635, 所以在犯错误的概率不超过0.010的前提下,认为“两个分厂生产的零件的质量有差异”.演练巩固提升1.D 解析:样本相关系数越接近1,相关性越强,现在所有的样本点都在直线y =12x +1上,样本的相关系数应为1.2.C 解析:法一:由线性回归直线方程过样本中心(176,176),排除A ,B 答案,结合选项可得C 为正确答案.法二:将表中的五组数值分别代入选项验证,可知y ^=88+12x 最适合. 3.A 解析:根据独立性检验的定义,由K 2的观测值k ≈7.8>6.635可知在犯错误的概率不超过0.010的前提下,认为“爱好该项运动与性别有关”.4.D 解析:由散点图知呈带状区域时有较强的线性相关关系,故去掉D 组数据.。
高考数学一轮复习第九章概率与统计第11讲回归分析与独立性检验课件理
(xn,yn),通过求偏差的平方和 Q= (yi-b^xi-a^)2 的最小值而 i1
得到回归直线的方法,即求回归直线,使得样本数据的点到它 的距离的平方和最小,这一方法叫做最小二乘法,则回归直线
方程^y=b^x+a^的系数为:
n
n
(xi x)( yi y)
xi yi nx y
(ui u)2
i1
解:(1)由散点图可以判断,y=c+d x适合作为年销售 y
关于年宣传费用 x 的回归方程类型.
(2)令 w= x,先建立 y 关于 w 的线性回归方程.
8
∵d^=
i1
(wi
8
w)( yi
y)
=1018.6.8=68,
(wi w)2
i1
∴^c=-y -d^-w =563-68×6.8=100.6.
系时,用什么方法最有说服力( A.平均数与方差 C.独立性检验
) B.回归直线方程 D.概率
解析:由于参加讨论的公民按性别被分成了两组,而且每 一组又被分成了两种情况:认为有关与无关,故该资料取自完 全随机统计,符合 2×2 列联表的要求.故用独立性检验最有说 服力.
答案:C
2.已知变量 x 与 y 正相关,且由观测数据算得样本平均数 x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )
i 1
n
n
( xi x)2 ( yi y)2
i 1
i 1
n
xi yi nx y
=
i1
叫做变量 y 与 x 之间的样本相
n
(
i2
n
2
高考数学一轮复习第十一章统计与统计案例第三节相关性最玄乘估计回归分析与独立性检验课件文北师大版
①当χ2_≤__2_._7_0_6_时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没
有关联的;
②当χ2 _>_2_._7_0_6_时,有90%的把握判定变量A,B有关联;
③当χ2 _>_3_._8_4_1_时,有95%的把握判定变量A,B有关联;
④当χ2 _>_6_._6_3_5_时,有99%的把握判定变量A,B有关联.
2.线性回归方程与相关系数 (1)最小二乘法: 如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与 直线y=a+bx的接近程度: _[_y_1_-_(_a_+_b_x_1)_]_2_+_[_y_2_-_(_a_+_b_x_2)_]_2_+_…__+_[_y_n_-_(_a_+_b_x_n)_]_2_.使得 上式达到_最__小__值__的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.
看看远处,要保护好眼睛哦~站起来动一动,久坐对身 体不好哦~
结束语
同学们,你们要相信梦想是价值的源泉,相信成 功的信念比成功本身更重要,相信人生有挫折没 有失败,相信生命的质量来自决不妥协的信念, 考试加油。
复习课件
高考数学一轮复习第十一章统计与统计案例第三节相关性最玄乘估计回归分析与独立性检验课件文 北师大版
2021/4/17
高考数学一轮复习第十一章统计与统计案例第三节相关性最玄乘
1
估计回归分析与独立性检验课件文北师大版
第三节 相关性、最小二乘估计、 回归分析与独立性检验
内容索引
必备知识·自主学习 核心考点·精准研析 核心素养测评
【教材·知识梳理】 1.相关性 (1)散点图:在考虑两个量的关系时,为了对_变__量__之间的关系有一个大致的了解, 人们通常将_变__量__所__对__应__的点描出来,这些点就组成了变量之间的一个图,通常称 这种图为变量之间的散点图. (2)曲线拟合:从散点图上可以看出,如果变量之间_存__在__着__某__种__关__系__,这些点会有 一个_集__中__的大致趋势,这种趋势通常可以用一条_光__滑__的__曲__线__来近似,这样近似的 过程称为曲线拟合.
老高考适用2023高考数学一轮总复习第十一章计数原理概率随机变量及其分布第五节事件的相互独立性与条件
率公式计算概率.
应用
强基础 增分策略
知识梳理
1.事件的相互独立性
事件A与事
件B相互独
立
事件A(或B)是否发生对事件B(或A)发生的概率没有影响,
这样的两个事件叫作相互独立事件.
两个相互独立事件同时发生的概率,等于这两个事件发生
的概率的积,即P(AB)=P(A)P(B)
第十一章
第五节 事件的相互独立性与条件概率
内
容
索
引
01
强基础 增分策略
02
增素能 精准突破
课标解读
衍生考点
核心素养
1.了解两个随机事件独立性的含义,
利用独立性计算概率.
1.相互独立事件
2.了解条件概率,能计算简单随机事 的概率
数学建模
件的条件概率.
数据分析
2.条件概率
3.了解条件概率与独立性的关系,会 3.全概率公式的 数学运算
成功的有80人,第一关闯关成功且第二关闯关也成功的选手有72人,以闯关
成功的频率近似作为闯关成功的概率,已知某个选手第一关闯关成功,则该
选手第二关闯关成功的概率为(
)
(2)(2021湖北恩施一模)小赵、小钱、小孙、小李到4个景点旅游,每人只去
一个景点,设事件A为“4个人去的景点不完全相同”,事件B为“小赵独自去一
即
1
,
4
方法总结求相互独立事件同时发生的概率的方法
1
对点训练 1 甲、乙、丙分别对一个目标射击,甲射击命中目标的概率是2,乙命
1
1
中目标的概率是 ,丙射击命中目标的概率是 ,现在三人同时射击目标:
3
4
(1)求目标被击中的概率;
高三数学冲刺复习概率统计、回归方程与独立性检验(2021年整理)
(完整)高三数学冲刺复习概率统计、回归方程与独立性检验(word版可编辑修改)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((完整)高三数学冲刺复习概率统计、回归方程与独立性检验(word版可编辑修改))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(完整)高三数学冲刺复习概率统计、回归方程与独立性检验(word版可编辑修改)的全部内容。
高三数学冲刺复习概率统计、回归方程与独立性检验(启尔优方法与思维数学备课资料)1、2016世界特色魅力城市强新鲜出炉,包括黄山市在内的个中国城市入选。
美丽的黄山风景和人文景观迎来众多宾客。
现在很多人喜欢自助游,某调查机构为了了解“自助游”是否与性别有关,在黄山旅游节期间,随机抽取了人,得如下所示的列联表:赞成“自助游”不赞成“自助游”合计男性女性合计(1)若在这人中,按性别分层抽取一个容量为的样本,女性应抽人,请将上面的列联表补充完整(在答题卡上直接填写结果,不需要写求解过程),并据此资料能否在犯错误的概率不超过前提下,认为赞成“自助游"是与性别有关系?(2)若以抽取样本的频率为概率,从旅游节游客中随机抽取人赠送精美纪念品,记这人中赞成“自助游”人数为,求的分布列和数学期望.附:2、某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东西两部各5个城市,得到观看该节目的人数(单位:千人)如下茎叶图所示其中一个数字被污损.(1)求东部各城市观看该节目观众平均人数超过西部各城市观看该节目观众平均人数的概率.(2)随着节目的播出,极大激发了观众对成语知识的学习积累的热情,从中获益匪浅,现从观看节目的观众中随机统计了4位观众的周均学习成语知识的时间(单位:小时)与年龄(单位:岁),并制作了对照表(如下表所示);年龄x (岁)20304050周均学习成语知识时间y(小时)2。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课时作业62 回归分析与独立性检验
一、选择题
1.下面是一个2×2
则表中a ,b A .94,72 B .52,50 C .52,74 D .74,52
2.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( ).
图1 图2
A .变量x 与y 正相关,u 与v 正相关
B .变量x 与y 正相关,u 与v 负相关
C .变量x 与y 负相关,u 与v 正相关
D .变量x 与y 负相关,u 与v 负相关
3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ).
A .若K 2的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患有肺病
B .由独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病
C .若统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
D .以上三种说法都不正确
4.下列说法:
①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
②设有一个回归方程y ^
=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;
③回归直线方程y ^=b ^x +a ^
必过点(x ,y );
④有一个2×2列联表中,由计算得K 2
的观测值k =13.079,则有99.9%的把握认为这两个变量间有关系.其中错误的个数是( ).
A .0
B .1
C .2
D .3
法分别求得相关系数r 0.82两变量更 ).
A .甲
B .乙
C .丙
D .丁
6.某产品的广告费用
根据上表可得回归方程y=b x+a中的b为9.4,据此模型预报广告费用为6万元时销售额为( ).
A.63.6万元B.65.5万元
C.67.7万元D.72.0万元
7. 设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( ).
A.x和y的相关系数为直线l的斜率
B.x和y的相关系数在0到1之间
C.当n为偶数时,分布在l两侧的样本点的个数一定相同
D.直线l过点(x,y)
二、填空题
8.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:
已知P(K2≥3.841)≈
根据表中数据,得到K2的观测值k=
-2
23×27×20×30
≈4.844,则认为选修文
科与性别有关系出错的可能性约为__________.
9.某单位为了了解用电量y(千瓦时)与气温x(℃)之间的关系,随机统计了某4天的用
由表中数据得线性回归方程y=b x+a中b=-2,预测当气温为-4 ℃时,用电量约为________千瓦时.
10.某市居民2007~2011年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)
5
支出有__________线性相关关系.
三、解答题
11.(2012辽宁高考)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?
(2)已知“超级体育迷”中有2名女性.若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
附:K 2=n ad -bc 2a +b c +++.
12.为了比较注射A ,200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B.下表
1和表2分别是注射药物A 和药物B 后的试验结果.(疱疹面积单位:mm 2)
图1 注射药物A 后皮肤疱疹面积的频率分布直方图
图2 注射药物B 后皮肤疱疹面积的频率分布直方图
(2)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.
附:K2=
参考答案
一、选择题
1.C 解析:∵a +21=73,
∴a =52.
又a +22=b ,∴b =74.
2.C 3.C
4.B 解析:一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于
回归直线方程y ^
=3-5x ,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归
方程的定义知,线性回归方程y ^=b ^x +a ^
必过点(x ,y ),③正确;因为K 2的观测值k =13.079
>10.828,故有99.9%的把握认为这两个变量有关系,④正确.
5.D 解析:丁同学所得相关系数r 最大,残差平方和m 最小,所以A ,B 两变量线性相关性更强.
6.B 解析:样本中心点是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1,
所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^
=65.5.
7.D 解析:A 中,相关系数不是l 的斜率;
B 中,x 和y 负相关;
C 中,样本点的个数分布无规律;
D 正确.
二、填空题
8.5% 解析:由K 2的观测值k ≈4.844>3.841,故认为选修文科与性别有关系出错的
可能性约为5%.
9.68 解析:x =10,y =40,
∵回归方程过点(x ,y ),
∴40=-2×10+a ^
.
∴a ^ =60.∴y ^
=-2x +60.
令x =-4,
得y ^
=(-2)×(-4)+60=68.
10.13万元 正 解析:根据中位数的定义,居民家庭年平均收入的中位数是13万元,家庭年平均收入与年平均支出有正线性相关关系.
三、解答题
11.解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成2×2
将2×2K 2的观测值
k =100×(30×10-45×15)275×25×45×55=10033
≈3.030. 因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.
(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件空间为
Ω={(a 1,a 2),(a 1,a 3),(a 2,a 3),(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2)}.
其中a i 表示男性,i =1,2,3.b j 表示女性,j =1,2.
Ω由10个基本事件组成,而且这些基本事件的出现是等可能的.
用A表示“任选2人中,至少有1人是女性”这一事件,则
A={(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)},事件A由7个基本事件组成,因而
P(A)=7 10 .
12.解:(1)
图1 注射药物A后皮肤疱疹面积的频率分布直方图
图2 注射药物B后皮肤疱疹面积的频率分布直方图
可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.
k=
100×100×105×95
≈24.56,
由于k>10.828,所以有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.。