2017-2019学年高中数学人教a版选修1-2练习:第1章 统计案例1.2 含解析
最新整理高中数学人教A版选修1-2 第一章 统计案例 测评1 Word版含答案.doc
学业分层测评(建议用时:45分钟)[学业达标]一、选择题1.在画两个变量的散点图时,下面叙述正确的是( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上【解析】 结合线性回归模型y =bx +a +e 可知,解释变量在x 轴上,预报变量在y 轴上,故选B.【答案】 B2.(2016·泰安高二检测)在回归分析中,相关指数R 2的值越大,说明残差平方和( )A .越大B .越小C .可能大也可能小D .以上均错【解析】 ∵R 2=1-∑i =1n(y i -y ^i )2∑i =1n (y i -y )2,∴当R 2越大时,∑i =1n(y i -y ^i )2越小,即残差平方和越小,故选B. 【答案】 B3.(2016·西安高二检测)已知x 和y 之间的一组数据x 0 1 2 3 y1357则y 与x 的线性回归方程y ^=b ^x +a ^必过点( ) A .(2,2)B.⎝ ⎛⎭⎪⎫32,0C .(1,2)D.⎝ ⎛⎭⎪⎫32,4 【解析】 ∵x =14(0+1+2+3)=32,y =14(1+3+5+7)=4, ∴回归方程y ^=b ^x +a ^必过点⎝ ⎛⎭⎪⎫32,4.【答案】 D4.已知人的年龄x 与人体脂肪含量的百分数y 的回归方程为y ^=0.577x -0.448,如果某人36岁,那么这个人的脂肪含量( )【导学号:19220003】A .一定是20.3%B .在20.3%附近的可能性比较大C .无任何参考数据D .以上解释都无道理【解析】 将x =36代入回归方程得y ^=0.577×36-0.448≈20.3.由回归分析的意义知,这个人的脂肪含量在20.3%附近的可能性较大,故选B.【答案】 B5.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元) 4 2 3 5 销售额y (万元)49263954根据上表可得回归方程y ^=b ^x +a ^中的b ^为9.4,据此模型预报广告费用为6万元时销售额为( )A .63.6万元B .65.5万元C .67.7万元D .72.0万元【解析】 样本点的中心是(3.5,42),则a ^=y -b ^x =42-9.4×3.5=9.1,所以回归直线方程是y ^=9.4x +9.1,把x =6代入得y ^=65.5.【答案】 B 二、填空题6.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为________.【解析】根据样本相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.【答案】 17.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________.【解析】由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y^-5=1.23(x-4),即y^=1.23x+0.08.【答案】y^=1.23x+0.087.某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:x 1020304050y 62■758189 由最小二乘法求得回归方程为y^=0.67x+54.9,现发现表中有一个数据模糊不清,请推断该点数据的值为________.【解析】由题意可得x=15(10+20+30+40+50)=30,设要求的数据为t,则有y=15(62+t+75+81+89)=307+t5,因为回归直线y^=0.67x+54.9过样本点的中心(x,y),所以307+t5=0.67×30+54.9,解得t=68.【答案】688.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y^=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】以x+1代x,得y^=0.254(x+1)+0.321,与y^=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.【答案】 0.254 三、解答题9.(2016·包头高二检测)关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x 2 3 4 5 6 y2.23.85.56.57.0如由资料可知y 对x 呈线性相关关系.试求:(1)线性回归方程:⎝ ⎛⎭⎪⎪⎫a ^=y -b ^x -,b ^=∑i =1nx i y i -n x -y -∑i =1nx 2i-n (x )2(2)估计使用年限为10年时,维修费用是多少? 【解】 (1)x =2+3+4+5+65=4,y =2.2+3.8+5.5+6.5+7.05=5,∑i =15x 2i =90,∑i =15x i y i =112.3, b ^=∑i =15x i y i -5x -y -∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23.于是a ^=y -b ^x =5-1.23×4=0.08. 所以线性回归方程为y ^=1.23x +0.08.(2)当x =10时,y ^=1.23×10+0.08=12.38(万元), 即估计使用10年时维修费用是12.38万元. 10.关于x 与y 有如下数据:x24568y 3040605070 为了对x,y两个变量进行统计分析,现有以下两种线性模型:甲模型y^=6.5x +17.5,乙模型y^=7x+17,试比较哪一个模型拟合的效果更好.【解】R2甲=1-∑i=15(y i-y^i)2∑i=15(y i-y)2=1-1551 000=0.845,R2乙=1-∑i=15(y i-y^i)2∑i=15(y i-y)2=1-1801 000=0.82,因为84.5%>82%,所以甲模型拟合效果更好.[能力提升]1.某学生四次模拟考试时,其英语作文的减分情况如下表:考试次数x 123 4所减分数y 4.543 2.5 显然所减分数y与模拟考试次数x之间有较好的线性相关关系,则其线性回归方程为()A.y=0.7x+5.25B.y=-0.6x+5.25C.y=-0.7x+6.25D.y=-0.7x+5.25【解析】由题意可知,所减分数y与模拟考试次数x之间为负相关,所以排除A.考试次数的平均数为x=14×(1+2+3+4)=2.5,所减分数的平均数为y=14×(4.5+4+3+2.5)=3.5.即直线应该过点(2.5,3.5),代入验证可知直线y=-0.7x+5.25成立,选D.【答案】 D2.已知x 与y 之间的几组数据如下表:x 1 2 3 4 5 6 y21334假设根据上表数据所得线性回归直线方程为y ^=b ^x +a ^.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′【解析】 根据所给数据求出直线方程y =b ′x +a ′和回归直线方程的系数,并比较大小.由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2, a ′=0-2×1=-2. 求b ^,a ^时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136,∑i =16x 2i =1+4+9+16+25+36=91,∴b ^=58-6×3.5×13691-6×3.52=57, a ^=136-57×3.5=136-52=-13, ∴b ^<b ′,a ^>a ′. 【答案】 C3.(2016·江西吉安高二检测)已知x ,y 的取值如下表所示,由散点图分析可知y 与x 线性相关,且线性回归方程为y =0.95x +2.6,那么表格中的数据m 的值为________.x 0 1 3 4 y2.24.34.8m【解析】 x =0+1+3+44=2,y =2.2+4.3+4.8+m 4=11.3+m 4,把(x -,y -)代入回归方程得11.3+m4=0.95×2+2.6,解得m =6.7.【答案】 6.74.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100棵种子中的发芽数,得到如下资料:日期 12月 1日 12月 2日 12月 3日 12月 4日 12月 5日 温差x (℃) 10 11 13 12 8 发芽y (颗)2325302616该农科所确定的研究方案是:先从这5组数据中选取3组数据求线性回归方程,剩下的2组数据用于回归方程检验.(1)若选取的是12月1日与12月5日的2组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(3)请预测温差为14 ℃的发芽数.【解】 (1)由数据求得,x =12,y =27,∑i =13x 2i =434,∑i =13x i y i =977. 由公式求得,b ^=52,a ^=y -b ^x =-3.所以y 关于x 的线性回归方程为y ^=52x -3. (2)当x =10时,y ^=52×10-3=22,|22-23|<2; 当x =8时,y ^=52×8-3=17,|17-16|<2. 所以该研究所得到的线性回归方程是可靠的. (3)当x =14时,有y ^=52×14-3=35-3=32, 所以当温差为14 ℃时的发芽数约为32颗.。
人教版A版高中数学选修1-2课后习题解答
人教版A版高中数学选修1-2课后习题解答高中数学选修1-2课后题答案第一章统计案例1.1 回归分析的基本思想及其初步应用回归分析是一种统计分析方法,用于探究自变量与因变量之间的关系。
它的基本思想是通过建立数学模型,利用已知数据进行拟合,从而预测或解释未知数据。
回归分析的初步应用包括简单线性回归和多元线性回归。
1.2 独立性检验的基本思想及其初步应用独立性检验是一种用于检验两个变量之间是否存在关联的方法。
其基本思想是通过观察两个变量之间的频数或频率分布,来判断它们是否相互独立。
独立性检验的初步应用包括卡方检验和Fisher精确检验。
第二章推理证明2.1 合情推理与演绎推理合情推理是指根据已知事实和常识,推断出可能的结论。
演绎推理是指根据已知的前提和逻辑规则,推导出必然的结论。
两种推理方法都有其适用的场合,需要根据具体情况进行选择。
2.2 直接证明与间接证明直接证明是指通过逻辑推理,直接证明所要证明的命题成立。
间接证明是指采用反证法或归谬法,证明所要证明的命题的否定不成立,从而推出所要证明的命题成立。
第三章数系的扩充与复数的引入3.1 数系的扩充与复数的概念数系的扩充是指在实数系的基础上引入新的数,使得一些原来不可解的方程可以得到解。
复数是指由实部和虚部组成的数,可以表示在平面直角坐标系中的点。
复数的引入扩充了数系,使得一些原本无解的方程可以得到解。
3.2 复数的代数形式的四则运算复数的代数形式是指将复数表示为实部和虚部的和的形式。
复数的四则运算包括加减乘除四种运算,可以通过对实部和虚部分别进行运算来得到结果。
第四章框图4.1 流程图流程图是一种用图形表示算法或过程的方法。
它由各种基本符号和连线构成,用于描述算法或过程的各个步骤及其执行顺序。
流程图可以帮助人们更好地理解算法或过程,从而提高效率。
4.2 结构图结构图是一种用于描述程序结构的图形表示方法。
它包括顺序结构、选择结构和循环结构三种基本结构,可以用来表示程序的控制流程。
高中数学选修1-2(人教A版)第一章统计案例1.2知识点总结含同步练习及答案
为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果 如表所示.根据所选择的
193
个病人的数据,能否作出药的效果与给药方式有关的结论? 有效 口服 注射 合计
58 64 122
无效
40 31 71
合计
98 95 193
解:提出假设
H 0 :药的效果与给药方式没有关系.
) 的前提下,认为"爱好该项运动与性别有关" 的前提下,认为"爱好该项运动与性别无关"
以上的把握认为"爱好该项运动与性别有关" 以上的把握认为"爱好该项运动与性别无关"
0.01 = 1% 1%
的机会错误,即有
99%
以上的把握认为“爱好这项运动与性别有
关”.同时,在犯错误的概率不超过
的前提下,认为“爱好该项运动与性别有关”.
答案: C 解析: 由题意
K 2 = 7.8 > 6.635 ,有 0.01 = 1% 的机会错误,即有 99% 以上的把握认为“爱好这项运 动与性别有关”.同时,在犯错误的概率不超过 1% 的前提下,认为“爱好该项运动与性别有关”;
高考不提分,赔付1万元,关注快乐学了解详情。
≈ 7.8
附表:
P (K 2 ⩾ k) k 0.050 3.841 0.010 6.635 0.001 10.828
参照附表,得到的正确结论是( A.在犯错误的概率不超过 B.在犯错误的概率不超过 C.有 D.有 解:C 由题意
K 2 = 7.8 > 6.635 ,有 99% 99% 0.1% 0.1%
答案: A
B.①③
C.②③
D.①②③
3. 分类变量 X 和 Y 的列联表如下:
则下列说法中正确的是 (
高中数学选修1-2第一章课后习题解答
新课程标准数学选修1—2第一章课后习题解答第一章统计案例1.1回归分析的基本思想及其初步应用练习(P8)1、画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据.说明:学生在对常用的函数图象比较了解的情况下,通过观察散点图可以判断两个变量的关系更近似于哪种函数.2、分析残差可以帮助我们解决以下两个问题:(1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错.(2)分析残差图可以发现模型选择是否合适.说明:分析残差是回归诊断的一部分,可以帮助我们发现样本数据中的错误,分析模型选择是否合适,是否有其他变量需要加入到模型中,模型的假设是否正确等. 本题只要求学生能回答上面两点即可,主要让学生体会残差和残差图可以用于判断模型的拟合效果.3、(1)解释变量和预报变量的关系式线性函数关系.R=.(2)21说明:如果所有的样本点都在一条直线上,建立的线性回归模型一定是该直线,所以每个=+,没有随机误差项,是严样本点的残差均为0,残差平方和也为0,即此时的模型为y bx aR=.格的一次函数关系. 通过计算可得21习题1.1 (P9)1、(1)由表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近似呈线性关系.y表示GDP值,t表示年份. 根据截距和斜率的最小二乘计算公式,得(2)用tˆ14292537.729a≈-,ˆ7191.969b≈从而得线性回归方程ˆ7191.96914292537.729=-.y t残差计算结果见下表.GDP 值与年份线性拟合残差表(年实际GDP 值为117251.9,所以预报与实际相差4275.540-.(4)上面建立的回归方程的20.974R =,说明年份能够解释约97%的GDP 值变化,因此所建立的模型能够很好地刻画GDP 和年份的关系.说明:关于2003年的GDP 值的来源,不同的渠道可能会有所不同.2、说明:本题的结果与具体的数据有关,所以答案不唯一.3、由表中数据得散点图如下:从散点图中可以看出,震级x 与大于或等于该震级的地震数N 之间不呈线性相关关系,随着x 的减少,所考察的地震数N 近似地以指数形式增长. 做变换lg y N =,得到的数据如下表所示.x 和y 的散点图如下:从这个散点图中可以看出x 和y 之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系. 根据截距和斜率的最小二乘计算公式,得ˆ 6.704a≈,ˆ0.741b ≈-, 故线性回归方程为 ˆ0.741 6.704y x =-+. 20.997R ≈,说明x 可以解释y 的99.7%的变化.因此,可以用回归方程 0.741 6.704ˆ10x N-+= 描述x 和N 之间的关系. 1.2独立性检验的基本思想及其初步应用练习(P15)列联表的条形图如图所示.由图及表直观判断,好像“成绩优秀与班级有关系”. 因为2K 的观测值0.653 6.635k ≈<,由教科书中表1-11克重,在犯错误的概率不超过0.01的前提下,不能认为“成绩与班级有关系”.说明:(1)教师应要求学生画出等高条形图后,从图形上判断两个分类变量之间是否有关系. 这里通过图形的直观感觉的结果可能会出错.(2)本题与例题不同,本题计算得到的2K 的观测值比较小,所以没有理由说明“成绩优秀与班级有关系”. 这与反证法也有类似的地方,在使用反证法证明结论时,假设结论不成立的条件下如果没有推出矛盾,并不能说明结论成立也不能说明结论不成立. 在独立性检验中,没有推出小概率事件发生类似于反证法中没有推出矛盾.习题1.2 (P16)1、假设“服药与患病之间没有关系”,则2K 的值应该比较小;如果2K 的值很大,则说明很可能“服药与患病之间没有关系”. 由列联表中数据可得2K 的观测值 6.110 5.024k ≈>,而由教科书表1-11,得2( 5.024)0.025P K ≥≈,所以在犯错误的概率不超过0.025的前提下可以认为“服药与患病之间有关系”. 又因为服药群体中患病的频率0.182小于没有服药群体中患病的频率0.400,所以“服药与患病之间关系”可以解释为药物对于疾病有预防作用. 因此在犯错误的概率不超过0.025的前提下,可以认为药物有效.说明:仿照例1,学生很容易完成此题,但希望学生能理解独立性检验在这里的具体含义,即“服药与患病之间关系”可以解释为“药物对于疾病有预防作用”.2、如果“性别与读营养说明之间没有关系”,由题目中所给数据计算,得2K 的观测值为8.416k ≈,而由教科书中表1-11知2(7.879)0.005P K ≥≈,所以在犯错误的概率不超过0.005的前提下认为“性别与读营养说明之间有关系”.3、说明:需要收集数据,所有没有统一答案. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.4、说明:需要从媒体上收集数据,学生关心的问题不同,收集的数据会不同. 第一步,要求学生收集并整理数据后得到列联表;第二步,类似上面的习题做出判断.第一章 复习参考题A 组(P19)根据散点图,可以认为中国人口总数与年份呈现很强的线性相关关系,因此选用线性回归模型建立回归方程.由最小二乘法的计算公式,得 2095141.503a ≈-,1110.903b ≈,则线性回归方程为 ˆ1110.9032095141.503yx =-. 由2R 的计算公式,得 20.994R ≈,明线性回归模型对数据的拟合效果很好.根据回归方程,,预计2003年末中国人口总数约为129997万人,而实际情况为129227万人,预测误差为770万人;预计2004年末中国人口总数约为131108万人,而实际情况为129988万人,预测误差为1120万人.说明:数据来源为《中国统计年鉴》(2003). 由于人数为整数,所以预测的数据经过四舍五入的取整运算.2、(1)将销售总额作为横轴,利润作为纵轴,根据表中数据绘制散点图如下:由于散点图中的样本点基本上在一个带形区域内分布,猜想销售总额与利润之间呈现线性相关关系.(2)由最小二乘法的计算公式,得 ˆ1334.5a≈,ˆ0.026b ≈, 则线性回归方程为 ˆ0.0261334.5yx =+ 其残差值计算结果见下表:(3)对于(2)中所建立的线性回归方程,20.457R ≈,说明在线性回归模型中销售总额只能解释利润变化的46%,所以线性回归模型不能很好地刻画销售总额和利润之间的关系. 说明:此题也可以建立对数模型或二次回归模型等,只要计算和分析合理,就算正确.3、由所给数据计算得2K 的观测值为 3.689k ≈,而由教科书中表1-11知2( 2.706)0.10P K ≥=所以在犯错误的概率不超过0.10的前提下认为“婴儿的性别与出生的时间有关系”.第一章 复习参考题B 组(P19)1、因为 21(,)()ni i i Q a b y a bx ==--∑21(()())n i i i y bx y bx a y bx ==--+--+∑ 2211()()n n i i i i y bx y bx a y bx ===--++-+∑∑12()()ni i i y bx y bx a y bx =---+-+∑ 并且221()()n i a y bx n a y bx =-+=-+∑,12()()n i i i y bx y bx a y bx =--+-+∑ 1()(())ni i i a y bx y bx ny nbx ==-+--+∑ ()()0a y b x n y n b xn y n b x=-+--+= 所以 221(,)()()ni i i Q a b y bx y bx n a y bx ==--++-+∑.考察上面的等式,等号右边的求和号中不包含a ,而另外一项非负,所以ˆa和ˆb 必然使得等号右边的最后一项达到最小值,即 ˆˆ0ay bx -+=, 即ˆˆy a bx =+. 2、总偏差平方和21()n i i y y =-∑表示总的效应,即因变量的变化效应;残差平方和21ˆ()ni i y y =-∑表示随机误差的效应,即随机误差的变化效应;回归平方和21ˆ()ni yy =-∑表示表示变量的效应,即自变量的变化效应. 等式 222111ˆˆ()()()n n n i ii i i y y y y y y ===-=-+-∑∑∑ 表示因变量的变化总效应等于随机误差的变化效应与自变量的变化效应之和.3、说明:该题主要是考察学生应用回归分析模型解决实际问题的能力,解答应该包括如何获取数据,如何根据散点图寻找合适的模型去拟合数据,以及所得结果的解释三方面的内容.。
高中数学人教A版选修1-2习题:第一章统计案例1.2
D.180
3 某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量的关系,随机抽查了 52 名中学生,得到统计数据如表 1 至表 4, 则与性别有关联的可能性最大的变量是 ( )
表1
成
绩
不及 及 总
格 格计
性别
男
6
女
10
总 计 16
14 20 22 32 36 52
表2
力 性别
视
好
差
总 计
1.2 独立性检验的基本思想及其初步应用 课时过关·能力提升
基础巩固
1 在独立性检验中,可以粗略地判断两个分类变量是否有关的是( )
A.散点图
B.等高条形图
C.假设检验的思想 D.以上都不对
解析等高条形图可以粗略地判断两个分类变量是否有关,但无法精确地给出结论的可靠程度.故选 B.
答案 B
2 判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是( )
2 在一次独立性检验中得到如下列联表:
A
总计
B 200 800 1 000
180 a 180+a
总 计
380
800+a
1 180+a
且最后发现,两个分类变量 A 和 B 没有关系,则 a 的可能值是( )
A.200
B.720
C.100
解析|ad-bc|越小,A 和 B 有关的可能性越小,故选 B.
答案 B
附:K2
P(K2≥k0) 0.500 0.400 0.100 0.010 0.001
k0
0.455 0.708 2.706 6.635 10.828
解由题意得 2×2 列联表:
人教A版高中数学选修1-2《一章 统计案例 1.2 独立性检验的基本思想及其初步应用》精品课件_33
解:根据题目所给数据得到如下列联表:
患心脏病 不患心脏病 总计
秃顶
214
ቤተ መጻሕፍቲ ባይዱ不秃顶
451
总计
665
175
389
597
1048
772
1437
根据列联表中的数据,得到
K 2 1437 (214597 175 451)2 16.373 6.635. 3891048 665 772
案 例:某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调查了 515个成年人,其中吸烟者220人,不吸烟者 295人。
调查结果:吸烟的220人中有37人患呼吸道疾 病,183人未患呼吸道疾病;不吸烟的295人中 有21人患病,274人未患病。
根据这些数据,能否断定:患呼吸道疾 病与吸烟有关?
(2)求k值 (3)下结论
5
8
3
2
6
1
4
5
9
8
(1)如果k 10.828,就有99.9%的把握认为" X 与Y有关系" (2)如果k 7.879,就有99.5%的把握认为" X 与Y有关系"
(3)如果k 6.635,就有99%的把握认为" X 与Y有关系"
(4)如果k 5.024,就有97.5%的把握认为" X 与Y有关系"
练习3:为了调查胃病是否与生活规律有关,在某地对540名40岁以上 的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者 生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生 活规律的共200人. (1)根据以上数据列出2×2列联表; (2)能够以99%的把握认为40岁以上的人患胃病与否和生活规律有关 系吗?为什么?
人教A版数学高二选修1-2单元测试第一章统计案例2
阶段质量检测(一)(时间:120分钟满分:150分)一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.有下列关系:①人的年龄与他拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中有相关关系的是() A.①②③B.①②C.②③D.①③④2.对于回归分析,下列说法中错误的是()A.在回归分析中,若变量间的关系是非确定性关系,则因变量不能由自变量唯一确定B.相关系数可以是正的也可以是负的C.回归分析中,如果R2=1,说明变量x与y之间是完全线性相关D.样本相关系数r∈(-∞,+∞)3.在一次调查后,根据所得数据绘制成如图所示的等高条形图,则()A.两个分类变量关系较弱B.两个分类变量无关系C.两个分类变量关系较强D.无法判断4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反5.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是()x 45678910y 14181920232528A.C.指数函数模型D.对数函数模型6.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ^,则a ^=( )A .10.5B .5.15C .5.2D .5.257.在研究吸烟与患肺癌的关系中,通过收集数据并整理、分析,得到“吸烟与患肺癌有关”的结论,并且有99%的把握认为这个结论成立.下列说法正确的个数是( )①在100个吸烟者中至少有99个人患肺癌;②如果一个人吸烟,那么这个人有99%的概率患肺癌;③在100个吸烟者中一定有患肺癌的人;④在100个吸烟者中可能一个患肺癌的人也没有.A .4B .3C .2D .18.下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:气温(℃) 18 13 10 4 -1 杯数2434395163若热茶杯数y ( ) A.y ^=x +6 B.y ^=x +42 C.y ^=-2x +60 D.y ^=-3x +789.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变大C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强10.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程为y ^=7.19x +73.93,若用此方程预测儿子10岁时的身高,有关叙述正确的是( )A .身高一定为145.83 cmB .身高大于145.83 cmC .身高小于145.83 cmD .身高在145.83 cm 左右11.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:( ) A .没有充足的理由认为课外阅读量大与作文成绩优秀有关 B .有0.5%的把握认为课外阅读量大与作文成绩优秀有关 C .有99.9%的把握认为课外阅读量大与作文成绩优秀有关 D .有99.5%的把握认为课外阅读量大与作文成绩优秀有关12.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35.若X 与Y 有关系的可信程度不小于97.5%,则c 等于( )A .3B .4C .5D .6 附:二、填空题(本大题共) 13.下面是一个2×2列联表:则表中b -a =________.14.已知样本容量为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ^=0.3x +a ^,则x≈________,a ^≈________.(精确到0.01)15.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ^=b ^x +a ^,其中b ^=-2.现预测当气温为-4℃时,用电量的度数约为________.16.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:三、解答题(本大题共6小题,共70分,解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题10分)x与y有如下五组数据,试分析x与y由.18.(本小题12分)有两个分类变量x与y,其一组观测值如下面的2×2列联表所示:其中a,15-a0.1的前提下认为x与y之间有关系?19.(本小题12分)某学校高三年级有学生1000名,经调查,其中750名同学经常参加体育锻炼(称为A类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A类、B类分两层)从该年级的学生中共抽取100名同学,如果以身高达165 cm 作为达标的标准,对抽取的100名学生,得到以下列联表:(1)(2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系(K2的观测值精确到0.001)?20.(本小题12分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了4次试验,得到数据如下:加工的时间y (小时) 2.5 3 4 4.5(1)(2)求y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试预测加工10个零件需要的时间.21.(本小题12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70), [70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P (K 2≥k )0.100 0.050 0.010 0.001 k2.7063.8416.63510.82822.(本小题)之间的一组数据如下表:价格x 1.4 1.6 1.8 2 2.2 需求量1210753(1)画出散点图;(2)求出y 对x 的线性回归方程,并在(1)的图形上画出它的图象; (3)如果价格定为1.9万元,预测需求量大约是多少.(结果精确到0.01 t).答案1.解析:选D 曲线上的点与该点的坐标之间是确定关系——函数关系,故②不正确.其余均为相关关系.2.解析:选D 在回归分析中,样本相关系数r 的范围是|r |≤1,故选D.3.解析:选C 从条形图中可以看出,在x 1中y 1比重明显大于x 2中y 1的比重,所以两个分类变量的关系较强.4.解析:选A 因为b >0时,两变量正相关,此时r >0;b <0时,两变量负相关,此时r <0.5.解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.6.解析:选D 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得a ^=5.25. 7.解析:选D 有99%的把握认为“吸烟与患肺癌有关”,指的是“吸烟与患肺癌有关”这个结论成立的可能性或者可信程度有99%,并不表明在100个吸烟者中至少有99个人患肺癌,也不能说如果一个人吸烟,那么这个人就有99%的概率患肺癌;更不能说在100个吸烟者中一定有患肺癌的人,反而有可能在100个吸烟者中,一个患肺癌的人也没有.故正确的说法仅有④,选D.8.解析:选C 由表格可知,气温与杯数呈负相关关系.把x =4代入y =-2x +60得y =52,e ^=52-51=1.把x =4代入y =-3x +78得y =66,e ^=66-51=15.故应选C.9.解析:选B 由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.10.解析:选D 用线性回归方程预测的不是精确值,而是估计值.当x =10时,y =145.83,只能说身高在145.83 cm 左右.11.解析:选D 根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.12.解析:选A 列2×2列联表如下:故K 2的观测值k =66×[10(35-c )-21c ]31×35×(10+c )(56-c )≥5.024. 把选项A ,B ,C ,D 代入验证可知选A. 13.解析:b -a =8. 答案:814.解析:由题意得x =111∑i =111x i =51011≈46.36,y =111∑i =111y i =21411,因为y =0.3x +a ^,所以21411=0.3×51011+a ^,可得a ^≈5.55.答案:46.36 5.5515.解析:由题意可知x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ^=-2.又回归直线y ^=-2x +a ^过点(10,40),故a ^=60, 所以当x =-4时,y ^=-2×(-4)+60=68. 答案:6816.解析:由列联表中的数据,得K 2的观测值为 k =89×(24×26-31×8)255×34×32×57≈3.689>2.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系. 答案:0.1017.解:作出散点图,如图所示:由散点图可以看出,x 与y 不具有线性相关关系.18.解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系,则k ≥2.706,而k =65×[a (30+a )-(20-a )(15-a )]220×45×15×50=65×(65a -300)220×45×15×50=13×(13a -60)260×90. 由k ≥2.706得a ≥7.19或a ≤2.04.又a >5且15-a >5,a ∈Z ,解得a =8或9,故a 为8或9时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系. 19.解:(1)填写列联表如下:身高达标 身高不达标总计 经常参加体育锻炼 40 35 75 不经常参加体育锻炼101525总计5050100(2)2k=100×(40×15-35×10)275×25×50×50≈1.333<3.841.所以不能在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系.20.解:(1)散点图如图所示:(2)由表中数据得x=3.5,y=3.5,∑i=14(x i-x)(y i-y)=3.5,∑i=14(x i-x)2=5,由公式计算得b^=0.7,a^=y--b^x-=1.05,所以所求线性回归方程为y^=0.7x+1.05.(3)当x=10时,y^=0.7×10+1.05=8.05,所以预测加工10个零件需要8.05小时.21.解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(15×25-15×45)260×40×30×70=2514≈1.79.因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.22.解:(1)散点图如图所示.(2)x-=1.8,y-=7.4,∑i=15x i y i=62,∑i=15x2i=16.6,b^=∑i=15x i y i-5x-y-∑i=15x2i-5x-2=62-5×1.8×7.416.6-5×1.82=-4.60.4=-11.5,a^=y--b^x-=7.4+11.5×1.8=28.1.所以y对x的线性回归方程为y^=-11.5x+28.1.画出图象如图.(3)当价格定为1.9万元,即x=1.9时,y=-11.5×1.9+28.1=6.25.所以商品价格定为1.9万元时,需求量大约是6.25t.。
高中数学选修1-2第一章统计案例测试题带详细解答
第1页,总20页选修1-2第一章、统计案例测试一、选择题1.已知x 与y 之间的一组数据:13574y +++==则y 与x 的线性回归方程为∧∧∧+=a x b y 必过点( ) A.(2,2) B. (1.5 ,4) C.(1.5 ,0) D.(1,2) 【答案】B 【解析】试题分析:由数据可知01231.54x +++==,,∴线性回归方程为∧∧∧+=a x b y 必过点(1.5,4)考点:本题考查了线性回归直线方程的性质点评:解决此类问题常常用到线性回归直线方程恒过定点(,)x y 这一结论,属基础题 2.年劳动生产率x (千元)和工人工资y (元)之间回归方程为1070y x =+,这意味着年劳动生产率每提高1千元时,工人工资平均A.增加70元 B.减少70元 C.增加80元 D.减少80元 【答案】A 【解析】试题分析:由题意,年劳动生产率x (千元)和工人工资y (元)之间回归方程为1070y x =+,故当x 增加1时,y 要增加70元,∴劳动生产率每提高1千元时,工资平均提高70元, 故A正确.考点:线性回归方程.点评: 本题考查线性回归方程的运用,正确理解线性回归方程是关键.3.已知某回归方程为:ˆˆ23y x =-,则当解释变量增加1个单位时,预报变量平均:( )A 、增加3个单位B 、增加13个单位 C 、减少3个单位 D 、减少13个单位试卷第2页,总20页【答案】C 【解析】解释变量即回归方程里的自变量xˆ,由回归方程知预报变量y ˆ减少3个单位 4.变量X 与Y 相对应的一组数据为(10, 1), (11.3, 2), (11.8, 3), (12.5, 4), (13, 5);变量U 与V 相对应的一组数据为(10,5), (11.3, 4), (11.8, 3), (12.5, 2), (13, 1),1r 表示变量Y 与X 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则 A .012<<r r B . 120r r << C . 120r r << D . 12r r = 【答案】C【解析】解:∵变量X 与Y 相对应的一组数据为(10,1),(11.3,2), (11.8,3),(12.5,4),(13,5), . X =(10+11.3+11.8+12.5+13)÷ 5 =11.72 . Y =(1+2+3+4+5) ÷5 =3∴这组数据的相关系数是r=7.2 ÷19.172 =0.3755, 变量U 与V 相对应的一组数据为 (10,5),(11.3,4), (11.8,3),(12.5,2),(13,1) . U =(5+4+3+2+1)÷ 5 =3, ∴这组数据的相关系数是-0.3755,∴第一组数据的相关系数大于零,第二组数据的相关系数小于零, 故选C .5.统计中有一个非常有用的统计量2k ,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个平行班(甲班A 老师教, 乙班B 老师教)进行某次数学考试,按学生考试及格与不及格统计成绩后的2×2列联表.根据2k 的值,你认为不及格人数的多少与不同老师执教有关系的把握大约为 A .99.5% B .99.9% C .95% D .无充分依据. 【答案】A第3页,总20页【解析】解:k2=22()()()()()n ad bc k a b c d a c b d -=++++ =80(4×24-16×36) 2/ 20×60×40×40 =9.6>7.879∴不及格人数的多少与不同老师执教有关系的把握大约为99.5% 故选A .6. 下面是一个2⨯2列联表,则表中a 、b 处的值分别为( )A. 94、96B. 52、54C. 52、50D. 54、52 【答案】B【解析】解:因为根据表格中的数据可知,2+a=b,b+46=100,b=54,a=52,选B7.右图是2×2列联表:则表中a 、b 的值分别为A.94,72B.52,50C.52,74D.74,52 【答案】C【解析】a=73-21=52 b=a+22=52+22=74 故选Cy 1 y 2 总计 x 1 a 21 73 x 2 2 25 27 总计b46100试卷第4页,总20页8.统计中有一个非常有用的统计量2k ,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个班级进行数学考试,按学生考试及格与不及格统计成绩后的2×2列联表.则2k 的值为( )A .0.559B .0.456C .0.443D .0.4 【答案】A【解析】2290(1236339)900.55945452169161χ⨯-⨯==≈⨯⨯⨯,故选A 。
高中数学人教A版选修1-2同步练习第一章 统计案例章末总结 Word版含解析
第一章统计案例章末总结新人教版选修回归方程及其应用对所抽取的样本数据进行分析,分析两个变量之间的关系——线性关系或非线性关系,并由一个变量的变化去推测另一个变量的变化,这就是对样本进行回归分析.某商场经营一批进价是元台的小商品,在市场试验中发现,此商品的销售单价(取整数)元与日销售量台之间有如下对应数据:()(方程的斜率保留一个有效数字).()设经营此商品的日销售利润为元,根据()写出关于的函数关系式,并预测当销售单价为多少元时,才能获得最大日销售利润.分析:作出散点图,根据散点图观察是否具有线性相关关系.解析:()散点图如图所示:从图中可以看出这些点大致分布在一条直线附近,因此两个变量具有线性相关关系.()设回归直线方程为=+.∵=,=,∴=错误!=-错误!≈-,错误!=错误!-错误!=-(-)×=.∴=-.()由题意,有=(-)(-)=-+- .∴当=≈时,有最大值.即预测销售单价为元时,能获得最大日销售利润.判断两个变量之间是否有线性相关关系一般有两种方法:一是计算样本相关系数;二是画散点图.两种方法要结合题目的要求合理选取,也可同时使用,则判断更加准确.►变式训练.从某居民区随机抽取个家庭,获得个家庭的月收入(单位:千元)与月储蓄(单位:千元)的数据资料,算得=.()求家庭的月储蓄对月收入的线性回归方程=+;()判断变量与之间是正相关还是负相关;()若该居民区某家庭月收入为千元,预测该家庭的月储蓄.附:线性回归方程=+中,=-(,\(-))),=-,其中,为样本平均值,线性回归方程也可写为=+.解析:()由题意知:=,===,===.又=-(,\(-))=-×=,=∑=)-=-××=,。
2019人教A版数学选修1-2同步配套课件:第一章 统计案例 1-2
1.分类变量和列联表
(1)分类变量:
不同类
变量的不同“值”表示个体所属的 ___________,像这样的变量称为分类变
频数表
别
量.
一般地,假设有两个分类变量X和Y,它
们的取值分别为 {x1,x ,其样本 总计 y1 y22}和{y1,y2}
x1 a b 频数列联表 (称为 2×2列联表 )为 x2 总计 c a+c d b+d a+b c+d a+b+c+d
2 n ad - bc K 2= . a+bc+da+cb+d
参照附表,得到的正确结论是______.( ③ 只填正确的序号) ①在犯错误的概率不超过 1%的前提下, 认为“该市居民能否做到‘光盘’ 与性别有关”; ②在犯错误的概率不超过 1%的前提下, 认为“该市居民能否做到‘光盘’ 与性别无关”; ③有 90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”; ④有 90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”.
2 100 × 688 - 288 得 K2= ≈3.419. 52×48×75×25
因为 2.706<3.419<3.841. 所以有 90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.
4.网络对现代人的生活影响较大,尤其 是对青少年,为了解网络对中学生学习成绩 的影响,某地区教育主管部门从辖区初中生
总计 1 350 任将数据整理如下: 650 2 000
试分析血液中含有酒精与对事故负有责任是否有关系.
[解析] 作等高条形图如下,图中阴影部
分表示有酒精负责任与无酒精负责任的比例,
从图中可以看出,两者差距较大,由此我们
可以在某种程度上认为“血液中含有酒精与
高中数学人教版选修1-2习题第1章 统计案例1.2 Word版含解析
选修第二章一、选择题.下列关于等高条形图的叙述正确的是( ).从等高条形图中可以精确地判断两个分类变量是否有关系.从等高条例形图中可以看出两个变量频数的相对大小.从等高条形图可以粗略地看出两个分类变量是否有关系.以上说法都不对[答案][解析]在等高条形图中仅能粗略判断两个分类变量的关系,故错.在等高条形图中仅能找出频率,无法找出频数,故错..在×列联表中,两个比值相差越大,两个分类变量之间的关系越强( ).与.与.与.与[答案][解析]与相差越大,说明与相差越大,两个分类变量之间的关系越强..在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是( ).吸烟,不吸烟.患病,不患病.是否吸烟、是否患病.以上都不对[答案][解析]“是否吸烟”是分类变量,它的两个不同取值;吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知、都是一个分类变量所取的两个不同值.故选..下列是一个×列联表:则该表中、的值分别为(....[答案][解析]=-=,=+=+=..在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )①若的观测值满足≥,我们有的把握认为吸烟与患肺病有关系,那么在个吸烟的人中必有人患有肺病;②从独立性检验可知有的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有的可能患有肺病;③从统计量中得知有的把握认为吸烟与患肺病有关系,是指有的可能性使得推断出现错误.①.①③.③.②[答案][解析]①推断在个吸烟的人中必有人患有肺病,说法错误,排除,,③正确.排除,选..假设有两个分类变量与,它们的可能取值分别为{,}和{,},其×列联表为:( ) .=,=,=,=.=,=,=,=.=,=,=,=.=,=,=,=[答案][解析]比较-.选项中,-=;选项中,-=;选项中,-=;选项中,-=.故选.二、填空题.为了调查患慢性气管炎是否与吸烟有关,调查了名岁以下的人,调查结果如下表:[答案][解析]=≈..调查者通过随机询问名男女中学生喜欢文科还是理科,得到如下列联表(单位:名) 性别与喜欢文科还是理科列联表。
(人教版)高中数学选修1-2检测第1章 统计案例1.2 Word版含答案
第一章
一、选择题(每小题分,共分)
.观察下列各图,其中两个分类变量,之间关系最强的是( )
解析:在四幅图中,图中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选.
答案:
.下面是一个×列联表:
..
..
解析:由(\\(+=,+=,))得(\\(=,=.))
答案:
.通过随机询问名性别不同的大学生是否爱好某项运动,得到如下的列联表:
由=算得,
=≈.
附表:
.有以上的把握认为“爱好该项运动与性别有关”
.有以上的把握认为“爱好该项运动与性别无关”
.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”
.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”
解析:由>知,有-即以上的把握认为“爱好该项运动与性别有关”.故选.
答案:
.某班主任对全班名学生进行了作业量的调查,数据如下表:
..
..无充分根据
解析:由于随机变量的观测值=≈>,所以在犯错误概率不超过的前提下,可认为学生的性别与认为作业量的大小有关系,即有的把握,故选.
答案:
二、填空题(每小题分,共分)
.下列关于的说法中,正确的是.
①在任何相互独立的问题中都可以用于检验是否相关;
②越大,两个变量的相关性越大;
③
是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这一类问题.
解析:反映的是两个分类变量相关的可能性的大小,而不是反映两个变量相关的程度,故①②错,只有③正确.
答案:③
.为研究某新药的疗效,给名患者服用此药,跟踪调查后得下表中的数据:
效果与患者的性别有关,这种判断出错的可能性为.。
高中数学人教a版选修1-2第一章统计案例章末复习【练习】(学生版)
高中数学学习材料
金戈铁骑整理制作
第一章统计案例
班级:姓名:_____________
1.线性回归模型y=bx+a+e中,b=_____________,a=______________e称为_________
2.若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为_________ 回归平方和为
____________
3.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以下的人,调查结果如下表:
患慢性气管炎未患慢性气管炎合计
吸烟43 162 205
不吸烟13 121 134
合计56 283 339
根据列联表数据,求得K2=_________________
4.在两个变量的回归分析中,作散点图的目的是_______________________________
5.在回归分析中,通过模型由解释变量计算预报变量时,应注意什么问题?(本题满分10分)
6.某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到
如下联表:
生产线与产品合格率列联表
合格不合格总计
甲线97 3 100
乙线95 5 100
总计192 8 200
请问甲、乙两线生产的产品合格率在多大程度上有关系?(本题满分10分)
7.为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:
天数x/天 1 2 3 4 5 6 繁殖个数y/个 6 12 25 49 95 190
(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图
(2)描述解释变量与预报变量之间的关系
(3)计算残差、相关指数R2.(本题满分20分)。
2017年春高中数学人教A版选修1-2习题课件_第1章 统计案例 1
(3)试预测加工 10 个零件需要多少时间?
n xiyi-n-x
- y
(注:b^=i=1
,a^= y -b^ x )
n
x2i -n x 2
i=1
第二十八页,编辑于星期六:二点 三十九分。
解:(1)散点图如图所示.
4
(2)由表中数据得xiyi=52.5, x =3.5, y =3.5,
i=1
第二十九页,编辑于星期六:二点 三十九分。
序号
科研费用支出 xi
利润 yi xiyi
x2i
5
2
11
3
4
4
5
5
3
6
2
合计
30
31 155 25
40 440 121
30 120 16
34 170 25
25
75 9
20
40 4
180 1 000 200
第十一页,编辑于星期六:二点 三十九分。
则利润(yi)对科研费用支出(xi)的线性回归方程为( )
4
x2i =54,
i=1
∴b^=0.7. ∴a^=1.05. ∴^y=0.7x+1.05. 回归直线如图中所示.
第三十页,编辑于星期六:二点 三十九分。
(3)将 x=10 代入回归直线方程,得 y=0.7×10+1.05= 8.05(小时),
∴预测加工 10 个零件需要 8.05 小时.
第三十一页,编辑于星期六:二点 三十九分。
x 10 15 17 20 25 28 32 y 1 1.3 1.8 2 2.6 2.7 3.3 这些数据的散点图如下图所示:
第十七页,编辑于星期六:二点 三十九分。
有下列判断: (1)根据此散点图,可以判断变量 x 与 y 之间具有线性相关关 系; (2)根据此散点图,可以判断变量 x 与 y 之间具有一次函数关 系. 以上两个命题中,正确的判断有__________(写出正确命题 的序号).
高中数学选修1-2第一章统计案例同步练习(二).docx
高中数学学习材料马鸣风萧萧*整理制作第一章 统计案例 同步练习(二)说明:本试卷分为第Ⅰ、Ⅱ卷两部分,请将第Ⅰ卷选择题的答案填入题后括号内,第Ⅱ卷可在各题后直接作答.共100分,考试时间90分钟.第Ⅰ卷(选择题 共30分)一、选择题(本大题共10小题,每小题3分,共30分)1、下面的各图中,散点图与相关系数r 不符合的是 ( )A 、B 、C 、D 、2、相关的一组数据如右表所示,它们的线性回归方程为,5.10ˆ+=x y则当解释变量1=x 时,预测变量=y ( )x1 2 3 4 5 y1.3 1.71.7 1.3 1.5A 、1.5B 、1.3C 、1.4D 、1.553、给定y 与x 的一组样本数据,求得相关系数,990.0-=r 则( ) A 、y 与x 的线性相关性很强B 、y 与x 的相关性很强x y o 01<<-r x y o 0=r x y o 5.0=r x y o 1-=rC 、y 与x 正线性相关D 、y 与x 负线性相关4、下列关系中是相关关系的是:( )A 、位移与速度、时间的关系B 、烧香的次数与成绩的关系C 、广告费支出与销售额的关系D 、物体的加速度与力的关系5、下表是性别与喜欢数学与否的统计列联表,依据表中的数据,得到 ( )不喜欢看电视 喜欢看电视 总计 男生 24 31 55 女生 8 26 34 总计 32 57 89 A 、317.72≈χB 、689.32≈χC 、706.22<χD 、879.72≈χ6、家庭收入x 与家庭消费支出y 如下表: 收入x 880 2000 7000 9000 12000 支出y7701300380039006600则y 与x 的线性回归方程是 ( )A 、x y4845.0530.380ˆ+= B 、x y2109.0442ˆ+= C 、x y4867.06972.275ˆ+= D 、x y 50.00.150ˆ+= 7、根据下面的列联表:吸烟 不吸烟 合计 患慢性气管炎 43 13 56 未患慢性气管炎 162 121 283合计 205 134 339得到了下列四个判断:①有99.9%的把握认为患慢性气管炎与吸烟有关;②有99.0%的把握认为患慢性气管炎与吸烟有关;③认为患慢性气管炎与吸烟有关的出错的可能为0.1%;④认为患慢性气管炎与吸烟有关的出错的可能为1.0% .其中正确的命题个数是 ( )A 、0B 、1C 、2D 、38、对两个变量的相关系数r ,下列说法中正确的是 ( ) A 、||r 越大,相关程度越大B 、||r 越小,相关程度越大C 、||r 趋近于0时,没有非线性相关关系D 、||r 越接近于1时,线性相关程度越强9、统计假设)()()(:0B P A P AB P H ⋅=成立时,以下判断:①)()()(B P A P B A P ⋅=②)()()(B P A P B A P ⋅=③)()()(B P A P B A P ⋅=其中正确的命题个数是 ( )A 、0B 、1C 、2D 、310、加工零件的个数x 与加工时间y (分钟)的相关数据如下表:零件数x (个) 10 20 30 40 50 60 70 80 90 100 加工时间y (分钟)62 68 75 81 89 95 102 108 115 122则每天工作8小时,预测加工零件的个数是 ( )A 、635.87B 、375.81C 、650.82D 、628.39第Ⅱ卷(非选择题 共70分)二、填空题(本大题共4小题,每小题4分,共16分)11、为考虑广告费用x 与销售额y 之间的关系,随机地抽取5家超市,得到如下表所示的数据:广告费用x (千元) 1.0 4.0 6.0 10.0 14.0 销售额y (千元)19.042.046.052.053.0现要使销售额达到10万元,则广告费用约为__________千元. 12、在0H 成立时,若,10.0)(2=≥k P χ则=k __________.13、独立性检验常作的图形是__________和__________.14、为了考察某种药物预防疾病的效果,进行动物试验,得到了如下的列联表:患病 未患病 总计 服用药 10 46 56 没服用药22 32 54总计32 78 110认为这种药物对预防疾病有效果的把握有_________________.三、解答题(本大题共5小题,共54分.解答应写出文字说明、证明过程或演算步骤)15、(本小题满分8分)保险公司统计的资料表明:居民住宅区到最近消防站的距离x(单位:千米)和火灾所造成的损失数额y(单位:千元)有如下的统计资料:距消防距离x(千米) 1.80 2.60 3.10 4.30 5.50 6.1017.8 19.6 27.5 31.3 36.0 43.2 火灾损失费用y(千元)如果统计资料表明y与x有线性相关关系,试求:(1)用计算器计算线性回归方程及相关系数r;(2)若发生火灾的某居民区与最近的消防站相距7.8千米,评估一下火灾的损失.16、(本小题满分10分)打鼾不仅影响别人休息,而且可能患某种疾病.下表是一次调查所得的数据的列联表.试判断每晚都打鼾与患心脏病是否有关,判断的把握有多大?患心脏病未患心脏病总计每晚都打鼾32 226 258 不打鼾24 1352 1376总计56 1578 163417、(本小题满分12分)某省1994~2005年国内生产总值和固定资产投资完成额的资料如下表:20 20 26 35 52 56固定资产投资完成额x亿元195 210 244 264 294 314 国内生产总值GDP y亿元xy3900 4200 6344 9240 15288 17584 x的平方400 400 676 1225 2704 313681 131 149 163 232 202 固定资产投资完成额x亿元360 432 481 567 655 704 国内生产总值GDP y亿元xy29160 56592 71669 92421 151960 142208 x的平方6561 17161 22201 26569 53824 40804求出y与x的线性回归方程中的估计参数baˆ,ˆ的值,并写出线性回归方程.18、(本小题满分12分)对200个接受心脏搭桥手术的病人和200个接受血管清障手术的病人进行了5年的跟踪研究,调查他们是否又发作过心脏病,列联表如下:又发作过心脏病未发作过心脏病总计心脏搭桥手术40 160 200血管清障手术30 170 200 总计70 330 400试画出列联表的三维柱形图和二维条形图,并结合图形判断选择手术的方式与心脏病的又发作是否有关?19、(本小题满分12分) 某学生6次考试的数学、物理成绩在班中的排名如下表: 数学成绩名次x 1 2 3 5 6 7物理成绩名次y24691113对上述数据分别用a bx y +=与d cx y +=2来拟合y 与x 之间的关系,并用残差分析两者的拟合效果.参考答案第Ⅰ卷(选择题 共30分)1-10 BADCB CCDDA第Ⅱ卷(非选择题 共70分)11、31.8564 12、2.70613、三维柱形图,二维条形图 14、99%15、(1),9778.0,3333.7ˆˆ,6154.5)())((ˆ61261=≈-=≈---=∑∑==r x b y ax xy y x xbj jj j j线性回归方程为,3333.76154.5ˆ+=x y,75.09778.0>=r ∴y 与x 有很强的相关关系(2)当x =7.8,代入回归方程有:1334.513333.78.76154.5ˆ≈+⨯=y(千元) 16、828.105798.741376258157856)22624135232(163422>≈⨯⨯⨯⨯-⨯⨯=χ,有99.9%的把握认为每晚都打鼾与患心脏病有关. 17、2767.21167175661124720116760056612)(12121212ˆ21211212212112112112122121≈-⨯⨯-⨯=--=--=∑∑∑∑∑∑∑=======i i i i i i i i i i i i i i ii x x y x y x xx yx yx b,9243.1711211672767.212472012ˆ12ˆ121121≈⨯-≈⨯-=∑∑==i ii ixbya所求的回归方程是:x y2767.29243.171ˆ+= 18、从二维条形图和三维柱形图(图略)可以判断选择手术方式与心脏病的又发作有关系 19、用a bx y +=来拟合y 与x 之间的关系,由于,5.7,4==y x,28)(,50))((61261=-=--∑∑==i i i i ix x y y x x则,3571.0428505.7ˆ,7857.12850ˆ≈⨯-=≈=a b此时得线性回归方程为,3571.07857.1ˆ+=x y它的残差平方和,214.0)ˆ(2611≈-=∑=i i i yy Q 再用d cx y +=2来拟合y 与x 之间的关系,令2x t =,则对应表中数据为:t 1 4 9 25 36 49 y2 4 6 9 11 13由于,5.7,6667.20=≈y t ,3333.1857)(,400))((61261≈-≈--∑∑==i i i i it t y y t t,0492.36667.203333.18574005.7ˆ,2154.03333.1857400ˆ≈⨯-≈'≈≈'a b此时拟合为0492.32154.0ˆ2+=x y,残差平方和,355.3)ˆ(2612≈'-=∑=i i i y y Q 由于,21Q Q <所以由用a bx y +=来拟合效果更好.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 1.2
A级基础巩固
一、选择题
1.下列关于等高条形图的叙述正确的是导学号 18674054( C )
A.从等高条形图中可以精确地判断两个分类变量是否有关系
B.从等高条例形图中可以看出两个变量频数的相对大小
C.从等高条形图可以粗略地看出两个分类变量是否有关系
D.以上说法都不对
[解析] 在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能找出频率,无法找出频数,故B错.
2.在2×2列联表中,两个比值________相差越大,两个分类变量之间的关系越强导学号 18674055( A )
A.
a
a+b
与
c
c+d
B.
a
c+d
与
c
a+b
C.
a
a+d
与
c
b+c
D.
a
b+d
与
c
a+c
[解析]
a
a+b
与
c
c+d
相差越大,说明ad与bc相差越大,两个分类变量之间
的关系越强.
3.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是导学号 18674056( C )
A.吸烟,不吸烟B.患病,不患病
C.是否吸烟、是否患病D.以上都不对
[解析] “是否吸烟”是分类变量,它的两个不同取值;吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A、B都是一个分类变量所取的两个不同值.故选C.
4.下列是一个2×2列联表:
则该表中a、b的值分别为导学号 18674057( C )
A.94,96 B.52,50
C.52,54 D.54,52
[解析] a=73-21=52,b=a+2=52+2=54.
5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是
导学号 18674058( C )
①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有
关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
A.①B.①③
C.③D.②
[解析] ①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A,B,③正确.排除D,选C.
6.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:
以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为导学号 18674059( D )
A.a=5,b=4,c=3,d=2
B.a=5,b=3,c=4,d=2。