高中数学选择性必修三 8 1 成对数据的相关关系-A基础练(含答案)

合集下载

高中数学新教材选择性必修第三册第八章 成对数据的统计分析 8.1 成对数据的相关关系(南开题库含详解)

高中数学新教材选择性必修第三册第八章  成对数据的统计分析 8.1  成对数据的相关关系(南开题库含详解)

第八章成对数据的统计分析 8.1 成对数据的相关关系一、选择题(共40小题;共200分)1. 下列图形中具有相关关系的两个变量是( )A. B.C. D.2. 有关线性回归的说法,不正确的是( )A. 具有相关关系的两个变量不具有因果关系B. 散点图能直观地反映数据的相关程度C. 回归直线最能代表线性相关的两个变量之间关系D. 任一组数据都有回归直线3. 下列两个变量之间的关系,不是函数关系的是( )A. 角度与它的正弦值B. 圆的半径与它的面积C. 正n边形的边数和正n边形的内角和D. 人的年龄与身高4. 下列两个变量之间的关系,不是函数关系的是( )A. 角度与它的余弦值B. 正方形的边长与面积C. 正n边形的边数与各内角的角度之和D. 人的年龄与身高5. 已知x与y之间的一组数据:x0123y1357则y与x的线性回归方程必过( )A. 点(2,2)B. 点(1.5,0)C. 点(1,2)D. 点(1.5,4)6. 一个口袋中有大小不等的红、黄、蓝三种颜色的小球若干个(大于5个),从中取5次,那么取出红球的次数和口袋中红球的数量是( )A. 确定性关系B. 相关关系C. 函数关系D. 无任何关系7. 下列关系属负相关的是( )A. 父母的身高与子女身高的关系B. 农作物产量与施肥的关系C. 吸烟与健康的关系D. 数学成绩与物理成绩的关系8. 如图所示,每个图的两个变量具有相关关系的是( )A. (1)(2)B. (1)(3)C. (2)(4)D. (2)(3)9. 下列两个变量之间是相关关系的是( )A. 圆的面积与半径之间的关系B. 球的体积与半径之间的关系C. 角度与它的正弦值之间的关系D. 降雪量与交通事故的发生率之间的关系10. 对变量x,y有观测数据(x i,y i)(i=1,2,⋯,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i=1,2,⋯,10),得散点图(2),由这两个散点图可以判断( )A. 变量x与y正相关,u与v正相关B. 变量x与y正相关,u与v负相关C. 变量x与y负相关,u与v正相关D. 变量x与y负相关,u与v负相关11. 已知变量x和y满足关系y=−0.1x+1,变量y与z正相关.下列结论中正确的是( )A. x与y正相关,x与z负相关B. x与y正相关,x与z正相关C. x与y负相关,x与z负相关D. x与y负相关,x与z正相关12. 下列关系中,是相关关系的有( )①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.A. ①②B. ①③C. ②③D. ②④13. 假设有两个分类变量X和Y的2×2列联表:YX y1y2总计x1a10a+10x2c30c+30总计6040100对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为( )A. a=45,c=15B. a=40,c=20C. a=35,c=25D. a=30,c=3014. 对于给定的两个变量的统计数据,下列说法中正确的是( )A. 都可以分析出两个变量的关系B. 都可以用一条直线近似地表示两者的关系C. 都可以作出散点图D. 都可以用确定的表达式表示两者的关系15. 以下四个命题:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件进行某项指标检测,这种抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在回归直线方程y^=0.2x+12中,当解释变量x每增加1个单位时,预报变量y^平均增加0.2个单位;④对分类变量X与Y,它们的随机变量K2的观测值k越小," X与Y有关系"的把握程度越大,其中正确的命题是( )A. ①④B. ②③C. ①③D. ②④16. 对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( )A. 频率分布直方图与总体密度曲线无关B. 频率分布直方图就是总体密度曲线C. 样本容量很大的频率分布直方图就是总体密度曲线D. 如果样本容量无限增大,分组的组距无限减小,那么频率分布直方图就会无限接近于总体密度曲线17. 试从下面四个图中的点在散点图上的分布状态,直观上初步判断两个变量之间有线性相关关系的是( )A. B.C. D.18. 列两个变量之间的关系,不是函数关系的是( )A. 角度与它的余弦值B. 正方形的边长与面积C. 正n边形的边数与内角度数之D. 人的年龄与身高19. 单位产品成本与其产量的相关关系,单位产品成本与单位产品原材料消耗量相关关系中( )A. 前者是正相关,后者是负相关B. 前者是负相关,后者是正相关C. 两者都是正相关D. 两者都是负相关20. 在下列各图中,图中的两个变量间具有相关关系的是( )A. (1)(2)B. (1)(3)C. (2)(4)D. (2)(3)21. 下列变量之间的关系是函数关系的是( )A. 已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量为这个函数对应方程的判别式B. 光照时间和果树亩产量C. 降雪量和交通事故的发生率D. 每亩施用肥料量和粮食亩产量22. 下列有关样本相关系数的说法不正确的是( )A. 相关系数用来衡量x与y之间的线性相关程度B. ∣r∣≤1,且∣r∣越接近0,相关程度越小C. ∣r∣≤1,且∣r∣越接近1,相关程度越大D. ∣r∣≥1,且∣r∣越接近1,相关程度越大23. 观察下列各图:其中两个变量x,y具有线性相关关系的图是( )A. ①②B. ①④C. ③④D. ②③24. 如图是根据变量x,y的观测数据(x i,y i,i=1,2,⋯,10)(得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是( )A. ①②B. ①④C. ②③D. ③④25. 如图是根据x,y的观测数据(x i,y i)(i=1,2,⋯,10)得到的散点图,由这些散点图可以判断变量x,y具有线性相关关系的图是( )A. ①②B. ①④C. ②③D. ③④26. 下列语句所表示的事件不具有相关关系的是( )A. 瑞雪兆丰年B. 名师出高徒C. 吸烟有害健康D. 喜鹊叫喜27. 已知变量x和y满足关系y=−0.1x+1,变量y与z正相关.下列结论中正确的是( )A. x与y正相关,x与z负相关B. x与y正相关,x与z正相关C. x与y负相关,x与z负相关D. x与y负相关,x与z正相关28. 观察下列散点图,其中两个变量的相关关系判断正确的是( )A. a为正相关,b为负相关,c为不相关B. a为负相关,b为不相关,c为正相关C. a为负相关,b为正相关,c为不相关D. a为正相关,b为不相关,c为负相关29. 在一组样本数据(x1,y1),(x2,y2),⋯,(x n,y n)(n≥2,x1,x2,⋯,x n不全相等)的散点图中,若所x+1上,则这组样本数据的样本相关系数为有样本点(x i,y i)(i=1,2,⋯,n)都在直线y=12( )D. 1A. −1B. 0C. 1230. 在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A. 100个吸烟者中至少有99人患有肺癌B. 1个人吸烟,那么这人有99%的概率患有肺癌C. 在100个吸烟者中一定有患肺癌的人D. 在100个吸烟者中可能一个患肺癌的人也没有31. 在研究打酣与患心脏病之间的关系中,通过收集数据、整理分析数据得"打酣与患心脏病有关"的结论,并且有99%以上的把握认为这个结论是成立的.下列说法中正确的是( )A. 100个心脏病患者中至少有99人打酣B. 1个人患心脏病,则这个人有99%的概率打酣C. 100个心脏病患者中一定有打酣的人D. 100个心脏病患者中可能一个打酣的人都没有32. 有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和身体健康情况;④圆的半径与面积;⑤汽车的重量和每千米耗油量.其中两个变量成正相关的是( )A. ①③B. ②④C. ②⑤D. ④⑤33. 对于回归分析,下列说法错误的是( )A. 在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B. 线性相关系数可以为正或负C. 回归分析中,如果r2=1或r±1,说明x与y之间完全线性相关D. 样本相关系数r∈(−1,1)34. 下图中的两个变量具有相关关系的是( )A. B.C. D.35. 下面两个变量之间是相关关系的是( )A. 出租车车费与行驶的里程B. 房屋面积与房屋价格C. 身高与体重D. 铁的大小与质量36. 对于给定的两个变量的统计数据,下列说法正确的是( )A. 都可以分析出两个变量的关系B. 都可以用一条直线近似地表示两者的关系C. 都可以作出散点图D. 都可以用确定的表达式表示两者的关系37. 对变量x,y有观测数据(x i,y i)(i=1,2,⋯,10),得散点图1;对变量u,v有观测数据(u i,v i)(i=1,2,⋯,10),得散点图2.由这两个散点图可以判断( ).A. 变量x与y正相关,u与v正相关B. 变量x与y正相关,u与v负相关C. 变量x与y负相关,u与v正相关D. 变量x与y负相关,u与v负相关38. 下表是某小卖部一周卖出热茶的杯数与当天气温的对比表:气温∘C1813104−1杯数2434395163若热茶杯数y与气温x近似地满足线性关系,则其关系式最接近的是( )A. y=x+6B. y=x+42C. y=−2x+60D. y=−3x+7839. 观察下面频率等高条形图,其中两个分类变量x,y之间关系最强的是( )A. B.C. D.40. 变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )A. r2<r1<0B. 0<r2<r1C. r2<0<r1D. r2=r1二、填空题(共30小题;共150分)41. 下列关系中带有随机性相关关系的有.①光照时间与果树的亩产量的关系;②圆柱体积与其底面直径的关系;③自由落体的物体的质量与落地时间的关系;④球的表面积与球半径之间的关系.42. 下列关系中,属于相关关系的是.①正方形的边长和面积之间的关系;②水稻产量与施肥量之间的关系;③人的身高与学习成绩之间的关系;④降雪量与交通事故的发生率之间的关系.43. 下列变量间的关系是相关关系的有,是函数关系的有.①球的表面积与体积;②光照时间和果树亩产量;③降雪量和交通事故发生率;④出租车费与行驶的里程;⑤人的身高与视力;⑥家庭的支出与收入;⑦收入水平与纳税水平.44. 在研究两个变量的关系时,可以通过残差e^1,e^2,⋯,e^n来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为分析.45. 相应于显著性水平0.05,观测值为10组的相关数临界值为.46. 自变量取值一定时,因变量的取值两个变量之间的关系叫做相关关系.与函数关系,相关关系是一种.47. 对具有的两个变量进行统计分析的方法叫回归分析.48. 现有一个由身高预测体重的回归方程:体重预测值=4(磅/英寸)×身高−130磅.其中体重与身高分别以磅和英寸为单位.如果换算为公制(1英寸≈2.5cm,1磅≈0.45kg),回归方程应该为.49. 从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为.50. 在分析两个分类变量之间是否有关系时,常用到的图表有.51. 据两个变量x,y之间的关系,观察数据画成散点图如图,这两个变量是否具有线性相关关系(答是与否).52. 为了判断两个变量x,y之间是否具有相关关系,描出每一组观测值(x,y)表示的点,得到的图形称为.53. 表示具有相关关系的两个变量的一组数据的图形叫做.54. 现实世界中存在许多情况是两个变量间有密切联系,但这种关系无法用确定的函数关系式表达出来,这种变量之间的关系称.55. 在两个变量的回归分析中,作散点图的目的是.56. 判断下列结论的正误(正确的打“√”错误的打“×”)(1)相关关系与函数关系都是一种确定性的关系.( )(2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示.( ) 57. 已知一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=bx i+a+e i(i=1、2.…n),若e i恒为0,则R2为.58. 若有一组数据的总偏差平方和为100,相关指数为0.5,则其残差平方和为,回归平方和为.59. 许多因素都会影响贫穷,教育也是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的线性回归方程为y^=0.8x+4.6,斜率的估计值等于0.8说明,成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)之间的相关系数.(填“大于0”或“小于0”)60. 有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系.其中有相关关系的是.61. 下列四个关系中为相关关系的是.①正方形的边长与其面积的关系;②圆的面积与半径的关系;③圆柱体积与其底面半径的关系;④Rt△ABC中,锐角A的大小与斜边长度的关系.62. 某市居民2010∼2014年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:年份20102011201220132014收入x11.512.11313.315支出y 6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是,家庭年平均收入与年平均支出有相关关系.(填“正”或“负”)63. 有下列关系:①名师出高徒;②球的体积与该球的半径之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系;⑥乌鸦叫,没好兆.其中,具有相关关系的是.64. 根据你的生活经验及掌握的知识,将下列所有你认为正确的结论填入题后空中.①一般地,学生的数学成绩与物理成绩之间是正相关的;②一般地,学生的数学成绩与英语成绩是负相关的;③一块农田的水稻产量与施肥量之间是相关关系;④对于在校儿童,年龄的大小与阅读能力有很强的相关关系.以上正确的结论是.65. 有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系;(2)曲线上的点与该点的坐标之间的关系;(3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系,其中有相关关系的是66. 已知施化肥量x与水稻产量y的试验数据如下表,则变量x与变量y是相关(填“正”或“负”)施化肥量x15202530354045水稻产量y33034536540544545045567. 下列命题中:①命题p:“∃x0∈R,x02−x0−1>0”的否定¬p“∀x∈R,x2−x−1≤0”;②汽车的重量和汽车每消耗1升汽油所行驶的平均路程成正相关关系;③命题“若a>b,则2a>2b−1”的否命题为“若a≤b,则2a≤2b−1”;④概率是随机的,在试验前不能确定.正确的有.68. 有同学在用电子邮件时发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少,为了研究国籍与邮箱名称是否与含有数字有关,于是我们共收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.那么认为"国籍和邮箱名称里是否含有数字有关"的把握性为.(用百分数表示)69. 某炼钢厂废品率x(%)与成本y(元/t)的线性回归方程为y^=105.492+42.569x.当成本控制在176.5元/t时,可以预计生产1000t钢中,约有t钢是废品.70. 以下四个命题,其中正确的序号是.①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程y^=0.2x+12中,当解释变量x每增加一个单位时,预报变量y^平均增加0.2个单位;④对分类变量X与Y的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.三、解答题(共30小题;共390分)71. 如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?72. 某种产品的广告费支出x与销售额y(单位:万元)之间有如下对应数据:x24568y3040605070判断这两者是否具有相关关系,如果具有的话,进一步判断是正相关还是负相关.73. 从高一(1)班中随机选出10名同学,将他们的身高、数学成绩和物理成绩列表如下:身高(m) 1.50 1.60 1.55 1.65 1.45 1.60 1.52 1.66 1.70 1.40数学成绩(分)90857888877695756870物理成绩(分)88848083787090807468试判断数学成绩与身高和物理成绩是否成线性相关关系.74. “明师出高徒”可以解释为教师的水平越高,学生的水平也越高.那么,教师的水平与学生的水平是否成相关关系?如成相关关系,是正相关,还是负相关?你能举出更多描述生活中两个变量或相关关系的成语吗?75. 5个学生的数学和物理成绩如下表(单位:分)画出散点图,并判断它们是否有相关关系.76. 在班级随机地抽取8名学生,得到一组数学成绩与物理成绩的数据:数学成绩6090115809513580145物理成绩4060754070856090(1)计算出数学成绩与物理成绩的平均分及方差;(2)求相关系数r的值,并判断相关性的强弱;(r≥0.75为强)(3)求出数学成绩x与物理成绩y的线性回归直线方程,并预测数学成绩为110的同学的物理成绩.77. 下图甲、乙分别是对应于(a),(b)两组数据的散点图:表(a)A261813104−1B202434385064表(b)C05101520253035D541.67602.66672.09704.99806.71908.59975.421034.75根据数据的散点图判断两图中变量是否具有相关关系;如果具有相关关系,请说出是哪种相关关系.78. 抽测10名15岁的男生的身高x(单位:cm)和体重y(单位:kg),得到如下数据:x157153151158155156159160158163y45.544424644.54546.5474549(1)作出散点图;(2)从散点图中观察身高与体重成什么关系?(3)如果近似成线性关系,试画出一条直线来近似地表示这种关系.79. 某校为调查学生喜欢数学是否与性别有关,对50名学生进行了问卷调查得到了如下的列联表:喜欢数学不喜欢数学合计男生5女生10合计50已知在全部50人中随机抽取1人抽到喜欢数学的学生的概率为3.5临界值参考:P(k2≥k)0.100.050.250.0100.0050.001k 2.706 3.841 5.024 6.6357.87910.828,其中n=a+b+c+d)(参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)(1)请将上面的列联表补充完整(不用写计算过程);(2)是否有99.5%的把握认为喜欢数学与性别有关?说明你的理由.80. 有一台机床可以按各种不同的速度运转,其加工的零件中有二级品,并且每小时生产的二级品零件的数量随机床运转的速度而变化,下面是记录的数据:机床运转的速度(转/秒)每小时生产二级品的数量/个851281491611(1)作出散点图,并说明上述两个变量之间是否具有线性相关关系;(2)求出机床运转的速度x与每小时生产二级品数量y的回归直线方程;(3)若实际生产中每小时所允许的二级品数量不超过10个,那么机床运转速度不得超过多少转/秒?(保留两位小数)81. 给出施化肥量对水稻产量影响的试验数据如下表:施化肥量x15202530354045水稻产量y330345365405445450455(1)画出散点图,并判断这两者之间是否具有线性相关关系;(2)如果具有线性相关关系,请求出回归直线并且画出图形.82. 在某小区随机抽取16名成年男子测量他们的体重,x表示第一年的体重,y表示第二年的体重,数据如下(单位:kg):x77599098668569847276887595847965y68668199759175808069726391849273(1)对变量y与x进行相关性检验;(2)如果y与x具有线性相关关系,求回归直线方程.83. 下表是某地一年中10天测量的白昼时间统计表(时间近似到0.1小时,一年按365天计算):日期日期位置序号x白昼时间y(小时)日期日期位置序号x白昼时间y(小时)1月1日1 5.66月21日17219.42月28日5910.28月13日22516.43月21日8012.49月20日26312.44月27日11716.410月25日2988.55月6日12617.312月21日3555.4(1)以日期在 365 天中的位置序号 x 为横坐标,白昼时间 y 为纵坐标,在给定的坐标系中画出这些数据的散点图;(2)试选用一个函数近似描述一年中白昼时间 y 与日期位置 x 之间的函数关系; (3)用 (2) 中的函数模型估计该地一年中大约有多少天白昼时间大于 15.9 个小时.84. 某公司的广告费支出 x 与销售额 y (单位:万元)之间有下列对应数据x 24568y 3040605070参考公式:回归方程为 y ^=bx +a ,其中 b =∑x i y i −nxyn i=1∑x i 2−nx2n i=1,a =y −bx .(1)画出散点图,并判断广告费与销售额是否具有相关关系;(2)根据表中提供的数据,用最小二乘法求出 y 与 x 的回归方程 y ^=bx +a ; (3)预测销售额为 115 万元时,大约需要多少万元广告费.85. 在研究色盲与性别的关系调查中,调查了男性 480 人,其中有 38 人患色盲,调查的 520 个女性中 6 人患色盲,根据以上的数据得到一个 2×2 的列联表如下患色盲不换色盲总计男480女520总计1000(1)请根据以上的数据完成这个 2×2 的列联表;(2)若认为“性别与患色盲有关系”,则出错的概率会是多少? 参考数据:(38×514−442×6)2480×520×44×956=0.02714;(38×6−442×514)2480×520×44×956=4.90618;(38×442−6×514)2480×520×44×956=0.01791;86. 菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水 x (单位:千克)清洗该蔬菜 1 千克后,蔬菜上残留的农药 y (单位:微克)的统计表:x 12345y 5854392910(1)在下面的坐标系中,描出散点图,并判断变量 x 与 y 的相关性;(2)若用解析式 y ^=cx 2+d 作为蔬菜农药残量 y ^ 与用水量 x 的回归方程,令 ω=x 2,计算平均值 ω 和 y ,完成以下表格(填在答题卡中),求出 y ^ 与 x 的回归方程;(c ,d 精确到 0.1)ω1491625y 5854392910ωi −ωy i −y(3)对于某种残留在蔬菜上的农药,当它的残留量低于 20 微克时对人体无害,为了放心食用该蔬菜,请估计需要用多少千克的清水清洗一千克蔬菜?(精确到 0.1,参考数据 √5≈2.236)(附:线性回归方程 y ^=b ^x +a ^ 中系数计算公式分别为: b^=i −x )(i −y )n i=1(x −x )2,a ^=y −b^x .)87. 某地区 2007 年至 2013 年农村居民家庭纯收入 y (单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t 1234567人均纯收入y2.93.33.64.44.85.25.9(1)求 y 关于 t 的线性回归方程;(2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均收入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入.88. 在块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg )施化肥量x/kg 15202530354045水稻产量y/kg 330345365405445450455 (1)作出这些数据的散点图; (2)由(1)分析两变量之间的关系: (3)求回归线性方程; (4)当所施化肥量为 50kg 时,求水稻的产量.89. 假设某关于设备的使用年限 x (年)和所支出的维修费用 y (万元)有如下的统计资料.x 23456y 2.2 3.8 5.5 6.57.0(1)画出散点图并判断是否线性相关; (2)如果线性相关,求回归直线方程; (3)估计使用 10 年时的维修费用.90. 已知一个样本数据的对应值如下表:x 1825303941424952y 356788910判断 x ,y 之间是否有线性相关关系,若有,求其线性回归方程.91. 在电视的收视率调查中,得到性别与收视习惯的列联表如下表所示.试用独立性检验的方法分析性别与收视习惯是否有关?若有关系,则说出可在多大程度上认为有关系?92. 如图是某企业 2010 年至 2016 年污水净化量(单位:吨)的折线图.注:年份代码 1∼7 分别对应年份 2010∼2016.附注:参考数据:y =54,∑(t i −t)7i=1(y i −y )=21,√14≈3.74,∑(y i −yi ^)27i=1=94.参考公式:相关系数 r =i −t)n i=1i −y )√∑(t i −t)ni=1∑(y i −y )2ni=1 y ^=a ^+b^t 中斜率和截距的最小二乘估计公式分别为 b^=i −t)n i=1i −y )∑(t −t)2n i=1,a ^=y −b^t . 反映回归效果的公式为 R 2=1i i 2n i=1∑(y −y)2n ,其中 R 2越接近于 1,表示回归的效果越好. (1)由折线图看出,可用线性回归模型拟合 y 和 t 的关系,请用相关系数加以说明; (2)建立 y 关于 t 的回归方程,预测 2017 年该企业污水净化量; (3)请用数据说明回归方程预报的效果.93. 2015 男篮亚锦赛决赛阶段,中国男篮以 9 连胜的不败战绩赢得第 28 届亚锦赛冠军,同时拿到亚洲唯一 1 张直通里约奥运会的入场券.赛后,中国男篮主力易建联荣膺本届亚锦赛 MVP (最有价值球员),如表是易建联在这 9 场比赛中投篮的统计数据.注:(1)表中 a/b 表示出售 b 次命中 a 次;(2)TS%(真实得分率)是横梁球员进攻的效率,其计算公式为:TS%=全场得分2×(投篮出手次数+0.44×罚球出手次数);(1)从上述9场比赛中随机选择一场,求易建联在该场比赛中TS%超过50%的概率;(2)从上述9场比赛中随机选择两场,求易建联在这两场比赛中TS%至少有一场超过60%的概率;(3)用x来表示易建联某场的得分,用y来表示中国队该场的总分,画出散点图如图所示,请根据散点图判断y与x之间是否具有线性相关关系?结合实际简单说明理由.94. 2015男篮亚锦赛决赛阶段,中国男篮以9连胜的不败战绩赢得第28届亚锦赛冠军,同时拿到亚洲唯一1张直通里约奥运会的入场券.赛后,中国男篮主力易建联荣膺本届亚锦赛MVP最有价值球员),如表是易建联这9场比赛中投篮的统计数据.注:(1)表中a/b表示出手b次命中a次;(2)TS%(真实得分率)是衡量球员进攻的效率,其计算公式为:TS%=全场得分2×(投篮出手次数+0.44×罚球出手次数)(1)从上述9场比赛中随机选择一场,求易建联在该场比赛中TS%过50%的概率;。

人教A版高中数学选择性必修第三册习题课(三) 成对数据的统计分析含答案

人教A版高中数学选择性必修第三册习题课(三) 成对数据的统计分析含答案

习题课(三) 成对数据的统计分析一、选择题1.在建立两个变量y 与x 的回归模型时,分别选择了4个不同的模型,它们的R 2如下,其中拟合得最好的模型为( )A .模型1的R 2为0.75B .模型2的R 2为0.90C .模型3的R 2为0.25D .模型4的R 2为0.55解析:选B R 2的值越大,意味着残差平方和越小,也就是说拟合效果越好. 2.对两个变量y 和x 进行回归分析,得到一组样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则下列说法中不正确的是( )A.由样本数据得到的经验回归方程y ^=b ^x +a ^必过样本点的中心(x -,y -) B.残差平方和越小的模型,拟合的效果越好C.用决定系数R 2来刻画回归效果,R 2的值越小,说明模型的拟合效果越好D.若变量y 和x 之间的样本相关系数r =-0.936 2,则变量y 与x 之间具有线性相关关系 解析:选C R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好. 3.对两个变量y 与x 进行回归分析,分别选择不同的模型,它们的样本相关系数r 如下,其中拟合效果最好的模型是( )A .模型Ⅰ:样本相关系数r 为0.96B .模型Ⅱ:样本相关系数r 为-0.81C .模型Ⅲ:样本相关系数r 为-0.53D .模型Ⅳ:样本相关系数r 为0.35 解析:选A |r |越大,拟合效果越好.4.关于残差和残差图,下列说法正确的是( ) A .残差就是随机误差 B .残差图的横坐标是残差C .残差点均匀分布的带状区域的宽度越窄,说明模型拟合精度越高D .残差点均匀分布的带状区域的宽度越窄,说明模型拟合精度越低解析:选C 根据残差分析的概念可知,C 选项正确.残差是真实值减去估计值. 5.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i =1,2,…,20)得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是A .y =a +bxB .y =a +bx 2C .y =a +b e xD .y =a +b ln x解析:选D 用光滑的曲线把图中各点连接起来,由图象的大致走向判断,此函数应该是对数函数类型的,故应该选用的函数模型为y =a +b ln x .6.根据如下所示的列联表得到如下四个判断:①根据小概率值α=0.001的独立性检验,认为患肝病与嗜酒有关;②根据小概率值α=0.01的独立性检验,认为患肝病与嗜酒有关;③没有证据显示患肝病与嗜酒有关.患病状况 饮酒习惯合计嗜酒(Y =0)不嗜酒(Y =1)患肝病(X =0) 7 775 42 7 817 未患肝病(X =1)2 099 49 2 148 合计9 874919 965其中正确命题的个数为( ) A .1 B .2 C .3D .0 解析:选B 根据列联表中的数据,经计算得到 χ2=9 965×(7 775×49-42×2 099)27 817×2 148×9 874×91≈56.632,由56.632>10.828>6.635.且P (χ2≥10.828)≈0.001,P (χ2≥6.635)≈0.01. 所以①②均正确. 二、填空题7.调查某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元)显示,年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的经验回归方程y ^=0.254x +0.321.由经验回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由经验回归方程y ^=0.254x +0.321,知x 每增加1,y 增加0.254. 答案:0.2548.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程为y ^=0.67x +54.9.零件数x /个 10 2030 40 50 加工时间y /min62758189现发现表中有一个数据模糊看不清,请你推断出该数据的值为________. 解析:由表知x =30,设模糊不清的数据为m , 则y =15(62+m +75+81+89)=307+m 5,因为y =0.67x +54.9,即307+m5=0.67×30+54.9,解得m =68.答案:689.假设关于某设备的使用年限x (单位:年)和所支出的维修费用y (单位:万元)有如下的统计资料:x /年 2 3 4 5 6 y /万元2.23.85.56.57.0若由资料可知y 对x 呈线性相关关系,且经验回归方程为y ^=a ^+b ^x ,其中已知b ^=1.23,请估计使用年限为20年时,维修费用约为________万元.解析:由表中数据可知, x -=2+3+4+5+65=4,y -=2.2+3.8+5.5+6.5+7.05=5.∵经验回归直线一定经过点(x -,y -), ∴5=a ^+1.23×4,∴a ^=0.08,∴经验回归方程为y ^=1.23x +0.08.故估计使用年限为20年时,维修费用约为y =1.23×20+0.08=24.68(万元). 答案:24.68 三、解答题10.2023年某市开展了“寻找身边的好老师”活动,市六中积极行动,认真落实,通过网络关注评选“身边的好老师”,并对选出的五位“好老师”的班主任的工作年限和被关注数量进行了统计,得到如下数据:(1)若“好老师”的被关注数量y 与其班主任的工作年限x 满足经验回归方程,试求经验回归方程y ^=b ^x +a ^,并就此分析:“好老师”的班主任工作年限为15年时被关注的数量;(2)若用y ix i(i =1,2,3,4,5)表示统计数据时被关注数量的“即时均值”(四舍五入到整数),从“即时均值”中任选2组,求这2组数据之和小于8的概率.解:(1)因为x -=8,y -=36,所以b ^=40+120+320+600+600-5×8×3616+36+64+100+144-5×82=6,a ^=36-6×8=-12, 所以y ^=6x -12.当x =15时,y ^=6×15-12=78(百人).(2)这5次统计数据,被关注数量的“即时均值”分别为3,3,5,6,4.从5组“即时均值”任选2组,共有C 25=10种情况,其中2组数据之和小于8为(3,3),(3,4),(3,4)共3种情况,所以这2组数据之和小于8的概率为310.11.“双11”已经成为网民们的网购狂欢节,某电子商务平台对某市的网民在今年“双11”的网购情况进行摸底调查,用随机抽样的方法抽取了100人,其消费金额t (百元)的频率分布直方图如图所示:(1)求网民消费金额t 的平均值t -和中位数t 0.(2)把下表中空格里的数填上,并判断能否根据小概率值α=0.001的独立性检验,认为网购消费与性别有关?单位:人消费金额 性别合计 男(Y =0)女(Y =1)t ≥t 0(X =0) t <t 0(X =1) 30 合计45解:(1)以每组的中间值代表本组的消费金额,则网民消费金额t 的平均值 t -=2.5×0.2+7.5×0.3+12.5×0.2+17.5×0.15+22.5×0.1+27.5×0.05=11.5. 直方图中第一组,第二组的频率之和为0.04×5+0.06×5=0.5. 所以t 的中位数t 0=10. (2)补充列联表如下:消费金额 性别合计男(Y =0) 女(Y =1) t ≥t 0(X =0) 25 25 50 t <t 0(X =1) 20 30 50 合计4555100零假设为H 0:网购消费与性别独立,即网购消费与性别无关. 根据列联表中的数据,经计算得到χ2=100×(25×30-25×20)250×50×45×55=10099≈1.01<10.828=x 0.001.根据小概率值α=0.001的独立性检验,没有充分证据推断H 0不成立,因此可以认为H 0成立,即认为网购消费与性别无关.12.流行性感冒(简称流感)是流感病毒引起的急性呼吸道感染,是一种传染性强、传播速度快的疾病.其主要通过空气中的飞沫、人与人之间的接触与被污染物品的接触传播.流感每年在世界各地均有传播,在我国北方通常呈冬春流行,南方有冬春季和夏季两个流行高峰.儿童相对免疫力低,在幼儿园、学校等人员密集的地方更容易被传染.某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:(1)求y 关于x 的回归直线方程;(2)计算变量x ,y 的样本相关系数r (计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人数与年龄负相关很强.(若|r |∈[0.75,1],则x ,y 相关性很强;若|r |∈[0.3,0.75),则x ,y 相关性一般;若|r |∈[0,0.3),则x ,y 相关性较弱)参考数据:30≈5.477.参考公式:b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,样本相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2·∑i =1n(y i -y )2.解:(1)由题意得,x =2+3+4+5+65=4,y =22+22+17+14+105=17,b ^=∑i =15(x i -x )(y i -y )∑i =15(x i -x )2=(-2)×5+(-1)×5+0×0+1×(-3)+2×(-7)(-2)2+(-1)2+02+12+22=-3.2,a ^=y -b ^x =17+3.2×4=29.8, 故y 关于x 的线性回归方程为y ^=-3.2x +29.8.(2)∵r =∑i =15(x i -x )(y i -y )∑i =15(x i -x )2·∑i =15(y i -y )2=-3210×108=-16330≈-0.97,∴r <0,说明x ,y 负相关.又|r |∈[0.75,1],说明x ,y 相关性很强.因此,可以认为该幼儿园去年春季流感人数与年龄负相关很强.。

人教版高中数学选择性必修第三册第八章成对数据的统计分析A卷基础训练(含解析)

人教版高中数学选择性必修第三册第八章成对数据的统计分析A卷基础训练(含解析)

人教版高中数学选择性必修第三册第八章成对数据的统计分析A卷基础训练(原卷版)一、选择题1.某同学为了解气温对热饮销售的影响,经过统计分析,得到了一个卖出的热饮杯数y与当天气温x的回归方程 2.352147.767y x=-+.下列选项正确的是()A.x与y线性正相关B.x与y线性负相关C.y随x增大而增大D.y随x减小而减小2.如表是一个2×2列联表:则表中a,b的值分别为()y1y2合计x1a2173x2222547合计b46120A.94,72B.52,50C.52,74D.74,523.春节期间,“履行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.α0.100.050.025xα 2.706 3.841 5.024参照附表,得到的正确结论是()A.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别无关”4.2020年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区2019年11月至2020年11月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码113分别对应2019年11月2020年11月)根据散点图选择y a x =+和ln y c d x =+两个模型进行拟合,经过数据处理得到的两个回归方程分别为0.93690.0285y x =+和0.95540.0306ln y x =+,并得到以下一些统计量的值:0.93690.0285y x=+0.95540.0306ln y x=+2R 0.9230.973注:x 是样本数据中x 的平均数,y 是样本数据中的平均数,则下列说法不一定成立的是()A .当月在售二手房均价y 与月份代码x 呈正相关关系B .根据0.93690.0285y x =+可以预测2021年2月在售二手房均价约为1.0509万元/平方米C .曲线0.93690.0285y x =+与0.95540.0306ln y x =+的图形经过点(),x yD .0.95540.0306ln y x =+回归曲线的拟合效果好于0.93690.0285y x =+的拟合效果5.(多选题)下列关于回归分析的说法中正确的是()A .回归直线一定过样本中心()x yB .残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适C .甲、乙两个模型的2R 分别约为0.98和0.80,则模型乙的拟合效果更好D .两个模型中残差平方和越小的模型拟合的效果越好6.(多选题)有甲、乙两个班级共计105人进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:参考公式:()()()()()22χ-=++++n ad bc a b c d a c b d 优秀非优秀总计甲班10b乙班c 30()2P K k ≥0.0500.0100.001k3.8416.63510.828已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是()A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为20,b 的值为45C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”二、填空题7.下列是关于出生男婴与女婴调查的列联表晚上白天总计男婴45A B 女婴E 35C 总计98D180那么A =________,B =________,C =________,D =________,E =________.8.某企业一种商品的产量与单位成本数据如下表:产量x (万件)234单位成本y (元/件)3a7现根据表中所提供的数据,求得y 关于x 的线性回归直线方程为25ay x =-,则预测当5x =时单位成本为每件______元.9.在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是________.(填序号)①若2χ的观测值为 6.635χ=,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌;②由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌;③若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误10.x 和y 的散点图如图所示,则下列说法中所有正确命题的序号为______.①x ,y 是负相关关系;②x ,y 之间不能建立线性回归方程;③在该相关关系中,若用21c xy c e =拟合时的相关指数为21R ,用y bx a =+$$$拟合时的相关指数为22R ,则2212R R >.三、解答题11.某企业投资两个新型项目,投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,投资新型项目B 的投资额x (单位:十万元)与纯利润y (单位:万元)的散点图如图所示.(1)求y 关于x 的线性回归方程;(2)根据(1)中的回归方程,若A ,B 两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a =+$$$的斜率和截距的最小二乘估计分别为1221ni ii ni i x y nx yb x nx==-=-∑∑,a y bx =-$$.12.2020年是脱贫攻坚的收官之年,国务院扶贫办确定的贫困县全部脱贫摘帽,脱贫攻坚取得重大胜利,为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础在产业扶贫政策的大力支持下,西部某县新建了甲、乙两家玩具加工厂,加工同一型号的玩具质监部门随机抽检了两个厂的各100件玩具,在抽取中的200件玩具中,根据检测结果将它们分成“A ”、“B ”、“C ”三个等级,A 、B 等级都是合格品,C 等级是次品,统计结果如下表所示:等级A B C 频数2012060(表一)厂家合格品次品合计甲75乙35合计(表二)在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由原厂家自行销.(1)请根据所提供的数据,完成上面的2×2列联表(表二),并判断是否有95%的把握认为产品的合格率与厂家有关?(2)每件玩具的生产成本为30元,A 、B 等级产品的出厂单价分别为60元、40元.另外已知每件次品的销毁费用为4元.若甲厂抽检的玩具中有10件为A 等级,用样本的频率估计概率,试判断甲、乙两厂能否都能盈利,并说明理由.附:22()()()()()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.()20P x χ≥0.500.400.250.150.100.050.0250.0100.0050.0010x 0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828人教版高中数学选择性必修第三册第八章成对数据的统计分析A 卷基础训练(解析版)一、选择题1.某同学为了解气温对热饮销售的影响,经过统计分析,得到了一个卖出的热饮杯数y 与当天气温x 的回归方程 2.352147.767y x =-+.下列选项正确的是()A .x 与y 线性正相关B .x 与y 线性负相关C .y 随x 增大而增大D .y 随x 减小而减小【答案】B【解析】由回归方程 2.352147.767y x =-+,可得:x 与y 线性负相关,且y 随x 增大而减小.故选:B2.如表是一个2×2列联表:则表中a ,b 的值分别为()y 1y 2合计x 1a 2173x 2222547合计b46120A .94,72B .52,50C .52,74D .74,52【答案】C【详解】a =73-21=52,b =a +22=52+22=74.故选:C.3.春节期间,“履行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 为样本容量.α0.100.050.025x α2.7063.8415.024参照附表,得到的正确结论是()A .在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”D .在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别无关”【答案】C【详解】由2×2列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,代入公式得χ2=100×(675-300)255×45×75×25≈3.030<3.841.∵2.706<3.030<3.841,∴在犯错误的概率不超过0.1的前提下认为“该市居民能否做到光盘与性别有关”.4.2020年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区2019年11月至2020年11月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码113分别对应2019年11月2020年11月)根据散点图选择y a =+和ln y c d x =+两个模型进行拟合,经过数据处理得到的两个回归方程分别为0.9369y =+和0.95540.0306ln y x =+,并得到以下一些统计量的值:注:x 是样本数据中x 的平均数,y 是样本数据中的平均数,则下列说法不一定成立的是()A .当月在售二手房均价y 与月份代码x 呈正相关关系B .根据0.9369y =+可以预测2021年2月在售二手房均价约为1.0509万元/平方米C .曲线0.9369y =+与0.95540.0306ln y x =+的图形经过点(),x yD .0.95540.0306ln y x =+回归曲线的拟合效果好于0.9369y =+的拟合效果【答案】C【解析】对于A ,散点从左下到右上分布,所以当月在售二手房均价y 与月份代码x 呈正相关关系,故A 正确;对于B ,令16x =,由0.9369 1.0509y =+=,所以可以预测2021年2月在售二手房均价约为1.0509万元/平方米,故B 正确;对于C ,非线性回归曲线不一定经过()x y ,故C 错误;对于D ,2R 越大,拟合效果越好,故D 正确.故选:C.5.(多选题)下列关于回归分析的说法中正确的是()A .回归直线一定过样本中心()x yB .残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适C .甲、乙两个模型的2R 分别约为0.98和0.80,则模型乙的拟合效果更好D .两个模型中残差平方和越小的模型拟合的效果越好【答案】ABD【解析】对于A 选项,回归直线一定过样本中心(),x y ,A 选项正确;对于B 选项,残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,B 选项正确;对于C 选项,甲、乙两个模型的2R 分别约为0.98和0.80,则模型甲的拟合效果更好,C 选项错误;对于D 选项,两个模型中残差平方和越小的模型拟合的效果越好,D 选项正确.故选:ABD.6.(多选题)有甲、乙两个班级共计105人进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:参考公式:()()()()()22χ-=++++n ad bc a b c d a c b d 优秀非优秀总计甲班10b 乙班c 30()2P K k ≥0.0500.0100.001k3.8416.63510.828已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是()A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为20,b 的值为45C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”【答案】BC【详解】由题意,在全部的105人中随机抽取1人,成绩优秀的概率为27,所以成绩又由的人数为2105=307⨯人,非优秀的人数为1053075-=人,所以301020,753045c b =-==-=,则()22105103020453366.110 3.8413075505555χ⨯⨯-⨯==≈>⨯⨯⨯,若按95%的可靠性要求,能认为“成绩与班级有关系”.故选:BC.二、填空题7.下列是关于出生男婴与女婴调查的列联表晚上白天总计男婴45A B 女婴E 35C 总计98D180那么A =________,B =________,C =________,D =________,E =________.【答案】47;92;88;82;53【详解】∵45+E =98,∴E =53,∵E +35=C ,∴C =88,∵98+D =180,∴D =82,∵A +35=D ,∴A =47,∵45+A =B ,∴B =92.8.某企业一种商品的产量与单位成本数据如下表:产量x (万件)234单位成本y (元/件)3a7现根据表中所提供的数据,求得y 关于x 的线性回归直线方程为25ay x =-,则预测当5x =时单位成本为每件______元.【答案】9【详解】由所给数据可求得23433x ++==,103a y +=,代入线性回归直线方程ˆ25ayx =-,得103a +=235a⨯-,解得5a =,所以线性回归直线方程ˆ21yx =-,当5x =时单位成本ˆ2519y=⨯-=(元/件).9.在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是________.(填序号)①若2χ的观测值为 6.635χ=,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌;②由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌;③若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误【答案】③【解析】若从统计量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误,故③正确.10.x 和y 的散点图如图所示,则下列说法中所有正确命题的序号为______.①x ,y 是负相关关系;②x ,y 之间不能建立线性回归方程;③在该相关关系中,若用21c xy c e =拟合时的相关指数为21R ,用y bx a =+$$$拟合时的相关指数为22R ,则2212R R >.【答案】①③【详解】在散点图中,点散布在从左上角到右下角的区域,因此x ,y 是负相关关系,故①正确;x,,y 之间可以建立线性回归方程,但拟合效果不好,故②错误;由散点图知用21c xy c e =拟合比用y bx a =+$$$拟合效果要好,则2212R R >,故③正确.三、解答题11.某企业投资两个新型项目,投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,投资新型项目B 的投资额x (单位:十万元)与纯利润y (单位:万元)的散点图如图所示.(1)求y 关于x 的线性回归方程;(2)根据(1)中的回归方程,若A ,B 两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a =+$$$的斜率和截距的最小二乘估计分别为1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-$$.【答案】(1) 1.60.2y x =+;(2)B 项目的收益更好.【解析】(1)由散点图可知,x 取1,2,3,4,5时,y 的值分别为2,3,5,7,8,所以1234535x ++++==,2357855y ++++==,2222221223354758535 1.61234553b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯,则5 1.630.2a =-⨯=,故y 关于x 的线性回归方程为 1.60.2y x =+.(2)因为投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为1.70.5n m =-,所以若A 项目投资60万元,则该企业所得纯利润的估计值为1.760.59.7⨯-=万元;因为y 关于x 的线性回归方程为 1.60.2y x =+,所以若B 项目投资60万元,则该企业所得纯利润的估计值为1.660.29.8⨯+=万元.因为9.89.7>,所以可预测B 项目的收益更好.12.2020年是脱贫攻坚的收官之年,国务院扶贫办确定的贫困县全部脱贫摘帽,脱贫攻坚取得重大胜利,为确保我国如期全面建成小康社会,实现第一个百年奋斗目标打下了坚实的基础在产业扶贫政策的大力支持下,西部某县新建了甲、乙两家玩具加工厂,加工同一型号的玩具质监部门随机抽检了两个厂的各100件玩具,在抽取中的200件玩具中,根据检测结果将它们分成“A ”、“B ”、“C ”三个等级,A 、B 等级都是合格品,C 等级是次品,统计结果如下表所示:等级A B C 频数2012060(表一)厂家合格品次品合计甲75乙35合计(表二)在相关政策扶持下,确保每件合格品都有对口销售渠道,但从安全起见,所有的次品必须由原厂家自行销.(1)请根据所提供的数据,完成上面的2×2列联表(表二),并判断是否有95%的把握认为产品的合格率与厂家有关?(2)每件玩具的生产成本为30元,A 、B 等级产品的出厂单价分别为60元、40元.另外已知每件次品的销毁费用为4元.若甲厂抽检的玩具中有10件为A 等级,用样本的频率估计概率,试判断甲、乙两厂能否都能盈利,并说明理由.附:22()()()()()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.()20P x χ≥0.500.400.250.150.100.050.0250.0100.0050.0010x 0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828【答案】(1)列联表答案见解析,没有95%的把握认为产品的合格率与厂家有关;(2)甲厂能盈利,乙不能盈利,理由见解析.【解析】(1)2×2列联表如下厂家合格品次品合计甲7525100乙6535100合计14060200()2220075352565 2.38 3.84110010014060χ⨯⨯-⨯=≈<⨯⨯⨯,∴没有95%的把握认为产品的合格率与厂家有关.(2)甲厂10件A 等级,65件B 等级,25件次品,对于甲厂,单件产品利润X 的可能取值为30,10,34-.X 的分布列如下:X 301034-P1101320141131()3010341010204E X ∴=⨯+⨯-⨯=>,∴甲厂能盈利,对于乙厂有10件A 等级,55件B 等级,35件次品,对于乙厂,单位产品利润Y 的可能取值为30,10,34-,Y 分布列如下:Y 301034-P1101120720111717()30103401020205E Y ∴=⨯+⨯-⨯=-<,乙不能盈利.。

人教A版高中数学选择性必修第三册精品课件 第8章 成对数据的统计分析 8.1 成对数据的统计相关性

人教A版高中数学选择性必修第三册精品课件 第8章 成对数据的统计分析 8.1 成对数据的统计相关性
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
解析:由样本相关系数r1=0.785 9>0知x与y正相关,由样本相关系数
r2=-0.956 8<0知u与v负相关,又|r1|<|r2|,故变量u与v的线性相关性较强.
规范展示:变量 y 与 x 的样本相关系数是
相关系数是
35.4
r'=15.6×2.3≈0.99,可以看出
与 BMI 值都是高度正相关.
28.3
r=15.6×1.9≈0.95,变量
z 与 x 的样本
TC 指标值与 BMI 值、GLU 指标值
本题考查均值、标准差以及样本相关系数等问题,是关于样本相关系数的
2.(1)每一个序号下的成对样本数据都可用直角坐标系中的点表示出来,由
这些点组成了统计图.我们把这样的统计图叫做散点图.
(2)如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现
增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另
一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
数据,由这四组不同的样本数据得到的样本相关系数r分别为
0.25,0.50,0.98,0.80,则其中相关程度最大的样本相关系数是(
A.0.25
B.0.50
C.0.98
D.0.80
解析:线性相关关系的判断中,样本相关系数为r,
|r|越接近于1,相关程度越大,
|r|越小,相关程度越小,故选C.
答案:C
)
15
1.3

人教A版高中数学选择性必修第三册课后习题 第八章 变量的相关关系 8.1.2 样本相关系数

人教A版高中数学选择性必修第三册课后习题 第八章 变量的相关关系 8.1.2 样本相关系数

8.1 成对数据的统计相关性8.1.1 变量的相关关系8.1.2 样本相关系数A级必备知识基础练1.下列说法正确的是( )A.圆的面积与半径之间的关系是相关关系B.粮食产量与施肥量之间的关系是函数关系C.一定范围内,学生的成绩与学习时间呈现正相关关系D.人的体重与视力呈现负相关关系2.在下列各图中,两个变量具有相关关系的是( )A.(1)(2)(3)B.(1)(3)(4)C.(2)(3)(4)D.(1)(2)(4)3.如下四个散点图中,呈现正相关关系的是( )4.为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的样本相关系数,其数值分别为0.939,0.937,0.948,则( )A.甲组数据的线性相关性最强,乙组数据的线性相关性最弱B.乙组数据的线性相关性最强,丙组数据的线性相关性最弱C.丙组数据的线性相关性最强,甲组数据的线性相关性最弱D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱5.下列两个变量之间具有相关关系的是.①正方形的边长a和面积S;②一个人的身高h和腿长x;③真空中的自由落体运动其下落的距离h和下落的时间t;④一个人的身高h和体重x.6.为了对某班考试成绩进行分析,现从全班同学中随机抽取8位同学,他们的数学、物理成绩对应如表.根据表中数据分析:是否可以认为变量x 与y具有线性相关关系?B级关键能力提升练7.在各散点图中,两个变量具有正相关关系的是( )8.甲、乙、丙、丁四位同学各自对x,y两变量的线性相关性做试验,并分别求得样本相关系数r,如表:则哪位同学的试验结果体现两变量有更强的线性相关性?( )A.甲B.乙C.丙D.丁9.如图所示,5组数据(x,y)中去掉D(3,10)后,下列说法正确的是( )A.相关系数r不变B.相关系数r变小C.负线性相关变为正线性相关D.变量x与变量y的相关性变强10.(多选题)对于样本相关系数r,以下说法错误的是( )A.r只能是正值,不能为负值B.|r|≤1,且|r|越接近于1,相关程度越强;相反则越弱C.|r|≤1,且|r|越接近于1,相关程度越弱;相反则越强D.r<0时表示两个变量不相关11.关于变量x,y的一组样本数据(a1,b1),(a2,b2),…,(a n,b n)(n≥2,a1,a2,…,a n不全相等)的散点图中,若所有样本点(a i,b i)(i=1,2,…,n)恰好都在直线y=-2x+1上,则根据这组样本数据推断的变量x,y的相关系数为.C级学科素养创新练12.许多先进国家对驾驶员的培训大多采用室内模拟教学和训练,而后再进行实地训练并考试,这种方法可以大大节约训练的费用.问题是这种方法有效吗?如表是12名学员的模拟驾驶成绩x与实际考试成绩y的记录(单位:分):y 75 97 92 80 71 72试问:两者的相关性如何?请画出散点图,并求出x与y间的样本相关系数.8.1.1 变量的相关关系8.1.2 样本相关系数1.C 对于A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A错误;对于B,粮食产量与施肥量之间的关系不是函数关系,是相关关系,所以B 错误;对于C,一定范围内,学生的成绩与学习时间呈现正相关关系,所以C正确; 对于D,人的体重与视力是没有相关关系的,所以D错误.2.A 图(1)、(2)、(3)中,散点图中的点大致分布在一条直线附近,呈带状分布,所以变量间具有线性相关关系;图(4)中,散点图中的点分布杂乱无章,不在一条直线附近,也不呈带状分布,所以变量间不具有相关关系.3.A 根据题意,依次分析选项:对于A,散点图中的点从左向右是上升的,呈现正相关关系;对于B,散点图中的点从左向右是下降的,呈现负相关关系;对于C,散点图中的点呈片状分布,没有明显的相关性;对于D,散点图中的点也呈片状分布,没有明显的相关性.4.D 甲、乙、丙三组数据的线性相关系数分别为0.939,0.937,0.948,所以线性相关系数最大的丙组数据的线性相关性最强,线性相关系数最小的乙组数据的线性相关性最弱.5.②④ 对于①,正方形的边长a 和面积S 是函数关系,不是相关关系; 对于②,一般情况下,一个人的身高h 和腿长x 是正相关关系;对于③,真空中的自由落体运动其下落的距离h 和下落的时间t 是函数关系,不是相关关系;对于④,一般情况下,一个人的身高h 和他的体重x 是正相关关系. 6.解x =18×(60+65+70+75+80+85+90+95)=77.5,y =18×(72+77+80+85+88+90+93+95)=85.Ʃi=18(x i -x )(y i -y )=685,Ʃi=18(x i -x )2=1050,Ʃi=18(y i -y )2=456.所以线性相关系数r=Ʃi=18(x i -x )(y i -y )√Ʃi=18(x i -x )Ʃi=18(y i -y )=√1050×456≈0.99,接近于1,所以可以认为变量x 与y 具有线性相关关系. 7.B 根据题意,依次分析选项为:对于A,是相关关系,但不是正相关关系,不符合题意; 对于B,是相关关系,也是正相关关系,符合题意; 对于C,是相关关系,是负相关关系,不符合题意;对于D,所示的散点图中,样本点不呈带状分布,这两个变量不具有相关关系,不符合题意.8.D 根据题意知,丁同学的样本相关系数|r|=0.87为最大,所以丁同学的试验结果体现两变量有更强的线性相关性.9.D 由散点图知,去掉点D(3,10)后,y与x的线性相关性加强,由于是正线性相关,所以相关系数r变大,选项A错误,选项B错误;仍然是正线性相关,选项C错误;变量x与变量y的相关性变强,所以选项D正确.10.ACD 由样本相关系数的性质知选项B正确,其余选项均错误.11.-1 所有样本点都在直线上,说明这两个变量间完全负相关,故其相关系数为-1.12.解两者的相关性很强.画出散点图,如图所示,由散点图中的点分布在一条直线附近,知两变量线性相关性很强;×(98+55+…+73)≈80,由表中数据,计算x=112y=1×(95+60+…+72)≈78.12相关系数为r=1122121212xy=√x12+x22+…+x122-12x2·√y12+y22+…+y122-12y298×95+55×60+…+73×72-12×80×78√982+552+…+732-12×802×√952+602+…+722-12×782≈2122≈0.9855.46.08×46.73所以y与x间的样本相关系数为0.9855,接近于1,知两变量的线性相关性很强.。

8.1 成对数据的相关关系(精练)(解析版)

8.1 成对数据的相关关系(精练)(解析版)

8.1 成对数据的相关关系(精练)【题组一相关关系】1.(2021·贵州贵阳市)如下四个散点图中,正相关的是()A.B.C.D.【答案】A【解析】对于A,散点图中的点从左向右是上升的,且在一条直线附近,是正相关;对于B,散点图中的点从左向右是下降的,且在一条直线附近,是负相关;对于C、D,散点图中的点不成带状分布,没有明显的相关关系;故选:A.2.(2021·秦安县第一中学高二期末)根据下面给出的2009年至2018年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2018年减少二氧化硫排放量的效果最显著B.2012年我国治理二氧化硫排放显现成效C.2011年以来我国二氧化硫年排放量呈减少趋势D.2011年以来我国二氧化硫年排放量与年份正相关【答案】D【解析】A. 逐年比较,2018年年排放量最少,故减少二氧化硫排放量的效果最显著;B. 2012年比2011年二氧化硫年排放量明显减少,故2012年我国治理二氧化硫排放显现成效;C. 2011年以来每年我国二氧化硫年排放量除2016年外几乎都在减少,故总体呈减少趋势.D. 2011年以来我国二氧化硫年排放量随年份逐渐减少,与年份负相关,故D错.故选:D3.(2020·全国高三专题练习)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:根据表中数据,下列说法正确的是()A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系【答案】A【解析】画出利润率与人均销售额的散点图,如图.由图可知利润率与人均销售额成正相关关系.故选:A.4.(2020·青海海东市)下列说法正确的是()A.圆的面积与半径之间的关系是相关关系B.粮食产量与施肥量之间的关系是函数关系C.一定范围内,学生的成绩与学习时间成正相关关系D.人的体重与视力成负相关关系【答案】C【解析】对于A ,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A 错误; 对于B ,粮食产量与施肥量之间的关系是不是函数关系,是相关关系,所以B 错误; 对于C ,一定范围内,学生的成绩与学习时间是成正相关关系的,所以C 正确; 对于D ,人的体重与视力是没有相关关系的,所以D 错误. 故选:C.5.(2019·广东广州市·执信中学)对于散点图下列说法正确一个是( ) A .一定可以看出变量之间的变化规律 B .一定不可以看出变量之间的变化规律 C .可以看出正相关与负相关有明显区别 D .看不出正相关与负相关有什么区别【答案】C【解析】给出一组样本数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,不一定存在回归直线来模拟数据, 但是通过散点图可以看出正相关与负相关有明显区别. 故选:C6.(2021·江门市)下列语句表示的事件中的因素不具有相关关系的是( ) A .瑞雪兆丰年 B .名师出高徒C .不积跬步,无以至千里D .喜鹊叫喜,乌鸦叫丧 【答案】D【解析】A. 瑞雪对小麦有好处,可能使得小麦丰收,所以瑞雪兆丰年具有相关关系; B. 名师水平高,可能使得学生学习好,所以名师出高徒具有相关关系; C. 不积跬步,就不会有千里,所以不积跬步,无以至千里具有相关关系; D. 喜鹊叫喜,乌鸦叫丧,两者没有必然的关系. 故选:D7.(2020·吉林长白山保护开发区教育局高一月考)下列两个变量之间的关系哪个不是函数关系( ) A .角度和它的正切值 B .人的右手一柞长和身高C .正方体的棱长和表面积D .真空中自由落体运动物体的下落距离和下落时间【答案】B【解析】A 选项,由于角度和正切值有确定的关系tan y x =;B 选项,人的右手一柞长和身高不具有统一的关系;C 选项,正方体的棱长和表面积有关系26S a =;D 选项,真空中自由落体运动物体的下落距离和下落时间有确定的关系212s gt =.故选:B 8.(2020·江西赣州市·南康中学高二期中(文))观察下列各图形,其中两个变量x y ,具有相关关系的图是( ) A .①② B .①④C .③④D .③【答案】C【解析】由图可知,图③中这些点大致分布在一条直线附近,具有线性相关关系;图④中这些点大致分布在一条类似二次曲线附近,具有相关关系;而图①②中这些点分布不均匀,比较分散,不具有相关关系. 故选:C .【题组二 样本的相关系数】1.(2020·广东广州市)在建立两个变量y 与x 的回归模型,模型14的()()221211niii nii y y R y y ==-=--∑∑的值依次是0.35,0.67,0.84,0.92,则其中拟合效果最好的模型是( ) A .模型1 B .模型2C .模型3D .模型4【答案】D【解析】根据相关指数的作用,可知相关指数越大,模型拟合效果越好, 因为0.350.670.840.92<<<,所以模型4的拟合效果最好.故选:D.2.(2020·河南)有一散点图如图所示,现拟合模型为直线l 1,在5个(x ,y )数据中去掉D (3,10)后,重新拟合模型为直线l 2给出下列说法:①相关系数r 变大;②相关指数R 2变大;③残差平方和变小;④解释变量x 与预报变量y 的相关性变强.其中正确说法的个数为( )A .1个B .2个C .3个D .4个【答案】D【解析】由题意,散点图有5个(,)x y 的数据,去掉(3,10)D 后, 可得y 与x 的相关性越强,并且是正相关,所以相关系数r 变大,相关指数2R 变大,残差的平方和变小, 所以四个命题都正确. 故选:D.3.(2020·全国高三专题练习)对于相关系数r ,下列说法中正确的是( ) A .r 越大,线性相关程度越强 B .r 越小,线性相关程度越强C .r 越大,线性相关程度越弱,r 越小,线性相关程度越强D .1r ≤,且r 越接近1,线性相关程度越强,r 越接近0,线性相关程度越弱 【答案】D【解析】对于选项A ,r 越大,线性相关程度越强,即A 错误; 对于选项B ,r 越小,线性相关程度越弱,即B 错误;对于选项C ,r 越大,线性相关程度越强,r 越小,线性相关程度越弱, 即C 错误;对于选项D ,1r ≤,且r 越接近1,线性相关程度越强,r 越接近0,线性相关程度越弱,即D 正确, 故选:D.4.(2020·甘肃省会宁县第一中学)下列结论:①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其中正确的是______.(将所有正确的序号填上) 【答案】①②④【解析】根据函数关系及相关关系的定义,①函数关系是一种确定性关系.②相关关系是一种非确定性关系.是正确的;由回归分析的定义及应用可知,④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.故答案为:①②④.5.(2020·合肥市第六中学高一期末)某统计部门对四组数据进行统计分析后,获得如图所示的散点图,关于相关系数的比较,其中正确的是( )A .4213r r r r <<<B .2413r r r r <<<C .2431r r r r <<<D .4231r r r r <<<【答案】C【解析】根据散点图的特征,数据大致呈增长趋势的是正相关,数据呈递减趋势的是负相关;数据越集中在一条线附近,说明相关性越强,由题中数据可知:(1)(3)为正相关,(2)(4)为负相关; 故1>0r ,3>0r ;20r <,40r <;又(1)与(2)中散点图更接近于一条直线,故13>r r ,24r r <, 因此,24310r r r r <<<<. 故选C .6.(2020·全国)对两个变量x 、y 进行线性相关检验,得线性相关系数10.7859r =,对两个变量u 、v 进行线性相关检验,得线性相关系数20.9568r =-,则下列判断正确的是( ) A .变量x 与y 正相关,变量u 与v 负相关,变量x 与y 的线性相关性较强 B .变量x 与y 负相关,变量u 与v 正相关,变量x 与y 的线性相关性较强 C .变量x 与y 正相关,变量u 与v 负相关,变量u 与v 的线性相关性较强 D .变量x 与y 负相关,变量u 与v 正相关,变量u 与v 的线性相关性较强 【答案】C【解析】由线性相关系数10.78590r =>知x 与y 正相关,由线性相关系数20.95680r =-<知u 与v 负相关,又12r r <,所以,变量u 与v 的线性相关性比x 与y 的线性相关性强, 故选:C.7.(2020·江苏扬州市·高三期中)某校从高二年级随机抽取了20名学生的数学总评成绩和物理总评成绩,记第i 位学生的成绩为(i i x y ,) (i =1,2,3...20),其中i i x y ,分别为第i 位学生的数学总评成绩和物理总评成绩.抽取的数据列表如下( 按数学成绩降序整理):(1)根据统计学知识,当相关系数|r |≥0.8时,可视为两个变量之间高度相关.根据抽取的数据,能否说明数学总评成绩与物理总评成绩高度相关?请通过计算加以说明. 参考数据:20202022111()()485.()678.()476iiii i i i x x y y x x y y ===--=-=-=∑∑∑参考公式:相关系数12211()().()()niii n niii i x x y y r x x x y ===--=--∑∑∑(2)规定:总评成绩大于等于85分者为优秀,小于85分者为不优秀,对优秀赋分1,对不优秀赋分0,从这20名学生中随机抽取2名学生,若用X 表示这2名学生两科赋分的和,求X 的分布列和数学期望. 【答案】(1)“数学学期综合成绩”与“物理学期综合成绩”高度相关;答案见解析;(2)分布列见解析,95. 【解析】(1)由题意,20()()ii xx y y r --=∑6260.87.515>>=>=⨯=,所以“数学学期综合成绩”与“物理学期综合成绩”高度相关;(2) 由题意得:X的可能取值为0,1,2,3,4.,根据赋分规则可知,7人赋分为2,4人赋分为1,9个人赋分为0,所以9222036(0)190CP XC===,49112203619(1)C CP XC===,211220479169(29)C C CP XC+===,114722023810(9)C CP XC===,27220(4)21190CP XC===,所以X的分布列为:所以36366928213421901901909()012341901901905E X=⨯+⨯+⨯+⨯+⨯==.8.(2020·安徽省太和第一中学)某湿地公园经过近十年的规划和治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的300个地块,并设计两种抽样方案,方案一:在该地区应用简单随机抽样的方法抽取30个作为样本区;依据抽样数据计算得到相应的相关系数0.81r=;方案二:在该地区应用分层抽样的方法抽取30个作为样本区,调查得到样本数据(),i ix y (1i=,2,…,30),其中ix和iy分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得30160iix==∑,3011200iiy==∑,()302190iix x=-=∑,()30218000iiy y=-=∑,()()301800i iix x y y=--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求方案二抽取的样本(),i ix y(1i=,2,…,30)的相关系数(精确到0.01);并判定哪种抽样方法更能准确的估计.附:相关系数()()niix x y y r --=∑ 1.414≈;相关系数[]0.75,1r ∈,则相关性很强,r 的值越大,相关性越强.【答案】(1)12000;(2)0.94r =,方案二的分层抽样方法更能准确的估计.【解析】(1)由题意可得,样区野生动物平均数为301111200403030i i y ==⨯=∑, 又地块数为300,所以该地区这种野生动物的估计值为3004012000⨯=; (2)由题中数据可得,样本(),i i x y (1i =,2,…,30)的相关系数为()()300.943iix x y y r --===≈∑.因为方案一的相关系数为0.81r =明显小于方案二的相关系数为0.94r =, 所以方案二的分层抽样方法更能准确的估计.9.(2020·湖北荆州市·荆州中学)在我国,大学生就业压力日益严峻,伴随着政府政策引导与社会观念的转变,大学生创业意识,就业方向也悄然发生转变.某大学生在国家提供的税收,担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数i y (单位:万元)与时间i t (单位:年)的数据,列表如下:(1)依据表中给出的数据,是否可用线性回归模型拟合y 与t 的关系,请计算相关系数r 并加以说明(计算结果精确到0.01).(若||0.75r >,则线性相关程度很高,可用线性回归模型拟合)附:相关系数公式:()()n ni i i it t y y t y nt y r---==∑∑7.547≈,51i iit y====∑(2)谈专营店为吸引顾客,特推出两种促销方案.方案一:每满500元可减50元;方案二:每满500元可抽奖一次,每次中奖的概率都为25,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.①某位顾客购买了1050元的产品、该顾客选择参加两次抽奖,求该顾客换得100元现金奖励的概率.②某位顾客购买了2000元的产品,作为专营店老板,是希望该顾客直接选择返回200元现金,还是选择参加四次抽奖?说明理由.【答案】(1)答案见解析;(2)①1225;②专营店老板希望该顾客选择参加四次抽奖,理由见解析.【解析】(1)由题知,1(12345)35t=++++=,1(2.4 2.7 4.1 6.47.9) 4.75y=++++=,51i iit y====∑则n t y ntyr-===14.70.970.7515.095≈≈>.故y与t的线性相关程度很高,可以用线性回归方程拟合;(2)①顾客选择参加两次抽奖,设他获得100元现金奖励为事件A,122312()5525P A C=⋅⋅=;②设X表示顾客在四次抽奖中中奖的次数,由于顾客每次抽奖的结果相互独立,则24,5X B⎛⎫⎪⎝⎭,∴2()4 1.65E X np ==⨯=. 由于顾客每中一次可获得100元现金奖励,因此顾客在四次抽奖中可获得的奖励金额的均值为1.6100160⨯=.由于顾客参加四次抽奖获得现金奖励的均值160小于直接返现的200元现金, 故专营店老板希望该顾客选择参加四次抽奖.10.(2020·福建省仙游县枫亭中学)互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:(1)试根据表格中这五天的日接单量情况,从统计的角度说明这两家外卖企业的经营状况; (2)据统计表明,y 与x 之间具有线性关系.①请用相关系数r 对y 与x 之间的相关性强弱进行判断;(若||0.75r >,则可认为y与x 有较强的线性相关关系(r 值精确到0.001))②经计算求得y 与x 之间的回归方程为ˆ 1.382 2.674yx =-,假定每单外卖业务企业平均能获纯利润3元,试预测当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润的大致范围.(x 值精确到0.01)相关公式:()()niix x y y r --=∑参考数据:()()5166,77i i i x x y y =--=≈∑.【答案】(1)外卖甲平均日接单与乙相同﹐但外卖甲日接单量更集中一些,所以外卖甲比外卖乙经营状况更好.(2)①可认为y 与x 之间有较强的线性相关关系;②外卖甲所获取的日纯利润大约不低于6006元. 【解析】(1)由题可知,52981175x ++++==(百单),231051575y ++++==(百单)外卖甲的日接单量的方差为()()()()()22222275727978711105s-+-+-+-+-==甲,外卖乙的日接单量的方差()()()()()22222272737107571523.65s-+-+-+-+-==乙, 因为x y =,22s s <甲乙,即外卖甲平均日接单与乙相同,但外卖甲日接单量更集中一些,所以外卖甲比外卖乙经营状况更好.(2)①因为()()niix x y y r --=∑由:()()5166,77i i i x x y y =--=≈∑代入计算可得,相关系数660.8570.7577r =≈> 所以可认为y 与x 之间有较强的线性相关关系; ②令25y ≥,得1.382 2.67425x -≥ 解得20.02x ≥,又20.021*******⨯⨯=,所以当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润大约不低于6006元.。

2022秋高中数学第八章成对数据的统计分析-变量的相关关系课后提能训练新人教A版选择性必修第三册

2022秋高中数学第八章成对数据的统计分析-变量的相关关系课后提能训练新人教A版选择性必修第三册

第八章 8.1.1A级——基础过关练1.(多选)以下关于相关关系的说法错误的是( )A.相关关系是函数关系B.函数关系是相关关系C.线性相关关系是正比例函数关系D.相关关系有两种,分别是线性相关关系和非线性相关关系【答案】ABC 【解析】根据相关关系的概念可知,只有D正确,故选ABC.2.下列关系属于线性负相关的是( )A.父母的身高与子女身高的关系B.农作物产量与施肥量的关系C.吸烟与健康的关系D.数学成绩与物理成绩的关系【答案】C 【解析】若以吸烟量为横轴,健康为纵轴画出散点图,则由生活常识知,这些点散布在从左上角到右下角的区域内. 因此,吸烟与健康的关系属于线性负相关.3.对于给定的两个变量的统计数据,下列说法正确的是( )A.都可以分析出两个变量的关系B.都可以用一条直线近似地表示两者的关系C.都可以作出散点图D.都可以用确定的表达式表示两者的关系【答案】C 【解析】给出一组样本数据,总可以作出相应散点图,但不一定分析出两个变量的关系,更不一定符合线性相关或有函数关系.4.下列两个变量之间的关系具有相关关系的是( )A.家庭的支出与收入B.某家庭用电量与水价间的关系C.单位圆中角的度数与其所对孤长D.球的体积与其半径【答案】A 【解析】C,D均为函数关系,B用电量与水价间不具有函数关系,也不具有相关关系,故选A.5.观察下列四个散点图,两变量具有线性相关关系的是( )【答案】A 【解析】选项A中的点大致分布在一条直线附近,故选A.6.有下列关系:①人的年龄与其拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其横截面直径与高度之间的关系;⑤学生与其学号之间的关系.其中具有相关关系的是________(填序号).【答案】①③④ 【解析】②⑤为确定性关系.7.函数关系是一种________关系,相关关系是一种________关系(两条横线上填“确定性”或“非确定性”).【答案】解定性 非确定性8.根据两个变量x,y之间的观测数据画成散点图如图,这两个变量是否具有线性相关关系________(填“是”或“否”).【答案】否 【解析】图中的点分布杂乱,两个变量不具有线性相关关系.9.下表是某小卖部6天卖出热茶的杯数与当天气温的对比表:气温/℃2518121040杯数183037355054(1)根据表中的数据画出散点图;(2)你能从散点图中发现气温与热茶杯数近似成什么关系吗?解:(1)根据表中的数据画出某小卖部6天卖出热茶的杯数与当天气温的散点图,如图.(2)从散点图上可以看出气温与卖出的热茶杯数近似地成线性关系.说明了当气温越高时,所卖出的热茶的杯数就越少.10.某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下对应数据:x10151720252832y1 1.3 1.82 2.6 2.7 3.3(1)画出散点图;(2)判断y与x是否具有线性相关关系.解:(1)散点图如下.(2)由图知,所有数据点接近直线排列,因此,认为y与x具有线性相关关系.B级——能力提升练11.下列说法正确的是( )A.相互关系与函数关系都是一种确定性的关系,也是一种因果关系B.根据身高和体重的相关关系可以确定身高对应的体重值C.“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系D.以上答案都不对【答案】C12.下面是四个散点图中的点的分布状态,直观上判断两个变量之间具有线性相关关系的是( )【答案】C 【解析】散点图A中的点无规律的分布,范围很广,表明两个变量之间的相关程度很小;B中所有的点都在同一条直线上,是函数关系;C中的点分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;D中的点也分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系,故选C.13.(多选)下列四个散点图中,变量x与y之间具有相关关系的是( )【答案】ACD 【解析】观察散点图可知,A,C选项中x与y之间具有非线性相关关系,D选项中x与y之间具有线性相关关系,B选项中x与y之间不具有相关关系.14.给出x,y值的数据如下:y35917x1248则根据数据可以判断x和y的关系是________(填“确定关系”“相关关系”或“没有关系”).【答案】确定关系 【解析】由表中数据可以得到x,y之间是一种函数关系y=2x+1,所以x,y是一种确定的关系,即函数关系.15.对某种珍稀动物胚胎的生长进行研究,测得9~20日龄动物的胚胎的质量如下:日龄/天91011121314胚重/g 1.656 2.662 3.100 4.579 6.5187.486日龄/天151617181920胚重/g9.94814.52215.61019.91423.73626.472(1)请作出这些数据的散点图;(2)关于这两个变量的关系,你能得出什么结论?解:(1)以动物胚胎的日龄为横坐标,以胚重为纵坐标,作出散点图如图所示:(2)从图象观察,许多点在同一曲线附近,且可以看出随着时间的增加,胚重增长得越来越快,所以两变量具有非线性相关关系.C级——探究创新练16.下表是从某校15岁的男生中随机地抽取9名所测得的身高与体重.编号123456789身高/cm165157155175168157178160163体重/kg524445555447625053由上述数据是否能推断身高与体重之间具有相关关系?若具有,则具有怎样的关系?解:从表中不难看出,同一身高157 cm对应着不同的体重44 kg和47 kg,所以体重不是身高的函数.如果把身高看作横坐标、体重看作纵坐标,在坐标平面中画出对应的点,就会发现,随着身高的增长,体重基本上呈直线增长的趋势(图略),也就是身高与体重之间存在着线性相关关系.。

【人教版高中数学A版选择性必修三】第八章 8.1

【人教版高中数学A版选择性必修三】第八章 8.1

温馨提示:此套题为Word 版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。

关闭Word 文档返回原板块。

第八章 成对数据的统计分析8.1 成对数据的统计相关性必备知识·素养奠基1.变量的相关关系(1)两个变量的关系(2)散点图:将样本中的每一个序号下的成对数据用直角坐标系中的点表示出来得到的统计图.(3)正相关与负相关加时,另一个变量的相应值也呈现增加的趋势加时,另一个变量的相应值呈现减少的趋势(4)线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.正相关与负相关是对所有具有相关关系的两个变量而言的,对吗?提示:不对,正相关与负相关是针对线性相关关系而言的.2.样本的相关系数(1)相关系数:统计学里一般用r=错误!未找到引用源。

=错误!未找到引用源。

来衡量y与x的线性相关性的强弱,这里的r称为样本相关系数(简称相关系数).(2)相关系数的性质1r>0时,成对数据正相关;r<0时,成对数据负相关,-1≤r≤1.2 |r|越小,两个变量之间的线性相关程度越弱,|r|越大,两个变量之间的线性相关程度越强.3|r|=1时,成对数据构成的点都在一条确定的直线上.|r|的大小有何实际意义?提示:|r|越小,两个变量之间的线性相关性越弱;|r|越大,两个变量之间的线性相关性越强.1.思维辨析(对的打“√”,错的打“×”)(1)两个变量的相关关系是一种确定的关系.( )(2)两个变量的相关系数越大,它们的相关程度越强.( )(3)当一个变量的值增加时,另一个变量的值随之减少,则称这两个变量负相关.( )(4)一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.( )提示:(1)×.两个变量的相关关系不是一种确定的关系,是一种随机关系. (2)×.相关系数|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.(3)×.存在相关关系的两个变量,当一个变量增加时,另一个变量的相应值呈减少的趋势,则称这两个变量负相关.(4)√.2.根据一组数据判断两个变量是否线性相关时,应选( )A.茎叶图B.频率分布直方图C.散点图D.频率分布折线图【解析】选C.判断两个变量是否有线性相关关系时,应先画出散点图.若这些点大体分布在一条直线附近则具有线性相关关系.3.已知两个变量负相关,且相关程度很强,则它们的相关系数的大小可能是( )A.-0.95B.-0.13C.0.15D.0.96【解析】选A.相关系数r<0时,成对数据负相关,且|r|越大,两个变量之间的线性相关程度越强.关键能力·素养形成类型一相关关系与线性相关关系角度1 相关关系【典例】(多选题)下列关系中,属于相关关系的是( )A.正方形的边长与面积之间的关系B.农作物的产量与施肥量之间的关系C.人的身高与年龄之间的关系D.降雪量与交通事故的发生率之间的关系【思维·引】紧扣相关关系的概念加以判断.【解析】选BD.在A中正方形的边长与面积之间的关系是函数关系;在B中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在C中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在D中,降雪量与交通事故的发生率之间具有相关关系.角度2 线性相关关系的判断【典例】5名学生的数学和物理成绩(单位:分)如下:物理70 66 68 64 62成绩判断数学成绩与物理成绩是否具有线性相关关系.【思维·引】根据散点图判断.【解析】以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系.【素养·探】本例考查利用散点图判断两个变量是否线性相关,同时考查了数据分析与数学抽象的核心素养.本例条件若改为:某公司2014~2019年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示:年份2014 2015 2016 2017 2018 2019利润x 12.2 14.6 16 18 20.4 22.3支出y 0.62 0.74 0.81 0.89 1 1.11判断x与y是否线性相关,是正相关还是负相关?【解析】作出散点图(图略),由散点图可知,各点分布在一条直线附近,故x与y 之间线性相关,且y随x的增大而增大,是正相关.【类题·通】1.函数关系与相关关系函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.两个变量是否相关的两种判断方法(1)实际经验法:借助积累的经验进行分析判断;(2)散点图法:绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.【习练·破】1.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【解析】选C.由题图象知,变量x与y呈负相关关系;u与v呈正相关关系.2.下列两个变量间的关系不是函数关系的是( )A.圆的半径与周长B.角的度数与它的正切值C.单产为常数时,土地面积与粮食总产量D.日照时间与水稻的单位产量【解析】选D.函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项C=2πr,B项y=tan α,C项y=ax(a>0,且a为常数),所以这三项均是函数关系.D项是相关关系.【加练·固】某个男孩的年龄与身高的统计数据如表所示.年龄x(岁) 1 2 3 4 5 6身高y(cm) 78 87 98 108 115 120(1)画出散点图;(2)判断y与x是否具有线性相关关系.【解析】(1)散点图如图所示.(2)由散点图知,所有数据点分布在一条直线附近,因此,认为y与x具有线性相关关系.类型二相关系数与相关程度的判断角度1 相关系数的概念【典例】下面的各图中,散点图与相关系数r不符合的是( )【思维·引】根据相关系数与散点图的关系解答.【解析】选B.A、B选项中散点全部集中在一条直线上,且分别呈负、正相关,故相关系数r的值应分别为-1,1;C选项变量呈负相关,故-1<r<0,D选项变量没有相关性,相关系数近似看为0.角度2 相关程度的判断【典例】一般来说,一个人的身高越高,他的手就越大,为调查这一问题,对某校10名高一男生的身高与右手长度进行测量得到如下数据(单位:cm):身高168 170 171 172 174 176 178 178 180 181 右手长度19.20.21.21.521.22.24.23.22.523.(1)判断两者有无线性相关关系;(2)如果具有线性相关关系,判断相关性的强弱.【思维·引】画散点图判断是否线性相关,求相关系数刻画相关程度. 【解析】(1)散点图如图所示.可见,身高与右手长度之间的总体趋势为一条直线,即它们线性相关.(2)根据以上数据可由计算器计算得错误!未找到引用源。

选择性必修第三册 成对数据的相关关系(含解析)

选择性必修第三册  成对数据的相关关系(含解析)

选择性必修第三册 8.1 成对数据的相关关系一、选择题(共13小题)1. 下列关系属负相关的是( )A. 父母的身高与子女身高的关系B. 农作物产量与施肥的关系C. 吸烟与健康的关系D. 数学成绩与物理成绩的关系2. 对于变量x与y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做( )A. 函数关系B. 线性关系C. 相关关系D. 回归关系3. 观察下列图形,其中两个变量x,y具有相关关系的图是( )A. ①②B. ①④C. ③④D. ②③4. 某公司去年上半年的月收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:月份123456月收入x(万元)12.314.515.017.019.820.6月支出y(万元) 5.63 5.75 5.82 5.89 6.11 6.18根据上述统计资料,则( )A. 月收入的中位数是15,x与y有正相关关系B. 月收入的中位数是17,x与y有负相关关系C. 月收入的中位数是16,x与y有正相关关系D. 月收入的中位数是16,x与y有负相关关系5. 两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系是( )A. ①②③B. ②③①C. ②①③D. ①③②6. 对变量x,y有观测数据(x i,y i)(i=1,2,⋯,10),可得散点图如图①;对变量u,v有观测数据(u i,v i)(i=1,2,⋯,10),可得散点图如图②.由这两个散点图可以判断( )A. 变量x与y正相关,u与v正相关B. 变量x与y正相关,u与v负相关C. 变量x与y负相关,u与v正相关D. 变量x与y负相关,u与v负相关7. 对于给定的两个变量的统计数据,下列说法中正确的是( )A. 都可以分析出两个变量的关系B. 都可以用一条直线近似地表示两者的关系C. 都可以作出散点图D. 都可以用确定的表达式表示两者的关系8. 在下列各图中,图中的两个变量间具有相关关系的是( )A. (1)(2)B. (1)(3)C. (2)(4)D. (2)(3)9. 以下四个命题:①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件进行某项指标检测,这种抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在回归直线方程ỳ=0.2x+12中,当解释变量x每增加1个单位时,预报变量ỳ平均增加0.2个单位;④对分类变量X与Y,它们的随机变量K2的观测值k越小," X与Y有关系"的把握程度越大,其中正确的命题是( )A. ①④B. ②③C. ①③D. ②④10. 已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表,对应散点图如图所示:学生编号12345678数学成绩6065707580859095物理成绩7277808488909395根据以上信息,则下列结论:①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;③从全班随机抽取2名同学(记为甲、乙),若甲同学的数学成绩为80分,乙同学的数学成绩为60分,则可以判断出甲同学的物理成绩一定比乙同学的物理成绩高;④从全班随机抽取2名同学(记为甲、乙),若甲同学的数学成绩为80分,乙同学的数学成绩为60分,则不能判断出甲同学的物理成绩一定比乙同学的物理成绩高;其中正确的个数是( )A. 1B. 2C. 3D. 411. 对相关系数r,下列说法正确的是( )A. ∣r∣越大,线性相关程度越强B. ∣r∣越小,线性相关程度越强C. ∣r∣越大,线性相关程度越弱,∣r∣越接近0,线性相关程度越强D. ∣r∣≤1,且∣r∣越接近1,线性相关程度越强,∣r∣越接近0,线性相关程度越弱12. 某公司2013−2018年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示:年份201320142015201620172018利润x12.214.6161820.422.3支出y0.620.740.810.89 1.00 1.11根据统计资料,则( )A. 利润中位数是16,x与y有正相关关系B. 利润中位数是17,x与y有正相关关系C. 利润中位数是17,x与y有负相关关系D. 利润中位数是18,x与y有负相关关系13. 对变量x,y有观测数据(x i,y i)(i=1,2,⋯,10),其散点图如图(1);对变量u,v有观测数据(u i,v i)(i=1,2,⋯,10),其散点图如图(2),由这两个散点图可以判断( )A. 变量x与y成正相关,u与v成正相关B. 变量x与y成正相关,u与v成负相关C. 变量x与y成负相关,u与v成正相关D. 变量x与y成负相关,u与v成负相关二、填空题(共5小题)14. 回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在附近,就称这两个变量之间具有关系,这条直线叫作回归直线.(2)回归方程:对应的方程叫回归直线的方程,简称回归方程.(3)最小二乘法:求回归直线时,使得样本数据的点到回归直线的的方法叫作最小二乘法.(4)求回归方程:若两个具有线性相关关系的变量的一组数据为:(x1,y1),(x2,y2),⋯,(x n,y n),则所求的回归方程为,其中à,b̀为待定的参数,由最小二乘法得:{b̀=i−x)ni=1i−y)∑(x−x)2n=∑x ini=1y i−nxy∑x i2ni=1−nx2, à= .b̀是回归直线斜率,à是回归直线在y轴上的截距.15. 变量间的相关关系.(1)相关关系:不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有性.(2)散点图:将样本中几个数据点(x i,y i)(i=1,2,⋯,n)描在平面直角坐标系中得到的图形.(3)正相关与负相关.①正相关:散点图中的点散布在从到的区域.②负相关:散点图中的点散布在从到的区域.16. 某校高三年级267名学生参加期末考试,其中某班37名学生的语文成绩,数学成绩与总成绩在全年级的排名情况分别如图①,图②所示,甲、乙、丙为该班三名学生.从这次考试成绩看,(1)在甲、乙两人中,语文成绩名次比其总成绩名次靠前的学生是;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.17. 某市居民2007−2011年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:年份20072008200920102011收入x11.512.11313.315支出y 6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是,家庭年平均收入与年平均支出有关系.18. 在一组样本数据(x1,y1),(x2,y2),⋯,(x n,y n)(n≥2,x1,x2,⋯,x n不全相等)的散点图x+1上,则这组样本数据的样本相关系中,若所有样本点(x i,y i)(i=1,2,⋯,n)都在直线y=12数为.三、解答题(共5小题)19. 如表为某地近几年机动车辆数与交通事故数的统计资料,请判断交通事故数与机动车辆数是否有线性相关关系.机动车辆数x/千台95110112120129135150180交通事故数y/千件 6.27.57.78.58.79.810.213.020. 以下是在某地搜集到的不同楼盘房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积11511080135105销售价格49.643.238.858.444判断房屋的销售价格和房屋面积之间是否具有线性相关关系.如果有线性相关关系,是正相关还是负相关?21. 某个男孩的年龄与身高的统计数据如下表所示.年龄x(岁)123456身高y(cm)788798108115120(1)画出散点图.(2)判断y与x是否具有线性相关关系.22. 请回答下列问题:(1)下列关系中,属于相关关系的是(填序号).①人的身高与视力的关系;②做自由落体运动的物体的质量与落地时间的关系;③降雪量与交通事故的发生率之间的关系.(2)有个男孩的年龄与身高的统计数据如表:年龄/岁123456身高/cm788798108115120画出散点图,并判断它们是否有相关关系.如果有相关关系,是正相关还是负相关?23. 已知箱子中装有4个白球和5个黑球,且规定:取出一个白球得2分,取出一个黑球得1分,现从该箱中任取3个球(无放回,且每球取到的机会均等),记随机变量X为取出3球所得分数之和.(1)求X的分布列;(2)求X的数学期望EX.答案1. C【解析】吸烟越多,危害越大,身体越不健康.2. C【解析】对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫相关关系.3. C4. C5. D6. C7. C【解析】给出一组样本数据,总可以作出其相应的散点图,但不一定能分析出两个变量的关系,更不一定符合线性相关或有函数关系.8. D9. B【解析】①中抽样间隔相同,应是系统抽样,④中K2的观测值越大,“X与Y有关系”的把握程度越大,故应选②③.10. B【解析】由散点图知两变量间是相关关系,非函数关系,所以①正确,②错误;利用概率知识进行预测,得到结论有一定的随机性,所以③错误,④正确;所以正确命题的个数为2.11. D【解析】两个变量之间的相关系数r的绝对值越接近于1,表示两个变量的线性相关性越强;r的绝对值越接近于0,表示两个变量的线性相关性越弱,此时两个变量之间几乎不存在线性相关关系.故选D.12. B13. C【解析】题图(1)中的散点大致分布在一条直线附近,且y随x的增大而减小,所以x与y成负相关.题图(2)中的散点大致分布在一条直线附近,且v随u的增大而增大,所以u与v成正相关.14. 一条直线,线性相关,回归直线,距离的平方和最小,ỳ=b̀x+à,y−b̀x15. 不确定,左下角,右上角,左上角,右下角16. 乙,数学【解析】(1)由题图①可知,在甲、乙两人中,语文成绩名次比其总成绩名次靠前的学生是乙.(2)因为同一个人的总成绩是不会变的,在题图②中丙是从右往左数第5个点,即丙的总成绩在班里倒数第5,所以在题图①中从右往左数第5个点表示的就是丙,可知这个点的位置比题图②中丙的位置高,所以语文名次更“大”,即其数学成绩更靠前.17. 13,正相关【解析】收入数据按大小排列为11.5,12.1,13,13.3,15,所以中位数为13.从数据变化情况看出,两个变量是正相关的.18. 119. 将数据列成如表:i x i y i x i2y i2x i y i195 6.2902538.44589.021107.51210056.25825.031127.71254459.29862.441208.51440072.251020.051298.71664175.691122.361359.81822596.041323.0715010.222500104.041530.0818013.032400169.002340.0∑103171.6137835671.009611.7由此可得x=128.875,y=8.950.≈0.993,进而求得r=√137835−8×128.8752×√671.00−8×8.9502因为0.993>0.75,所以可以得出:交通事故数y与机动车辆数x有较强的线性相关关系.20. 数据对应的散点图如图:由以上数据对应的散点图可以判断,房屋的销售价格和房屋面积之间具有线性相关关系,是正相关.21. (1)散点图如图所示.(2) 由图知,所有样本点接近一条直线排列,因此,认为 y 与 x 具有线性相关关系. 22. (1) ③【解析】① 身高与视力无关,不具有函数关系,也不具有相关关系;② 自由落体的物体的质量与落地时间无关,不具有相关关系;③ 降雪量越大,交通事故发生率越高,具有不确定性的相关关系. (2) 散点图是分析变量相关关系的重要工具.作出散点图如下图所示.由图可见,男孩年龄与身高具有线性相关关系,且是正相关. 23. (1) 由题可知 X 的所有取值为:3,4,5,6. 所以 P (x =3)=C 53C 93=542;P (x =4)=C 52C 41C 93=1021;P (x =5)=C 51C 42C 93=514;P (x =6)=C 43C 93=121.故所求 X 的分布列为X 3456P5421021514121(2) 所求 X 的数学期望 EX =3×542+4×1021+5×514+6×121=133.。

人教A版选择性必修第三册8.1成对数据的统计相关性学案

人教A版选择性必修第三册8.1成对数据的统计相关性学案

第八章成对数据的统计分析8.1成对数据的统计相关性知识点1相关关系两个变量有关系,但又没有确切到可由其中的一个去____________另一个的程度,这种关系称为相关关系.思考:函数关系是相关关系吗?答案:精确地决定思考:提示:不是.函数关系中两个变量之间是一种确定关系.知识点2线性相关(1)散点图一般地,如果收集到了变量x和变量y的n对数据(简称为成对数据),如下表所示.1,2,3,…,n,就i i可以得到这n对数据的散点图.(2)正相关和负相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现________,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现________,则称这两个变量负相关.(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条________附近,我们就称这两个变量线性相关.答案:(2)增加的趋势减小的趋势(3)直线知识点3相关系数r的计算公式假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(x n,y n),则变量间相关系数r的计算公式如下:r=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2∑i=1n(y i-y)2=∑i=1nx i y i-n x y∑i=1n⎝⎛⎭⎫x2i-n x2∑i=1n⎝⎛⎭⎫y2i-n y2.知识点4相关系数r的性质(1)|r|≤1,且y与x正相关的充要条件是r>0,y与x负相关的充要条件是r<0.(2)|r|越小,说明两个变量之间的线性相关性越弱,也就是得出的回归直线方程越没有价值,即方程越不能反映真实的情况;|r|越大,说明两个变量之间的线性相关性越强,也就是得出的回归直线方程越有价值.(3)|r|=1的充要条件是成对数据构成的点都在回归直线上.[重点理解]1.相关关系与函数关系的异同(1)相同点:两者均是指两个变量的关系.(2)不同点:①函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系;相关关系是一种非确定的关系,如一块农田的水稻产量与施肥量之间的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.判断变量的相关性通常有两种方式:一是散点图,二是相关系数r.前者只能粗略地说明变量间具有相关性,而后者从定量的角度分析变量相关性的强弱.3.只有当两变量间呈现线性相关关系时,才可以求回归系数,得到回归直线方程y^=b^x+a^;若两变量间的关系不是线性相关关系,应观察分析其散点图,找出拟合函数,通过变量代换把非线性回归问题转化为线性回归问题.[自我排查]1.(2021·山西朔州高二期末)对于变量x与y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做() A.函数关系B.线性关系C.相关关系D.回归关系答案:C解析:对于自变量x和因变量y,当x取值一定时,y 的取值带有一定的随机性,x,y之间的这种非确定性关系叫相关关系.故选C.2.(2021·河北邢台月考)已知r1表示变量X与Y之间的线性相关系数,r2表示变量U与V之间的线性相关系数,且r1=0.837,r2=-0.957,则()A.变量X与Y之间呈现正相关关系,且X与Y之间的相关性强于U与V之间的相关性B.变量X与Y之间呈现负相关关系,且X与Y之间的相关性强于U与V之间的相关性C.变量U与V之间呈现负相关关系,且X与Y之间的相关性弱于U与V之间的相关性D.变量U与V之间呈现正相关关系,且X与Y之间的相关性弱于U与V之间的相关性答案:C解析:因为r1=0.837,r2=-0.957,所以变量X与Y之间呈现正相关关系,变量U与V之间呈现负相关关系,且X与Y之间的相关性弱于U与V之间的相关性.故选C.3.(2021·新疆哈密第八中学高二期末)观察下列各图形,其中两个变量x,y具有相关关系的图是________.答案:③④解析:由图可知,图③中这些点大致分布在一条直线附近,具有线性相关关系;图④中这些点大致分布在一条类似二次曲线附近,具有相关关系;而图①②中这些点分布不均匀,比较分散,不具有相关关系.故为③④.4.(2021·陕西咸阳百灵学校高二月考)r是相关系数,当|r|越接近于1,线性相关程度________.答案:越强 解析:相关系数的范围是|r |≤1,|r |越接近于1,表示线性相关程度越强.故答案为越强.5.在一次试验中,测得(x ,y )的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y 与x 的相关系数为________.答案:-1 解析:方法一:x =1.5,y =1,∑i =14x 2i =22,∑i =14y 2i =56,∑i =14x i y i =-20,相关系数r =-20-4×1.5×1(22-4×1.52)(56-4×12)=-1. 方法二:观察四个点,发现其在一条单调递减的直线上,故y 与x 的相关系数为-1.研习1 [典例1] (多选题)下列变量之间的关系是相关关系的是( )A .二次函数y =ax 2+bx +c 中,a ,c 是已知常数,取b 为自变量,因变量是判别式Δ=b 2-4acB .光照时间和果树亩产量C .降雪量和交通事故发生率D .每亩田施肥量和粮食亩产量答案:BCD 解析:在A 中,若b 确定,则a ,b ,c 都是常数,Δ=b 2-4ac 也就唯一确定了,因此,这两者之间是确定性的函数关系;在B中,一般来说,光照时间越长,果树亩产量越高;在C中,降雪量越大,交通事故发生率越高;在D中,施肥量在一定范围内越多,粮食亩产量越高,所以BCD是相关关系.[巧归纳]两个变量是否相关的两种判断方法1.根据实际经验:借助积累的经验进行分析判断.2.利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.[练习1](2021·新疆伽师县第四中学高二期末)下列图形中,两个变量具有线性相关关系的是()答案:B解析:对于AC,由图象可知,两个变量是确定的函数关系,不是相关关系,故AC不正确;对于B,由散点图可知,散点呈现带状分布,所以两个变量具有线性相关关系,故B正确;对于D ,由散点图可知,散点不呈现带状分布,所以两个变量不具有线性相关关系,故D 不正确.故选B .研习2 相关系数的计算[典例2] 假设关于某种设备的使用年限x (单位:年)与所支出的维修费用y (单位:万元)有如下统计资料:已知∑i =15x 2i =90,∑i =15y 2i ≈140.8,∑i =15x i y i =112.3,79≈8.9,2≈1.4.计算y 与x 之间的相关系数(精确到0.001),并推断它们的相关程度.解:因为x =2+3+4+5+65=4, y =2.2+3.8+5.5+6.5+7.05=5. 所以∑i =15x i y i -5x y =112.3-5×4×5=12.3,∑i =15x 2i -5x 2=90-5×42=10,∑i =15y 2i -5y 2=140.8-5×52=15.8,所以r =12.310×15.8=12.3158=12.32×79≈12.31.4×8.9≈0.987. 由样本相关系数r ≈0.987,可以推断维修费用和年限这两个变量呈现正相关关系,且相关程度很强.[巧归纳]应用公式r =∑i =1n(x i -x )(y i -y )∑i =1n (x i -x )2∑i =1n (y i -y )2=∑i =1n x i y i -n x y∑i =1n x 2i -nx 2∑i =1ny 2i -n y 2,正确计算. [练习2] 某厂的生产原料耗费x (单位:百万元)与销售额y (单位:百万元)之间有如下的对应关系:x2 4 6 8 y 30 40 50 70计算x 与y 之间的相关系数,并推断它们的相关程度.解:画出(x ,y )的散点图如图所示,由图可知x ,y 有线性关系.x =5,y =47.5,∑i =14x 2i =120,∑i =14y 2i =9 900,∑i =14x i y i =1 080,故相关系数r =∑i =14x i y i -4x y⎝ ⎛⎭⎪⎫∑i =14x 2i -4x 2⎝ ⎛⎭⎪⎫∑i =14y 2i -4y 2=1 080-4×5×47.5(120-4×52)(9 900-4×47.52)≈0.982 7.由样本相关系数r≈0.982 7,可以推断销售额与生产原料耗费这两个变量呈现正相关关系,且相关程度很强.研习3 相关系数的性质及应用[典例3](2021·宁夏银川一中高二期末)两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型3的相关指数R2为0.50B.模型2的相关指数R2为0.80C.模型1的相关指数R2为0.98D.模型4的相关指数R2为0.25答案:C解析:相关指数R2越接近1,则模型的拟合效果越好,所以模型1的相关指数R2为0.98时,拟合效果最好.故选C.[巧归纳]线性相关强弱的判断方法1.散点图(越接近直线,相关性越强).2.相关系数(绝对值越大,相关性越强):|r|≤1,|r|越接近1,相关程度越大;|r|越接近0,相关程度越小.[练习3]对四组变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数.①n=7,r=0.954 5;②n=15,r=0.381 2;③n=17,r=0.498 5;④n=3,r=0.987 0,则变量y与x具有较强相关关系的是________.答案:①④解析:相关系数r的绝对值越大,线性相关程度越高,故填①④.1.(2021·江西南昌高一期末)对两变量间的关系,下列论述正确的是()A.任何两个变量都具有相关关系B.正方形的面积与该正方形的边长具有相关关系C.农作物的产量与施化肥量之间是一种确定性关系D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系答案:D解析:对A:当两个变量之间具有确定关系时,两个变量之间是函数关系,而不是相关关系,所以A错误;对B:正方形的面积与该正方形的边长之间是函数关系,所以B 错误;对C:农作物的产量与施化肥量之间是相关关系,是非确定性的关系,所以C错误;对D:学生的数学成绩与物理成绩之间是相关关系,是非确定性的关系,所以D正确.故选D.2.在研究两个变量y与x的相关关系时,分别选择了四组不同的数据,由这四组不同的数据得到的相关系数r分别为0.25,0.50,0.98,0.80,则其中相关程度最大的相关系数是()A.0.25 B.0.50C.0.98 D.0.80答案:C解析:线性相关系数的判断中,相关系数为r,|r|越接近于1,相关程度越大;|r|越小,相关程度越小.故选C.3.(2021·安徽定远县育才学校高二期中)对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是()A.0.2 B.0.8C.-0.98 D.-0.7答案:C解析:∵相关系数的绝对值越大,越具有强大相关性,C相关系数的绝对值最大约接近1,∴C拟合程度最好.故选C.4.在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i,y i)(i=1,2,3,…,n)都在直线2x+y-1=0上,则这组样本数据的样本相关系数r为________.答案:-1解析:∵直线2x+y-1=0的斜率k=-2,且若所有样本点(x i,y i)(i=1,2,3,…,n)都在直线2x+y-1=0上,∴说明这组数据的样本完全负相关,则相关系数达到最小值-1.[误区警示]对散点图理解不准确致错[示例]已知如图所示的两个散点图,则图(1)图(2)A.数学成绩与身高、物理成绩均具有相关关系B.数学成绩与身高、物理成绩均无关C.由于散点图的横轴、纵轴的单位长度不一致,所以无法判断D.数学成绩与身高无关,与物理成绩正相关[正解]图(1)中各点杂乱无章,可以认定数学成绩与身高无关,图(2)则清晰地显示,物理成绩越高,数学成绩也越高,明显呈现一种正相关关系.[答案]D[错因分析]本题易错选C.散点图中两个变量之间是否相关与哪个变量是横坐标、哪个变量是纵坐标无关,只需关注两个变量的变化趋势即可.。

人教A版高中数学选择性必修第三册课后习题 第8章 成对数据的统计分析 分类变量与列联表 独立性检验

人教A版高中数学选择性必修第三册课后习题 第8章 成对数据的统计分析 分类变量与列联表 独立性检验

08学习单元3 列联表与独立性检验8.3.1 分类变量与列联表8.3.2 独立性检验A级必备知识基础练1.下面是一个2×2列联表:则表中a,b处的值分别为( )A.94,96B.52,50C.52,60D.54,522.为了解喜爱足球是否与性别有关联,随机抽取了若干人进行调查,抽取女性人数是男性的2倍,男性喜爱足球的人数占男性人数的56,女性喜爱足球的人数占女性人数的13.若本次调查得出“依据α=0.005的独立性检验,认为喜爱足球与性别有关联”的结论,则被调查的男性人数至少为( )χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)A.11B.12C.13D.143.疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的生物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗预防效果,在进行动物试验时,得到如下2×2列联表:单位:只零假设为H0:该种疫苗对传染病无效.现从试验动物中任取一只,取到已注射疫苗的动物概率为2,则下列判断错误的是( )5A.已注射疫苗发病的动物数为10B.从该试验未注射疫苗的动物中任取一只,发病的概率为23C.能在犯错误的概率不超过0.001的前提下,认为该疫苗有效D.该疫苗的有效率为75%4.为考察某种药物对某种疾病的治疗效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高堆积条形图,最能体现该药物对治疗该种疾病有效果的等高堆积条形图是( )5.(多选题)某市为了研究该市空气中的PM2.5浓度和SO2浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的PM2.5浓度和SO2浓度(单位:μg/m3),得到如下所示的表格:单位:μg/m3(75,115] 10 10零假设为H0:该市一天空气中PM2.5浓度与SO2浓度无关.经计算χ2=100×(64×10-16×10)280×20×74×26≈7.484 4,则可以推断出( )A.该市一天空气中PM2.5浓度不超过75 μg/m3,且SO2浓度不超过150 μg/m3的概率估计值是0.64B.若2×2列联表中的天数都扩大到原来的10倍,χ2的值不会发生变化C.根据α=0.01的独立性检验,认为该市一天空气中PM2.5浓度与SO2浓度无关D.能在犯错误的概率不超过0.01的条件下,认为该市一天空气中PM2.5浓度与SO2浓度有关6.(多选题)有两个分类变量X,Y,其2×2列联表如下表所示:其中a,15-a均为大于5的整数,若依据小概率值α=0.05的独立性检验,认为X,Y有关联,则a的值可以为( )A.6B.7C.8D.97.在对某小学的学生进行吃零食的调查中,得到数据如下表:单位:人根据上述数据分析,可得χ2约为.8.某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:单位:人合计 30 20 50则依据α=0.005的独立性检验认为同意限定区域停车与家长的性别 .(填“有关联”或“无关联”)B 级关键能力提升练9.(多选题)针对时下流行的某社交平台,某高校对学生性别和喜欢该平台是否有关联进行了一次调查,其中被调查的男生、女生人数相同,男生喜欢该平台的人数占男生人数的45,女生喜欢该平台的人数占女生人数的35.零假设为H 0:喜欢该平台和性别无关联.若依据α=0.05的独立性检验认为喜欢该平台和性别有关联,则调查人数中男生的人数可能为( ) A.25B.45C.60D.7510.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:单位:人试根据上述数据计算χ2≈,根据小概率值α=0.1的独立性检验,这两种手术对病人又发作心脏病的影响差别.(填“有”或“没有”)11.有人发现了一个有趣的现象,中国人的邮箱名称里含有数字比较多,而外国人邮箱名称里含有数字比较少.为了研究国籍和邮箱名称里含有数字的关系,小明收集了124个邮箱名称,其中中国人的64个,外国人的60个,中国人的邮箱中有43个含数字,外国人的邮箱中有27个含数字.(1)根据以上数据建立2×2列联表;(2)他发现在这组数据中,外国人邮箱里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关联,你能依据α=0.05的独立性检验帮他判断一下吗?12.书籍是文化的重要载体,读书是传承文化的重要方式.某地区为了解学生课余时间的读书情况,随机抽取了n名学生进行调查,根据调查得到的学生日均课余读书时间绘制成如图所示的频率分布直方图,将日均课余读书时间不低于40分钟的学生称为“读书之星”,日均课余读书时间低于40分钟的学生称为“非读书之星”.已知抽取的样本中日均课余读书时间低于10分钟的有10人.(1)求n,p的值;(2)根据已知条件完成下面的2×2列联表,依据α=0.05的独立性检验能否认为“读书之星”与性别有关联?单位:人(3)将上述调查所得到的频率视为概率,现从该地区大量学生中随机抽取3名学生,每次抽取1名,已知每个人是否被抽到互不影响,记被抽取的“读书之星”人数为随机变量X,求X的分布列和均值E(X).参考答案学习单元3 列联表与独立性检验8.3.1 分类变量与列联表8.3.2 独立性检验1.C ∵a+21=73,∴a=52,b=a+8=52+8=60.2.B 设男性人数为k,依题意,得2×2列联表如下:单位:人零假设为H 0:喜爱足球与性别无关联. χ2=3k(5k 6·4k 3-k 6·2k 3) 2k ·2k ·3k 2·3k2=2k 3,因为本次调查得出“依据α=0.005的独立性检验,认为喜爱足球与性别有关联”的结论,于是χ2≥x 0.005,即2k 3≥7.879,解得k≥11.8185,而k ∈N *,因此k min =12. 故选B.3.D 由题知,已注射疫苗的动物共40只,未注射疫苗的动物共60只,补充列联表如下:单位:只由此可得A,B正确.计算得χ2=100×(20×10-40×30)260×40×50×50≈16.67>10.828=x0.001,根据α=0.001的独立性检验,我们推断H0不成立,即认为该疫苗有效,此推断犯错误的概率不超过0.001,C正确.易知D错误.故选D.4.C 根据四个列联表对应的等高堆积条形图知,选项C中不服药与服药时患该种疾病的差异最大,它最能体现该药物对预防该种疾病有效果.故选C.5.AD 补充完整列联表如下:单位:μg/m3对于A,该市一天中,空气中PM2.5浓度不超过75μg/m3,且SO2浓度不超过150μg/m3的概率估计值为64100=0.64,故A正确;对于B,χ2=1000×(640×100-160×100)2800×200×740×260≈74.844≠7.4844,故B不正确;因为7.4844>6.635=x0.01,由表可知,根据α=0.01的独立性检验,我们推断H0不成立,即认为该市一天空气中PM2.5浓度与SO2浓度有关,此推断犯错误的概率不大于0.01,故D正确,C不正确.故选AD.6.CD 由题意可知χ2=65×[a(30+a)-(15-a)(20-a)]220×45×15×50=13×(13a-60)220×45×3×2>3.841=x0.05,根据a>5,且15-a>5,a∈Z,得当a=8或9时满足题意.7.2.334 χ2=102×(27×29-34×12)261×41×39×63≈2.334.8.有关联零假设为H0:同意限定区域停车与家长的性别无关联.因为χ2=50×(20×15-5×10)225×25×30×20≈8.333>7.879=x0.005,所以依据α=0.005的独立性检验,我们推断H0不成立,即认为同意限定区域停车与家长的性别有关联,此推断犯错误的概率不大于0.005.9.BCD 设男生的人数为5n(n∈N*),根据题意列出2×2列联表如下:单位:人则χ2=10n×(4n×2n-3n×n)27n×3n×5n×5n =10n21.因为依据α=0.05的独立性检验,我们推断H0不成立,即认为喜欢该平台和性别有关联,所以χ2≥3.841,即10n21≥3.841,解得n≥8.0661.因为n∈N*,所以根据选项调查人数中男生人数的可能值为45,60或75.故选BCD.10.1.779 没有零假设为H0:这两种手术对病人又发作心脏病的影响没有差别.根据列联表中的数据,可以求得χ2=392×(39×167-29×157)2196×196×68×324≈1.779<2.706=x0.1.根据小概率值α=0.1的χ2独立性检验,我们没有充分的证据推断H0不成立,即认为这两种手术对病人又发作心脏病的影响没有差别.11.解(1)2×2列联表如下:单位:个(2)零假设为H0:国籍和邮箱名称里是否含有数字无关联.由表中数据得χ2=124×(43×33-27×21)270×54×64×60≈6.201>3.841=x0.05.依据α=0.05的独立性检验,我们推断H0不成立,即认为国籍和邮箱名称里是否含有数字有关联,此推断犯错误的概率不大于0.05.12.解(1)因为(0.005+p+0.018+0.020+0.022+0.025)×10=1,所以p=0.01.所以n=100.1=100.(2)因为n=100,所以“读书之星”有100×[(0.02+0.005)×10]=25(人). 从而2×2列联表如下所示:单位:人性别非读书之星读书之星合计零假设为H 0:“读书之星”与性别无关联.将2×2列联表中的数据代入公式计算得χ2=100×(30×10-15×45)245×55×75×25=10033≈3.030<3.841=x 0.05.依据α=0.05的独立性检验,没有充分证据推断H 0不成立,因此可以认为H 0成立,即认为“读书之星”与性别无关联.(3)将频率视为概率,即从该地区学生中抽取一名学生是“读书之星”的概率为14.由题意可知X~B 3,14.所以P(X=0)=C 3×(14)0×(1-14)3=2764; P(X=1)=C 31×14×(1-14)2=2764;P(X=2)=C 32×(14)2×1-14=964; P(X=3)=C 33×(14)3=164. 所以X 的分布列为X123P 27642764964164E(X)=3×14=34.。

人教版高中数学选择性必修第三册8-1-1变量的相关关系

人教版高中数学选择性必修第三册8-1-1变量的相关关系
编号 1 2 3 4 5 6 7 8 9 身高/cm 165 157 155 175 168 157 178 160 163 体重/kg 52 44 45 55 54 47 62 50 53
判断所给的两个变量之间是否存在相关关系. [思路分析] 在研究两个变量之间是否存在某种关系时,一般从散点图入手.
[变式训练 2] 如下四个散点图中,是正相关的是( A )
解析:对于 A,散点图中的点从左向右是上升的,且在一条直线附近,是正相 关;对于 B,散点图中的点从左向右是下降的,且在一条直线附近,是负相关;对 于 C、D,散点图中的点杂乱无章,无规律可言,没有明显的相关关系.故选 A.
检测篇·达标小练
3.怎样理解两个变量之间的关系?
提示:两个变量间的关系分为三类: ①确定性的函数关系,如正方形的边长与面积的关系. ②相关关系,变量间确实存在关系,但又不具备函数关系所要求的确定性,它们 的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与 “数学成绩”之间的关系. ③不相关,即两个变量间没有任何关系.
2.有几组变量:
①汽车的重量和汽车每消耗 1 升汽油所行驶的平均路程
②平均日学习时间和平均学习成绩
③立方体的棱长和体积
④人体脂肪含量与年龄
其中,两个变量成正相关的是( C )
A.①③
B.②③ C.②④
D.③④
解析:①是负相关;②是正相关;③是函数关系,不是相关关系;④是正相关.故
选 C.
3.观察下列四个散点图,两变量具有线性相关关系的是( A ) 解析:直接根据线性相关关系的定义判断,显然只有 A 正确.故选 A.
3.某商场近 5 个月的销售额和利润额如表所示: 销售额 x/千万元 3 5 6 7 9 利润额 y/百万元 1 3 3 4 5

高中数学选择性必修三 精讲精炼 8 1 成对据的统计相关性(精讲)(含答案)

高中数学选择性必修三 精讲精炼 8 1 成对据的统计相关性(精讲)(含答案)

8.1 成对数据的统计相关性(精讲)考点一相关关系的辨析【例1】(2021·全国·高二单元测试)下列说法错误的是( )A.正方体的体积与棱长之间的关系是函数关系B.人的身高与视力之间的关系是相关关系C.汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关D.体重与学习成绩之间不具有相关关系【答案】B【解析】正方体的体积与棱长之间的关系是函数关系,故A正确;人的身高与视力之间不具有相关关系,故B错误;汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关,故C正确;体重与学习成绩之间不具有相关关系,故D正确.故选:B.【一隅三反】1.(2021·全国·高一课时练习)有五组变量:①汽车的重量和汽车每消耗一升汽油所行驶的距离;②平均日学习时间和平均学习成绩;③某人每天的吸烟量和身体健康状况;④圆的半径与面积;⑤汽车的重量和每千米的耗油量.其中两个变量成正相关的是( )A.②④⑤B.②④C.②⑤D.④⑤【答案】C【解析】①中,汽车的重量和汽车每消耗1升汽油所行驶的平均路程是负相关的关系;②中,平均日学习时间和平均学习成绩的关系是一个正相关;③中,某人每日吸烟量和其身体健康情况是负相关的关系;④中,圆的半径与面积是函数关系;⑤中,汽车的重量和百公里耗油量关系是一个正相关;,所以②⑤中的两个变量属于线性正相关.故选:C.2.(2021·全国·高一课时练习)最新《交通安全法》实施后,某市管理部门以周为单位,记录的每周查处的酒驾人数与该周内出现的交通事故数量如下:通过如表数据可知,酒驾人数x与交通事故数y之间是( )A.正相关B.负相关C.不相关D.函数关系【答案】A【解析】由表格中的数据,在直角坐标系中描出数据的散点图,如图所示,直观判断散点从左向右成带状分布,在一条直线附近,所以具有线性相关关系,且是正相关.故选:A.3.(2021·全国·高一课时练习)某公司2006~2011年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示:根据统计资料,则利润中位数( )A.是16,x与y有正线性相关关系B.是17,x与y有正线性相关关系C.是17,x与y有负线性相关关系D.是18,x与y有负线性相关关系【答案】B【解析】由题意,利润中位数是1618172+=,而且随着利润的增加,支出也在增加,故x与y有正线性相关关系.故选:B.4.(2021·全国·高一课时练习)从统计学的角度看,下列关于变量间的关系说法正确的是( )A.人体的脂肪含量与年龄之间没有相关关系B.汽车的重量和汽车每消耗1L汽油所行驶的平均路程负相关C.吸烟量与健康水平正相关D.气温与热饮销售好不好正相关【答案】B【解析】从统计学的角度看:在一定年龄段内,人体的脂肪含量与年龄之间有相关关系,∴A错误;汽车的重量和汽车每消耗1L汽油所行驶的平均路程是负相关关系,∴B正确;吸烟量与健康水平是负相关关系,∴C错误;气温与热饮销售好不好是负相关关系,∴D错误.故选:B考点二相关系数的理解【例2-1】(2021·安徽·定远县育才学校高二期中(文))对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是( )A.0.2 B.0.8 C.-0.98 D.-0.7【答案】C【解析】∵相关系数的绝对值越大,越具有强大相关性,C相关系数的绝对值最大约接近1,∴C拟合程度越好.故选:C【例2-2】(2021·全国·高二课时练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )A .24310r r r r <<<<B .42130r r r r <<<<C .42310r r r r <<<<D .24130r r r r <<<<【答案】A【解析】由给出的四组数据的散点图可以看出,题图1和题图3是正相关,相关系数大于0,题图2和题图4是负相关,相关系数小于0,题图1和题图2的点相对更加集中,所以相关性更强,所以1r 接近于1,2r 接近于1-,由此可得24310r r r r <<<<.故选:A . 【一隅三反】1.(2021·宁夏·海原县第一中学)在建立两个变量y 与x 的回归模型中,分别选择了4个不同的模型,模型1的相关指数2R 为0.88,模型2的相关指2R 数为0.66,模型3的相关指数2R 为0.945,模型4的相关指数2R 为0.01,其中拟合效果最好的模型是( )A .模型1B .模型2C .模型3D .模型4【答案】C【解析】因为4个不同的模型,模型3的相关指数2R 最大且最接近1, 所以拟合效果最好的模型是模型3,故选:C2.(2021·安徽·淮南第一中学)如果发现散点图中所有的样本点都落在一条斜率为非0实数的直线上,则下列说法错误的是( )A .解释变量和预报变量是一次函数关系B .相关系数1r =C .相关指数21R =D .残差平方和为0【答案】B【解析】散点图中所有的样本点都落在一条斜率为非0实数的直线上,所以解释变量和预报变量是一次函数关系,且残差平方和为0,因此选项AD 正确;由题意可知,||1r =,若直线的斜率为正,则1r =,若直线的斜率为负,则1r =-. 故选:B.3.(2021·广西·玉林市育才中学高二月考)已知r 1表示变量X 与Y 之间的线性相关系数,r 2表示变量U 与V 之间的线性相关系数,且r 1=0.837,r 2=﹣0.957,则( )A .变量X 与Y 之间呈正相关关系,且X 与Y 之间的相关性强于U 与V 之间的相关性B .变量X 与Y 之间呈负相关关系,且X 与Y 之间的相关性强于U 与V 之间的相关性C .变量U 与V 之间呈负相关关系,且X 与Y 之间的相关性弱于U 与V 之间的相关性D .变量U 与V 之间呈正相关关系,且X 与Y 之间的相关性弱于U 与V 之间的相关性 【答案】C【解析】因为线性相关系数r 1=0.837,r 2=﹣0.957,所以变量X 与Y 之间呈正相关关系,变量U 与V 之间呈负相关关系,X 与Y 之间的相关性弱于U 与V 之间的相关性.故选:C4.(2021·全国·高二课时练习)相关变量x ,y 的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到回归直线方程11y b x a =+,相关系数为1r ;方案二:剔除点()1021,,根据剩下的数据得到回归直线方程22y b x a =+,相关系数为2r .则( )A .1201r r <<<B .2101r r <<<C .1210r r -<<<D .0110r r -<<<【答案】D【解析】由题中散点图可知两变量负相关,所以10r <,20r <,因为剔除点()1021,后,剩下的数据线性相关性更强,2r 更接近1,所以2110r r -<<<.故选D.5.(2021·山东·威海市第一中学高二月考)对变量X ,Y 有观测数据(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)对变量U ,V 有观测数据(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),1r 表示变量X ,Y 之间的线性相关系数,2r 表示受最U ,V 之间的线性相关系数,则( ) A .210r r << B .210r r <<C .120r r <<D .21r r =【答案】C【解析】由条件可知:第一组中的数据负相关,相关系数小于零; 第二组中的数据正相关,相关系数大于零.所以有120r r <<.故选:C6.(2021·全国·高一课时练习)如图,5个(),x y 数据,去掉()3,10D 后,下列说法错误的是( )A .x 与y 的相关性变强B .残差平方和变大C .相关指数2R 变大D .解释变量x 与预报变量y 的相关性变强【答案】B【解析】由散点图知,去掉()3,10D 后,y 与x 的线性相关性加强,A 正确;残差平方和变小,B 错误; 相关系数r 变大,相关指数2R 变大,C 正确;解释变量x 与预报变量y 的相关性变强,D 正确.故选:B .考点三 相关系数的应用【例3】(2021·全国·高二课时练习)某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x 年与年销量y (单位:万件)之间的关系如表:在图中画出表中数据的散点图,推断两个变量是否线性相关,计算样本相关系数,并估计它们的相关程度.32.62.24,41418i i i x y ==∑.参考公式:相关系数()()n iix x y y r --=∑【答案】作图见解析;y 与x 的相关系数近似为0.9997,可以推断该公司的年销量y 与第x 年呈正线性相关,且线性相关程度很强. 【解析】作出散点图如图:由散点图可知,各点大致分布在一条直线附近,由此推断x 与y 线性相关. 由题中所给表格及参考数据得: 52x =,692y =,41418i ii x y==∑32.6≈,42130i i x ==∑,()()4411569441847322iii ii i x x y y x y x y ==--=-=-⨯⨯=∑∑,2.24===≈,()()4730.99972.2432.6iix x y y r --==≈⨯∑.∵y 与x 的相关系数近似为0.9997,可以推断该公司的年销量y 与第x 年呈正线性相关,且线性相关程度很强. 【一隅三反】1.(2021·全国·高二课时练习)根据统计,某蔬菜基地西红柿亩产量的增加量y (百千克)与某种液体肥料每亩使用量x (千克)之间的对应数据的散点图,如图所示.依据数据的散点图可以看出,可用线性回归模型拟合y 与x 的关系,请计算相关系数r 并加以说明(若0.75r >,则线性相关程度很高,可用线性回归模型拟合);附:相关系数公式()()nniii ix x y y x y nx yr ---==∑∑.0.55≈0.95≈. 【答案】0.95,答案见解析. 【解析】由已知数据可得2456855x ++++==,3444545y ++++==, 所以()()()()()5131100010316i ii x xy y =--=-⨯-+-⨯+⨯+⨯+⨯=∑,==所以相关系数()()50.95iix x y y r--==∑.因为0.75r >,所以可用线性回归模型拟合y 与x 的关系.2.(2021·全国·高二课时练习)某企业坚持以市场需求为导向,合理配置生产资源,不断改革、探索销售模式.下表是该企业每月生产的一种核心产品的产量x (件)与相应的生产总成本y (万元)的五组对照数据:试求y 与x 的相关系数r ,并利用相关系数r 说明y 与x 是否具有较强的线性相关关系(若0.75r >,则线性相关程度很高,可用线性回归模型拟合).参考公式:()()niixx y y r--=∑【答案】0.98,y 与x 具有较强的线性相关关系,可用线性回归方程拟合y 与x 的关系. 【解析】1234535x ++++==,378101285y ++++==,()()5121iii x x yy =--=∑.∴相关系数0.98r =≈.∵0.75r>,∴y 与x 具有较强的线性相关关系,可用线性回归方程拟合y 与x 的关系.3.(2021·贵州威宁·高二期末(理))2021年4月20日我校高三学生参加了高考体检,为了解我校高三学生中男生的体重y (单位:kg )与身高x (单位:cm )是否存在较好的线性关系,体检机构搜集了7位我校男生的数据,得到如下表格:根据表中数据计算得到y 关于x 的线性回归方程为ˆˆ1.15yx a =+. (1)求ˆa;(2)已知()()22121ˆ1n i i i n ii y y R y y ==-=--∑∑,且当20.9R ≥时,回归方程的拟合效果非常好;当20.80.9R <<时,回归方程的拟合效果良好.试问该线性回归方程的拟合效果是非常好还是良好?说明你的理由.(2R 的结果保留到小数点后两位)参考数据:()721ˆ52.36i i i y y=-=∑. 【答案】(1)136.55-;(2)该线性回归方程的拟合效果是良好的.【解析】(1)由题意可得,1661731851831781801741777x ++++++==,57675975716776772y +++++==+, 又y 关于x 的线性回归方程为ˆˆ1.15yx a =+,所以ˆ= 1.1567 1.15177136.55a y x -=-⨯=- (2)由题意,()()()()2222222271100884511407i i y y =-=-++-+++-+=∑ 所以()()22121ˆ52.36110.870.9407n i i i n ii y yR y y ==-=-=-≈<-∑∑, 所以该线性回归方程的拟合效果是良好的.。

人教版高中数学选择性必修第三册8.1成对数据的相关关系B组能力提高训练(含解析)

人教版高中数学选择性必修第三册8.1成对数据的相关关系B组能力提高训练(含解析)

人教版高中数学选择性必修第三册8.1成对数据的相关关系B 组能力提高训练(原卷版)一、选择题1.(2021·陕西西安市西安中学高二月考)某超市统计了最近5年的商品销售额与利润率数据,经计算相关系数 뜰୛뀀ɚ炔玾,则下列判断正确的是()A.商品销售额与利润率正相关,且具有较弱的相关关系B.商品销售额与利润率正相关,且具有较强的相关关系C.商品销售额与利润率负相关,且具有较弱的相关关系D.商品销售额与利润率负相关,且具有较强的相关关系2.(2021·全国高二课时练)某统计部门对四组数据进行统计分析后,获得如图所示的散点图,关于相关系数的比较,其中正确的是()A .4213r r r r <<<B .2413r r r r <<<C .2431r r r r <<<D .4231r r r r <<<3.(2021·全国高二课时练习)已知x ,y 是两个变量,下列四个关系中,x ,y 呈负相关的是()A .y =x 2-1B .y =-x 2+1C .y =x -1D .y =-x +14.(2021·全国高二课时练习)对两个变量x 、y 进行线性相关检验,得线性相关系数10.7859r =,对两个变量u 、v 进行线性相关检验,得线性相关系数20.9568r =-,则下列判断正确的是()A .变量x 与y 正相关,变量u 与v 负相关,变量x 与y 的线性相关性较强B .变量x 与y 负相关,变量u 与v 正相关,变量x 与y 的线性相关性较强C .变量x 与y 正相关,变量u 与v 负相关,变量u 与v 的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强5.(多选题)(2020·福建上杭一中高二月考)在下列各图中,两个变量具有线性相关关系的图是()6.(多选题)(2021·全国高二专题练习)对于相关系数r,下列说法中错误的是()A.r越大,线性相关程度越强B.r越小,线性相关程度越强C.r越大,线性相关程度越弱,r越小,线性相关程度越强r≤,且r越接近1,线性相关程度越强,r越接近0,线性相关程度越弱D.1二、填空题7.(2021·扶风县法门高中高二月考)如图所示,有5组(),x y数据的散点图,去掉________组数据后,剩下的4组数据的线性相关系数最大.8.(2021·江西赣州市高二期末)甲、乙、丙、丁四位同学各自对,A B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r如下表:甲乙丙丁r-0.82-0.78-0.69-0.85则同学的试验结果体现A,B两变量有更强的线性相关性.9.(2021·全国高二专题练习)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份123456人均销售额658347利润率(%)12.610.418.53.08.116.3①利润率与人均销售额成正相关关系;②利润率与人均销售额成负相关关系;③利润率与人均销售额成正比例函数关系;④利润率与人均销售额成反比例函数关系根据表中数据,下列说法正确的是.10.(2021·福建福州三中高二月考)高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.三、解答题11.(2021·吉林长春市高二月考)某湿地公园经过近十年的规划和治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的300个地块,并设计两种抽样方案,方案一:在该地区应用简单随机抽样的方法抽取30个作为样本区;依据抽样数据计算得到相应的相关系数0.81r =;方案二:在该地区应用分层抽样的方法抽取30个作为样本区,调查得到样本数据(),i i x y (1i =,2,…,30),其中i x 和i y 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得30160ii x==∑,3011200i i y ==∑,()302190i i x x=-=∑,()30218000ii y y =-=∑,()()301800i i i x x y y =--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求方案二抽取的样本(),i i x y (1i =,2,…,30)的相关系数(精确到0.01);并判定哪种抽样方法更能准确的估计.附:相关系数()()ni ix x y yr--=∑1.414≈;相关系数[]0.75,1r∈,则相关性很强,r的值越大,相关性越强.12.(2021·全国高二专题练)在我国,大学生就业压力日益严峻,伴随着政府政策引导与社会观念的转变,大学生创业意识,就业方向也悄然发生转变某大学生在国家提供的税收,担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数i y(单位:万元)与时间i t(单位:年)的数据,列表如下:it12345iy 2.4 2.7 4.1 6.47.9(1)依据表中给出的数据,是否可用线性回归模型拟合y与t的关系,请计算相关系数r并加以说明(计算结果精确到0.01).(若0.75r>,则线性相关程度很高,可用线性回归模型拟合):(2)该专营店为吸引顾客,特推出两种促销方案.方案一:每满500元可减50元;方案二:每满500元可抽奖一次,每次中奖的概率都为25,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.①某位顾客购买了1050元的产品,该顾客选择参加两次抽奖,求该顾客获得100元现金奖励的概率.②某位顾客购买了1500元的产品,作为专营店老板,是希望该顾客直接选择返回150元现金,还是选择参加三次抽奖?说明理由附:相关系数公式()()n ni i i it t y y t y nty r---=∑∑7.547≈.人教版高中数学选择性必修第三册8.1成对数据的相关关系B 组能力提高训练(解析版)一、选择题1.(2021·陕西西安市西安中学高二月考)某超市统计了最近5年的商品销售额与利润率数据,经计算相关系数 뜰୛뀀ɚ炔玾,则下列判断正确的是()A.商品销售额与利润率正相关,且具有较弱的相关关系B.商品销售额与利润率正相关,且具有较强的相关关系C.商品销售额与利润率负相关,且具有较弱的相关关系D.商品销售额与利润率负相关,且具有较强的相关关系【答案】B【详解】由 뜰୛뀀ɚ炔玾>୛可知利润率与人均销售额成正相关关系,且相关性较强,故选:B.2.(2021·全国高二课时练)某统计部门对四组数据进行统计分析后,获得如图所示的散点图,关于相关系数的比较,其中正确的是()A .4213r r r r <<<B .2413r r r r <<<C .2431r r r r <<<D .4231r r r r <<<【答案】C【详解】根据散点图的特征,数据大致呈增长趋势的是正相关,数据呈递减趋势的是负相关;数据越集中在一条线附近,说明相关性越强,由题中数据可知:(1)(3)为正相关,(2)(4)为负相关;故1>0r ,3>0r ;20r <,40r <;又(1)与(2)中散点图更接近于一条直线,故13>r r ,24r r <,因此,24310r r r r <<<<.故选C .3.(2021·全国高二课时练习)已知x ,y 是两个变量,下列四个关系中,x ,y 呈负相关的是()A .y =x 2-1B .y =-x 2+1C .y =x -1D .y =-x +1【答案】D【详解】根据题意,依次分析选项:对于A ,y =x 2-1,当x 增大时,y 的值不一定减小,两个变量不是负相关,不符合题意;对于B ,y =-x 2-1,当x 增大时,y 的值不一定减小,两个变量不是负相关,不符合题意;对于C ,y =x -1,当x 增大时,y 的值一定增大,两个变量正相关,不符合题意;对于D ,y =-x +1,当x 增大时,y 的值一定减小,两个变量负相关,符合题意;故选D .4.(2021·全国高二课时练习)对两个变量x 、y 进行线性相关检验,得线性相关系数10.7859r =,对两个变量u 、v 进行线性相关检验,得线性相关系数20.9568r =-,则下列判断正确的是()A .变量x 与y 正相关,变量u 与v 负相关,变量x 与y 的线性相关性较强B .变量x 与y 负相关,变量u 与v 正相关,变量x 与y 的线性相关性较强C .变量x 与y 正相关,变量u 与v 负相关,变量u 与v 的线性相关性较强D .变量x 与y 负相关,变量u 与v 正相关,变量u 与v 的线性相关性较强【答案】C【详解】由线性相关系数10.78590r =>知x 与y 正相关,由线性相关系数20.95680r =-<知u 与v 负相关,又12r r <,所以,变量u 与v 的线性相关性比x 与y 的线性相关性强,故选:C.5.(多选题)(2020·福建上杭一中高二月考)在下列各图中,两个变量具有线性相关关系的图是()【答案】BC【详解】A 中两个变量为函数关系,不是线性相关关系,所以A 错误;B 中两个变量有明显的正相关,所以具有线性相关性,所以B 正确;C 中两个变量有明显的负相关,所以具有线性相关性,所以C 正确;D 中两个变量不具有相关性,所以D 错误.6.(多选题)(2021·全国高二专题练习)对于相关系数r ,下列说法中错误的是()A .r 越大,线性相关程度越强B .r 越小,线性相关程度越强C .r 越大,线性相关程度越弱,r 越小,线性相关程度越强r≤,且r越接近1,线性相关程度越强,r越接近0,线性相关程度越弱D.1【答案】ABC【解析】对于选项A,r越大,线性相关程度越强,即A错误;对于选项B,r越小,线性相关程度越弱,即B错误;对于选项C,r越大,线性相关程度越强,r越小,线性相关程度越弱,即C错误;r≤,且r越接近1,线性相关程度越强,r越接近0,线性相关程度越弱,即D 对于选项D,1正确,故选:ABC.二、填空题7.(2021·扶风县法门高中高二月考)如图所示,有5组(),x y数据的散点图,去掉________组数据后,剩下的4组数据的线性相关系数最大.【答案】D【解析】线性相关系数越大,则说明线性相关性质越好,由散点图可知,A、B、C、E的线性相关性质最好,所以应该去掉D.8.(2021·江西赣州市高二期末)甲、乙、丙、丁四位同学各自对,A B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r如下表:甲乙丙丁r-0.82-0.78-0.69-0.85则同学的试验结果体现A,B两变量有更强的线性相关性.【答案】丁>>>,且相关系数的绝对值越接近1,则两个变量的线性相关性【解析】0.850.820.780.69越强,∴能体现出A,B两变量有更强的线性相关性的是丁.9.(2021·全国高二专题练习)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份123456人均销售额658347利润率(%)12.610.418.5 3.08.116.3①利润率与人均销售额成正相关关系;②利润率与人均销售额成负相关关系;③利润率与人均销售额成正比例函数关系;④利润率与人均销售额成反比例函数关系根据表中数据,下列说法正确的是.【答案】①【解析】画出利润率与人均销售额的散点图,如图.由图可知利润率与人均销售额成正相关关系.10.(2021·福建福州三中高二月考)高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是________;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是________.【答案】乙;数学【解析】①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是乙;②由高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级的排名情况的散点图可知,两个图中,同一个人的总成绩是不会变的.从第二个图看,丙是从右往左数第5个点,即丙的总成绩在班里倒数第5.在左边的图中,找到倒数第5个点,它表示的就是丙,发现这个点的位置比右边图中丙的位置高,所以语文名次更“大”,及数学的成绩更靠前.三、解答题11.(2021·吉林长春市高二月考)某湿地公园经过近十年的规划和治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的300个地块,并设计两种抽样方案,方案一:在该地区应用简单随机抽样的方法抽取30个作为样本区;依据抽样数据计算得到相应的相关系数0.81r =;方案二:在该地区应用分层抽样的方法抽取30个作为样本区,调查得到样本数据(),i i x y (1i =,2,…,30),其中i x 和i y 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得30160i i x ==∑,3011200i i y ==∑,()302190i i x x=-=∑,()30218000ii y y =-=∑,()()301800i i i x x y y =--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求方案二抽取的样本(),i i x y (1i =,2,…,30)的相关系数(精确到0.01);并判定哪种抽样方法更能准确的估计.附:相关系数()()niix x y y r --=∑ 1.414≈;相关系数[]0.75,1r ∈,则相关性很强,r 的值越大,相关性越强.【详解】(1)由题意可得,样区野生动物平均数为301111200403030i i y ==⨯=∑,又地块数为300,所以该地区这种野生动物的估计值为3004012000⨯=;(2)由题中数据可得,样本(),i i x y (1i =,2,…,30)的相关系数为()()300.943iix x y y r --===≈∑.因为方案一的相关系数为0.81r =明显小于方案二的相关系数为0.94r =,所以方案二的分层抽样方法更能准确的估计.12.(2021·全国高二专题练)在我国,大学生就业压力日益严峻,伴随着政府政策引导与社会观念的转变,大学生创业意识,就业方向也悄然发生转变某大学生在国家提供的税收,担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数i y(单位:万元)与时间i t(单位:年)的数据,列表如下:it12345iy 2.4 2.7 4.1 6.47.9(1)依据表中给出的数据,是否可用线性回归模型拟合y与t的关系,请计算相关系数r并加以说明(计算结果精确到0.01).(若0.75r>,则线性相关程度很高,可用线性回归模型拟合):(2)该专营店为吸引顾客,特推出两种促销方案.方案一:每满500元可减50元;方案二:每满500元可抽奖一次,每次中奖的概率都为25,中奖就可以获得100元现金奖励,假设顾客每次抽奖的结果相互独立.①某位顾客购买了1050元的产品,该顾客选择参加两次抽奖,求该顾客获得100元现金奖励的概率.②某位顾客购买了1500元的产品,作为专营店老板,是希望该顾客直接选择返回150元现金,还是选择参加三次抽奖?说明理由附:相关系数公式()()n ni i i it t y y t y nty r---=∑∑7.547≈.【详解】(1)由题可知:513, 4.7iiit y t y======∑,则14.70.970.7515.094niit y nt yr-====≈>∑故y与t的线性相关程度很高,可用线性线性回归模型拟合.(2)顾客选择参加两次抽奖,设他获得100元现金奖励为事件A.122312()5525P A C=⋅⋅=.设X表示顾客在三次抽奖中中奖的次数,由于顾客每次抽奖的结果相互独立,则2~3,5X B⎛⎫⎪⎝⎭,所以2()3 1.25E X np==⨯=,由于顾客每中一次可获得100元现金奖励,因此该顾客在三次抽奖中可获得的奖励金额的均值为1.2100120⨯=,由于顾客参加三次抽奖获得现金奖励的均值120小于直接返现的150元,所以专营店老板希望顾客参加抽奖.。

【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册(含解析)

【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册(含解析)

8.1成对数据的统计相关性A一.选择题(共8小题)1.两个变量的散点图如图,可考虑用如下函数进行拟合比较合理的是( )A .by a x =B .bxy a e =C .y a blnx =+D .b xy a e =2.如图所示,图中有5组数据,去掉______组数据后(填字母代号),剩下的4组数据的线性相关性最大( )A .EB .CC .AD .D3.在下列各图中,两个变量具有相关关系的图是()A .(1)(2)(3)B .(1)(3)(4)C .(2)(3)(4)D .(1)(2)(4)4.为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的线性相关系数,其数值分别为0.939,0.937,0.948,则( ) A .甲组数据的线性相关性最强,乙组数据的线性相关性最弱B .乙组数据的线性相关性最强,丙组数据的线性相关性最弱C .丙组数据的线性相关性最强,甲组数据的线性相关性最弱D .丙组数据的线性相关性最强,乙组数据的线性相关性最弱5.如图是九江市2019年4月至2020年3月每月最低气温与最高气温(C)︒的折线统计图:已知每月最低气温与最高气温的线性相关系数0.83r =,则下列结论错误的是( )A .每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关B .月温差(月最高气温-月最低气温)的最大值出现在10月C .912-月的月温差相对于58-月,波动性更大D .每月最高气温与最低气温的平均值在前6个月逐月增加6.甲、乙、丙、丁四位同学各自对x ,y 两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r ,如表:相关系数甲 乙 丙 丁 r0.82-0.780.690.87则哪位同学的试验结果体现两变量有更强的线性相关性?( ) A .甲B .乙C .丙D .丁7.恩格尔系数是食品支出总额占个人消费支出总额的比重.据某机构预测,(10)n n 个城市职工购买食品的人均支出y (千元)与人均月消费支出x (千元)具有线性相关关系,且回归方程为0.4 1.2y x =+,若其中某城市职工的人均月消费支出为5千元,则该城市职工的月恩格尔系数约为( ) A .60%B .64%C .58%D .55%8.对变量x ,y 有观测数据(i x ,)(1i y i =,2,⋯,10),得散点图(1);对变量u ,v ,有观测数据(i u ,)(1i v i =,2,⋯,10),得散点图(2),由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关 二.多选题(共2小题)9.如图所示,5个(,)x y 数据,去掉(3,10)D 后,下列说法正确的是( )A .相关系数r 变大B .残差平方和变大C .相关指数2R 变小D .解释变量x 与预报变量y 的相关性变强 10.下列结论中正确的个数是( ) A .若a b >,则22am bm >B .在线性回归分析中,相关系数r 越大,变量间的相关性越强C .已知随机变量ξ服从正态分布2(1,)N σ,(4)0.79P ξ=,则(2)0.21P ξ-=D .已知l ,m 为两条不同直线,α,β为两个不同平面,若l αβ=,//m α,//m β,则//m l三.填空题(共4小题)11.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设z lny =,将其变换后得到线性方程0.34=+,则c,k的值分别是4e和0.3,③在残差图中,残差点分布的带状区z x域的宽度越狭窄,其模型拟合的精度越高,④若变量x和y满足关系0.11=-+,且变量yy x与z正相关,则x与z也正相关,正确的个数是.12.甲、乙、丙、丁四位同学各自对A、B两变量进行线性相关试验,并用回归分析方法分别求得相关系数r如表:甲乙丙丁r0.850.800.82-0.90-则这四位同学的试验结果能体现出A、B两变量有更强的线性相关性的是.13.对两个变量的相关系数r,有下列说法:(1)||r越大,相关程度越大;(2)||r越小,相关程度越大;(3)||r趋近于0时,没有非线性相关系数;(4)||r越接近于1时,线性相关程度越强,其中正确的是.14.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级的排名情况如图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是.四.解答题(共4小题)15.在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:x(元)1416182022y(件)1210753且知x与y具有线性相关关系,求出y对x的线性回归方程,并说明拟合效果的好坏.16.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如表所示:根据以上数据试判断含杂质的高低与设备改造有无关系?杂质高杂质低旧设备37121新设备2220217.研究某设备的使用年限x与维修费用y之间的关系,测得一组数据如下(y值为观察值):年限x(年)23456维修费用y(万元)3 4.45 5.6 6.2由数据可知y与x有明显的线性相关关系,可以用一条直线l的方程来反映这种关系.(Ⅰ)将表中的数据画成散点图;(Ⅱ)如果直线l过散点图中的最左侧点和最右侧点,求出直线l的方程;(Ⅲ)如果直线l过散点图中的中间点(即点(4,5)),且使维修费用的每一个观察值与直线l 上对应点的纵坐标的差的绝对值之和最小,求出直线l的方程.18.某种产品的广告费支出x与销售额y(单位:万元)之间有如下对应数据:2P k k0.500.400.250.150.100.050.0250.0100.0050.001 ()k0.4550.708 1.323 2.072 2.706 3.841 5.024 6.6357.87910.83 x24568y3040605070(Ⅰ)画出散点图;(Ⅱ)求回归直线方程;(Ⅲ)试预测广告费支出为10万元时,销售额多大?8.1成对数据的统计相关性A参考答案与试题解析一.选择题(共8小题)1.【解答】解:由散点图可知,此曲线类似对数函数型曲线,因此可用函数y a blnx=+模型进行拟合.故选:C.2.【解答】解:图中5组数据,A、B、C、E四点分布在一条直线附近且靠近某一直线,点D离得较远,是离群点;所以去掉D点剩下的4组数据的线性相关性最大.故选:D.3.【解答】解:图(1)、(2)、(3)中,散点图中的点大致分布在一条直线附近,成带状分布,所以变量间具有线性相关关系;图(4)中,散点图中的点分布杂乱无章,不在一条直线附近,也不成带状分布,所以变量间不具有线性相关关系.故选:A.4.【解答】解:甲、乙、丙三组数据的线性相关系数分别为0.939,0.937,0.948,所以线性相关系数最大的丙组数据的线性相关性最强,线性相关系数最小的乙组数据的线性相关性最弱.故选:D.5.【解答】解:每月最低气温与最高气温的线性相关系数0.83r=,可知每月最低气温与最高气温有较强的线性相关性,且二者为线性正相关,由所给的折线图可以看出月温差(月最高气温-月最低气温)的最大值出现在10月,912-月的月温差相对于58-月,波动性更大,每月的最高气温与最低气温的平均值在前5个月逐月增加,第六个月开始减少,所以ABC正确,D错误;故选:D.6.【解答】解:根据题意知,丁同学的相关系数||0.87r=为最大,所以丁同学的试验结果体现两变量有更强的线性相关性.故选:D .7.【解答】解:把5x =代入回归方程0.4 1.2y x =+中,得0.45 1.2 3.2y =⨯+=; 则该城市职工的月恩格尔系数约为3.20.6464%5==. 故选:B .8.【解答】解:由题图1可知,y 随x 的增大而减小,各点整体呈下降趋势,x 与y 负相关, 由题图2可知,u 随v 的增大而增大,各点整体呈上升趋势,u 与v 正相关. 故选:C .二.多选题(共2小题)9.【解答】解:由散点图知,去掉离群点D 后,x 与y 的相关性变强,且为正相关, 所以相关系数r 的值变大,相关指数2R 的值变大,残差平方和变小. 故选:AD .10.【解答】解:若a b >,且0m =,则22am bm =,若0m ≠,则22am bm >,故A 错误; 根据线性相关系数r 的绝对值越接近1,两个变量的线性相关性越强;反之,线性相关性越弱,判断B 错误;已知随机变量ξ服从正态分布2(1,)N σ,(4)0.79P ξ=,则曲线关于1x =对称,可得(4)10.790.21P ξ>=-=,(2)(4)0.21P P ξξ-=>=,故C 正确;已知l ,m 为两条不同直线,α,β为两个不同平面,若l αβ=,//m α,过m 的一个平面与α交于a ,由线面平行的性质定理可得,//m a ,同理由//m β,过m 的平面与β交于b ,可得//m b ,则//a b ,a β⊂/,可得//a β,再由线面平行的性质定理可得//a l ,则//m l ,故D正确.其中正确的个数为2. 故选:CD .三.填空题(共4小题)11.【解答】解:对于①,根据独立性原理知,分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,①正确;对于②,根据回归模型和对数的运算性质知,以模型kx y ce =去拟合一组数据时,为了求出回归方程,设z lny =,将其变换后得到线性方程0.34z x =+,则c ,k 的值分别是4e 和0.3,所以②正确;对于③,利用残差分析模型拟合效果时,在残差图中,残差点分布的带状区域的宽度越狭窄, 其模型拟合的精度越高,所以③正确;对于④,若变量x 和y 满足关系0.11y x =-+,且变量y 与z 正相关,则x 与z 是负相关,所以④错误.综上知,正确命题的序号是①②③,共3个. 故答案为:3.12.【解答】解:根据线性相关系数的定义,||1r →,相关性更强, 由表格可得能体现出A 、B 两变量有更强的线性相关性的是丁. 故答案为:丁.13.【解答】解:对于(1),||r 越大,相关程度越大,命题(1)正确; 对于(2),||r 越小,相关程度越小,命题(2)错误;对于(3),||r 趋近于0时,线性相关关系越弱,命题(3)错误; 对于(4),||r 越接近于1时,线性相关程度越强,命题(4)正确. 综上,正确的命题是(1)、(4). 故答案为:(1)、(4). 14.【解答】解:①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 乙;②由高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级的排名情况的散点图可知,两个图中,同一个人的总成绩是不会变的.从第二个图看,丙是从右往左数第5个点,即丙的总成绩在班里倒数第5.在左边的图中,找到倒数第5个点,它表示的就是丙,发现这个点的位置比右边图中丙的位置高,所以语文名次更“大”,及数学的成绩更靠前. 故答案为:乙;数学. 四.解答题(共4小题) 15.【解答】解:1(1416182022)185x =++++=,1(1210753)7.45y =++++=,∴51620i i i x y ==∑,5211660i i x ==∑,1.15b ∴=-,28.1a =.∴线性回归方程为 1.1528.1y x =-+;14x =时,12y =,差是0, 16x =时,9.7y =,差是0.3, 18x =时,7.4y =,差是0.4,20x =时, 5.1y =,差是0.1, 22x =时, 2.8y =,差是0.2,21(00.090.160.010.04)(21.16 6.760.16 5.7619.36)10.00563910.9943609R ∴=-++++÷++++=-=,由于0.9943609非常接近1, 故这个回归模型拟合效果比较好.16.【解答】解:由已知数据得到如下22⨯列联表杂质高 杂质低 合计 旧设备 37 121 158 新设备 22 202 224 合计59323382由公式2382(3720212122)13.1115822459323K ⨯⨯-⨯=≈⨯⨯⨯,由于13.1110.828>,故有99.9%的把握认为含杂质的高低与设备是否改造是有关的. 17.【解答】解:(Ⅰ)如图所示.(Ⅱ)因为散点图中的最左侧点和最右侧点分别是(2,3),(6,6.2), 所以直线l 的方程是: 6.233(2)62y x --=--,即4570x y -+=. (Ⅲ)由题意可设直线l 的方程为(4)5y k x =-+.则维修费用的每一个观察值与直线l 上对应点的纵坐标的差的绝对值之和4.46,0.6()|3(25)||4.4(5)||5.6(5)||6.2(25)|2|1|4|0.6|20.4,0.616 4.4,1k k S k k k k k k k k k k k -⎧⎪=--++--++-++-+=-+-=-<⎨⎪->⎩,因为()S k 的单调递增区间为(0.6,)+∞,单调递减区间为(,0.6)-∞, 所以当0.6k =时,()S k 取得最小值0.8, 此时直线l 的方程是35130x y -+=.18.【解答】解:(Ⅰ)根据表中所列数据可得散点图如下:(Ⅱ)2456855x ++++==,3040506070505y ++++==又已知521145ii x ==∑,511380i i i x y ==∑.于是可得:51522113805550ˆ 6.51455555i i i ii xy xybxx ==--⨯⨯===-⨯⨯-∑∑ˆˆ50 6.5617.5ay bx =-=-⨯= 因此,所求回归直线方程为:ˆ 6.517.5yx =+ (Ⅲ)根据上面求得的回归直线方程,当广告费支出为10万元时, ˆ 6.51017.582.5y=⨯+=(万元) 即这种产品的销售收入大约为82.5万元。

新人教版高中数学选择性必修第三册第八章成对数据的统计分析全套课件及配套课时作业

新人教版高中数学选择性必修第三册第八章成对数据的统计分析全套课件及配套课时作业

量正线性相关,且相关程度很高.
反思 感悟
线性相关强弱的判断方法 (1)散点图:散点图只是粗略作出判断,其图象越接近直线, 相关性越强. (2)样本相关系数:样本相关系数能够较准确的判断相关的 程度,其绝对值越大,相关性越强.
跟踪训练3 假设关于某种设备的使用年限x(单位:年)与所支出的维修 费用y(单位:万元)有如下统计资料:
解析 x =3+3+5+6+6+107+8+9+9+10=6.6, y =15+17+25+28+30+ 1036+37+42+40+45=31.5.
∴r=
10
xi- x yi- y
i=1
≈0.991 8.
10
xi- x 2
10
yi- y 2
i=1
i=1
12345
课堂小结
KE TANG XIAO JIE
反思 感悟
两个变量是否相关的两种判断方法 (1)根据实际经验:借助积累的经验进行分析判断. (2)利用散点图:通过散点图,观察它们的分布是否存在一 定的规律,直观地进行判断.如果发现点的分布从整体上看 大致在一条直线附近,那么这两个变量就是线性相关的,注 意不要受个别点的位置的影响.
跟踪训练1 (多选)在下列所示的四个图中,每个图的两个变量具有相 关关系的图是
(2)某种产品的广告支出费x与销售额y之间有如下对应数据(单位:百万元): x2 4 5 6 8 y 30 40 60 50 70
①画出散点图;
解 以x对应的数据为横坐标,y对应的数据为纵坐标, 所作的散点图如图所示.
②从散点图中判断销售金额与广告支出费成什么样的关系?
解 从图中可以发现广告支出费与销售金额之间具有相关关系,并且当 广告支出费由小变大时,销售金额也大多由小变大,图中的数据大致分 布在某条直线的附近,即x与y成正相关关系.

高中数学第8章成对数据的统计分析8-1成对数据的统计相关性新人教版选择性必修第三册

高中数学第8章成对数据的统计分析8-1成对数据的统计相关性新人教版选择性必修第三册
据的值变大时,另一个数据的值通常也 变大 .
当r<0时,称成对样本数据 负相关 .这时,当其中一个数据
的值变小时,另一个数据的值通常会 变大 ;当其中一个数
据的值变大时,另一个数据的值通常会 变小 .
(4)样本相关系数r的取值范围为[-1,1].样本相关系数r的绝
对值大小可以反映成对样本数据之间线性相关的程度:当|r|
知识概览
课前•基础认知
1.变量的相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地
决定另一个的程度,这种关系称为 相关关系 .
微思考 两个变量间的关系有几类?
提示:两个变量间的关系分为三类:第一类是确定性的函数
关系,如正方形边长与面积的关系;第二类是变量间确实存在
关系,但又不具备函数关系所要求的确定性,它们的关系是带
越接近1时,成对样本数据的线性相关程度越 强 ;当|r|越接
近0时,成对样本数据的线性相关程度越 弱 .
微训练3(1)在研究两个变量y与x的相关关系时,分别选择了
四组不同的数据,这四组不同的数据得到的样本相关系数r分
别为0.25,0.50,0.98,0.80,则其中相关程度最强的样本相关系数
是(
)
系数r说明.

参考公式:r=
∑ ( -)( -)
=


∑ ( -)
=

,其中, 为数据的平均数.
∑ ( -)
=
解:(1)根据表中数据,画出散点图如下:
(2)由散点图知,这些点都集中在一条直线附近,由此可判断绿
由散点图可知,各点落在一条直线附近,故两个变量线性相
关.
规律总结 两个随机变量是否具有相关关系的判断方法

2022年人教A版高中数学选择性必修第三册同步培优第八章成对数据的统计分析第1节成对数据的统计相关性

2022年人教A版高中数学选择性必修第三册同步培优第八章成对数据的统计分析第1节成对数据的统计相关性

第八章8.1A组·素养自测一、选择题1.(多选题)下列关系中,属于相关关系的是(BD)A.正方形的边长与面积之间的关系B.农作物的产量与施肥量之间的关系C.人的身高与年龄之间的关系D.降雪量与交通事故的发生率之间的关系[解析]在A中正方形的边长与面积之间的关系是函数关系;在B中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在C中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在D中,降雪量与交通事故的发生率之间具有相关关系.2.(2021·重庆高一期中)已知x,y是两个变量,下列四个散点图中,x,y呈正相关趋势的是(A)[解析]x,y呈正相关趋势时,散点图应该是从左下到右上趋势,由图可知选项A中的散点图是从左下到右上趋势,描述了y随着x的增大而增大的变化趋势,故选A.3.已知两个变量x,y与其线性相关系数r,下列说法正确的是(C)①若r>0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全相关(有函数关系).A.①②B.②③C.①③D.①②③[解析]若两个变量正相关,则因变量随着自变量的增大(减小)而增大(减小),此时相关系数r>0;若两个变量负相关,则因变量随自变量的增大(减小)而减小(增大),此时相关系数r<0;若|r|=1,则两个变量完全相关.故选C.4.(2021·陕西西安高一期中)在下列各图中,相关关系最强的是(A)[解析]对于A,图中各点成带状分布,这组变量具有较强的线性相关关系;对于B,C,D图中所示的散点图中,样本点成片状分布,两个变量的线性相关关系相对较弱,或不具有相关关系,故选A.5.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份12345 6人均销售额658347利润率(%)12.610.418.5 3.08.116.3根据表中数据,下列说法正确的是(C)A.利润率与人均销售额成正比例函数关系B.利润率与人均销售额成反比例函数关系C.利润率与人均销售额成正相关关系D.利润率与人均销售额成负相关关系[解析]根据题意,画出利润率与人均销售额的散点图,如图所示:由散点图知,利润率与人均销售额成正相关关系.二、填空题6.下列两个变量之间具有相关关系的是__②④__.(填序号) ①正方形的边长a 和面积S ; ②一个人的身高h 和右手一拃长x ;③真空中的自由落体运动其下落的距离h 和下落的时间t ; ④一个人的身高h 和体重x .[解析] 对于①,正方形的边长a 和面积S 是函数关系,不是相关关系;对于②,一般情况下,一个人的身高h 和右手一拃长x 是正相关关系;对于③,真空中的自由落体运动其下落的距离h 和下落的时间t 是函数关系,不是相关关系;对于④,一般情况下,一个人的身高h 和他的体重x 是正相关关系.7.下列说法中正确的是__①②__(填序号).①变量间的线性相关系数r 的取值范围为[-1,1];②变量间的线性相关系数r 的绝对值越接近0,则变量间的线性相关程度越低;③变量间的相关系数越小,变量间的相关程度越小.[解析] 根据题意,依次分析.对于①,相关系数r 满足|r |≤1,即相关系数r 的取值范围为[-1,1],①正确;对于②,根据相关系数的性质知|r |≤1,且|r |越接近1,相关程度越大; |r |越接近0,相关程度越小,则②正确;对于③,当r 接近-1时,变量间的相关程度比r 接近0时的大,故③错误. 8.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =-15x +1上,则这组样本数据的样本相关系数为__-1__.[解析] 因为这组样本数据的所有样本点(x i ,y i )(i =1,2,…n )都在直线y =-15x +1上,所以这组样本数据完全相关,其相关系数是-1.三、解答题9.某厂的生产原料耗费x (单位:百万元)与销售额Y (单位:百万元)之间有如下的对应关系:x 2 4 6 8 Y30405070x 与Y 之间是否具有线性相关关系?若有,判断相关性的强弱. [解析] 画出散点图如图所示,由图可知x ,Y 有线性关系.x =5,y =47.5,∑i =14x 2i =120,∑i =14y 2i =9 900,∑i =14x i y i =1 080,r =∑i =14x i y i -4x y(∑i =14x 2i -4x2)(∑i =14y 2i -4y 2)=1 080-4×5×47.5(120-4×52)(9 900-4×47.52)≈0.982 7.故x 与Y 之间具有很强的正相关关系.10.为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI 值、总胆固醇TC 指标值(单位:mmol /L)、空腹血糖CLU 指标值(单位:mmol/L)如表所示.人员编号 1 2 3 4 5 6 7 8 BMI 值x 25 27 30 32 33 35 40 42 TC 指标值y 5.3 5.4 5.5 5.6 5.7 6.5 6.9 7.1 CLU 指标值z6.77.27.38.08.18.69.09.1用变量y 与x ,z 与x 的相关系数,分别说明TC 指标值与BMI 值、CLU 指标值与BMI 值的相关程度.参考公式:相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2参考数据:x =33,y =6,z =8,∑i =18(x i -x)2=244,∑i =18(y i -y )2≈3.6,∑i =18(z i -z )2=5.4,∑i =18(x i -y )(y i -y )=28.3,∑i =18(x i -x )(z i -z )=35.4,244≈15.6, 3.6≈1.9, 5.4≈2.3.[解析] 变量y 与x 的相关系数r ≈28.315.6×1.9≈0.95,变量z 与x 的相关系数r ′≈35.415.6×2.3≈0.99,可以看出TC 指标值与BMI 值、CLU 指标值与BMI 值都是高度正相关.B 组·素养提升一、选择题1.(多选题)以下各对变量成正相关的是( CD ) A .学生的学籍号与学生的数学成绩 B .坚持每天吃早餐的人数与患胃病的人数 C .气温与冷饮销售量D .电瓶车的重量和行驶每千米的耗电量[解析] 对于A ,学生的学籍号与学生的数学成绩没有相关关系;对于B ,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;对于C ,一般情况下,气温与冷饮销售量成正相关关系;对于D ,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.2.(多选题)下列说法正确的是( ABC )A .若样本x 1,x 2,x 3,…,x 10的平均数为5,标准差为1,则样本2x 1+1,2x 2+1,2x 3+1,…,2x 10+1的平均数为11,标准差为2B .身高和体重具有相关关系C .现有高一学生30名,高二学生40名,高三学生30名,若按分层抽样的方法从中抽取20名学生,则需抽取高三学生6名D .两个变量间的线性相关程度越强,相关系数的值就越大[解析]对于A,若样本x1,x2,x3,…,x10的平均数为5,标准差为1,则样本2x1+1,2x2+1,2x3+1,…,2x10+1的平均数为2×5+1=11,标准差为2×1=2,故A正确;对于B,身高和体重具有相关关系,故B正确;对于C,高三学生人数占总人数的比例为3030+40+30=310,所以抽取的20名学生中高三学生有20×310=6(名),故C正确;对于D,两个变量间的线性相关程度越强,应是相关系数的绝对值越大,故D错误.故选ABC.3.(2021·江苏省盐城中学高三月考)相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据计算得到的相关系数为r1;方案二:剔除点(10,21)后,根据剩下的数据计算得到的相关系数为r2.则(D)A.0<r1<r2<1 B.0<r2<r1<1C.-1<r1<r2<0 D.-1<r2<r1<0[解析]由散点图得两个变量负相关,所以r1<0,r2<0.因为剔除点(10,21)后,剩下的样本点线性相关程度更强,所以|r2|更接近1,所以-1<r2<r1<0.4.(2021·黑龙江哈尔滨高二月考)研究表明,开始吸烟年龄X分别为16岁、18岁、20岁和22岁者,其得肺癌的相对危险度Y依次为15.10,12.81,9.72,3.21;每天吸烟支数U分别为10,20,30者,其得肺癌的相对危险度V分别为7.5,9.5和16.6,用r1表示变量X与Y之间的线性相关系数,用r2表示变量U与V之间的线性相关系数,则下列说法正确的是(D) A.r1=r2B.0<r2<r1C.0<r1<r2D.r1<0<r2[解析]由题意可知,开始吸烟年龄递增时,得肺癌的相对危险度呈递减趋势,所以吸烟年龄与得肺癌的危险度呈负相关,所以r1<0,同理可知,得肺癌的危险度与每天吸烟支数呈正相关,所以r2>0.因此可得r1<0<r2.故选D.二、填空题5.如图所示的五组数据(x,y)中,去掉__(4,10)__后,剩下的四组数据相关性增强.[解析]去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强.6.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则r1,r2,0的大小关系为__r2<0<r1__.[解析]对于变量X与Y而言,Y随X的增大而增大,故变量Y与X正相关,即r1>0;对于变量U与V而言,V随U的增大而减小,故变量V与U负相关,即r2<0.故r2<0<r1.7.(2021·河南郑州高一期末)现求得甲、乙、丙3组不同的成对样本数据的样本相关系数分别为0.81,-0.98,0.63,其中__乙__(填甲、乙、丙中的一个)组成对样本数据的线性相关程度最强.[解析]因为成对样本数据的样本相关系数的绝对值越接近1,相关程度越强,又甲、乙、丙3组不同的成对样本数据的样本相关系数分别为0.81,-0.98,0.63,乙组的样本相关系数的绝对值最接近1,所以乙组成对样本数据的线性相关程度最强.三、解答题8.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一组数据,如表所示:判断含碳量与冶炼时间的相关关系的强弱.[解析]由已知数据列成下表.于是r =∑i =110x i y i -10x y(∑i =110x 2i -10x 2)(∑i =110y 2i -10y 2)≈0.990 6.y 与x 具有很强的线性相关关系.9.(2021·山东临沂高二期末)根据统计,某蔬菜基地西红柿亩产量的增加量y (百千克)与某种液体肥料每亩使用量x (千克)之间对应数据的散点图如图所示.依据散点图可以看出,y 与x 间具有较强的线性相关关系,请计算样本相关系数r 并加以说明(若|r |>0.75,则线性相关程度很高).附:样本相关系数公式r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x)2∑i =1n(y i -y )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2∑i =1ny 2i -n y2,参考数据:0.3≈0.55,0.9≈0.95.[解析] 由已知数据可得x =2+4+5+6+85=5,y =3+4+4+4+55=4.所以∑i =15(x i -x )(y i -y )=(-3)×(-1)+(-1)×0+0×0+1×0+3×1=6,∑i =15(x i -x )2=(-3)2+(-1)2+02+12+32=25,∑i =15(y i -y )2=(-1)2+02+02+02+12=2,所以样本相关系数r=∑i=15(x i-x)(y i-y)∑i=15(x i-x)2∑i=15(y i-y)2=625×2=910≈0.95.因为|r|>0.75,所以y与x具有较强的线性相关关系.。

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

8.1 成对数据的相关关系 ---A 基础练
一、选择题
1.下列现象中线性相关程度最强的是( )
A .商店的职工人数与商品销售额之间的线性相关系数为0.87
B .流通费用率与商业利润率之间的线性相关系数为-0.94
C .商品销售额与商业利润率之间的线性相关系数为0.51
D .商品销售额与流通费用率之间的线性相关系数为0.70 【答案】B
【详解】线性相关系数r 的绝对值越接近于1,两个变量间的线性相关程度越强,故选B.
2.(2021·福建三明一中高二月考)变量x ,y 的散点图如图所示,那么x ,y 之间的样本相关系数r 最接近的值为( )
A .1
B .-0.5
C .0
D .0.5 【答案】C
【详解】根据变量x ,y 的散点图,得:x ,y 之间的样本相关关系非常不明显,所以相关系数r 最接近的值应为0.故选C.
3.(2021·山东泰安实验高中高二月考)一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =1
2 x +1上,则这组样本
数据的样本相关系数为( )
A .-1
B .0
C .0.5
D .1 【答案】D
【详解】因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1. 4.甲、乙、丙、丁四位同学各自对x ,y 两变量的线性相关性作试验,求得相关系数r 如表:
A .甲
B .乙
C .丙
D .丁 【答案】D
【详解】根据题意知,丁同学的相关系数|r |=0.87为最大,所以丁同学的试验结果体现两变量有 更强的线性相关性.故选D.
5.(多选题)(2021·全国高二课时练)以下两个变量成正相关的是( )
A.学生的学籍号与学生的数学成绩
B.坚持每天吃早餐的人数与患胃病的人数
C.气温与冷饮销售量
D.电瓶车的重量和行驶每千米的耗电量
【答案】CD
【详解】对于A,学生的学籍号与学生的数学成绩没有相关关系;对于B,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;对于C,一般情况下,气温与冷饮销售量成正相关关系;对于D,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.综上所述,其中两个变量成正相关的是CD.
6.(多选题)(2021·山东德州市高二期末)对相关系数r来说,下列说法错误的有()
A.|r|≤1,|r|越接近0,相关程度越大;|r|越接近1,相关程度越小
B.|r|≥1,|r|越接近1,相关程度越大;|r|越大,相关程度越小
C.|r|≤1,|r|越接近1,相关程度越大;|r|越接近0,相关程度越小
D.|r|≥1,|r|越接近1,相关程度越小;|r|越大,相关程度越大
【答案】ABD
【详解】用相关系数r可以衡量两个变量之间的相关关系的强弱,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值接近于0时,表示两个变量之间几乎不存在相关关系,故“对于相关系数r来说,|r|≤1,|r|越接近1,相关程度越大;|r|越接近0,相关程度越小”,C正确,故选ABD.
二、填空题
7.下列两个变量之间的关系是函数关系的是________.
①角度和它的余弦值;②正方形的边长和面积
③正n边形的边数和内角和;④人的年龄和身高
【答案】①②③
【详解】函数关系是变量之间的一种确定性的关系.①②③中的两个变量之间都是函数关系,可以写出它们的函数关系式,分别为f(θ)=cos θ,g(a)=a2,h(n)=(n-2)×180°.而④中的两个变量之间不是函数关系,对于年龄相同的人来说,可以有不同的身高.
8.(2021·江西上饶市高二期末)某个男孩的年龄与身高的统计数据如下表所示.
其散点图如下;
则y 与x (填:是或否)具有线性相关关系. 【答案】是
【详解】由图知,所有数据点接近一条直线排列,因此,认为y 与x 有线性相关关系.
9.已知变量x 和变量y 的3对随机观测数据(2,2),(3,-1),(5,-7),则成对样本数据的样本相关系数是________. 【答案】-20
21
【详解】x - =103 ,y - =-2,有相关系数公式得∴r =-20
21
10.(2021·全国高二专题练习)已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表: 学生编号 1 2 3 4 5 6 7 8 数学成绩 60 65 70 75 80 85 90 95 物理成绩
72
77
80
84
88
90
93
95
给出散点图如下:
根据以上信息,判断下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系; ②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高. 其中正确的个数为________. 【答案】1
【详解】由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关
关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;
若甲同学的数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1. 三、解答题
11.(2021·河南高二期中)5名学生的数学和物理成绩如下表:
画出散点图,并判断它们是否具有相关关系.
【详解】把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在直角坐标系中描点(x i ,y i )(i =1,2,…,5),作出散点图如图.
从图中可以直观地看出数学成绩和物理成绩具有相关关系,且当数学成绩增大时,物理成绩也在由小变大,即它们正相关.
12.(2021·浙江丽水高级中学高二期中)下图是我国2014年至2021年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2014~2021.
由折线图看出,可用线性回归模型拟合y 与t 的关系,请求出相关系数r ,并用相关系数的大小说明y 与t 相关性的强弱.
参考数据:∑i =1
7
y i =10.97,∑i =1
7
t i y i =47.36,
∑i =1
7
(y i -y -
)2 =0.664,7 ≈2.646.
参考公式:
相关系数r =
∑i =1
n
(t i -t -)(y i -y -

∑i =1
n (t i -t -)2∑i =1
n (y i -y -
)2

∑i =1
n
t i y i -t -∑i =1
n
y i
∑i =1
n
(t i -t -)2∑i =1
n (y i -y -
)2
【详解】由折线图中数据和参考数据得t - =4,∑i =1
7 (t i -t -
)2=28,
∑i =1
7 (y i -y -)2
=0.664,∑i =1
7 (t i -t - )(y i -y - )=∑i =1
7t i y i -t - ∑i =1
7
y i =47.36-4×10.97=3.48, ∴r ≈ 3.48
0.664×2×2.646
≈0.99.
∵y 与t 的相关系数近似为0.99,∴y 与t 的线性相关程度比较高.。

相关文档
最新文档