高中数学 第三章 统计案例 3.1 回归分析 3.1.2 相关系数 北师大版选修2-3
高中数学 第三章 统计案例 3.1 回归分析课件 北师大版选修23
一
二
三
二、相关系数
假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),则变量
间线性相关系数r的计算公式为
∑ (x i -x)(y i -y)
r=
=
=1
n
2
∑ ( -) ·∑ ( - )
i=1
=1
2
∑ -
.
=1
∑
探究一
探究二
探究三
思维辨析
解(1)散点图如图所示.
(2)采用列表的方法计算 a 与回归系数 b.
xi2
i
xi
yi
xiyi
1
5
7.25
25
36.25
2
10
8.12
100
81.2
3
15
8.95
225
134.25
4
20
9.90
400
198
5
25
10.96
625
274
6
30
11.80
900
354
探究一
探究二
2 300
2 200
2 200
xi2
3 969
5 184
5 041
4 624
4 225
yi2
4 410 000
5 290 000
5 290 000
4 840 000
4 840 000
xiyi
132 300
165 600
163 300
149 600
143 000
14 67
2 200
4 489
高中数学第三章统计案例3.1.2相关系数教案北师大版选修2_3
1.2 相关系数(一)、问题情境1、情境:下面是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可以用作预测和估计吗?2.问题:思考、讨论:求得的线性回归方程是否有实际意义.(二)、学生活动对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确地刻画线性相关关系呢?这就是上节课提到的问题①,即模型的合理性问题.为了回答这个问题,我们需要对变量x 与y 的线性相关性进行检验(简称相关性检验).(三)、探析新课1、相关系数的计算公式:对于x ,y 随机取到的n 对数据(,)i i x y (1,2,3,,)i n =,样本相关系数r 的计算公式为2、相关系数r 的性质:(1)||1r ≤;(2)||r 越接近与1,x ,y 的线性相关程度越强;(3)||r 越接近与0,x ,y 的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关.3、对相关系数r 进行显著性检验的步骤: 相关系数r 的绝对值与1接近到什么程度才表明利用线性回归模型比较合理呢?这需要对相关系数r 进行显著性检验.对此,在统计上有明确的检验方法,基本步骤是:(1)提出统计假设0H :变量x ,y 不具有线性相关关系;(2)如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在附录2(教材P111)中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平);(3)计算样本相关系数r ;(4)作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系。
2018版高中数学北师大版选修2-3课件:第三章 1-1 回归
解答
反思与感悟
(1)求线性回归方程的基本步骤 ①列出散点图,从直观上分析数据间是否存在线性相关关系.
n 2 ②计算: x , y , xi , xiyi. i=1 i=1
n
③代入公式,求出y=bx+a中参数b,a的值. ④写出线性回归方程并对实际问题作出估计. (2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程 才有实际意义,否则求出的回归方程毫无意义.
跟踪训练2
某个服装店经营某种服装,在某周内纯获利 y(元) 与该周
每天销售这种服装件数x之间的一组数据如下表:
x y (1)求样本点的中心;
解 x =6, y ≈79.86,样本点的中心为(6,79.86).
解答
3 66
4 69
5 73
6 81
7 89
8 90
9 91
(2)画出散点图;
解 散点图如下:
(2)参数a,b的求法
i=1
xi- x yi- y xi- x
n 2
n
i=1
xiyi-n x y
2 - n x x2 i n
n
lxy b= = lxx
i=1
=
i=1
,a= y -b x .
知识点二
相关系数
思考1
给出n对数据,按照公式求出的线性回归方程,是否一定能反映 这n对数据的变化规律? 答案 如果数据散点图中的点都大致分布在一条直线附近,这
i=1 n
∑ xiyi-n x y
i=1 2 ∑ y2 - n y i n
n
i=1
2 ∑ x2 - n x i
.
(2)相关系数r的取值范围是 [-1,1] ,|r|值越大,变量之间的线性相
高中数学 第三章 统计案例 1.2 相关系数知识导航 北师大版选修2-3(2021年最新整理)
高中数学第三章统计案例1.2 相关系数知识导航北师大版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第三章统计案例1.2 相关系数知识导航北师大版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第三章统计案例1.2 相关系数知识导航北师大版选修2-3的全部内容。
1。
2相关系数自主整理判断两个变量之间的线性相关关系的方法有:(1)_______________________________________________________________. (2)_______________________________________________________________。
高手笔记1。
假设两个随机变量的数据分别为(x 1,y 1),(x 2,y 2),…,(x n ,y n ),则变量间线性相关系数r 的计算公式为r=∑∑∑∑∑∑======---==---=ni i ni i ni ii ni in i ii ni iyyxx xy yn y xn x yx n yx y yx xy y x xl l l 122122121121)()()()(2。
(1)r∈[—1,1],|r|值越大,误差Q 越小,变量之间的线性相关程度越高. (2)|r |值越接近0,Q 越大,变量之间的线性相关程度越低。
(3)当r >0时,l xy >0,b=xxxy l l >0,两个变量正相关。
当r <0时,l xy <0,b=xxxy l l <0,两个变量负相关。
当r=0时,两个变量线性不相关。
北师大版高中数学课本目录标准版
必修1第一章集合§1 集合的含义与表示§2 集合的基本关系§3 集合的基本运算交集与并集全集与补集第二章函数§1 生活中的变量关系§2 对函数的进一步认识函数概念函数的表示法映射§3 函数的单调性§4 二次函数性质的再研究二次函数的图像二次函数的性质§5 简单的幂函数课题学习个人所得税的计算第三章指数函数和对数函数§1 正整数指数函数§2 指数扩充及其运算性质指数概念的扩充指数运算的性质§3指数函数指数函数的概念指数函数和的图像和性质指数函数的图像和性质§4 对数对数及其运算换底公式§5 对数函数对数函数的概念y=log2x的图像和性质对数函数的图像和性质§6 指数函数、幂函数、对数函数增长的比较第四章函数应用§1 函数与方程利用函数性质判定方程解的存在利用二分法求方程的近似解§2 实际问题的函数建模实际问题的函数刻画用函数模型解决实际问题函数建模案例必修2第一章立体几何初步§1 简单几何体简单旋转体简单多面体§2 直观图§3 三视图简单组合体的三视图由三视图还原成实物图§4 空间图形的基本关系与公理空间图形基本关系的认识空间图形的公理§5 平行关系平型关系的判定平行关系的性质§6 垂直关系垂直关系的判定垂直关系的性质§7 简单几何体的面积和体积简单几何体的侧面积棱柱、棱锥、棱台和圆柱、圆锥、圆台的体积课题学习正方体截面的形状第二章解析几何初步§1 直线与直线的方程直线的倾斜角和斜率直线的方程两条直线的位置关系两条直线的交点平面直角坐标系中的距离公式§2 圆与圆的方程圆的标准方程圆的一般方程直线与圆、圆与圆的位置关系§3 空间直角坐标系空间直角坐标系的建立空间直角坐标系中点的坐标空间两点间的距离公式必修3第一章统计§1 从普查到抽样§2 抽样方法简单随机抽样分层抽样与系统抽样§3 统计图表§4 数据的数字特征平均数、中位数、众数、极差、方差标准差§5 用样本估计总体估计总体的分布估计总体的数字特征§6 统计活动:结婚年龄的变化§7 相关性§8 最小二乘估计第二章算法初步§1 算法的基本思想算法案例分析排序问题与算法的多样性§2 算法框图的基本结构及设计顺序结构与选择结构变量与赋值循环结构§3 几种基本语句条件语句循环语句第三章概率§1 随机事件的概率频率与概率生活中的概率§2 古典概型古典概型的特征和概率计算公式建立概率模型互斥事件§3 模拟方法—概率的应用必修4第一章三角函数§1 周期现象§2 角的概念的推广§3 弧度制§4 正弦函数和余弦函数的定义与诱导公式任意角的正弦函数、余弦函数的定义单位圆与周期性单位圆与诱导公式§5 正弦函数的性质与图像从单位圆看正弦函数的性质正弦函数的图像正弦函数的性质§6 余弦函数的性质与图像正弦函数的图像正弦函数的性质§7 正切函数正切函数的定义正切函数的图像与性质正切函数的诱导公式§8 函数y=Asin 的图像§9 三角函数的简单应用第二章平面向量§1 从位移、速度、力到向量位移、速度、和力向量的概念§2 从位移的合成到向量的加法向量的加法向量的减法§3 从速度的倍数到数乘向量数乘向量平面向量基本定理§4 平面向量的坐标平面向量的坐标表示平面向量线性运算的坐标表示向量平行的坐标表示§5 从力做的功到向量的数量积§6 平面向量数量积的坐标表示§7 向量应用举例点到直线的距离公式向量的应用举例第三章三角恒等变形§1 同角三角函数的基本关系§2 两角和与差的三角函数两角差的余弦函数两角和与差的正弦、余弦函数两角和与差的正切函数§3 二倍角的三角函数必修5第一章数列§1 数列数列的概念数列的函数特征§2 等差数列等差数列等差数列的前n项和§3 等比数列等比数列等比数列的前n项和§4 数列在日常经济生活中的应用第二章解三角形§1 正弦定理与余弦定理正弦定理余弦定理§2 三角形中的几何计算§3 解三角形的实际应用举例第三章不等式§1 不等关系不等关系比较大小§2 一元二次不等式一元二次不等式的解法一元二次不等式的应用§3 基本不等式基本不等式基本不等式与最大(小)值§4 简单线性规划二元一次不等式(组)与平面区域简单线性规划简单线性规划的应用选修1-1第一章常用逻辑用语§1 命题§2 充分条件与必要条件充分条件必要条件充要条件§3 全称量词与存在量词全称量词与全称命题存在量词与特称命题全称命题与特称命题的否定§4 逻辑联结词“且”或“非” 逻辑联结词“且” 逻辑联结词“或” 逻辑联结词“非”第二章圆锥曲线与方程§1 椭圆椭圆及其标准方程椭圆的简单性质§2 抛物线抛物线及其标准方程抛物线的简单性质§3 双曲线双曲线及其标准方程双曲线的简单性质第三章变化率与导数§1 变化的快慢与变化率§2 导数的概念及其几何意义导数的概念导数的几何意义§3 计算导数§4 导数的四则运算法则导数的加法与减法法则导数的乘法与除法法则第四章导数应用§1 函数的单调性与极值导数与函数的单调性函数的极值§2 导数在实际问题中的应用实际问题中的导数的意义最大值、最小值问题选修1-2第一章统计案例§1 回归分析回归分析相关系数可线性化的回归分析§2 独立性检验条件概率与独立事件独立性检验独立性检验的基本思想独立性检验的应用第二章框图§1 流程图§2 结构图第三章推理与证明§1 归纳与类比归纳推理类比推理§2 数学证明§3 综合法与分析法综合法分析法§4 反证法第四章数系的扩充与复数的引入§1 数系的扩充与复数的引入数的概念的扩展复数的有关概念§2 复数的四则运算复数的加法与减法复数的乘法与除法选修2-1第一章常用逻辑用语§1 命题§2 充分条件与必要条件充分条件必要条件充要条件§3 全称量词与存在量词全称量词与全称命题存在量词与特称命题全称命题与特称命题的否定§4 逻辑联结词“且”“或”“非” 逻辑联结词“且” 逻辑联结词“或” 逻辑联结词“非”第二章空间向量与立体几何§1 从平面向量到空间向量§2 空间向量的运算§3 向量的坐标表示和空间向量基本定理空间向量的标准正交分解与坐标表示空间向量基本定理空间向量运算的坐标表示§4 用向量讨论垂直与平行§5 夹角的计算直线间的夹角平面间的夹角直线与平面的夹角§6 距离的计算第三章圆锥曲线与方程§1 椭圆椭圆及其标准方程椭圆的简单性质§2 抛物线抛物线及其标准方程抛物线的简单性质§3 双曲线双曲线及其标准方程双曲线的简单性质§4 曲线与方程曲线与方程圆锥曲线的共同性质直线与圆锥曲线的交点选修2-2第一章推理与证明§1 归纳与类比归纳推理类比推理§2综合法与分析法综合法分析法§3 反证法§4 数学归纳法第二章变化率与导数§1 变化的快慢与变化率§2 导数的概念及其几何意义导数的概念导数的几何意义§3 计算导数§4 导数的四则运算法则导数的加法与减法法则导数的乘法与除法法则§5 简单复合函数的求导法则第三章导数应用§1 函数的单调性与极值导数与函数的单调性函数的极值§2 导数在实际问题中的应用实际问题中的导数的意义最大值、最小值问题第四章定积分§1 定积分的概念定积分的背景—面积和路程问题定积分§2 微积分基本定理§3 定积分的简单应用平面图形的面积简单几何体的体积第五章数系的扩充与复数的引入§1 数系的扩充与复数的引入数的概念的扩展复数的有关概念§2 复数的四则运算复数的加法与减法复数的乘法与除法选修2-3第一章计数原理§1 分类加法计数原理与分步乘法计数原理分类加法计数原理分步乘法计数原理§2 排列§3 组合§4 简单计数问题§5 二项式定理二项式定理二项式系数的性质第二章概率§1 离散型随机变量及其分布列§2 超几何分布§3 条件概率与独立事件§4 二项分布§5 离散型随机变量的均值与方差§6 正态分布连续型随机变量正态分布第三章统计案例§1 回归分析回归分析相关系数可线性化的回归分析§2 独立性检验独立性检验独立性检验的基本思想独立性检验的应用选修3-1数学史选讲第一章数学发展概述§1 从数学的起源、早期发展到初等数学形成§2 从变量数学到现代数学第二章数与符号§1 数的表示与十进制§2 数的扩充§3 数学符号第三章几何学发展史§1 从经验几何到演绎几何§2 投影画与射影几何§3 解析几何第四章数学史上的丰碑——微积分§1 积分思想的渊源§2 圆周率§3 微积分第五章无限§1 初识无限§2 实数集的基数第六章明题赏析§1 费马大定理§2 哥尼斯堡七桥问题§3 高次方程§4 中国剩余定理§5 哥德巴赫猜想选修3-3 球面上的几何2007年5月第2版2009年5月第5次印刷第一章球面的基本性质§1 直线、平面与球面的位置关系§2 球面直线与球面距离第二章球面上的三角形§1 球面三角形球面上两直线的交角球面上的对称性球面三角形球面三角形的基本性质球面极三角形§2 球面三角形的全等§3 球面三角形的边角关系平面三角形的余弦定理和正弦定理球面三角形边的余弦定理球面三角形角的余弦定理和正弦定理§4 球面三角形的面积球面二角形球面三角形的面积第三章欧拉公式与非欧几何§1 球面上的欧拉公式球面三角部分球面上的欧拉公式球面上欧拉公式证明§2 简单多面体的欧拉公式凸多面体和简单多面体简单多面体的欧拉公式的证明§3 欧氏几何与球面几何的比较欧氏几何与球面几何的区别与联系另一种非欧几何选修4-1几何证明选讲2008年5月第3版2009年5月第3次印刷第一章直线、多边形、圆§1 全等与相似图形变化的不变形平移、旋转、反射相似与位似平行线分线段成比例定理直角三角形的射影定理§2 圆与直线圆周角定理圆的切线的判定和性质弦切角定理切割线定理相交弦定理§3 圆与四边形圆内接四边形托勒密定理第二章圆锥曲线§1 截面欣赏§2 直线与球、平面与球的位置关系直线与球的位置关系平面与球的关系§3 柱面与平面的截面柱面、旋转面垂直截面一般截面§4 平面截圆锥面圆锥面垂直截面一般截面§5 圆锥曲线的几何性质选修4-22008年6月第3版2009年5月第3次印刷第一章平面向量与二阶方阵§1 平面向量及向量的运算§2 向量的坐标表示及直线的向量方程§3 二阶方阵与平面向量的乘法第二章几何变换与矩阵§1 几种特殊的矩阵变换§2 矩阵变换的性质第三章变换的合成与矩阵乘法§1变换的合成与矩阵乘法§2 矩阵乘法的性质第四章逆变换与逆矩阵§1 逆变换与逆矩阵§2 初等变换与逆矩阵§3 二阶行列式与逆矩阵§4 可逆矩阵与线性方程组第五章矩阵的特征值与特征向量§1 矩阵变换的特征值与特征向量§2 特征向量在生态模型中的简单应用选修4-4坐标系与参数方程2007年5月第2版2009年5月第5次印刷第一章坐标系§1 平面直角坐标系平面直角坐标系与曲线方程平面直角坐标轴中的伸缩变换§2 极坐标系极坐标系的概念点的极坐标与直角坐标的互化直线与圆的极坐标方程曲线的极坐标方程与直角坐标方程的互化圆锥曲线统一的极坐标方程§3 柱坐标系和球坐标系第二章参数方程§1 参数方程的概念§2 直线和圆锥曲线的参数方程直线的参数方程圆的参数方程椭圆的参数方程双曲线的参数方程§3 参数方程化成普通方程§4 平摆线和渐开线平摆线渐开线选修4-5【不等式选讲】2007年5月第2版2009年5月第5次印刷第一章不等关系与基本不等式§1 不等式的性质§2 含有绝对值的等式§3 平均值不等式§4 不等式的证明§5 不等式的应用第二章几个重要的不等式§1 柯西不等式§2 排序不等式§3 数学归纳法与贝努利等式。
高中数学第三章统计案例1.1回归分析1.2相关系数ppt课件北师大版选修2_3
19 解答
(2)画出散点图; 解 散点图如下:
2021/5/26
20 解答
(3)求纯获利y与每天销售件数x之间的回归方程.
7
7
解 因为 xiyi=3 487, x2i =280,
i=1
i=1
7
xiyi-7 x y
i=1
3 487-7×6×79.86
所以 b=
7
= 280-7×62 ≈4.75.
2021/5/26
8 答案
思考2
怎样通过相关系数刻画变量之间的线性相关关系?
答案 |r|值越接近1,变量之间的线性相关程度越高;|r|值越 接近0,变量之间的线性相关程度越低;当r=0时,两个变量线 性不相关.
2021/5/26
9 答案
梳理
(1)相关系数 r 的计算公式 r=
n
∑xiyi-n x y
=bx+a;
4
解 因为 xiyi=6×2+8×3+10×5+12×6=158,
i=1
6+8+10+12
2+3+5+6
x=
4
=9, y =
4
=4,
4
x2i =62+82+102+122=344,
i=1
所以 b=15384-4-4×4×9×924=2104=0.7,
a= y -b x =4-0.7×9=-2.3,
2021/5/26
22 解答
(2)求日销售量y对销售单价x的线性回归方程;
2021/5/26
24 解答
(3)设经营此商品的日销售利润为P元,根据(2)写出P关于x的函数关系式, 并预测当销售单价x为多少元时,才能获得最大日销售利润. 解 依题意,有P=(161.5-3x)(x-30)=-3x2+251.5x-4 845 =-3(x-2561.5)2+25112.52-4 845. 所以当 x=2561.5≈42 时,P 有最大值,约为 426 元. 即预测当销售单价为42元时,能获得最大日销售利润.
3.1_回归分析(三)
xi2 1660, yi2 327, xi yi 620,
i 1 i 1 i 1
ˆ b
x y 5x y
i 1 5
x
i 1
2 i
5x
2
620 5 18 7.4 1.15. 2 1660 5 18
ˆ a 7.4 1.15 18 28.1.
残差图的制作及作用 几点说明: 1、坐标纵轴为残差变量,横轴可以有不同的选择; 第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为 2、若模型选择的正确,残差图中的点应该分布在以横 的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数 据;如果数据采集没有错误,则需要寻找其他的原因。 轴为心的带形区域; 另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这 样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。 3、对于远离横轴的点,要特别注意。
x
6 9 12 15 18 21 24 27 30 33 36 39
郑平正 制作
最好的模型是哪个?
400 300
400 300 200 100 0
0 5 10 15 20 25 30 35 40
产卵数
产卵数
200 100 0 -100
450 400 350 300 250
产卵数
-40
-30
-20
-10 0 -100 -200
2013-6-13
郑平正 制作
复习回顾
1、线性回归模型: y=bx+a+e, (3)
y=bx+a+e,
E(e)=0,D(e)=
高中数学 第三章 统计案例 3.1 第2课时 残差分析及回归模型的选择学案 新人教A版选修23
3.1 第二课时 残差分析及回归模型的选择一、课前准备 1.课时目标(1) 了解残差分析回归效果; (2) 了解相关指数2R 分析回归效果;(3) 了解常见的非线性回归转化为线性回归的方法. 2.基础预探1.在线性回归模型y bx a e =++中,a b 和为模型的未知参数,e y 是与y bx a =+之间的误差,通常e为随机变量,称为_______.它的均值E(e)=0,方差2()0D e σ=>.线性回归模型的完整表达形式为2()0,()y bx a eE e D e σ=++⎧⎨==⎩.在此模型中,随机误差r的方差2σ越小,通过回归直线y bx a =+预报真实值y的精度越高. 2.对于样本点1122(,),(,),,(,)n n x y x y x y 而言,相应于它们的随机误差为(1,2,,)i i i i e y y y bx a i n =-=--=,其估计值为(1,2,,)i i i i i e y y y bx a i n =-=--=,i e 称为相应于点(,)i i x y 的______.类比样本方差估计总体方差的思想,可以用21(,)2Q a b n σ=-(n>2)作为2σ的估计量,其中a b 和由公式给出,()Q a b ,称为残差平方和.可以用2σ衡量回归直线方程的预报精度.通常2σ越小,预报精度越高.3.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差12,,n e e e 来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为_______.4.用相关指数2R 来刻画回归的效果,其计算公式是:22121()1()nii nii y y R y y ==-=--∑∑.显然2R 取值越大,意味着残差平方和_______,也就是说模型的拟合效果________. 二、学习引领1. 进行回归分析的步骤是什么?(1)确定研究对象,明确是哪两个变量之间的相关关系.(2)画出散点图,观察它们之间的关系是否存在线性关系,也可计算变量间的线性相关系数的值来精确判断它们之间是否存在相关关系.如果不存在线性相关关系,判断散点图是否存在非线性相关关系.(3)若存在相关关系,则由经验确定回归方程的类型:如观察到数据呈线性关系,则选用线性回归方程ˆy=bx+a ;否则可选择指数模型、对数模型或二次函数模型等. (4)利用残差图或者相关指数2R 对回归效果进行判断2.随机误差e的产生及估计的方法(1)在实际中,随机变量y除了受随机变量x的影响之外,还受其它变量的影响;(2)由于前面相关关系公式中的a b 和为截距和斜率的估计值,它们与真实值a b 和之间也存在误差.(3)因为随机误差是随机变量,因此可以通过这个随机变量的数字特征来刻画它的一些总体特征.均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机变量的均值为0,因此可以用方差2来衡量随机误差的大小. 3.如何利用2R 判断回归效果在线性回归模型中,2R 表示解释变量对于预报变量变化的贡献率. 2R 越接近于1,表示回归的效果越好(因为2R 越接近于1,表示解释变量和预报变量的相关性越强).如果对某组数据可能采取几种不同的回归方程进行回归分析.也可以通过比较几个2R ,选择其值大的模型.4.常见的可线性化的回归模型(1)幂函数曲线y=ax b(如图所示), 作变换u=lny ,v=lnx,c=lna,得线性函数u=c+bv.(2)指数函数y=ae bx(如图所示) 作变换u=lny, c= lna,得线性函数u=c+bx.(3)倒指数曲线y=a b xe (如图所示).(4)对数曲线y=a+blnx(如图所示)三、典例导析题型一相关系数的应用例1 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断交通事故数与机动车r,由此判断交通事故数y与机动车辆数x是否线性相关.解析:将数据列成下表由此可知x=128.875 y=8.95,进而求得0.9927≈.因为|r|接近1 ,所以可得交通事故数y和机动车辆数x有较强的线性相关关系.规律总结:进行回归分析时,通常先进行相关性检验,若能确定两个变量具有线性相关关系,再去求其线性回归方程,否则所求的方程无意义.两个变量正(负)相关时,它们就有相同(反)的变化趋势,即当由小变大时,相应的有由小(大)变大(小)的趋势.变式训练:某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系?从这个工完成下列要求:(1)计算x 与y 的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验。
(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测题(有答案解析)
一、选择题1.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是()A.①回归分析,②取平均值B.①独立性检验,②回归分析C.①回归分析,②独立性检验D.①独立性检验,②取平均值2.某中学采取分层抽样的方法从高二学生中按照性别抽出20名学生,其选报文科、理科的情况如下表所示,参考公式和数据:22()()()()()n ad bcKa cb d a bc d-=++++,其中n a b c d=+++.则以下判断正确的是A.至少有97.5%的把握认为学生选报文理科与性别有关B.至多有97.5%的把握认为学生选报文理科与性别有关C.至少有95%的把握认为学生选报文理科与性别有关D.至多有95%的把握认为学生选报文理科与性别有关3.某班主任对全班50名学生进行了作业量的调查,数据如表:若推断“学生的性别与认为作业量大有关”,则这种推断犯错误的概率不超过()附:()()()()()22n ad bcKa b c d a c b d-=++++A.0.01 B.0.025 C.0.10 D.0.054.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合5.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()P(K2≥k)…0.250.150.100.0250.0100.005…k…1.3232.0722.7065.0246.6357.879…A.90% B.95% C.97.5% D.99.5%6.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1; ③若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为2;④对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为( ) A .1 B .2 C .3 D .47.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关8.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率 9.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程^^^y b x a =+必过(),x y ;④在一个22⨯列联表中,由计算得213.079K =,则有99%以上的把握认为这两个变量间有关系.其中错误..的个数是( ) A .0 B .1 C .2D .310.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( ) A .25B .25C .35D .321011.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系 12.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: )C(件)由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .58二、填空题13.针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的13,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若有95%的把握认为是否喜欢韩剧和性别有关,求男生至少有______人.14.以下结论正确..的序号有_________ (1)根据22⨯列联表中的数据计算得出2K ≥6.635, 而P (2K ≥6.635)≈0.01,则有99% 的把握认为两个分类变量有关系.(2)在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关.(3)在线性回归分析中,相关系数为r ,r 越接近于1,相关程度越大;r 越小,相关程度越小.(4)在回归直线0.585y x =-中,变量200x =时,变量y 的值一定是15.15.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表: 专业 性别非统计专业统计专业男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K 2的观测值为.因为k >3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.16.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程=+x 中=﹣2,据此预测当气温为5℃时,用电量的度数约为_____.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③某项测量结果ξ服从正态分布()21,σN ,()50.81ξP ≤=,则()30.19ξP ≤-=;④对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.从某高校在校大学生中随机选取5名女大学生,由她们身高和体重的数据得到的回归直线方程为ˆ0.7973.56yx =-,数据列表是:则其中的数据a =__________.19.以下4个命题中,正确命题的序号为_________.①“两个分类变量的独立性检验”是指利用随机变量2K 来确定是否能以给定的把握认为“两个分类变量有关系”的统计方法;②将参数方程cos sin x y θθ=⎧⎨=⎩(θ是参数,[]0,θπ∈)化为普通方程,即为221x y +=;③极坐标系中,22,3A π⎛⎫⎪⎝⎭与()3,0B 的距离是19; ④推理:“因为所有边长相等的凸多边形都是正多边形,而菱形是所有边长都相等的凸多边形,所以菱形是正多边形”,推理错误在于“大前提”错误. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表: 年龄段(岁) ()0,20[)20,40[)40,60[)60100,网购人数 2632348 男性人数1510 105(1)若把年龄在[2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?网购迷 非网购迷 总计男性 女性 总计附:()()()()()22n ad bc K a b c d a c b d -=++++. ()20P K k ≥0.10 0.05 0.01 0.001两人年龄都小于20岁的概率.22.为了解使用手机是否对学生的学习有影响,某校随机抽取50名学生,对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出9人,再从这9人中随机抽取3人,记这3人中“学习成绩优秀”的人数为X,试求X的分布列与数学期望.参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:23.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x和对应的销售额y(万元)进行了调查得到以下数据:关系数r的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii xx =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii n ii x y nx y bxnx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑24.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,25.为了响应国家号召,某校组织部分学生参与了“垃圾分类,从我做起”的知识问卷作答,并将学生的作答结果分为“合格”与“不合格”两类与“问卷的结果”有关?(1)是否有90%以上的把握认为“性别”与“问卷的结果”有关?(2)在成绩合格的学生中,利用性别进行分层抽样,共选取9人进行座谈,再从这9人中随机抽取5人发送奖品,记拿到奖品的男生人数为X,求X的分布列及数学期望()E X.附:22()()()()()n ad bcKa b c d a c b d-=++++26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.050 0.010 0.001k 3.841 6.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题1.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.2.C解析:C【解析】由题易得22⨯列联表如下:则2K的观测值为()220235104.432 3.841128713k⨯⨯-⨯=≈>⨯⨯⨯,所以至少有95%的把握认为学生选报文理科与性别有关,故选:C.【解题必备】(1)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.(2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体.即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释. (3)独立性检验的具体做法:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α, 然后查下表确定临界值0k ; ②利用公式()()()()()22n ad bc K a c b d a b c d -=++++,计算随机变量2K 的观测值k ;③如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.说明:通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.3.B解析:B 【解析】分析:根据表格中所给数据,代入公式()()()()()22n ad bc K a b c d a c b d -=++++,求出观测值,把所求的观测值同临界值进行比较,从而可得结果. 详解:根据表中数据得到()2250181589 5.059 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯,所以,若推断“学生的性别与认为作业量大有关”, 则这种推断犯错误的概率不超过0.025,故选B.点睛:本题主要考查独立性检验的应用,解题的关键是正确求出这组数据的观测值,计算过程一定要细心,避免出现计算错误,属于基础题.4.A解析:A 【解析】回归直线方程过样本中心点,过A 选项正确.5.C解析:C 【详解】∵2 6.023 5.024K=>∴可断言市民收入增减与旅游欲望有关的把握为97.5%.故选C.点睛:本题主要考查独立性检验的实际应用.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22()()()()()n ad bcKa b c d a c b d-=++++,计算出2K的值;(3)查表比较2K与临界值的大小关系,作统计判断.6.B解析:B【解析】由题意得,若数据x1,x2,x3,…,x n的方差为1,则2x1,2x2,2x3,…,2x n的方差为4,所以③不正确;对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.7.C解析:C【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.8.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.考点:独立性检验的意义.9.B解析:B【解析】一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y35x=-,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y= b x+a必过点(),x y,③正确;因为213.079 6.635K=>,故有0099以上的把握认为这两个变量间有关系,④正确,即错误的个数为1,故选B. 10.B解析:B【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.C解析:C 【解析】由22⨯列联表数据计算得随机变量2K 的观测值是 6.879 6.635k =>,通过对照表中数据得,在犯错误的概率不超过1.0%的前提下,认为这两个变量间有关系,故选C.12.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.二、填空题13.【分析】设男生人数为依题意填写列联表计算观测值列出不等式求出的取值范围再根据题意求出男生的人数【详解】设男生人数为由题意可得列联表如下: 喜欢韩剧 不喜欢韩剧 总计 男生 女生 总 解析:18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列出不等式求出x 的取值范围,再根据题意求出男生的人数. 【详解】设男生人数为x ,由题意可得列联表如下:则 3.841k>,即2452()3636969 3.84171711931818x x x x xxkx x xx⋅-⋅==>⋅⋅⋅,解得12.697x>.因为各部分人数均为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人.故答案为:18.【点睛】本题考查独立性检验的应用,解题关键是列出列联表,然后进行计算,属于常考题. 14.(1)(3)【解析】分析:根据独立性检验残差图相关系数回归分析的定义及性质逐一分析四个答案的真假即可详解:对于(1)根据2×2列联表中的数据计算得出≥6635而P(≥6635)≈001则有99的把握解析:(1)(3).【解析】分析:根据独立性检验、残差图、相关系数、回归分析的定义及性质,逐一分析四个答案的真假即可.详解:对于(1),根据2×2列联表中的数据计算得出2K≥6.635, 而P(2K≥6.635)≈0.01,则有99%的把握认为两个分类变量有关系,故(1)正确.对于(2),根据残差图的意义可得,当带状区域的宽度较小时,说明选用的模型比价合适,而当带状区域的宽度较大时,说明选用的模型不合适,故(2)不正确.对于(3),在线性回归分析中,相关系数为r,|r|越接近于1,则相关程度越大;|r|越接近于0,则相关程度越小.故(3)正确.对于(4),在回归直线y=0.5x−85中,当x=200时,y=15,但实际观测值可能不是15,故(4)不正确.综上可得(1)(3)正确.点睛:本题考查回归分析和独立性检验的基本知识,属于基础类题目,解题的关键是熟记相关的的概念和性质.15.5【解析】因为随机变量K2的观测值k>3841所以在犯错误的概率不超过005的前提下认为主修统计专业与性别有关系故这种判断出现错误的可能性为5考点:独立性检验思想解析:5% 【解析】因为随机变量K 2的观测值k >3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%. 考点:独立性检验思想.16.40【解析】试题分析:根据所给的表格做出本组数据的样本中心点根据样本中心点在线性回归直线上利用待定系数法做出a 的值现在方程是一个确定的方程根据所给的x 的值代入线性回归方程预报要销售的件数解:由表格得解析:40 【解析】试题分析:根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出a 的值,现在方程是一个确定的方程,根据所给的x 的值,代入线性回归方程,预报要销售的件数.解:由表格得=(14+12+8+6)÷4=10,=(22+26+34+38)÷4=30 即样本中心点的坐标为:(10,40), 又∵样本中心点(10,40)在回归方程 上且b=﹣2∴30=10×(﹣2)+a , 解得:a=50, ∴当x=5时,y=﹣2×(5)+50=40. 故答案为40.考点:回归分析的初步应用.17.【解析】试题分析:对于①从匀速传递的新产品生产流水线上质检员每20分钟抽取一件新产品进行某项指标检测这样的抽样是系统抽样而不是分层抽样故①错;对于②两个随机变量的相关性知识可知②正确;对于③变量所以 解析:2【解析】试题分析:对于①,从匀速传递的新产品生产流水线上,质检员每20分钟抽取一件新产品进行某项指标检测,这样的抽样是系统抽样,而不是分层抽样,故①错;对于②,两个随机变量的相关性知识可知②正确;对于③变量2(1,)N ξσ~,所以()()30.191510.810.19ξξP ≤-==-P ≤=-=,故③正确;对于④,随机变量2K 观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大,故④错,所以真命题有2个. 考点:1. 回归分析的基本思想及其应用初步;2.统计与概率.18.163【解析】由根据回归直线经过样本中心即得由得故答案为解析:163 【解析】由4953565864565y ++++==,根据回归直线经过样本中心(),x y ,即560.7973.56x =⨯-,得164x =,由1551611671741645a x ++++==,得163a =,故答案为163.19.①③④【解析】①是独立性检验的应用①对②中由于所以显然是半个圆②错③中由极坐标中两点距离公式=③对④中所有边长相等的凸多边形都是正多边形为大前提是错误的因为只需要正多边形挤压变形使之仍为凸多边形即可解析:①③④ 【解析】①是独立性检验的应用,①对.②中由于[]0,θπ∈,所以01y ≤≤,显然是半个圆,②错.③中,由极坐标中两点距离公式2221212212cos()AB ρρρρθθ=+--=14912()19,2+-⨯-=AB ③对.④中“所有边长相等的凸多边形都是正多边形”为大前提,是错误的,因为只需要正多边形挤压变形,使之仍为凸多边形即可.④对.所以填①③④.20.①④【解析】分析:根据性回归方程独立性检验相关关系以及命题的否定等知识选出正确的得到结果详解:线性回归方程必过样本中心点故①正确命题的否定是故②错误③相关系数r 绝对值越小表明两个变量相关性越弱故不正解析:①④ 【解析】分析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.详解:线性回归方程ˆˆˆy bx a =+必过样本中心点(),x y ,故①正确.命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃≥+<” 故②错误 ③相关系数r 绝对值越小,表明两个变量相关性越弱,故不正确;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系,正确. 故答案为①④.点睛:本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.三、解答题21.(1)列联表答案见解析,能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)310.【分析】(1)根据表格中的数据可题中信息可完善22⨯列联表,计算出2K 的观测值,结合临界值表可得出结论;(2)计算得出年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b ,列举出所有的基本事件,并确定事件“所抽的两人年龄都小于20岁”所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率. 【详解】(1)由题中信息可完善22⨯列联表如下表所示:计算得()2100201446207.605 6.63566344060K ⨯⨯-⨯=≈>⨯⨯⨯,故能在犯错误的概率不超过1%的前提下,认为网购与性别有关;(2)年龄在()0,20、[)20,40网购男性分别有15人、10人.按分层抽样的方法随机抽取5人,年龄段()0,20应抽取3人,分别记为1、2、3;年龄段[)20,40应抽取2人,分别记为a 、b .从中随机抽取2人的一切可能结果所组成的基本事件共10个:()1,2、()1,3、()1,a 、()1,b 、()2,3、()2,a 、()2,b 、()3,a 、()3,b 、(),a b .用A 表示“两人年龄都小于20岁”这一事件,则事件A 由3个基本事件组成:()1,2、()1,3、()2,3.故事件A 的概率为()310P A =. 【点睛】方法点睛:求解古典概型的概率方法如下: (1)列举法; (2)列表法; (3)树状图法; (4)排列、组合数的应用.22.(1)没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)分布列见解析,()2E X =.【分析】(1)根据表格中数据和题中信息可完善22⨯列联表,计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知,随机变量X 的可能取值有0、1、2、3,计算出随机变量X 在不同取值下的概率,可得出随机变量X 的分布列,进而可求得随机变量X 的数学期望值. 【详解】(1)22⨯列联表如下表所示:()22505102015258.33310.828203025253χ⨯⨯-⨯==≈<⨯⨯⨯,所以,没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)9人中学习成绩优秀的人有209630⨯=人,学习成绩一般的有109330⨯=人, X 可能的取值有0、1、2、3,()3911084P X C ===,()1263393114C C P X C ===,()21633915228C C P X C ===,()363953?21C P X C ===.所以,随机变量X 的分布列为()1232142821E X =⨯+⨯+⨯=. 【点睛】思路点睛:求解随机变量分布列的基本步骤如下:(1)明确随机变量的可能取值,并确定随机变量服从何种概率分布; (2)求出每一个随机变量取值的概率;(3)列成表格,对于抽样问题,要特别注意放回与不放回的区别,一般地,不放回抽样由排列、组合数公式求随机变量在不同取值下的概率,放回抽样由分步乘法计数原理求随机变量在不同取值下的概率.23.(1)0.94r ≈,线性相关性较弱;(2) +77.3ˆyx =。
高中数学 统计案例3.1回归分析3.1.2相关系数课件北师大版
∑ 1 031
题型一
题型二
由此可得,������=128.875,������=8.950. 进而求得 r=
9 611.7-8×128.875×8.950 137 835-8×128.8752 × 671.00-8×8.9502
≈0.993.
因此,交通事故数 y 与机动车辆数 x 有较强的线性相关程度.
1
2
3
4
4.某企业的某种产品产量与单位成本数据如下表:
产量 x/千件 单位成 本 y/(元/件) 2 73 3 72 4 71 3 73 4 69 5 68
(1)试确定相关系数r及回归直线; (2)指出产量每增加1千件时,单位成本下降多少; (3)产量为6千件时,单位成本是多少?单位成本为70元时,产量应为 多少?
5
∑ xiyi=8 285, ∑ ������������2 =59 051,������=15,������=108.6.
∑ ������������ ������������ -5������ ������ ������=1
2 5 2 2 2 ∑ ������������ -5������ ∑ ������������ -5������ ������=1 ������=1 5 5
求相关系数r.
题型一
题型二
解:列表如下:
i 1 2 3 4 5 6 7 xi 18 20 22 24 26 28 30 yi 26.86 28.35 28.75 28.87 29.75 30.00 30.36 202.94 xi2 324 400 484 576 676 784 900 4 144 xiyi 483.48 567 632.5 692.88 773.5 840 910.8 4 900.16 yi2 721.459 6 803.722 5 826.562 5 833.476 9 885.062 5 900 921.729 6 5 892.013 6
北师大版高中数学课本目录(含重难点及课时分布)
高中数学课本内容及其重难点北师大版高中数学必修一·第一章集合(考点的难度不是很大,是高考的必考点)· 1、集合的基本关系· 2、集合的含义与表示· 3、集合的基本运算(重点)(2课时)·第二章函数· 1、生活中的变量关系· 2、对函数的进一步认识· 3、函数的单调性(重点)· 4、二次函数性质的再研究(重点)· 5、简单的幂函数(5课时)·第三章指数函数和对数函数· 1、正整数指数函数· 2、指数概念的扩充· 3、指数函数(重点)· 4、对数· 5、对数函数(重点)· 6、指数函数、幂函数、对数函数增减性(重点)(3课时)·第四章函数应用· 1、函数与方程· 2、实际问题的函数建模(2课时)北师大版高中数学必修二·第一章立体几何初步· 1、简单几何体· 2、三视图(重点)· 3、直观图(1课时)· 4、空间图形的基本关系与公理(重点)· 5、平行关系(重点)· 6、垂直关系(重点)· 7、简单几何体的面积和体积(重点)· 8、面积公式和体积公式的简单应用(重点、难点)(4课时)·第二章解析几何初步· 1、直线与直线的方程· 2、圆与圆的方程· 3、空间直角坐标系(4课时)北师大版高中数学必修三·第一章统计· 1、统计活动:随机选取数字· 2、从普查到抽样· 3、抽样方法· 4、统计图表· 5、数据的数字特征(重点)· 6、用样本估计总体· 7、统计活动:结婚年龄的变化· 8、相关性· 9、最小二乘法(3课时)·第二章算法初步· 1、算法的基本思想· 2、算法的基本结构及设计(重点)· 3、排序问题(重点)· 4、几种基本语句(2课时)·第三章概率· 1、随机事件的概率(重点)· 2、古典概型(重点)· 3、模拟方法――概率的应用(重点、难点)(4课时)北师大版高中数学必修四·第一章三角函数· 1、周期现象与周期函数· 2、角的概念的推广· 3、弧度制· 4、正弦函数(重点)· 5、余弦函数(重点)· 6、正切函数(重点)· 7、函数的图像(重点)· 8、同角三角函数的基本关系(重点、难点)(5课时)·第二章平面向量· 1、从位移、速度、力到向量· 2、从位移的合成到向量的加法(重点)· 3、从速度的倍数到数乘向量(重点)· 4、平面向量的坐标(重点)· 5、从力做的功到向量的数量积(重点)· 6、平面向量数量积的坐标表示(重点)· 7、向量应用举例(难点)(5课时)·第三章三角恒等变形(重点)· 1、两角和与差的三角函数· 2、二倍角的正弦、余弦和正切· 3、半角的三角函数· 4、三角函数的和差化积与积化和差· 5、三角函数的简单应用(难点)(4课时)北师大版高中数学必修五·第一章数列· 1、数列的概念· 2、数列的函数特性· 3、等差数列(重点)· 4、等差数列的前n项和(重点)· 5、等比数列(重点)· 6、等比数列的前n项和(重点)· 7、数列在日常经济生活中的应用(6课时)·第二章解三角形(重点)· 1、正弦定理与余弦定理正弦定理· 2、正弦定理· 3、余弦定理· 4、三角形中的几何计算(难点)· 5、解三角形的实际应用举例(6课时)·第三章不等式· 1、不等关系· 1。
高中数学北师大版选修2-3 3.1.2相关系数 课件
选修2-3
【思路探究】
先根据表中的数据作相关检验,然后判
断是否具有相关关系, 再根据所给的数据解出线性回归方程, 最后进行预测.
【自主解答】
(1)根据数据我们对区内大学生人数 x 与
1 店铺季度销售额 y 作相关检验.根据数据可知: x = (0.2+ 10
i=1 n n
∑ xi- x
i=1
2
i=1
yi- y 2
n
∑xiyi-n x y =
i=1 n 2 ∑x2 i -n x i=1 2 ∑y2 i -n y i=1 n
n
BS ·数学
选修2-3
相关系数及其应用
维尼纶纤维的耐热水性能的好坏可以用指标 “缩醛化度”y 来衡量,这个指标越高,耐热水性能就越好, 而甲醛浓度是影响“缩醛化度”的重要因素,在生产中常用 甲醛浓度 x(克/升)去控制这一指标, 为此必须找出它们之间的 关系,现安排一批试验,获得如下表数据. 甲醛浓度 18 20 22 24 26 28 30 (克/升) 缩醛化度 26. 28. 28. 28. 29. 30. 30. (克分子%) 86 35 75 87 75 00 36 求相关系数 r. 【思路探究】 可直接利用相关系数 r 的公式直接计算.
BS ·数学
选修2-3
【解】 i 1 2 3 4 5 6 7 xi 15 20 25 30 35 40 45 yi 320 330 360 410 460 470 480 xi2 225 400 625 900 1 225 1 600 2 025 yi2 102 400 108 900 129 600 168 100 211 600 220 900 230 400 xiyi 4 800 6 600 9 000 12 300 16 100 18 800 21 600
(常考题)北师大版高中数学高中数学选修2-3第三章《统计案例》检测(答案解析)(3)
一、选择题1.给出下列说法:①回归直线ˆˆˆy bx a =+恒过样本点的中心(,)x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数||r 就越接近1; ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5个单位.其中说法正确的是( ) A .①②④B .②③④C .①③④D .②④2.已知x 与y 之间的几组数据如下表:参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()niix x y y r --=∑上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >3.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1表2表3表4A .成绩B .视力C .智商D .阅读量4.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a'D .b<b',a>a'5.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D.有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”7.某种产品的广告费支出x与销售额y(单位:万元)之间有下表关系:x24568y3040605070y与x的线性回归方程为 6.5175ˆ.y x=+,当广告支出5万元时,随机误差的效应(残差)为()A.40 B.20C.30 D.108.对于相关指数R2,下列说法正确的是A.R2的取值越小,模型拟合效果越好B.R2的取值可以任意大,且R2取值越大,拟合效果越好C.R2的取值越接近于1,模型拟合效果越好D.以上答案都不对9.以下四个命题中:①在回归分析中,可用相关指数R2的值判断拟合的效果,R2越大,模型的拟合效果越好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近1;③若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为2;④对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为( ) A .1 B .2 C .3 D .410.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率 11.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .412.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,统计数据如下表附:经计算2 4.514K ≈,现判断数学成绩与物理成绩有关系,则判断出错的概率不会超过A .0.5%B .1%C .2%D .5%二、填空题13.如图所示是世界20个地区受教育程度的人口百分比与人均收入的散点图,样本点基本集中在一个条型区域,因此两个变量呈线性相关关系.利用散点图中的数据建立的回归方程为ˆ 3.19388.193yx =+,若受教育的人口百分比相差10%,则其人均收入相差_________.14. 2.5PM 是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据某地某日早7点至晚8点甲、乙两个 2.5PM 监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是_________.15.给出下列命题:①线性相关系数越大,两个变量的线性相关越强;反之,线性相关性越弱; ②由变量和的数据得到其回归直线方程:,则一定经过;③从越苏传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好; ⑤在回归直线方程中,当解释变量每增加一个单位时,预报变量增加0.1个单位,其中真命题的序号是___________. 16.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________. 17.给出下列5种说法:①标准差越小,样本数据的波动也越小; ②回归分析研究的是两个相关事件的独立性;③在回归分析中,预报变量是由解释变量和随机误差共同确定的; ④相关指数是用来刻画回归效果的,的值越大,说明回归模型的拟合效果越好.⑤对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越小.其中说法正确的是________(请将正确说法的序号写在横线上).18.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,可以有_______%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.超重 不超重 合计 偏高 4 1 5 不偏高 3 12 15 合计71320独立性检验临界值表()20P K k ≥0.025 0.010 0.005 0.001 0k 5.0246.6357.87910.828独立性检验随机变量2K 值的计算公式:22()()()()()n ad bc K a b c d a c b d -=++++19.已知下列说法: ①分类变量A 与B 的随机变量越大,说明“A 与B 有关系”的可信度越大;②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.其中说法正确的为_____________.(填序号)20.用线性回归模型求得甲、乙、丙3组不同的数据对应的2R 的值分别为0.81,0.98,0.63,其中__________(填甲、乙、丙中的一个)组数据的线性回归的效果最好.三、解答题21.根据教育部《中小学生艺术素质测评办法》,为提高学生审美素养,提升学生的综合素质,江苏省中考将增加艺术素质测评的评价制度,将初中学生的艺术素养列入学业水平测试范围.为初步了解学生家长对艺术素质测评的了解程度,某校随机抽取100名学生家长参与问卷测试,并将问卷得分绘制频数分布表如下: 得分 [)30,40 [)40,50 [)50,60 [)60,70 [)70,80 [)80,90 []90,100男性人数 49 12 13 11 6 3女性人数1 2 2 21 10 4 2了解”(得分低于60分)两类,完成22⨯列联表,并判断是否有99%的把握认为“学生家长对艺术素质评价的了解程度”与“性别”有关?(2)以这100名学生家长中“比较了解”的频率代替该校学生家长“比较了解”的概率.现在再随机抽取3名学生家长,设这3名家长中“比较了解”的人数为X ,求X 的概率分布列和数学期望.不太了解 比较了解 合计男性 女性 合计附:()()()()()2n ad bc a b c d a c b d χ-=++++,()n a b c d =+++.临界值表:()20P x χ≥0.15 0.100.050.025 0.010 0.005 0.001 0x2.0722.7063.8415.0246.6357.87910.82822.“微粒贷”是腾讯旗下2015年9月开发上市的微众银行网货产品.腾讯公司为了了解“微粒贷”上市以来在C 市的使用情况,统计了C 市2015年至2019年使用了“微粒货”贷款的累计人数,统计数据如表所示: 年份 2015 2016 2017 2018 2019 年份代号x 1 2 3 4 5 累计人数y (万人)2.93.33.64.44.8(1)已知变量x ,y 具有线性相关关系,求累计人数y (万人)关于年份代号x 的线性回归方程y bx a =+;并预测2020年使用“微粒贷“贷款的累计人数;(2)“微粒贷”用户拥有的贷款额度是根据用户的账户信用资质判定的,额度范围在500元至30万元不等,腾讯公司在统计使用人数的同时,对他们所拥有的贷款额度也作了相应的统计.我们把拥有货款额度在500元至5万元(不包括5万元)的人群称为“低额度贷款人群”,简称“A 类人群”;把拥有贷款额度在5万元及以上的人群称为“高额度贷款人群”,简称“B 类人群”.根据统计结果,随机抽取6人,其中A 类人群4人,B 类人群2人.现从这6人中任取3人,记随机变量ξ为A 类人群的人数,求ξ的分布列及其期望.参考公式:1122211()()()()nni iiii i nniii i x y nx y x x y y b xn x x x ====---==--∑∑∑∑, a y bx =-参考数据:5162i ii x y=≈∑23.在中国,不仅是购物,而且从共享单车到医院挂号再到公共缴费,日常生活中几乎全部领域都支持手机支付,出门不带现金的人数正在迅速增加.某机构随机抽取了一组市民,并统计他们各自出门随身携带现金(单位:元)的情况,制作出如图所示的茎叶图.规定:随身携带的现金在100元以下(不含100元)的为“手机支付族”,其他为“非手机支付族”.(1)根据茎叶图的数据,完成答题卡上的22⨯列联表;男生 女生 合计手机支付族 非手机支付族合计45(2)根据(1)中的列联表,判断是否有99%的把握认为“手机支付族”与“性别”有关. 附:()20P K k ≥0.050 0.010 0.001 0k 3.8416.63510.82822()()()()()()n ad bc K n a b c d a b c d a c b d -==+++++++24.某公司(人数众多)为鼓励员工利用网络进行营销,准备为员工办理手机流量套餐.为了解员工手机流量使用情况,按照男员工和女员工1:3的比例分层抽样,得到200名员工的月使用流量L (单位:M )的数据,其频率分布直方图如图所示.求a 的值,并估计这200名员工月使用流量的平均值x (同一组中的数据用中点值代表);(2)若将月使用流量在800M 以上(含800M )的员工称为“手机营销达人”,填写下面的22⨯列联表,能否有超过0095的把握认为“成为手机营销达人与员工的性别有关”;男员工 女员工 合计手机营销达人5(3)若这200名员工中有2名男员工每月使用流量在[]900,1000,从每月使用流量在[]900,1000的员工中随机抽取名3进行问卷调查,记女员工的人数为X,求X的分布列和数学期望.参考公式及数据:()()()()()22n ab bcKa b c d a c b d-=++++,其中n a b c d=+++.25.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A的研发费用x(百万元)和销量y(万盒)的统计数据如下:(1)根据上表中的数据,建立y关于x的线性回归方程y bx a=+(用分数表示);(2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---==--∑∑∑∑,a y bx=-.26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的. 【详解】对于①中,回归直线ˆˆˆy bx a =+恒过样本点的中心(,)x y ,但不一定过一个样本点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数||r 就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位,所以是正确的. 故选:B. 【点睛】本题主要考查了统计知识的相关概念及判定,其中解答中熟记回归直线方程的特征,回归系数的含义,相关系数的意义,以及方程的计算方法是解答的关键,属于基础题.2.D解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()4222221 1.50.50.5 1.55i i x x =-=-+-++=∑ , ()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.3.D解析:D 【分析】计算得到22322214χχχχ>>>,得到答案. 【详解】计算得到:222152(6221410)5281636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯; 222252(4201612)521121636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯ ; 222352(824128)52961636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯ ; 222452(143062)524081636322016363220χ⨯⨯-⨯⨯==⨯⨯⨯⨯⨯⨯;故22322214χχχχ>>>. 故选:D . 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.4.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K 的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人, 又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人, 又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530) 4.762 3.8412109075225K ⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”, 故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.7.D解析:D 【解析】∵y 与x 的线性回归方程为 6.5175ˆ.yx =+ 当5x =时,ˆ50y=. 当广告支出5万元时,由表格得:60y = 故随机误差的效应(残差)为605010.-= 故选D .8.C解析:C 【解析】两个变量y 与x 的回归模型中,它们的相关指数R 2越接近于1,这个模型的拟合效果越好.故选C .9.B解析:B【解析】由题意得,若数据x 1,x 2,x 3,…,x n 的方差为1,则2x 1,2x 2,2x 3,…,2x n 的方差为4,所以③不正确;对分类变量x 与y 的随机变量K 2的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越小,所以④不正确.其中①、②是正确的,故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
北师大版选修1-2--第一章-1-1.1-回归分析--1.2-相关系数----课件(42张)
10
∑ -10
进而可以求得 b= =110
∑ 2 -10
2
=1
=
252 688-10×158.8×159.1
18 542
典例透析
题型一
题型四
题型三
题型二
由此可得≈27.4, ≈81.3,
7
∑
=1
xi2
7
= 5 414, ∑
i=1
7
= 124 393, ∑ = 18 542.
=1
7
所以 r=
∑ -7
=1
7
∑
=1
≈
2
2
2 -7
7
2
∑ 2 -7
=1
18 542-7×27.4×81.3
i
1
2
3
4
5
6
7
∑
xi
21
23
25
27
29
32
35
192
yi
7
11
21
24
66
115
325
569
xi2
yi2
441
529
625
729
841
1 024
1 225
5 414
49
121
441
576
4 356
13 225
105 625
124 393
xiyi
147
253
525
648
1 914
3 680
11 375
题型四
反思对于两个变量的数据比较多的时候判断它们之间是否线性相
关,可通过计算线性相关系数来判断.