2020届高三数学复习《统计案例》学案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020届高三数学《统计案例》复习学案
回归教材
1. (选修1-2P19A组第3题)调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.能否在犯错误的概率不超过0.10的前提下认为婴儿的性别与出生的时间有关系?
2. (选修1-2P19A组第2题)假设美国10家工业公司提供了以下数据(单位:百万美元):
(1) 作出销售总额和利润的散点图,根据该图猜想它们之间的关系应是什么形式;
(2) 建立销售总额为解释变量,利润为预报变量的回归模型,并计算残差;
(3) 计算R2,你认为这个模型能较好地刻画销售总额和利润之间的关系吗?请说明理由.
举题固法
目标1回归分析
两个具有相关关系的变量之间可以由散点图直观看出是否具有较好的线性相关关系,定量的方法就是计算
相关系数,相关系数的绝对值越接近1,其线性相关关系越强.
例1:(2019·武汉调研)一个工厂在某年里连续10个月每月产品的总成本y (单位:万元)与该月产量x (单位:万件)之间有如下一组数据:
x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 y
2.25
2.37
2.40
2.55
2.64
2.75
2.92
3.03
3.14
3.26
(1) 通过画散点图,发现可用线性回归模型拟合y 与x 的关系,请用相关系数加以说明; (2) ①建立月总成本y 与月产量x 之间的回归方程;
②通过建立的y 关于x 的回归方程,估计某月产量为 1.98万件时产品的总成本为多少万元.(均精确到0.001)
参考数据:∑i =110x i =14.45,∑i =1
10
y i =27.31,
∑i =1
10
x 2i -10x 2=0.850, ∑i =1
10
y 2i -10y 2
=1.042, =1.222;
参考公式:相关系数
r =
∑i =1
n
x i y i -n x y
⎝ ⎛⎭⎪⎫∑i =1n x 2i -n x 2⎝ ⎛⎭
⎪⎫∑i =1n y 2i -n y 2
,
回归方程=x +
中斜率和截距的最小二乘估计公式分别为=
∑i =1
n
x i y i -n x y
∑i =1
n
x 2i -n x
2
,
=y -x .
变式1:(2019·怀化二模)某市房产中心数据研究显示,2018年该市新建住宅销售均价如下表,3月至7月房价上涨过快,为抑制房价过快上涨,政府从8月份开始出台了相关限购政策,10月份开始房价得到了很好的抑制.
均价(万元/m 2)
0.95 0.98 1.11 1.12 1.20 1.22 1.32 1.34 1.16 1.06 月份
3
4
5
6
7
8
9
10
11
12
宅销售均价;
(2) 试用相关系数说明3月至7月各月均价y (万元/m 2)与月份x 之间可用线性回归模型拟合(保留小数点后2位).
参考数据:∑i =1
5x i =25,∑i =1
5y i =5.36,∑i =1
5 (x i -x )(y i -y )=0.64,
∑i =1
5
y 2i ≈5.789,y 2
≈1.149,0.44≈0.663.
回归方程斜率和截距的最小二乘法估计公式分别为=
∑i =1
n
(x i -x )(y i -y )
∑i =1
n
(x i -x )2
,
=y -x ;
相关系数r =
∑i =1
n
(x i -x )(y i -y )
∑i =1
n
(x i -x )2∑i =1
n
(y i -y )2
.
变式2:近期某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每天使用扫码支付的人次,用x 表示活动推出的天数,y 表示每天使用扫码支付的人次,统计数据如下表:
x 1 2 3 4 5 6 7 y 60 110 210 340 660 1 010 1 960
(1) 根据散点图判断在推广期内,y =a +bx 与y =c ·d x (c ,d 均为大于零的常数)哪一个适宜作为扫码支付的人次y 关于活动推出天数x 的回归方程类型(给出判断即可,不必说明理由);
(2) 根据(1)的判断结果及下表中数据,建立y 关于x 的回归方程,并预测活动推出第8天使用扫码支付的人次.
参考数据:
y v ∑
i=1
7
x i y i∑
i=1
7
x i v i100.54
621 2.54 25 350 78.12 3.47 参考公式:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归直线的斜率和截距的最小二乘估计公式分别为
目标2独立性检验
独立性检验类似于反证法,即在假设两个分类变量无关的情况下,得出假设成立为小概率事件,从而否定该假设,得出两个分类变量有关,进而得出原结论成立的概率.例2:(2019·芜湖三模)随着科技的发展,近年看电子书的国人越来越多,所以近期有许多人呼吁“回归纸质书”,目前出版物阅读中纸质书占比出现上升.现随机选出200人进行采访,经统计这200人中看纸质书的人数占总人数的
4
5.将这200人按年龄分成五组:第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],其中统计看纸质书的人得到的频率分布直方图如图所示.
(1) 求a的值及看纸质书的人的平均年龄;
(2) 按年龄划分,把年龄在[15,45)的称为青壮年组,年龄在[45,65]的称为中老年组,若选出的200人中看电子书的中老年人有10人,请完成下面2×2列联表,并判断能否在犯错误的概率不超过0.1的前提下认为看书方式与年龄层有关.
看电子书看纸质书合计
青壮年
中老年
合计
附:K2=
n(ad-bc)
(a+b)(c+d)(a+c)(b+d)
(其中n=a+b+c+d).
P(K2≥k)0.100.050.0250.0100.0050.001
k 2.706 3.841 5.024 6.6357.87910.828