2017-2018学年高中数学(人教B版选修2-3)教师用书:第3章-章末分层突破
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
章末分层突破
[自我校对]
①回归分析
②相互独立事件的概率
③χ2公式
④判断两变量的线性相关
回归分析问题
建立回归模型的步骤
(1)确定研究对象,明确变量x,y。
(2)画出变量的散点图,观察它们之间的关系(如是否存在线性相
关关系等).
(3)由经验确定回归方程的类型(如我们观察到数据呈线性相
关关系,则选用回归直线方程错误!=错误!x+错误!)。
(4)按一定规则估计回归方程中的参数(如最小二乘法)。
(5)得出回归方程.
另外,回归直线方程只适用于我们所研究的样本的总体,而且一
般都有时间性。
样本的取值范围一般不能超过回归直线方程的适用
范围,否则没有实用价值.
假设一个人从出生到死亡,在每个生日那天都测量身高,
并作出这些数据散点图,则这些点将不会落在一条直线上,但在一
段时间内的增长数据有时可以用线性回归来分析。
下表是一位母亲
给儿子作的成长记录:
年龄/周
3456789岁
身高/cm90。
897.6104。
2110.9115。
7122.0128.5
年龄/周
10111213141516岁
身高/cm134。
2140。
8147.6154.2160。
9167。
6173.0
(1)作出这些数据的散点图;
(2)求出这些数据的线性回归方程;
(3)对于这个例子,你如何解释回归系数的含义?
(4)解释一下回归系数与每年平均增长的身高之间的联系.
【精彩点拨】(1)作出散点图,确定两个变量是否线性相关;
(2)求出a,b,写出线性回归方程;
(3)回归系数即b的值,是一个单位变化量;
(4)根据线性回归方程可找出其规律.
【规范解答】(1)数据的散点图如下:
(2)用y表示身高,x表示年龄,
因为错误!=错误!×(3+4+5+…+16)=9.5,
错误!=错误!×(90。
8+97。
6+…+173.0)=132,
错误!=错误!≈错误!≈6.316,
错误!=错误!-b错误!=71.998,
所以数据的线性回归方程为y=6。
316x+71.998。
(3)在该例中,回归系数6。
316表示该人在一年中增加的高度。
(4)回归系数与每年平均增长的身高之间近似相等.
[再练一题]
1。
假定小麦基本苗数x与成熟期有效穗Y之间存在相关关系,今测得5组数据如下:
x15.025。
830.036。
644。
4
Y39.442。
942.943。
149。
2
(1)以x为解释变量,Y为预报变量,作出散点图;
(2)求Y与x之间的回归方程,对于基本苗数56.7预报有效穗.
【解】(1)散点图如下。
(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用回归方程刻画它们之间的关系.
设回归方程为错误!=错误!x+错误!,错误!=30.36,错误!=43。
5,
错误!错误!=5 101。
56,错误!错误!=9 511。
43。
错误!错误!=1 320。
66,错误!2=1 892。
25,错误!2=921.729 6,y i=6 746。
76。
错误!i
由错误!=错误!≈0。
29,
错误!=错误!-错误!错误!=43。
5-0.29×30。
36≈34.70.
故所求的线性回归方程为错误!=34。
70+0。
29x。
当x=56。
7时,错误!=34。
70+0.29×56。
7=51。
143。
估计成熟期有效穗约为51.143。
独立性检验
独立性检验的基本思想类似于反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系"成立,在该假设下,我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值很大,则在一定程度上说明假设不合理,根据随机变量χ2的含义,可以通过P(χ2>6.635)≈0.01来评价假设不合理的程度,由实际计算出χ2〉6。
635说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%.
独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表。
(2)根据公式χ2=错误!计算χ2的值。
(3)比较χ2与临界值的大小关系并作统计推断.
在某校高三年级一次全年级的大型考试中数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系较大?
物理优秀化学
优秀
总分
优秀
数学优秀228225267
数学非优
秀
14315699
注:,非优秀的有880人。
【精彩点拨】分别列出数学与物理,数学与化学,数学与总分优秀的2×2列联表,求k的值。
由观测值分析,得出结论。
【规范解答】(1)列出数学与物理优秀的2×2列联表如下:
物理优秀物理非优
秀
合计
数学优秀 228 132 360 数学非优秀 143 737 880 合计
371
869
1 240
n 11=228,n 12=132,n 21=143,n 22=737,
n 1+=360,n 2+=880,n +1=371,n +2=869,n =1 240. 代入公式χ2
=
n n 11n 22-n 12n 212
n 1+n 2+n +1n +2
,
得χ21=错误!≈270.114 3.
(2)列出数学与化学优秀的2×2列联表如下:
化学优
秀 化学非优秀 合计 数学优秀 225 135 360 数学非优秀 156 724 880 合计
381
859
1 240
n 11=225n 12n 21n 22
n 1+=360,n 2+=880,n +1=381,n +2=859,n =1 240。
代入公式,得χ22=错误!≈240.611 2.
(3)列出数学与总分优秀的2×2列联表如下:
n11=267122122
n1+=360,n2+=880,n+1=366,n+2=874,n=1 240.
代入公式,得χ23=错误!≈486。
122 5.
由上面计算可知数学成绩优秀与物理、化学、总分优秀都有关系,由计算分别得到χ2的统计量都大于临界值6。
635,由此说明有99%的把握认为数学优秀与物理、化学、总分优秀都有关系,但与总分优秀关系最大,与物理次之。
[再练一题]
2。
某推销商为某保健药品做广告,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”.经调查发现,在不服用该药品的418人中仅有18人患A疾病.请用所学知识分析该药品对预防A 疾病是否有效.
【解】将问题中的数据写成如下2×2列联表:
患A疾病不患A疾
病
合计
服用该药品5100105
不服用该药
品
18400418
合计23500523
将上述数据代入公式χ2=错误!中,计算可得χ2≈0。
041 4,因为0.041 4〈3。
841,故没有充分理由认为该保健药品对预防A疾病有效。
转化与化归思想在回归分析中的应用
回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.
某商店各个时期的商品流通率Y(%)的商品零售额x(万元)资料如下:
x9。
511。
513。
515.517.5
y6 4.64 3.2 2.8
.经济理论和实际经验都证明,流通率Y 决定于商品的零售额x ,体现着经营规模
效益,假定它们之间存在关系式:y =a +b
x。
试根据上表数据,求出a
与b 的估计值,并估计商品零售额为30万元的商品流通率.
【规范解答】 设u =错误!,则y =a +bu ,得下表数据:
错误!
=-0。
187 5+56.25 u 。
所以所求的回归方程为y ,^=-0.187 5+错误!.当x =30时,y =1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.
[再练一题]
3。
在某化学实验中,测得如下表所示的6对数据,其中x(单位:min)表示化学反应进行的时间,Y(单位:mg)表示未转化物质的质量.
(1)设c和d 的值(精确到0。
001);
(2)估计化学反应进行到10 min时未转化物质的质量(精确到0.1).
【解】(1)在y=cd x两边取自然对数,令ln y=z,ln c=a,ln d =b,则z=a+bx.由已知数据,得
错误!错误!错误!=3.905 5-0.221 9x。
而ln c=3.905 5,ln d=-0。
221 9,
故c≈49。
675,d≈0。
801,
所以c,d的估计值分别为49.675,0。
801.
(2)当x=10时,由(1)所得公式可得y≈5.4(mg).
1。
为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万
8.28。
610.011.311。
9
元)
支出y(万
6.2
7.58。
0
8.5
9.8
元)
错误!错误!x错误!错误!=0.76,错误!=错误!-错误!错误!。
据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元
B.11。
8万元
C。
12.0万元 D.12.2万元
【解析】由题意知,x=错误!=10,
错误!=错误!=8,
∴错误!=8-0。
76×10=0。
4,
∴当x=15时,错误!=0。
76×15+0。
4=11。
8(万元)。
【答案】B
2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1 表2
4
A。
成绩
C.智商D。
阅读量
【解析】A中,a=6,b=14,c=10,d=22,a+b=20,c+d =32,a+c=16,b+d=36,n=52,
χ2=错误!=错误!。
B中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c =16,b+d=36,n=52,
χ2=错误!=错误!。
C中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2=错误!=错误!.
D中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2=错误!=错误!.
∵
13
1 440
〈错误!<错误!<错误!,
∴与性别有关联的可能性最大的变量是阅读量。
【答案】D
3。
如图3。
1是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
图3。
1
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量。
附注:
参考数据:错误!y i=9。
32,错误!t i y i=40.17,错误!=0。
55,错误!≈2。
646。
参考公式:相关系数r=错误!,回归方程错误!=错误!+错误!t中斜率
和截距的最小二乘估计公式分别为错误!=错误!,错误!=错误!-错误!错误!.
【解】(1)由折线图中的数据和附注中的参考数据得
t=4,错误!(t i-错误!)2=28,错误!=0。
55,
错误!(t i-错误!)(y i-错误!)=错误!t i y i-错误!错误!y i=40。
17-4×9。
32=2.89,
∴r≈错误!≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度
相当大,从而可以用线性回归模型拟合y与t的关系。
(2)由错误!=错误!≈1.331及(1)得
错误!=错误!=错误!≈0.103.
错误!=错误!-错误!错误!≈1.331-0.103×4≈0.92.
所以y关于t的回归方程为错误!=0.92+0.10t。
将2016年对应的t=9代入回归方程得错误!=0.92+0.10×9=1。
82.
所以预测2016年我国生活垃圾无害化处理量约为1。
82亿吨.
4。
某地区2007年至2013年农村居民家庭人均纯收入y(单位:
千元)的数据如下表:
(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:
错误!=错误!,错误!=错误!-错误!错误!.
【解】(1)由所给数据计算得错误!=错误!(1+2+3+4+5+6+7)=4,
错误!=错误!(2.9+3。
3+3。
6+4.4+4。
8+5。
2+5.9)=4。
3,
错误!(t i-错误!)2=9+4+1+0+1+4+9=28,
错误!(t i-错误!)(y i-错误!)=(-3)×(-1。
4)+(-2)×(-1)+(-1)×(-0。
7)+0×0。
1+1×0。
5+2×0.9+3×1.6=14,
错误!=错误!=错误!=0。
5,
错误!=错误!-错误!错误!=4。
3-0。
5×4=2。
3,
所求回归方程为错误!=0。
5t+2。
3.
(2)由(1)知,错误!=0。
5〉0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0。
5千元。
将2015年的年份代号t=9代入(1)中的回归方程,得
错误!=0.5×9+2。
3=6。
8,
故预测该地区2015年农村居民家庭人均纯收入为6。
8千元。