人教版数学高二人教A版选修2-3第三章《统计案例》章末小结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
知识点一 线性回归方程 求线性回归方程的基本步骤:
(1)列出散点图,从直观上分析数据间是否存在线性相关关系.
(2)计算
(3)代入公式求出y ^=b ^x +a ^中参数b ^,a ^
的值. (4)写出线性回归方程并对实际问题作出估计.
在我国某地的一个县城,近期发现了好几个癌症村.政府部门十分震惊,马上组成调查组调查病因,经调查发现致癌的罪魁祸首是水源中的金属砷,它们来自附近的几家化工厂,化工厂排出的废水中含有金属砷,废水污染了水源,人食用了这种水就会致癌.下面就是调查组对几个癌症村水源中的砷超标的倍数和患癌症的人数统计的数据:
(1)画出表中数据的散点图; (2)求y 对x 的回归方程;
(3)若一个村的水源中砷超标的倍数为7,试估计这个村的患癌症的人数.
砷超标的倍数x 3 4 5.5 4.2 5.8 6 3.5 患癌症人数y
15
20
28
24
35
44
34
解析:(1)散点图如图所示:
(2)观察散点图,可知x 、y 成线性相关关系. 计算得
=327,=2007
,
根据求b ^
公式代入数据计算得 b ^≈6.065,a ^=200
7-6.065×327
≈0. 846.
所以患癌症人数y 对水源中砷超标的倍数x 的回归直线方程为y ^
=6.065x +0.846.
(3)根据上面求得的回归直线方程,当水源中砷超标的倍数为7时,y =6.065×7+0.846=43.301. 即该村患癌症的人数约为43人. 知识点二 回归分析
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤是先画出两个变量的散点图,然后利用常见的函数模型去拟合样本点,对于用什么类型的函数去拟合该组数据,拟合的效果如何,常用方法有残差分析、求相关指数R 2.
一个车间为了规定工时定额,需确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下表:
零件
数x /个 10
20
30
40
50
60
70
80
90
100
加工时
间y /min
62
72
75
81
85
95
103
108
112
127
且知x 与y 具有线性相关关系,试求出线性回归方程并说明拟合效果的好坏. 解析:设回归模型为y ^=a ^+b ^x ,
y ^i 61.833 68.533 75.233 81.933 88.633 y i -y ^i
0.167
3.467
-0.233
-0.933
-3.633
y i-y
--30-20-17-11-7
y
^
i
95.333102.033108.733115.433122.133
y i-y
^
i
-0.3330.967-0.733-3.433 4.867
y i-y
-311162035
知识点三独立性检验
独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过概率P(K2≥6.635)≈0.01来评价该假设不合理的程度,由实际计算出的k>6.635,说明该假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%.
现对某市工薪阶层关于“楼市限购令”的态度进行调查,随机抽调了50人,他们月收入的频数分布及对“楼市限购令”赞成人数如下表所示:
月收入/
百元
[15,25)[25,35)[35,45)[45,55)[55,65)[65,75) 频数51015105 5
赞成人数481252 1
根据以上统计数据填写下面2×2列联表,并问:是否有99%的把握认为以月收入5 500元为分界点对“楼市限购令”的态度有差异?
月收入不低于5 500
元的人数
月收入低于5 500
元的人数
合计
赞成a=c=
不赞成b=d=
合计
解析:2×2列联表如下:
月收入不低于5 500
元的人数
月收入低于5 500
元的人数
合计赞成a=3c=2932
不赞成b=7d=1118
合计104050由公式得K2的观测值为
k=
50×(3×11-7×29)2
(3+7)(29+11)(3+29)(7+11)
≈6.27<6.635.
所以没有99%的把握认为以月收入5 500元为分界点对“楼市限购令”的态度有差异.
一、选择题
1.下列关系中:①吸烟有害健康;②粮食产量与施肥量;③名师出高徒;④乌鸦叫,没好兆.不具有相关关系的是(D)
A.①B.②C.③D.④
2.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y
^
=7.19x+73.93,用这个模型预测这孩子10岁时的身高,则正确的叙述是(D)
A.身高一定是145.83 cm
B.身高在145.83 cm以上
C.身高在145.83 cm以下
D.身高在145.83 cm左右
3.变量X与Y相对应的一组数据为(10,1)、(11.3,2)、(11.8,3)、(12.5,4)、(13,5);变量U
与V 相对应的一组数据为(10,5)、(11.3,4)、(11.8,3)、(12.5,2)、(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则(C )
A .r 2<r 1<0
B .0<r 2<r 1
C .r 2<0<r 1
D .r 2=r 1
解析:画散点图,由散点图可知X 与Y 是正相关,则相关系数r 1>0,U 与V 是负相关,相关系数r 2<0,故选C.
4.(2014·泰安一模)为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老人,其结果如下表:
由K 2=
n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
,得
K 2=
500×(40×270-30×160)2
200×300×70×430
≈9.967.
附表:
P (K 2≥ k )
0.050 0.010 0.001 k
3.841
6.635
10.828
参照附表,可得到的结论是(C)
A .在犯错误的概率不超过0.1%的前提下,认为“需要志愿者提供帮助与性别有关”
B .在犯错误的概率不超过0.1%的前提下,认为“需要志愿者提供帮助与性别无关”
C .有99%以上的把握认为“需要志愿者提供帮助与性别有关”
D .有99%以上的把握认为“需要志愿者提供帮助与性别无关” 解析:由数据知,选项C 正确. 能力提升
5.(2014·重庆卷)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该
观测数据算得的线性回归方程可能是(A )
A.y ^
=0.4x +2.3 B.y ^
=2x -2.4 C.y ^
=-2x +9.5 D.y ^
=-0.3x +4.4
解析:因为变量x 与y 正相关,则在线性回归方程中,x 的系数应大于零,排除B ,D ;将x =3,y =3.5分别代入A ,B 中的方程只有A 满足,故选A.
6.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^
=0.66x +1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为(A )
A .83%
B .72%
C .67%
D .66%
解析:将y =7.675代入回归方程,可计算得x ≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.
7.如果K 2的观测值8.654,可以认为“X 与Y 无关”的可信度为(B ) A .99.5% B .0.5% C .99% D .1%
解析:∵K 2=8.654≥k =7.879, ∴P (K 2≥7.879)=0.005=0.5%. 8.有下列数据:
下列四个函数中,模拟效果最好的为(A) A .y =3·2x -
1 B .y =log 2x C .y =3x D .y =x 2
解析:分别将x =1,2,3,代入求值,结果最接近y 的函数是y =3·2x -1. 故选A.
9.已知一个回归方程为y ^
=1.5x +45,x ∈{1,5,7,13,19},则y =________. 解析:=9,∴=1.5× 9+45=58.5.
答案:58.5
10.在对某小学的学生进行吃零食的调查中,得到如下数据:
吃零食 不吃零食 合计 男学生 24 31 55 女学生 8 26 34 合计
32
57
89
根据上述数据分析,我们得出K 2的观测值k =________. 解析:K 2的观测值
k =89×(24×26-31×8)255×34×32×57≈3.689.
答案:3.689
11.下表为收集到的一组数据:
x 1 3 5 7 9 y
4
8
11
17
20
已知变量x 、y 呈线性相关关系,则二者对应的回归直线方程为________________________________________________________________________.
12.(2014·韶关一模)设某大学的女生体重y (kg)与身高x (cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的线性回归方程为y ^
=0.85x -85.71,给出下列结论:
①y 与x 具有正的线性相关关系; ②回归直线过样本点的中心(x ,y );
③若该大学某女生身高增加1 cm ,则其体重约增加0.85 kg ;
④若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg. 其中,正确结论的序号是________. 解析:利用有关概念可知,①②③正确. 答案:①②③
13.已知x 、y 之间的一组数据:
(1)分别计算:x -,y -,x 1y 1+x 2y 2+x 3y 3+x 4y 4,x 21+x 22+x 23+x 2
4; (2)求出回归直线方程y ^=b ^x +a ^. 解析:(1)x -=0+1+2+3
4=1.5,
y -=1+3+5+74
=4,
x 1y 1+x 2y 2+x 3y 3+x 4y 4=0×1+1×3+2×5+3×7=34,
x 21+x 22+x 23+x 24=02+12+22+32=14.
(2)b ^=x 1y 1+x 2y 2+x 3y 3+x 4y 4-4x -y -x 21+x 22+x 23+x 24-4x -2
=
34-4×1.5×4
14-4×1.52
=2;
a ^=y --
b ^x -
=4-2×1.5=1, 所以回归方程为y ^
=2x +1.
14.在调查学生数学成绩与物理成绩之间的关系时,得到如下数据(人数):
试判断数学成绩与物理成绩之间是否相关,判断出错误的概率有多大. 解析:由公式得K 2的观测值为 k =135×(62×22-28×23)290×45×85×50
≈4.066.
因为4.066>3.841,所以有95%的把握认为数学成绩与物理成绩相关,判断出错的概率只有5%. 15.为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B .下表1和表2分别是注射药物A 和药物B 后的试验结果(疱疹面积单位:mm 2).
表1 注射药物A 后皮肤疱疹面积的频数分布表
表2 注射药物B 后皮肤疱疹面积的频数分布表
完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.
表3
解析:
70 mm 2
于70 mm 2 注射药物A a =70 b =30 100 注射药物B c =35 d =65 100 总计
105
95
n =200
由列联表中的数据,得K 2的观测值为 k =200×(70×65-35×30)2100×100×105×95
≈24.561>10.828.
因此,有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”. 16.(2014·沈阳市质检)为了研究“教学方式” 对教学质量的影响,某高中老师分别用两种不同的教学方式对入学数学平均分数和优秀率都相同的甲、乙两个高一新班进行教学(勤奋程度和自觉性都一样).以下茎叶图为甲、乙两班(每班均为20人)学生的数学期末考试成绩.
(1)现从甲班数学成绩不低于80分的同学中随机抽取两名同学,求成绩为87分的同学至少有一名被抽中的概率;
(2)学校规定:成绩不低于75分的为优秀.请填写下面的2× 2列联表,并判断有多大把握认为“成绩优秀与教学方式有关” .
甲班 乙班 合计 优秀 不优秀 合计
下面临界值表供参考:
打印版
高中数学
⎝
⎛⎭⎪⎫参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ) 解析:(1)甲班成绩为87分的同学有2个,其他不低于80分的同学有3个“从甲班数学成绩不低于80分的同学中随机抽取两名同学” 的一切可能结果组成的基本事件有C 25=10个,
“抽到至少有一个87分的同学” 所组成的基本事件有C 13C 12+C 22=7个,所以
P =710
. (2)
K 2=40×(6×6-14×14)2
20×20×20×20
=6.4>5.024, 因此,我们有97.5%的把握认为成绩优秀与教学方式有关.。