2017_2018学年高中数学时期质量检测一统计案例新人教A版选修1_2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
时期质量检测(一) 统计案例
(时刻120分钟 总分值150分)
一、选择题(本大题共12小题,每题5分,共60分.在每题给出的四个选项中,只有一项为哪一项符合题目要求的)
1.对有线性相关关系的两个变量成立的回归直线方程y ^=a ^+b ^x 中,回归系数b ^
( ) A .能够小于0 B .大于0 C .能等于0
D .只能小于0
解析:选A ∵b ^=0时,那么r =0,这时不具有线性相关关系,但b ^
能够大于0也能够小于0. 2.每一吨铸铁本钱y (元)与铸件废品率x %成立的回归方程y ^
=56+8x ,以下说法正确的选项是( ) A .废品率每增加1%,本钱每吨增加64元 B .废品率每增加1%,本钱每吨增加8% C .废品率每增加1%,本钱每吨增加8元 D .若是废品率增加1%,那么每吨本钱为56元
解析:选C 依照回归方程知y 是关于x 的单调增函数,而且由系数知x 每增加一个单位,y 平均增加8个单位.
3.下表显示出样本中变量y 随变量x 转变的一组数据,由此判定它最可能是( )
x 4 5 6 7 8 9 10 y
14
18
19
20
23
25
28
A .线性函数模型
B .二次函数模型
C .指数函数模型
D .对数函数模型
解析:选A 画出散点图(图略)能够取得这些样本点在某一条直线上或该直线周围,故最可能是线性函数模型.
4.实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),那么y 与x 之间的回归直线方程为( ) A .y ^=x +1 B . y ^
=x +2 C .y ^=2x +1 D .y ^
=x -1
解析:选A 由题意发觉,(x ,y )的四组值均知足y ^=x +1,故y ^
=x +1为回归直线方程.
5.以下关于等高条形图说法正确的选项是( ) A .等高条形图表示高度相对的条形图
B .等高条形图表示的是分类变量的频数
C .等高条形图表示的是分类变量的百分比
D .等高条形图表示的是分类变量的实际高度 解析:选C 由等高条形图的特点及性质进行判定.
6.依照一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的散点图分析存在线性相关关系,求得其回归方程y ^
=0.85x -85.7,那么在样本点(165,57)处的残差为( )
A .54.55
B .2.45
C .3.45
D .111.55
解析:选B 把x =165代入y ^
=0.85x -85.7,得y =0.85×165-85.7=54.55,由57-54.55=2.45,应选B .
7.有甲、乙两个班级进行数学考试,依照大于等于85分为优秀,85分以下为非优秀统计成绩,取得如下所示的列联表:
优秀 非优秀 总计 甲班 10
b
乙班 c 30
总计
105
已知在全数105人中随机抽取1人,成绩优秀的概率为2
7,那么以下说法正确的选项是( )
A .列联表中c 的值为30,b 的值为35
B .列联表中c 的值为15,b 的值为50
C .依照列联表中的数据,假设按95%的靠得住性要求,能以为“成绩与班级有关系”
D .依照列联表中的数据,假设按95%的靠得住性要求,不能以为“成绩与班级有关系”
解析:选C 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,因此c =20,b =45,选项A 、B 错误.依照列联表中的数据,取得K 2
=
105×10×30-20×45
2
55×50×30×75
≈6.109>3.841,因此有95%的把握以为“成
绩与班级有关系”,选项C 正确.
8.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与
x 具有相关关系,回归方程为y ^
=0.66x +1.562,假设某城市居民人均消费水平为7.675千元,估量该城市人
均消费额占人均工资收入的百分比约为( )
A .83%
B .72%
C .67%
D .66%
解析:选A 将y =7.675代入回归方程,可计算得x ≈9.262,因此该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83≈83%,即约为83%.
9.为了研究男子的年龄与抽烟的关系,抽查了100个男子,按年龄超过和不超过40岁,抽烟量天天多于和不多于20支进行分组,如下表:
年龄
总计
不超过40岁 超过40岁
吸烟量不多于 20支/天 50
15
65
吸烟量多于 20支/天 10 25 35 总计
60
40
100
那么在犯错误的概率不超过__________的前提下以为抽烟量与年龄有关( ) A .0.001 B .0.01 C .0.05
D .没有理由
解析:选A K 2
=
100×50×25-10×15
2
65×35×60×40
≈22.16>10.828,
因此咱们在犯错误的概率不超过0.001的前提下以为抽烟量与年龄有关.
10.为了考察两个变量x 和y 之间的线性相关性,甲、乙两个同窗各自独立做了10次和15次实验,而且利用线性回归方式,求得回归直线为l 1和l 2,已知在两人的实验中发觉对变量x 的观测数据的平均值恰好相等,都为s ,对变量y 的观测数据的平均值也恰好相等,都为t ,那么以下说法正确的选项是( )
A .直线l 1和直线l 2有交点(s ,t )
B .直线l 1和直线l 2相交,但交点未必是点(s ,t )
C .直线l 1和直线l 2由于斜率相等,因此必然平行
D .直线l 1和直线l 2必然重合
解析:选A l 1与l 2都过样本中心(x ,y ).
11.假设有两个分类变量X 和Y ,它们的可能取值别离为{x 1,x 2}和{y 1,y 2},其2×2列联表如下:
y 1 y 2 总计
x 1 a b a +b x 2
c d c +d 总计
a +c
b +d
a +
b +
c +d
X Y ) A .a =9,b =8,c =7,d =6 B .a =9,b =7,c =6,d =8 C .a =8,b =6,c =9,d =7 D .a =6,b =7,c =8,d =9
解析:选B 关于同一样本|ad -bc |越小,说明X 与Y 之间的关系越弱,|ad -bc |越大, 故查验知选B . 12.两个分类变量X 和Y, 值域别离为{x 1,x 2}和{y 1,y 2}, 其样本频数别离是a =10, b =21, c +d =35. 假设X 与Y 有关系的可信程度不小于97.5%, 那么c 等于( )
A .3
B .4
C .5
D .6
解析:选A 列2×2列联表如下:
x 1
x 2
总计 y 1 10
21
31 y 2
c
d
35 总计
10+c
21+d
66
故K 2
的观测值k =
66×[1035-c
-21c ]
2
31×35×10+c
56-c
≥5.024. 把选项A, B, C, D 代入验证可知选A .
二、填空题(本大题共4小题,每题5分,共20分.请把正确答案填在题中的横线上)
13.已知某车间加工零件的个数x 与所花费时刻y (h)之间的线性回归方程为y ^
=0.01x +0.5,那么加工600个零件大约需要________h .
解析:当x =600时,y ^
=0.01×600+0.5=6.5. 答案:6.5
14.假设一组观测值(x 1,y 1),(x 2,y 2),…,(x n ,y n )之间知足y i =bx i +a +e i (i =1,2,…,n ),假设e i
恒为0,那么R 2
为________.
解析:e i 恒为0,说明随机误差总为0,于是y i =y ^,故R 2
=1. 答案:1
15.以下是关于诞生男婴与女婴调查的列联表
晚上 白天 总计
男婴 45
A
B 女婴 E
35
C
总计
98
D
180
那么A =______,B =______,C ______,D =________,E =________. 解析:∵45+E =98,∴E =53,
∵E +35=C ,∴C =88,∵98+D =180,∴D =82, ∵A +35=D ,∴A =47,∵45+A =B ,∴B =92. 答案:47 92 88 82 53
16.已知x ,y 之间的一组数据如表,关于表中数据,甲、乙两同窗给出的拟合直线别离为l 1:y =1
3
x +1与
l 2:y =1
2x +12
,利用最小二乘法判定拟合程度更好的直线是________.
x 1 3 6 7 8 y
1
2
3
4
5
解析:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估量值的差的平方和为:S 1=⎝ ⎛⎭
⎪⎫1-432+(2-2)
2
+(3-3)2
+⎝
⎛⎭⎪⎫4-1032+⎝ ⎛⎭⎪⎫5-1132=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估量值的差的平
方和为:S 2=(1-1)2+(2-2)2+⎝ ⎛⎭⎪⎫3-722+(4-4)2
+⎝ ⎛⎭⎪⎫5-922=12
.
因为S 2<S 1,故用直线l 2:y =12x +1
2,拟合程度更好.
答案:y =12x +1
2
三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明进程或演算步骤)
17.(本小题总分值10分)对某校小学生进行心理障碍测试得如以下联表:(其中焦虑、扯谎、懒惰都是心理障碍)
焦虑 说谎 懒惰 总计 女生 5 10 15 30 男生 20 10 50 80 总计
25
20
65
110
试说明在这三种心理障碍中哪一种与性别关系最大?
解:关于上述三种心理障碍别离构造三个随机变量K 2
1,K 2
2,K 2
3,由表中数据可得 K 21
=
110×5×60-25×202
30×80×25×85
≈0.863,
K 22
=
110×10×70-20×102
30×80×20×90
≈6.366,
K 23
=
110×15×30-15×502
30×80×65×45
≈1.410.
因为K 2
2的值最大,因此扯谎与性别关系最大.
18.(本小题总分值12分)有人统计一个省的6个城市某一年的人均国内生产总值(人均GDP)x 和这一年各城市患白血病的儿童数量y ,其数据如下表所示:
人均GDP x /万元 10 8 6 4 3 1 患白血病的儿童数量y /人
351
312
207
175
132
180
(1)画出散点图,并判定是不是线性相关; (2)求y 与x 之间的回归方程. 解:(1)作散点图(如以下图所示).
由散点图可知y 与x 具有线性相关关系.
(2)将数据代入公式,可得b ^≈23.253,a ^
≈102.151. 故y 与x 之间的线性回归方程是y ^
=23.253x +102.151.
19.(本小题总分值12分)某校在两个班进行教学方式对如实验,两个月后进行了一次检测,实验班与对照班成绩统计如下表所示(单位:人):
80及80分以上
80分以下
总计 试验班 35 15
50 对照班 20 m
50
总计
55
45
n
(1)求m ,n ;
(2)可否在犯错误的概率不超过0.005的情形下以为教学方式与成绩有关系? 解:(1)m =45-15=30,n =50+50=100. (2)由表中的数据,得K 2
的观测值为 k =
100×35×30-15×202
50×50×55×45
≈9.091.
因为9.091>7.879,因此能在犯错误的概率不超过0.005的前提下以为教学方式与成绩有关系. 20.(本小题总分值12分)某工厂用甲、乙两种不同工艺生产一大量同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率散布直方图如下图:
(1)依照上述数据完成以下2×2列联表,依照此数据你以为选择不同的工艺与生产出一等品是不是有关?
甲工艺 乙工艺 总计 一等品 非一等品 总计
附:
P(K2≥k0)0.100.050.01
k02.7063.8416.635
K2=
n ad-bc2
a+b c+d a+c b+d
(2)以上述各类产品的频率作为各类产品发生的概率,假设一等品、二等品、三等品的单件利润别离为30元、20元、15元,你以为以后该工厂应该选择哪一种工艺生产该种零件?请说明理由.解:(1)2×2列联表如下
甲工艺乙工艺总计
一等品5060110
非一等品504090
总计100100200
K2=200×50×40-60×502
110×90×100×100
≈2.02<2.706,因此没有理由以为选择不同的工艺与生产出一等品有关.
(2)由题知运用甲工艺生产单件产品的利润X的散布列为
X 302015
P 0.50.30.2
X的数学期望为E(X)=30×0.5+20×0.3+15×0.2=24,X的方差为D(X)=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.
乙工艺生产单件产品的利润Y的散布列为
Y 302015
P 0.60.10.3
Y的数学期望为E(Y)=30×0.6+20×0.1+15×0.3=24.5,
Y的方差为D(Y)=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.
由上述结果能够看出D(X)<D(Y),即甲工艺波动小,尽管E(X)<E(Y),但相差不大,因此以后选择甲工艺.21.(本小题总分值12分)为调查某地域老年人是不是需要志愿者提供帮忙,用简单随机抽样的方式从该地域调查了500位老年人,结果如下:
性别
是否需要志愿者
男女
需要4030
不需要160270
P(K2≥k0)0.050.010.001 k03.8416.63510.828
附:K2的观测值k=
n ad-bc2
a+b c+d a+c b+d
.
(1)估量该地域老年人中,需要志愿者提供帮忙的老年人的比例;
(2)在犯错误的概率不超过0.01的前提下是不是能够为该地域的老年人是不是需要志愿者提供帮忙与性别有关?
(3)依照(2)的结论,可否提出更好的调查方式来估量该地域的老年人中,需要志愿者提供帮忙的老年人的比例?请说明理由.
解:(1)调查的500位老人中有70位需要志愿者提供帮忙,因此该地域老年人中,需要帮忙的老年人的比
例的估算值为70
500
=14%.(2)随机变量K2的观测值
k=500×40×270-30×1602
200×300×70×430
≈9.967.
由于9.967>6.635,因此,在犯错误的概率不超过0.01的前提下以为该地域的老年人是不是需要志愿者提供帮忙与性别有关.
(3)由(2)的结论知,该地域的老年人是不是需要帮忙与性别有关,而且从样本数据中能看出该地域男性老年人与女性老年人中需要帮忙的比例有明显不同,因此在调查时,先确信该地域老年人中男、女的比例,再把老年人分成男、女两层,而且采纳分层抽样方式比采纳简单随机抽样的方式更好.
22.(本小题总分值12分)某市为了对学生的数理(数学与物理)学习能力进行分析,从10 000名学生中随机抽出100位学生的数理综合学习能力品级分数(6分制)作为样本,分数频数散布如下表:
等级得分(0,1](1,2](2,3](3,4](4,5](5,6]
人数317303017 3
(1)若是以能力品级分数大于4分作为良好的标准,从样本中任意抽取2名学生,求恰有1名学生为良好的概率.
(2)统计方式中,同一组数据经常使用该组区间的中点值(例如区间(1,2]的中点值为1.5)作为代表:
①据此,计算这100名学生数理学习能力品级分数的期望μ及标准差σ(精准到0.1);
②假设整体服从正态散布,以样本估量整体,估量该市这10 000名学生中数理学习能力品级在(1.9,4.1)范围内的人数.
(3)从这10 000名学生中任意抽取5名同窗,他们数学与物理单科学习能力品级分数如下表:
x(数学学习能力)2345 6
y(物理学习能力)1.534.55 6
①请画出上表数据的散点图;
②请依照上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^
(附参考数据:129≈11.4)
. 解:(1)样本中学生为良好的人数为20人.故从样本中任意抽取2名学生,那么仅有1名学生为良好的概率为C 1
20×C 1
80C 2100=3299
.
(2)①整体数据的期望约为:μ=0.5×0.03+1.5×0.17+2.5×0.30+3.5×0.30+4.5×0.17+5.5×0.03=3.0,
标准差σ=[(0.5-3)2
×0.03+(1.5-3)2
×0.17+(2.5-3)2
×0.3+(3.5-3)2
×0.3+(4.5-3)2
×0.17+(5.5-3)2
×0.03]12
= 1.29≈1.1,
②由于μ=3,σ=1.1
当x ∈(1.9,4.1)时,即x ∈(μ-σ,μ+σ),
故数理学习能力品级分数在(1.9,4.1)范围中的概率为0.682 6.
数理习能力品级分数在(1.9,4.1)范围中的学生的人数约为10 000×0.682 6=6 826人. (3)①数据的散点图如图:
②设线性回归方程为y ^=b ^x +a ^
,那么
b ^
=
∑i =1
5
x i y i -5x y
∑i =1
5
x 2i -5x 2
=1.1,a ^=y -b ^
x =-0.4.
故回归直线方程为y ^
=1.1x -0.4.。