高考数学 考点26 随机抽样、用样本估计总体、变量间的相关关系、统计案例 试题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卜人入州八九几市潮王学校考点26随机抽样、用
样本估计总体、
变量间的相关关系、统计案例
1.〔2021·高考文科·T4〕如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为A B x x 和,样本HY 差分别为s A 和s B ,那么〔〕
(A)A x >B x ,s A >s B (B)A x <B x ,s A >s B (C)A x >B x ,s A <s B (D)A x <B x ,s A <s B
此题考察样本平均数、HY 差的概念的灵敏应用,属保分题。
【思路点拨】直接观察图像易得结论,不用详细的运算
【标准解答】选B 由图易得A x <B x ,又A 波动性大,B 波动性小,所以s A >s B
【方法技巧】统计内容有抽样方法、样本特征数〔均值、方差,直方图等〕、回归分析、预测〔应用〕等,表达算法思想.弄清根本概念,原理,计算方法等.
2.〔2021·高考理科·T6〕样本中一共有五个个体,其值分别为a,0,1,2,3,,假设该样本的平均值为1,那么样本方差为〔〕
6
5
(D)2 此题考察用样本的平均数、方差,考察了考生的运算求解才能. 【思路点拨】先由平均值求出a ,再利用方差的计算公式求解.
【标准解答】选D,由题意知
1
a+0+1+2+3)=15
(,解得a=-1,所以样本方差为 2222221
S =[(-1-1)+(0-1)+(1-1)+(2-1)+(3-1)]5
=2,应选D.
3.〔2021·高考文科·T6〕在某项体育比赛中,七位裁判为一选手打出的分数如下: 90899095939493
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 〔A 〕(C)93,2
此题考察样本数据的平均值和方差的概念及运算,考察了考生的运算求解才能.
【思路点拨】根据平均值和方差的公式直接计算即可,应注意去掉一个最高分和一个最低分后再计算. 【标准解答】选了B ,去掉一个最高分95一个最低分89,剩下5个数的平均值为
1(9090939493)925++++=,方差为222221
[(9092)(9092)(9392)(9492)(9392)] 2.85
-+-+-+-+-= 4.〔2021·高考文科·T9〕假设某校高一年级8()
和和92
和和92
此题考察中位数与平均数的求解。
【思路点拨】把数据从小到大排列后可得其中位数,平均数是把所有的数据加起来除以数据的个数。
【标准解答】选A ,数据从小到大排列后可得其中位数为
9192
91.52
+=,平均数为
8789909192939496
91.58
+++++++=。
【方法技巧】给出实际数据求解中位数和平均数等数据特征相对较为容易,但是同学也要理解“众数、中位数、平均数与频率分布直方图的关系〞,会用频率分布直方图估计众数、中位数、平均数。
1.众数:取最高小长方形底边中点的横坐标作为众数;
2.中位数:在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界限与x 轴交点的横坐标称为中位数。
3.平均数:平均数是频率分布直方图的“重心〞,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
5.〔2021·高考理科·T7〕随机变量X 服从正态分布N(3,1),且P(2 ≤X ≤,那么P 〔X>4〕=() A.0.1588B.0.1587 C.0.1586D.
此题考察随机变量的正态分布的意义。
【思路点拨】由条件先求出(24)P X X <>或,再求出(4)
P X >的值。
【标准解答】选B
∴1
(4)(24)0.15872
P X P X X >=
<>=或,应选.B 6.〔2021·高考文科·T3〕某商品销售量y 〔件〕与销售价格x 〔元/件〕负相关,那么其回归方程可能是〔〕
A.
^
10200y x =-+ B.^
10200y x =+
O
长度m
组距
0.050.040.03
0.01
40
353025
20
15105
C.
^10200y x =-- D.^
10200y x =-
以朴素的题材为背景,让学生感受线性回归的意义,变量之间的变化趋势. 【思路点拨】负相关说明斜率为负,而价格为0时,销量不能为负。
【标准解答】∵商品销售量y 〔件〕与销售价格x 〔元/件〕负相关,∴∵x=0时,y>0,∴答案为A.
【方法技巧】回归问题主要研究变量之间的相关性,变化趋势,分为正相关和负相关,线性相关不是研究变量之间确实定性,而是相关性,即有关联.求斜率和截距常用给定的公式.
7.〔2021·高考·T4〕某棉纺厂为了理解一批棉花的质量,从中随机抽测了100根棉花纤维的长度〔棉花纤维的长度是棉花质量的重要指标〕,所得数据均在区间[5,40]中,其频率分布直方图如下列图,那么在抽测的100根中,有_____________根棉花纤维的长度小于20mm 。
此题考察频率分布直方图及其相关知识.
【思路点拨】频率分布直方图的纵坐标为频率/组距,小矩形的面积为相应数据所占的频率。
【标准解答】由频率分布直方图观察得,棉花纤维的长度小于20mm 的根数为 100×〔0.001+0.001+0.004〕×5=30. 【参考答案】30
【方法技巧】对于统计图表问题,求解时,最重要的就是认真观察图表,从中发现有用的信息和数据.对于频率分布直方图,应注意的是图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积之和为1,当有两个小矩形的高相等时,说明数据落在这两个区间上的频率相等,在进展计算时,不能漏掉其中的任何一个. 8.〔2021·高考文科·T11〕在如下列图的茎叶图中,甲、乙两组数据的中位数分别是、
此题主要考察了茎叶图所表达的含义,以及从样本数据中提取数字特征的才能,属容易题。
【思路点拨】把甲、乙两组数据从小到大排序后,找位于中间的数或者中间两数的平均数。
【标准解答】甲位于中间的数是45,把乙的数据排序后,位于中间的数是46。
【参考答案】45;46.
9.〔2021·高考文科·T14〕将容量为n 的样本中的数据分成6组,绘制频率分布直方图。
假设第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,那么n 等于。
8 91 25
9 45 826
2 3 4
甲乙
此题考察频率分布直方图中频数与频率的关系。
【思路点拨】频率之比即为频数之比,按比例设六组的频数,可解。
【
标
准
解
答
】
设
第
一
组
到
第
六
组
的
频
数
分
别
为
2a,3a,4a,6a,4a,a
,
2a 3a 4a 27,a 3,∴++=∴=2a 3a 4a 6a 4a a 20a 60∴+++++==。
【参考答案】60.
10.〔2021·高考理科·T11〕从某随机抽取100名同学,将他们的身高〔单位:厘米〕数据绘制成频率分布直方图〔如图〕。
由图中数据可知a =。
假设要从身高在[120,130〕,[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参
加一项活动,那么从身高在[140,150]内的学生中选取的人数应为。
此题考察频率公布直方图,抽样方法中的分层抽样。
纯熟掌握频率公布直方图的性质,分层抽样的原理是解决此题的关键。
【思路点拨】利用各矩形的面积之和为1可解出a 。
分层抽样时,选算出身
高在[140,150]内的学生在三组学生中所占比例,再从18人中抽取相应比例的人数。
【标准解答】各矩形的面积和为:0.005100.03510100.02010
a ⨯+⨯+⨯+⨯0.010101+⨯=,解得0.030a =。
身高在[120,130〕,[130,140),[140,150]三组内的学生人数分别为:30、20、10,人数的比为3:2:1,因此从身高在[140,150]内的学生中选取的人数应为181
6
⨯=3人。
【参考答案】0.0303。
11.〔2021·高考文科·T12〕某居民2021~2021年家庭年平均收入x 〔单位:万元〕与年平均支出Y 〔单位:万元〕的统计资料如下表所示:
根据统计资料,居民家庭年平均收入的中位数是,家庭年平均收入与年平均支出有_________线性相关关系. 此题考察统计中根本特征量的意义以及变量间的关系.
【思路点拨】按大小排列出收入数据的顺序,找出中间的那个数据.
【标准解答】收入数据按大小排列为:11.5、12.1、13、13.3、15,所以中位数为13. 【参考答案】13正向.
12.〔2021·高考文科·T14〕某地有居民100000户,其中普通家庭99000户,高收入家庭1000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取l00户进展调查,发现一共有120户家庭拥有3套或者3套以上住房,其中普通家庭50户,高收人家庭70户.根据这些数据并结合所掌握的统计知识,你认为该地拥有3套或者3套以上住房的家庭所占比例的合理估计是.
此题主要考察分层抽样原理,考察考生用样本估计总体的根本思想。
【思路点拨】根据分层抽样原理,分别估计普通家庭和高收入家庭拥有3套或者3套以上住房的户数,
进而得出100000户居民中拥有3套或者3套以上住房的户数,用它除以100000即可得到结果。
【标准解答】该地拥有3套或者3套以上住房的家庭估计约有:
50709900010005700990100
⨯
+⨯=户, 所以所占比例的合理估计约是5700100000 5.7%÷=. 【参考答案】5.7%
13.〔2021·高考理科·T19〕为理解学生身高情况,某校以10%的比例对全校700名学生按性别进展分层抽样调查,测得身高情况的统计图如下: 〔Ⅰ〕估计该校男生的人数;
〔Ⅱ〕估计该校学生身高在170~185cm 之间的概率;
〔Ⅲ〕从样本中身高在165~180cm 之间的女生中任选2人,求至少有1人身高在170~180cm 之间的概率。
此题考察了分层抽样的概念、条形图的识别、概率的简单求法等根底知识,考察了同学们利用所学知识解决实际问题的才能。
【思路点拨】读懂频数条形图是解题的关键
【标准解答】〔Ⅰ〕样本中男生人数为40,由分层抽样比例为10%估计全校男生人数为400。
〔Ⅱ〕由统计图知,样本中身高在170~185cm 之间的学生有14+13+4+3+1=35人,样本容量为70,所以样本生身高在170~
185cm 之间的频率
35
0.5,70
f =
=故由f 估计该校学生身高在170~180cm 之间的概率
0.5.p =
〔Ⅲ〕样本中女生身高在165~180cm 之间的人数为10,身高在170~180cm 之间的人数为4。
设A 表示事件“从样本中身高在165~180cm 之间的女生中任选2人,至少有1人身高在170~180cm 之间〞,那么
2112
664422
101022
()1(()).33
C C C C P A P A C C +=-===或 14.〔2021·高考文科·T19〕为理解学生身高情况,某校以10%的比例对全校700名学生按性别进展分层抽样调查,测得身高情况的统计图如下:
〔Ⅰ〕估计该校男生的人数;
〔Ⅱ〕估计该校学生身高在170~185cm 之间的概率;
〔Ⅲ〕从样本中身高在180~190cm 之间的男生中任选2人,求至少有1人身高在185~190cm 之间的概率。
【思路点拨】读懂频数条形图是解题的关键 【标准解答】〔Ⅰ〕〔Ⅱ〕同理科
〔Ⅲ〕样本中身高在180~185cm 之间的男生有4人,设其编号为①,②,③,④,样本中身高 185~190cm 之间的男生有2人,设其编号为⑤,⑥ 从上述6人中任取2人的树状图为:
故从样本中身高在180~190cm之间的6名男生中任选2人的所有可能结果数为15,至少有1人身高在
185~190cm之间的可能结果数为9,因此,所求概率
93
.
155 P==
15.〔2021·高考文科·T18〕为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B的试验结果.〔疱疹面积单位:mm2〕
表1:注射药物A后皮肤疱疹面积的频数分布表
〔Ⅱ〕完成下面2×2列联表,并答复能否有%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异〞.
表3
附:K2=
2
()
()()()()
n ad bc
a b c d a c b d
-
++++
【思路点拨】〔I〕根据频率分布直方图,估计中位的范围,比较中位数的大小。
〔II〕将各数据代入公式计算,比较2
K
【标准解答】〔I〕
可以看出注射药物A后的疱疹面的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后的疱疹面积的中位数小于注射药物B后疱疹面积的中位数。
〔II〕
所以有99%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异〞。
由于K10.828,
【方法技巧】
1、在做频率分布直方图时,一定要注意,小长方形的高表示的是频率与组距的比,不要当成了频率。
2、根据频率分布直方图确定中位所在的大致区间,就是在直方图中做一条垂直于横轴的直线,使直线两侧的小长方形的面积大致相等,那么直线的垂足所在区间就是中位数所在的区间。
3、P(K2“指注射药物A后的疱疹面积于注射药物B后的疱疹面积没有差异〞的概率,所以有关的概率是1-P(K2>10.828)=9%。
16.〔2021·高考理科·T18〕为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B。
〔Ⅰ〕甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率;
〔Ⅱ〕下表1和表2分别是注射药物A和B后的试验结果.〔疱疹面积单位:mm2〕表1:注射药物A后皮
肤疱疹面积的频数分布表
〔ⅱ〕完成下面2×2列联表,并答复能否有9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异〞.
表3
附:K 2
=
2
()()()()()n ad bc a b c d a c b d -++++
此题考察了古典概型、频率分布直方图、HY 性检验等知识。
【思路点拨】〔I 〕
〔II 〕计算小长方形的高,作图
【标准解答】解:
〔Ⅰ〕甲、乙两只家兔分在不同组的概率为
99
1981002002100
199
C P C ==
……4分 〔Ⅱ〕〔i 〕
图Ⅰ注射药物A 后皮肤疱疹面积的频率分布直方图图Ⅱ注射药物B 后皮肤疱疹面积的频率分布直方图
可以看出注射药物A 后的疱疹面积的中位数在65至70之间,而注射药物B 后的疱疹面积的中位数在70至75之间,所以注射药物A 后疱疹面积的中位数小于注射药物B 后疱疹面积的中位数。
〔ii 〕表3:
由于K 2
>10.828,所以有9%的把握认为“注射药物A 后的疱疹面积于注射药物B 后的疱疹面积有差异〞。
【方法技巧】
1、在频率分布直方图中,小长方形的高是频率与组距的比值,不要当成了频率。
2、根据频率分布直方图确定中位所在的大致区间,就是在直方图中做一条垂直于横轴的直线,使直线两侧的小长方形的面积大致相等,那么直线的垂足所在区间就是中位数所在的区间。
3、P(K 2
“指注射药物A 后的疱疹面积于注射药物B 后的疱疹面积没有差异〞的概率,所以有关的概率是1-P(K 2
>10.828)=9%
17.〔2021·高考理科·T17〕某食品厂为了检查一条自动包装流水线的消费情况,随即抽取该流水线上40件产品作为样本算出他们的重量〔单位:克〕重量的分组区间为〔490,]495,〔495,]500,……〔510,]
515,由此得到样本的频率分布直方图,如图4所示。
(1) 根据频率分布直方图,求重量超过505克的产品数量;
(2) 在上述抽取的40件产品中任取2件,设Y 为重量超过505克的产品数量,求Y 的分布列; (3) 从流水线上任取5件产品,求恰有2件产品合格的重量超过505克的概率。
此题考察统计中的频率分布直方图的意义、随机变量的分布列以及概率中古典概型的计算. 【思路点拨】直方图中小矩形的面积等于样本在该范围的频率.
【标准解答】〔1〕重量超过505克的产品分布在最右边的两个直方内,由频率分布直方图得其数量为:
40(0.0550.015)400.312⨯⨯+⨯=⨯=件.
〔2〕Y 的所有可能取值为0、1、2.
其中228240378(0)780C P Y C ===,112812240336(1)780C C P Y C ⋅===,2
122
4066
(2)780
C P Y C === 所以,Y 的分布列为
从流水线上任取5件产品,恰有2件产品合格的重量超过505克的概率为:
【方法技巧】求随机变量的分布列,首先要明确变量的所有可能取值,在计算相应的概率.
18.〔2021·高考文科·T17〕某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
〔1〕由表中数据直观分析,收看新闻节目的观众是否与年龄有关
〔2〕用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名 〔3〕在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率. 此题是一道应用题,主要考察统计的意义以及分层抽样的方法和概率的根本计算. 【思路点拨】在计算概率是,要列出所有根本领件,从而求解. 【标准解答】解:〔1〕假设收看新闻节目的观众与年龄无关,那么
18275842=,即99
2914
=,这是矛盾的,所以收看新闻节目的观众与年龄有关.
〔2〕设应该抽取大于40岁的观众x 名,那么有:5
2745
x =,解得 3.x = 所以大于40岁的观众应该抽取3名.
〔3〕设所抽取的5名观众中,a 、b 两人为20至40岁;C 、D 、E 三人为40岁以上,从中任抽取2人,所有抽法有:
ab 、aC 、aD 、aE 、bC 、bD 、bE 、CD 、CE 、DE 一共10种,其中恰有1名观众的年龄为20至40岁的
抽法有aC 、aD 、aE 、bC 、bD 、bE 一共6种,所以恰有1名观众的年龄为20至40岁的概率为:63.105
= 【方法技巧】在计算根本领件数时,可用字母把根本领件一一列出.
19.〔2021·高考文科·T18〕某2010年4月1日—4月30日对空气污染指数的监测数据如下〔主要污染物为可吸入颗粒物〕:
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,
77,86,81,83,82,82,64,79,86,85,75,71,49,45,
(Ⅰ)完成频率分布表;
〔Ⅱ〕作出频率分布直方图;
〔Ⅲ〕根据国家HY,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为细微污染;在151~200之间时,为轻度污染。
请你根据所给数据和上述HY,对该的空气质量给出一个简短评价.
此题主要考察频率分布直方图,用样本估计总体的思想,考察学生运用统计知识解决简单实际问题的才能,数据处理才能和应用意识.。
【思路点拨】首先根据题目中的数据完成频率分布表,作出频率分布直方图,根据污染指数,确定空气质量为优、良、细微污染、轻度污染的天数。
【标准解答】
(Ⅲ)答对下述两条中的一条即可:
(1)该一个月中空气污染指数有2天处于优的程度,占当月天数的
1
15
,有26天处于良的程度,占当月天数的
13
15
,处
于优或者良的天数一共有28天,占当月天数的14
15。
说明该空气质量根本良好。
(2)细微污染有2天,占当月天数的
1
15。
污染指数在80以上的接近细微污染的天数有15天,加上处于细微污染的天
数,一共有17天,占当月天数的17
30
,超过50%,说明该空气质量有待进一步改善。
【方法技巧】1在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量;
2在频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率;
3对于开放性问题的答复,要选择适当的数据特征进展考察,根据数据特征分析得出实际问题的结论。
20.〔2021
•高考•理科T19〕为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
〔Ⅰ)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
〔Ⅱ〕能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
〔Ⅲ〕根据〔Ⅱ〕的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.
此题重点考察了统计中HY性检验的相关知识,要求学生可以纯熟的利用图表中的数据来进展分析,进而得出相应的结论.
【思路点拨】利用古典概型的计算公式以及列联表的相关知识求解.
【标准解答】〔Ⅰ)调查的500位老年人中有70为需要志愿者提供帮助,因此在该地区老年人中,需要帮助的老年人的比例
的估计值为70
14% 500
=.
〔Ⅱ〕
2
2
500(4027030160)
9.967
20030070430
K
⨯⨯-⨯
=≈
⨯⨯⨯
因为9.967 6.635
>,所以有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关.
〔Ⅲ〕根据〔Ⅱ〕的结论可知,该地区的老年人是否需要志愿者提供帮助与性别有关,并且从样本数据可以看出该地区男性老年人与女性老年人中需要帮助的比列有明显差异,因此在调查时,先确定该地区老年人中男女的比例,在把老年人分成男女两层,并采用分层抽样方法比简单随机抽样方法更好.。