2019届一轮复习北师大版统计与统计案例学案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第20练 统计与统计案例
[明考情]
统计中的抽样方法、统计图表、样本估计总体,少数年份考查,形式为选择、填空题,中低档难度. [知考向] 1.随机抽样.
2.统计图表和样本数字特征.
3.统计案例.
考点一 随机抽样
要点重组 简单随机抽样的特点是逐个抽取,适用于总体个数较少情况;系统抽样也称等距抽样,适用总体个数较多情况;分层抽样一定要注意按比例抽取,总体由差异明显的几部分组成.
1.某 校有男 生400名,女 生600名.为了解男、女 生在 习兴趣与业余爱好方面是否存在显著差异,拟从全体 生中抽取男 生40名,女 生60名进行调查,则这种抽样方法是( ) A.抽签法B.随机数法C.系统抽样法D.分层抽样法 答案 D
解析 由题意知,样本和总体中男、女生的比例都是2∶3,所以这种抽样方法为分层抽样. 2.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C ,则抽到的人中,做问卷B 的人数为( ) A.15B.7C.9D.10 答案 D
解析 按系统抽样的规则应把总体分成32组,每组30人,即抽样的间隔为30.因为45030=15,
所以做问卷A 的有15人;因为750
30=25,所以做问卷B 的有25-15=10(人).故选D.
3.(2017·长沙模拟)某林场有树苗30000棵,其中松树苗4000棵,为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A.20B.15C.25D.30 答案 A
解析 根据分层抽样的定义可得样本中松树苗的数量为4000
30000
×150=20.
4.(2017·烟台模拟)用0,1,2,…,299给300名 生编号,并用系统抽样的方法从中抽取15名 生的数 成绩进行质量分析,若从第一组抽取的 生的编号为8,则从第三组抽取的 生编号为( ) A.20B.28C.40D.48 答案 D
解析 ∵是从300名 生中抽取15个样本, ∴组距是20,
∵第一组抽取的 生的编号为8, ∴第三组抽取的 生编号为8+40=48.
5.(2017·宝山区一模)某中 的高一、高二、高三共有 生1350人,其中高一500人,高三比高二少50人,为了解该校 生健康状况,现采用分层抽样方法进行调查,在抽取的样本中有高一 生120人,则该样本中的高二 生人数为( ) A.80B.96C.108D.110 答案 C
解析 设高二有x 人,则x +x -50+500=1350,x =450, 所以高一、高二、高三的人数分别为500,450,400. 因为120500=625,所以高二 生抽取人数为450×6
25=108.
考点二 统计图表和样本数字特征 方法技巧
1.由频率分布直方图进行相关计算时,需掌握关系式:频数样本容量=频率,此关系式的变形为
频数
频率
=样本容量,样本容量×频率=频数. 2.总体估计的方法:用样本的数字特征估计总体的数字特征.
3.图表判断法:若根据统计图表比较样本数据的大小,可根据数据的分布情况直观分析,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小.
6.(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是()
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
答案 A
解析对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错误;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;
对于选项C,D,由图可知显然正确.
故选A.
7.从向阳小区抽取100户居民进行月用电量调查,为制定阶梯电价提供数据,发现其用电量都在50到350度之间,制作频率分布直方图的工作人员粗心大意,位置t处未标明数据,你认为t等于()
A.0.0041
B.0.0042
C.0.0043
D.0.0044
答案 D
解析由题意得,50×(0.006+t+0.0036+0.0024×2+0.0012)=1,
t=0.0044.
8.(2016·山东)某高校调查了200名生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图知,这200名生中每周的自习时间不少于22.5小时的人数是()
A.56
B.60
C.120
D.140
答案 D
解析由题图知,组距为2.5,故每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,
∴这200名生中每周的自习时间不少于22.5小时的人数是200×0.7=140,故选D.
9.(2017·全国Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()
A.x1,x2,…,x n的平均数
B.x1,x2,…,x n的标准差
C.x1,x2,…,x n的最大值
D.x1,x2,…,x n的中位数
答案 B
解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.
故选B.
10.(2017·哈师大附中、东北师大附中、辽宁实验联考)检测600个某产品的质量(单位:g),得到的直方图中,前三组的长方形的高度成等差数列,后三组所对应的长方形的高度成公比为0.5的等比数列,已知检测的质量在100.5~105.5之间的产品数为150,则质量在115.5~120.5的长方形高度为()
A.1
12B.1
30C.1
6D.
1
60
答案 D
解析由题设质量在100.5~105.5之间的产品的频率为150
600=
1
4,设质量在105.5~110.5之间
的产品的频率为h,则质量在95.5~100.5之间的产品的频率为2×1
4-h=
1
2-h,质量在
110.5~115.5之间与质量在115.5~120.5之间的产品的频率分别为12h ,1
4h ,故由频率的性质
可知,12-h +14+h +12h +14h =1,解得h =13,所以质量在115.5~120.5的长方形高度为13×
14×15=160
. 考点三 统计案例
方法技巧 (1)线性回归方程问题的两个要点:样本点的中心在回归直线上;由线性回归方程求出的数值是估计值.
(2)独立性检验的关键在于准确求出K 2值,然后对比临界值表中的数据,然后下结论. 11.(2017·宁德一模)从某大 随机抽取的5名女大 生的身高x (厘米)和体重y (公斤)数据如表:
根据上表可得线性回归方程为y ^
=0.92x +a ^
,则a ^
等于( ) A.-96.8B.96.8C.-104.4D.104.4 答案 A
解析 由表中数据可得x =165,y =55, ∵(x ,y )一定在线性回归方程y ^
=0.92x +a ^
上, ∴55=0.92×165+a ^
, 解得a ^
=-96.8.
12.已知变量x ,y 呈线性相关关系,回归方程为y ^
=1-2x ,则变量x ,y 是( ) A.线性正相关关系 B.由回归方程无法判断其正负相关关系 C.线性负相关关系 D.不存在线性相关关系
答案 C
解析 根据变量x ,y 的线性回归方程是y ^
=1-2x , 回归系数b ^
=-2<0,
所以变量x ,y 是线性负相关关系.
13.(2017·南昌一模)设某中 的高中女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,3,…,n ),用最小二乘法近似得到线性回归方程为y ^
=0.85x -85.71,则下列结论中不正确的是( ) A.y 与x 具有正的线性相关关系 B.回归直线过样本点的中心(x ,y )
C.若该中 某高中女生身高增加1cm ,则其体重约增加0.85kg
D.若该中 某高中女生身高为160cm ,则可断定其体重必为50.29kg 答案 D
解析 由于线性回归方程中x 的系数为0.85,因此y 与x 具有正的线性相关关系,A 正确; 由线性回归方程必过样本点中心(x ,y )知,B 正确;
由线性回归方程中系数的意义知,x 每增加1cm ,其体重约增加0.85kg ,C 正确; 当某女生的身高为160cm 时,其体重估计值是50.29kg ,而不是具体值,因此D 错误.故选D.
14.通过随机询问110名 生是否爱好打篮球,得到如下的2×2列联表:
附:K 2=
n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
,其中n =a +b +c +d .
参照附表,正确的结论是( )
A.在犯错误的概率不超过0.1 的前提下,认为“爱好打篮球与性别无关”
B.在犯错误的概率不超过0.1 的前提下,认为“爱好打篮球与性别有关”
C.有99 以上的把握认为“爱好打篮球与性别无关”
D.有99 以上的把握认为“爱好打篮球与性别有关” 答案 D 解析 因为
K 2=
110×(40×30-20×20)2
60×50×60×50
≈7.8>6.635,所以在犯错误的概率不超过1 的前
提下,即有99 以上的把握认为“爱好打篮球与性别有关”.
15.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁.为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:
附表:
P (K 2≥k 0)
0.10 0.05 0.025 k 0
2.706
3.841
5.024
参照附表,在犯错误的概率不超过________(填百分比)的前提下,认为“小鼠是否被感染与服用疫苗有关”. 答案 5 解析
K 2=
100(10×30-20×40)2
30×70×50×50
≈4.762>3.841,所以在犯错误的概率不超过5 的前提下,
认为“小鼠是否被感染与服用疫苗有关”.
1.为了保证乘客的安全,某市要对该市出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果,得出司机年龄情况的残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )
A.32
B.33
C.34
D.37 答案 C
解析 根据直方图的性质,[25,30)岁对应的频率为1-(0.01×5+0.07×5+0.06×5+0.02×5)=0.2.
∵中位数处左右频率各占0.5,易知中位数在30~35之间, 设中位数为x ,则0.25+0.07(x -30)=0.5, ∴x ≈33.6,∴中位数大约是34.
2.(2017·北京海淀区模拟)中国诗词大会节目是央视首档全民参与的诗词节目,节目以“赏中华诗词、寻文化基因、品生活之美”为基本宗旨,力求通过对诗词知识的比拼及赏析,带动全民重温那些曾经 过的古诗词,分享诗词之美,感受诗词之趣,从古人的智慧和情怀中汲取营养,涵养心灵.如图是2016年中国诗词大会中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a 1,a 2,则一定有( )
A.a 1>a 2
B.a 2>a 1
C.a 1=a 2
D.a 1,a 2的大小与m 的值有关
答案 B
解析 由茎叶图知,
a 1=80+1+5+5+4+5
5=84,
a 2=80+4+4+6+4+7
5=85,
故选B.
解题秘籍 (1)在频率分布直方图中:
①最高的小长方形底边中点的横坐标即是众数; ②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
(2)茎叶图的特点是保留了完整的原始数据,根据茎叶图就可以得到数据的所有数字特征.求解茎叶图问题需注意:重复出现的数字应该按原次数写入叶子部位,不能只写入一次.
1.(2017·湖北黄冈质检)已知数据x 1,x 2,x 3,…,x n 是某市n (n ≥3,n ∈N *)个普通职工的年收入,设这n 个数据的中位数为x ,平均数为y ,方差为 ,如果再加上世界首富的年收入x n +1,则这n +1个数据中,下列说法正确的是( ) A.年收入平均数可能不变,中位数可能不变,方差可能不变 B.年收入平均数大大增大,中位数可能不变,方差变大 C.年收入平均数大大增大,中位数可能不变,方差也不变 D.年收入平均数大大增大,中位数一定变大,方差可能不变 答案 B
解析 ∵数据x 1,x 2,x 3,…,x n 是某市普通职工n (n ≥3,n ∈N *)个人的年收入,而x n +1为世界首富的年收入,则x n +1会远大于x 1,x 2,x 3,…,x n ,故这n +1个数据中,年收入平均数大大增大,但中位数可能不变,也可能稍微变大,但由于数据的集中程度也受到x n +1比较大的影响,而更加离散,则方差变大.
2.(2017·中卫二模)某市教育主管部门为了全面了解2017届高三 生的 习情况,决定对该市参加2017年高三第一次全国大联考统考(后称统考)的32所 校进行抽样调查,将参加统考
的32所 校进行编号,依次为1到32,现用系统抽样法,抽取8所 校进行调查,若抽到的最大编号为31,则最小的编号是( ) A.2B.1C.4D.3 答案 D
解析 根据系统抽样法,总体分成8组,组距为32
8=4,
若抽到的最大编号为31,则最小的编号为3.
3.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N ,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N 为( ) A.101 B.808 C.1212 D.2012
答案 B
解析 由题意知,抽样比为1296,而四个社区一共抽取的驾驶员人数为12+21+25+43=101,
故有1296=101
N
,解得N =808.
4.某 校教务处采用系统抽样方法,从 校高三年级全体1000名 生中抽50名 生做 习状况问卷调查.现将1000名 生从1到1000进行编号,求得间隔数k =20,即分50组,每组20人.在第1组中随机抽取一个号,如果抽到的是17号,则第8组中应抽取的号码是( ) A.177 B.157 C.417 D.367 答案 B
解析 根据系统抽样法的特点,可知抽取的号码为首项为17,公差为20的等差数列,所以第8组应抽取的号码是17+(8-1)×20=157.
5.某市8所中 生参加比赛的得分茎叶图如图所示,其中茎为十位数,叶为个位数,则这组数据的平均数和方差分别是( )
A.91,5.5
B.91,5
C.92,5.5
D.92,5
答案 A
解析 把茎叶图中的数据按由小到大的顺序排列,如下: 87,88,90,91,92,93,93,94.
平均数是1
8×(87+88+90+91+92+93+93+94)=91,
s 2=1
8
×[(87-91)2+(88-91)2+(90-91)2+…+(94-91)2]=5.5.
6.(2016·全国Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15℃,B 点表示四月的平均最低气温约为5℃.下面叙述不正确的是( )
A.各月的平均最低气温都在0℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20℃的月份有5个 答案 D
解析 由题意知,平均最高气温高于20℃的有七月,八月,故选D.
7.从某小 随机抽取100名同 ,将他们的身高(单位:厘米)数据绘制成频率分布直方图,如图所示,由图中数据可知,身高在[120,130)内的 生人数为( )
A.20
B.25
C.30
D.35 答案 C
解析 由图可知,(0.035+a +0.020+0.010+0.005)×10=1,解得a =0.03,所以身高在[120,130)内的 生人数在样本中的频率为0.03×10=0.3,所以身高在[120,130)内的 生人数为0.3×100=30.故选C.
8.(2017·唐山二模)如图是八位同 400米测试成绩的茎叶图(单位:秒),则( )
A.平均数为64
B.众数为7
C.极差为17
D.中位数为64.5
答案 D
解析 由茎叶图可知,该组数据为58,59,61,62,67,67,70,76,平均数为58+59+61+62+67+67+70+768=65,众数为67,极差为76-58=18,中位数为62+672=64.5,故选D.
9.(2017·永州二模)实验测得四组数对(x ,y )的值为(1,2),(2,5),(4,7),(5,10),则y 与x 之间的线性回归方程可能是( )
A.y ^=x +3
B.y ^
=x +4 C.y ^=2x +3
D.y ^=2x +4 答案 A
解析 由题意可知,x =3,y =6,线性回归方程经过点(3,6).
代入选项,A 符合.
10.(2017·山东)为了研究某班 生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名 生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其线性回归方程为y ^=b ^x +a ^.已知∑10i =1
x i =225,∑10i =1y i =1600,b ^=4.该班某 生的脚长为24,据此估计其身高为( )
A.160
B.163
C.166
D.170
答案 C
解析 ∵∑10i =1x i =225,∴x =110∑10i =1x i =22.5. ∵∑10
i =1y i =1600,∴y =110∑10i =1y i =160. 又b ^=4,∴a ^=y -b ^x =160-4×22.5=70.
∴线性回归方程为y ^=4x +70.
将x =24代入上式,得y ^=4×24+70=166.故选C.
11.在一次百米测试中,某年级120名 生成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的 生人数是________.
答案 54
解析 成绩在[16,18]的 生人数所占比例为6+31+3+7+6+3=920
, 所以成绩在[16,18]的 生人数为120×920
=54. 12.某校为了研究 生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K 2=7.069,则所得到的统计 结论是:有______的把握认为“ 生性别与支持该活动有关系.”
附: P (K 2≥k 0)
0.100 0.050 0.025 0.010 0.001 k 0
2.706
3.841 5.024 6.635 10.828
答案 99
解析 因为7.069>6.635,所以得到的统计 结论是:有1-0.010=0.99=99 的把握认为“ 生性别与支持该活动有关系”.。