专题五 第1讲 统计与统计案例(解析版)
统计案例(精讲)(提升版)(原卷版)
8.5 统计案例(精讲)(提升版)思维导图
考点一独立性检验
【例1】(2022·吉林·梅河口市第五中学高三开学考试)某中学准备组建“文科”兴趣特长社团,由课外活动小组对高一学生进行了问卷调查,问卷共100道题,每题1分,总分100分,该课外活动小组随机抽取了100名学生的问卷成绩(单位:分)进行统计,将数据按照[0,20),[20,40),[40,60),[60,80),[80,100]分成5组,绘制的频率分布直方图如图所示,若将不低于60分的称为“文科方向”学生,低于60分的称为“理科方向”学生.
(1)根据已知条件完成下面2×2列联表,并据此判断是否有99.5%的把握认为“文科方向”与性别有关?
理科方向文科方向总计
男40
女45
考点呈现
例题剖析
总计 100
1人,共抽取4次,记被抽取的4人中“文科方向”的人数为X ,若每次抽取的结果是相互独立的,求X 的分布列和数学期望.
参考公式:()()()()
22
()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.
参考临界值:
()
2P k αχ=
0.10 0.05 0.025 0.010 0.005 0.001
k
2.706
3.841 5.024 6.635 7.879 10.828
【一隅三反】
1.(2022·白山模拟)十三届全国人大四次会议表决通过了关于国民经济和社会发展第十四个五年规划和2035年远景目标纲要的决议,决定批准这个规划纲要,纲要指出:“加强原创性引领性科技攻关”.某企业集中科研骨干,攻克系列“卡脖子”技术,已成功实现离子注入机全谱系产品国产化,包括中束流、大束流、高能、特种应用及第三代半导体等离子注入机,
数学高考复习统计与统计案例专题训练(含答案)
数学高考复习统计与统计案例专题训练(含答
案)
统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。以下是数学高考复习统计与统计案例专题训练,请考生掌握。
一、选择题
1.(山西省重点中学第三次四校联考)已知x、y的取值如下表所示:
x 0 1 3 4 y 0.9 1.9 3.2 4.4 从散点图分析,y与x线性相关,且=0.8x+a,则a=()
A.0.8
B.1
C.1.2
D.1.5
[答案] B
[解析] ==2,==2.6,
又因为回归直线=0.8x+a过样本中心点(2,2.6)
所以2.6=0.82+a,解得a=1.
2.(文)(豫东、豫北十所名校联考)某厂生产A、B、C三种型号的产品,产品数量之比为32∶4,现用分层抽样的方法抽取一个样本容量为180的样本,则样本中B型号的产品的数量为()
A.20
B.40
C.60
D.80
[答案] B
[解析] 由分层抽样的定义知,B型号产品应抽取180=40件.
(理)(济南模拟)某全日制大学共有学生5600人,其中专科生有1300人,本科生有3000人,研究生1300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则应在专科生,本科生与研究生这三类学生中分别抽取()
A.65人,150人,65人
B.30人,150人,100人
C.93人,94人,93人
D.80人,120人,80人
[答案] A
[解析] =,1300=65,3000=150,故选A.
3.(文)(新乡、许昌、平顶山二调)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{an}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为()
新教材2024高考数学二轮专题复习分册一专题五统计与概率课件
800
表一
表二
试根据小概率值 α=0.005 的独立性检验,分析物理和生物选课与性别是否有关(
)
n(ad-bc)2
附:χ =
,
(a+b)(c+d)(a+c)(b+d)
2
n=a+b+c+d.α=P(χ2≥xα)
α
0.15
0.10
0.05
0.025
0.01
0.005
0.001
xα
2.072
2.706
3.841
参考数据:
A.12
答案:C
B.18
α
0.10
0.05
0.025
0.010
xα
2.706
3.841
5.024
6.635
C.36
D.48
技法领悟
1.求经验回归方程的关键
^
^
(1)正确理解b ,a 的计算公式并能准确地进行运算.
(2)根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关
2
2
D.若 R1 >R2 ,则第二组变量比第一组变量拟合的效果好
答案:B
解析:线性相关系数|r|越大,两个变量的线性相关性越强,故A错误,B正确;
残差平方和S2越小,则决定系数R2越大,从而两个变量拟合的效果越好,
残差平方和S2越大,则决定系数R2越小,从而两个变量拟合的效果越差,故C、D
2023年新高考数学大一轮复习专题五概率与统计第1讲统计与统计案例(含答案)
新高考数学大一轮复习专题:
第1讲 统计与统计案例
[考情分析] 高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体,线性回归方程的求解与运用,独立性检验问题.常与概率综合考查,中等难度. 考点一 统计图表 核心提炼
1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率
组距.
2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数. 频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
例1 (1)(多选)(2020·新高考全国Ⅱ)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( )
A .这11天复工指数和复产指数均逐日增加
B .这11天期间,复产指数增量大于复工指数的增量
C .第3天至第11天复工复产指数均增大都超过80%
D .第9天至第11天复产指数增量大于复工指数的增量 答案 CD
(2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:
将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确的是( ) A.抽样表明,该校约有一半学生为阅读霸
B.该校只有50名学生不喜欢阅读
C.该校只有50名学生喜欢阅读
统计学相关案例解析
n
10
置信上限:x t0.025
S 791.1 2.262 17.136 803.3(6 克)
n
10
∴ 有95%的把握这批食品的平均每袋重 量在778.84克到803.36克之间。
例4.某制造厂质量管理部门的负责人希望估计移交给
接收部门的5500包原材料的平均重量。一个由250包
原材料组成的随机样本所给出的平均值 x 65千克 。
x 27,y 380,lxy 985.5,lxx 101.2,l yy 12995。试求:
(1)相关系数 r ;
(2) y 对的 x 线性回归方程。
解:(1) r lxy
985.5
0.86。
lxxlyy 101.2 12995
(2)
∵
ˆ1
lxy lxx
985.5 101.2
9.74,
另1994年末全国总人口为119850万人。 计算:(1)“九五”时期我国年人均国内生产总值;
(2)“九五”时期人均国内生产总值平均每年 的增长速度。
解:(1) “九五”时期平均年人均国内生产总值:
35% 65% 39.18%。 500
即有95%的概率可以认为喜欢这一专题的 观众在30.82%到39.18%之间。
例3.某商场从一批袋装食品中随机抽取10袋,测得每 袋重量(单位:克),计算出 x 791.1, S 17.136 ,假 设重量服从正态分布,要求在5%的显著性水平下,求这 批食品的平均每袋重量的置信区间。已知Z0.05 1.645,
赢在微点高考二轮数学·理科复习课件2-5-1
A.19 C.15
第14页
B.110 D.18
返回导航
赢在微点 无微不至
考前顶层设计·数学理·教案
5x,x=18,19, 解析 由题意知 y=95+x-194-3,x=20,21,
5x,x=18,19, 即 y=76+x,x=20,21。 当日销量不少于 20 个时,日利润不少于 96 元。 当日销量为 20 个时,日利润为 96 元,当日销量为 21 个时,日利润为 97 元, 日利润为 96 元的有 3 天,日利润为 97 元的有 2 天,故所求概率为CC5222=110。故 选 B。
答案 C
第23页
返回导航
赢在微点 无微不至
考前顶层设计·数学理·教案
平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们 所反映的情况有着重要的实际意义。平均数、中位数、众数描述数据的集 中趋势,方差和标准差描述数据的波动大小。
第24页
返回导航
赢在微点 无微不至
考前顶层设计·数学理·教案
解析 由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确。男 生平均每天锻炼时间超过 65 分钟的概率 P1=150=12,女生平均每天锻炼时间超 过 65 分钟的概率 P2=140=25,P1>P2,因此④正确。设男生、女生两组数据的 平均数分别为 x 甲, x 乙,标准差分别为 s 甲,s 乙。易求 x 甲=65.2, x 乙=61.8,知 x 甲> x 乙,②正确。又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散, 所以 s 甲<s 乙,③错误,因此符合茎叶图所给数据的结论是①②④。故选 C。
第1讲 统计与统计案例
1
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
第1讲 统计与统计案例
2
真题感悟 考点整合
热点聚焦 分类突破
@《创新设计》
高考定位 1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要 以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率、回 归分析与概率是近年命题的热点,2018年、2019年和2020年在解答题中均有考查.
增加.为调查该地区某种野生动物的数量,将其分成面积相近的 200 个地块,从这些
地块中用简单随机抽样的方法抽取 20 个作为样区,调查得到样本数据(xi,yi)(i=1,
2,…,20),其中 xi 和 yi 分别表示第 i 个样区的植物覆盖面积(单位:公顷)和这种野
20
20
20
生动物的数量,并计算得∑ i=1xi=60,i∑=1yi=1
为 60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数 r=
20
∑
i=1
ቤተ መጻሕፍቲ ባይዱ
(xi--x)(yi--y)
20
∑
i=1
(xi--x)2∑ i2=01
(yi--y)2
=
800 80×9
=2 000
3
2≈0.94.
2023版高考数学二轮总复习第2篇经典专题突破核心素养提升专题4统计与概率第1讲统计与统计案例课件
一半学生为阅读霸.
【易错提醒】 (1)对于给出的统计图表,一定要结合问题背景理解 图表意义,不能似懂非懂.
(2)频率分布直方图中纵坐标不要误以为频率.
对点演练
1.(1)(2022·四省八校双教研联考)如图1为某省2019年1~4月份快递 业务量统计图,图2为该省2019年1~4月份快递业务收入统计图,
10
10
10
并计算得x2i =0.038,y2i =1.615 8, xiyi=0.247 4.
i=1
i=1
i=1
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积 量;
(2)求 该林 区这 种树 木 的根 部横 截面 积与 材积 量的 样本 相关 系数 (精 确到 0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种 树木的根部横截面积总和为 186 m2.已知树木的材积量与其根部横截面 积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
(2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情 况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读 时间的频率分布直方图如图所示:
将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确
的是
(A )
A.抽样表明,该校约有一半学生为阅读霸
B.该校只有50名学生不喜欢阅读
统计与统计案例35752
第二十一页,共二十八页。
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
(2)由题意可知,利用分层抽样的方法抽取上网时间在 0~ 2 小时内的学生 1 名(记为 A),抽取上网时间在 2~4 小时内的 学生 3 名(分别记为 B1,B2,B3),从这 4 名学生中随机抽取 2 名学生有(A,B1),(A,B2),(A,B3),(B1,B2),(B2,B3),(B1, B3),共 6 种结果,
其中上网时间在 2~4 小时内的学生有 2 名被抽到所包括 的基本事件有(B1,B2),(B2,B3),(B1,B3),共 3 种结果,
故所求概率 P=36=12.
第二十二页,共二十八页。
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
(2013·福建理,4)某校从高一年级学生中随机抽取部分学 生,将他们的模块测试成绩分成 6 组:[40,50),[50,60),[60,70), [70,80),[80,90),[90,100]加以统计,得到如图所示的频率分 布直方图,已知高一年级共有学生 600 名,据此估计,该模块 测试成绩不少于 60 分的学生人数为( )
第二十页,共二十八页。
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
专题一 统计与统计案例的常考题型(教师)
概率与统计的引入拓宽了应用过问题取材的范围.由于中学数学中所学的概率与统计的内容是这一数学分支中最基础的内容,考虑到教学实际和考生的生活实际,高考对这部分内容的考查贴近考生生活,注重考查基础知识和基本方法.
全国卷中一般以“1大2小”3个题,共22分,且“简单—中等”难度出现,但是涉及知识点多且杂、 数字计算量大、具有实际应用背景等题型特点,也是考生易失分的地方.
本节主要讲解统计部分的基础知识和基本方法,与常考题型.
第一部分 随机抽样
一、简单随机抽样
1.设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2.简单随机抽样的常用方法
最常用的简单随机抽样有抽签法和随机数法:
(1)抽签法:把总体中的N 个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到一个容量为n 的样本.
(2)随机数法:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫做随机数法. 二、系统抽样
假设要从容量为N 的总体中抽取容量为n 的样本. 1.先将总体的N 个个体编号.
2.确定分段间隔k ,对编号进行分段,当N n 是整数时,取k =N n ,当N
n 不是整数时,随机从总体中剔除
余数,再取k =⎣⎡⎦⎤
N n .
3.在第1段用简单随机抽样确定第一个个体编号l (l ≤k ).
4.按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本.
教辅-高考数学大二轮专题复习:概率与统计之统计、统计案例
15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二
组,…,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组
与第二组共有 20 人,则第三组中的人数为
.
答案 18
核心知识回顾
热点考向探究
真题VS押题
专题作业
解析 由直方图可得,分布在第一组与第二组共有 20 人,分布在第一 组与第二组的频率分别为 0.24,0.16,设总的人数为 n,则2n0=0.24+0.16 =0.4,所以 n=50.所以第三组中的人数为 50×0.36=18.
核心知识回顾
热点考向探究
真题VS押题
专题作业
(3)(多选)(2020·山东省泰安市高三一模)某调查机构对全国互联网行业 进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90 后从事互 联网行业岗位分布条形图,则下列结论正确的是( )
注:90 后指 1990 年及以后出生,80 后指 1980~1989 年之间出生.80 前 指 1979 年及以前出生.
个月的数据未统计出来.根据以上数据,该教师这 8 个月的月平均通话时间
的中位数大小不可能是( )
A.580
B.600
C.620
D.640
答案 D
核心知识回顾
热点考向探究
真题VS押题
专题作业
统计与统计案例小题突破练-高三数学二轮专题复习
冲刺高考二轮统计与统计案例小题突破练
(原卷+答案)
一、单项选择题
1.已知某地区中小学生人数比例和近视情况分别如图甲和图乙所示,
为了了解该地区中小学生的近视形成原因,用分层抽样的方法随机抽取1%的学生进行调查,其中被抽取的小学生有80人,则样本容量和该地区的高中生近视人数分别为() A.200,25 B.200,2 500
C.8 000,25 D.8 000,2500
2.某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则()
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
3.国外新冠肺炎疫情形势严峻,国内疫情传播风险加大,为了更好地抗击疫情,国内进一步加大新冠疫苗的接种力度.某制药企业对某种新冠疫苗开展临床接种试验,若使用该疫苗后的抗体呈阳性,则认为该新冠疫苗有效.该企业对参与试验的1 000名受试者的年龄和抗体情况进行统计,结果如下图表所示:
年龄频率
[20,30)0.20
[30,40)0.30
[40,50)0.10
[50,60)0.20
[60,70)0.10
[70,80]0.10
则下列结论正确的是( )
A .在受试者中,50岁以下的人数为700
B .在受试者中,抗体呈阳性的人数为800
C .受试者的平均年龄为45岁
人教A版选修2-3高二数学下册期末考点完全梳理:统计案例(解析版)
人教A 版选修2-3高二数学下册期末考点完全梳理:统计案例
1.两个变量的线性相关
(1)正相关:在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
2.回归方程 (1)最小二乘法
求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法. (2)回归方程
方程y ^=b ^x +a ^
是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^
是待定参数.
∑∑∑∑=--
=-=-=--Λ
--=⎪⎭⎫ ⎝
⎛-⎪⎭⎫
⎝⎛-⎪⎭⎫ ⎝⎛-=n i i n i i i n
i i n
i i i x n x y x n y x x x y y x x 1221
121b ,-Λ-Λ-=x y b a . 3.回归分析
(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心
对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x -,y -
)称为样本点的中心. (3)相关系数
当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.
r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.
高考数学复习第十一章统计与统计案例第1讲随机抽样课件理新人教A版
准差.
第十一章 统计与统计案例
知识点
考纲下载
能从样本数据中提取基本的数字特征(如平均数、标
准差),并给出合理的解释.
用样本 会用样本的频率分布估计总体分布,会用样本的基
估计总 本数字特征估计总体的基本数字特征,理解用样本估
体 计总体的思想.
会用随机抽样的基本方法和样本估计总体的思想解
决一些简单的实际问题.
解析:选 B.由题意得,抽样间隔为84420=20.所以在区间[481, 720]抽取22400=12(人).
分层抽样
[典例引领]
(1)某报社做了一次关于“什么是新时代的雷锋精神”的
问卷调查,在 A,B,C,D 四个单位回收的问卷数依次成等差
数列,且共回收 1 000 份,因报道需要,再从回收的问卷中按
某中学采用系统抽样方法,从该校高一年级全体 800 名学生 中抽 50 名学生做牙齿健康检查.现将 800 名学生从 1 到 800 进行编号.已知从 33~48 这 16 个数中抽取的数是 39,则在第 1 小组 1~16 中随机抽取的数是________. 解析:间隔数 k=85000=16,即每 16 人抽取一个人.由于 39= 2×16+7,所以第 1 小组中抽取的数为 7. 答案:7
()
A.12
B.13
1
1
C.6
D.4
统计与统计案例
【解析】 根据题意可知二年级女生的人数应为 2 000×0.19=380(人),故一年级共有人数 750 人,二年级共有 750 人,这两个年级均应抽取 64×2705000=24(人),则应在三 年级抽取的学生人数为 64-24×2=16(人).
【答案】 C
误区分析 15 忽视“抽样比”相等导致分层抽样失误
【答案】 C
考向三 分层抽样及其应用
[典例剖析]
【例 3】 (2013·湖南高考)某工厂甲、乙、丙三个车间生
产了同一种产品,数量分别为 120 件,80 件,60 件.为了解
它们的产品质量是否存在显著差异,用分层抽样方法抽取了
一个容量为 n 的样本进行调查,其中从丙车间的产品中抽取
了 3 件,则 n=( )
[对点练习]
某校共有学生 2 000 名,各年级男、女生人数如下表.已
知在全校学生中随机抽取 1 名,抽到二年级女生的概率是
0.19,现用分层抽样的方法在全校抽取 64 名学生,则应在三
年级抽取的学生人数为( )
一年级 二年级 三年级
女生 373
x
y
男生 377 370
z
A.24
B.18
C.16
D.12
[典例剖析]
【典例】 (2015·洛阳模拟)交通管理部门为了解机动车 驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、 丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数 为 N,其中甲社区有驾驶员 96 人.若在甲、乙、丙、丁四个 社区抽取驾驶员的人数分别为 12,21,25,43,则这四个社区驾 驶员的总人数 N 为( )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1讲 统计与统计案【典例】
【要点提炼】
考点一 统计图表
1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率
组距.
2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数. 频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
【热点突出】
【典例】1 (1)(多选)(2020·新高考全国Ⅱ)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( )
A .这11天复工指数和复产指数均逐日增加
B .这11天期间,复产指数增量大于复工指数的增量
C .第3天至第11天复工复产指数均增大都超过80%
D .第9天至第11天复产指数增量大于复工指数的增量 【答案】 CD
(2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根
据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:
将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确的是( ) A.抽样表明,该校约有一半学生为阅读霸
B.该校只有50名学生不喜欢阅读
C.该校只有50名学生喜欢阅读
D.抽样表明,该校有50名学生为阅读霸
【答案】 A
【解析】根据频率分布直方图可列下表:
阅读时间(分
钟) [0,10
)
[10,20) [20,30) [30,40) [40,50) [50,60]
抽样人数(名) 10 18 22 25 20 5
抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸.
易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂.
(2)频率分布直方图中纵坐标不要误以为频率.
【拓展训练】1 (1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )
A.各月的平均最低气温都在0 ℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温不低于20 ℃的月份有5个
【答案】 D
【解析】由题中雷达图易知A,C正确.七月份平均最高气温超过20 ℃,平均最低气温约为13 ℃;一月份平均最高气温约为6 ℃,平均最低气温约为2 ℃,所以七月的平均温差比一月平均温差大,故B正确.由题图知平均最高气温不低于20 ℃的月份为六、七、八月,有3个.
(2)(多选)(2020·重庆模拟)新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考),其中“选择考”成绩将计入高考总成绩,即将学生考试时的原始卷面分数由高到低进行排序,评定为A,B,C,D,E五个等级,再转换为分数计入高考总成绩.某试点高中2020年参加“选择考”总人数是2018年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2018年和2020年“选择考”成绩等级结果,得到如图所示的统计图.
针对该校“选择考”情况,2020年与2018年比较,下列说法正确的是( ) A .获得A 等级的人数增加了 B .获得B 等级的人数增加了1.5倍 C .获得D 等级的人数减少了一半 D .获得E 等级的人数相同 【答案】 AB
【解析】 设2018年参加“选择考”的总人数为x ,则2020年参加“选择考”的总人数为2x ,根据图表得出2018年和2020年各个等级的人数如表所示.
由表可知,获得A 等级的人数增加了,故A 正确;获得B 等级的人数增加了0.8x -0.32x
0.32x =1.5倍,故B 正确;
获得D 等级的人数增加了,故C 错误;获得E 等级的人数不相同,故D 错误.
【要点提炼】
考点二 回归分析
在分析两个变量的相关关系时,可根据样本数据作出散点图来判断两个变量之间是否具有相关关系.若具有线性相关关系,则回归直线过样本点的中心(x ,y ),并且可通过线性回归方程估计预报变量的值.
【热点突破】
【典例】2 (2020·全国Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得
i=60,i=1 200,(x i-x)
2=80,
(y i-y)2=9 000,(x i-x)(y i-y)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(x i,y i)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
【解析】解(1)由已知得样本平均数y=1
20i
=60,
从而该地区这种野生动物数量的估计值为
60×200=12 000.
(2)样本(x i,y i)(i=1,2,…,20)的相关系数
r=
800
80×9 000
=
22
3
≈0.94.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
规律方法样本数据的相关系数
r=
∑
n
i=1
x i-x y i-y
∑
n
i=1
x i-x2∑
n
i=1
y i-y2
,
反映样本数据的相关程度,|r|越大,则相关性越强.
【拓展训练】2 (1)已知某产品的销售额y与广告费用x之间的关系如下表:
x(单位:万元) 0 1 2 3 4