统计与统计案例 专题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计与统计案例专题
[考情考向分析] 1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.2.在概率与统计的交汇处命题,以解答题中档难度出现.
热点一抽样方法
1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体数较少.
2.系统抽样特点是将总体平均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.
3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.
例1(1)某学校在高一新生入学后为了解学生的体质情况,决定从该校的1 000名高一新生中采用系统抽样的方法抽取50名学生进行体质分析,已知样本中第一个号为007号,则抽取的第10个学生的编号为()
A.107 B.097 C.207 D.187
(2)已知某高级中学高一、高二、高三学生人数分别为880,860,820,现用分层抽样的方法从该校抽调128人,则在高二年级中抽调的人数为________.
思维升华(1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的.
(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同.
(3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.
跟踪演练1(1) 为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分
人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ) A .简单随机抽样 B .按性别分层抽样 C .按年龄段分层抽样
D .系统抽样
(2)(2018·永州模拟)现从已编号(1~50)的50位同学中随机抽取5位了解他们的数学学习状况,用每部分选取的号码间隔一样的系统抽样方法所选取的5位同学的编号可能是( ) A .5,10,15,20,25 B .3,13,23,33,43 C .1,2,3,4,5 D .2,10,18,26,34 热点二 用样本估计总体
1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.
2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数
利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
例2 (1)一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为( ) A .-11 B .3 C .9 D .17
(2)某高校调查了320名学生每周的自习时间(单位:小时),制成了下图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图可知,这320名学生中每周的自习时间不足22.5小时的人数约是( )
A.68 B.72 C.76 D.80
跟踪演练2(1)为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的6次数学测试的分数进行统计,甲、乙两人的得分情况如图所示,若甲、乙两人的平均成绩分别是x甲,x乙,则下列说法正确的是()
A.x甲>x乙,乙比甲成绩稳定,应选乙参加比赛
B.x甲>x乙,甲比乙成绩稳定,应选甲参加比赛
C.x甲 D.x甲 (2)下面是追踪调查200个某种电子元件寿命(单位:h)的频率分布直方图, 其中300~400,400~500的两组数据丢失,下列四个说法中有且只有一个与原数据相符,这个说法是() ①寿命在300~400的频数是90; ②寿命在400~500的矩形的面积是0.2; ③用频率分布直方图估计电子元件的平均寿命为 150×0.1+250×0.15+350×0.45+450×0.15+550×0.15; ④寿命超过400 h的频率为0.3. A.①B.②C.③D.④ 热点三统计案例 1.线性回归方程 方程y^=b^x+a^称为线性回归方程,其中b^=∑ n i=1 x i y i-n x y ∑ n i=1 x2i-n x2 ,a ^ =y-b ^ x,(x,y)称为样 本点的中心.2.随机变量 K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d. 例3 某高三理科班共有60名同学参加某次考试,从中随机挑选出5名同学,他们的数学成绩x与物理成绩y如下表: 数据表明y与x之间有较强的线性关系. (1)求y 关于x 的线性回归方程; (2)该班一名同学的数学成绩为110分,利用(1)中的回归方程,估计该同学的物理成绩; (3)本次考试中,规定数学成绩达到125分为优秀,物理成绩达到100分为优秀.若该班数学优秀率与物理优秀率分别为50%和60%,且除去抽走的5名同学外,剩下的同学中数学优秀但物理不优秀的同学共有5人.能否在犯错误的概率不超过0.01的前提下认为数学优秀与物理优秀有关? 参考数据:回归直线的系数b ^=∑n i =1 (x i -x )(y i -y )∑n i =1 (x i -x ) 2 ,a ^ =y -b ^x . K 2= n (ad -bc )2 (a +b )(c +d )(a +c )(b +d ) , P ()K 2≥6.635=0.01,P ()K 2≥10.828=0.001. 思维升华 (1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值;回归直线过样本点的中心(x ,y ),应引起关注. (2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入公式求解K 2即可. 跟踪演练3 下表为2014年至2017年某百货零售企业的线下销售额(单位:万元),其中年份代码x =年份-2013. (1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程,并预测2019年该百货零售企业的线下销售额; (2)随着网络购物的飞速发展,有不少顾客对该百货零售企业的线下销售额持续增长表示怀疑,某调査平台为了解顾客对该百货零售企业的线下销售额持续增长的看法,随机调查了55位男顾客、50位女顾客(每位顾客从“持乐观态度”和“持不乐观态度”中任选一种),其中对该百货零售企业的线下销售额持续增长持乐观态度的男顾客有10人、女顾客有20人,能否在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关?