专题七 第3讲 统计与统计案例(理)(教师)资料讲解
统计教学案例
统计教学案例(经典版)编制人:__________________审核人:__________________审批人:__________________编制单位:__________________编制时间:____年____月____日序言下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!并且,本店铺为大家提供各种类型的经典范文,如工作报告、合同协议、演讲致辞、条据文书、策划方案、规章制度、心得体会、教学资料、作文大全、其他范文等等,想了解不同范文格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!Moreover, our store provides various types of classic sample essays, such as work reports, contract agreements, speeches, policy documents, planning plans, rules and regulations, insights, teaching materials, complete essays, and other sample essays. If you want to learn about different sample formats and writing methods, please stay tuned!统计教学案例统计教学案例统计教学案例1作为义务教育阶段学习的继续,初中阶段的数学学习将巩固,加深学生已形成的对数裾分析方法的理解,扩展学生已经获得的对不确定性和概率的经验。
课件1:第三章 统计案例
(3)比较K2与临界值的大小关系作统计推断.
自主检测
1.(2014·唐山模拟)对具有线性相关关系的变量 x、y 有一组观测
^ 1
数据(xi,yi)(i=1,2,…,8),其回归直线方程是:y= x+a,且
3
x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数 a 的值
水得病的有9人,不得病的有22人.按此样本数据分析这种疾
病是否与饮用水有关,并比较两种样本在反映总体时的差异.
解析 (1)假设 H0:传染病与饮用水无关.把表中数据代入公式得:
830× 52×218-466×94
2
K 的观测值 k=
146×684×518×312
2
≈54.21.
在 H0 成立的情况下,P(K2>10.828)≈0.001,是小概率事件,所以拒绝
跨度x(m)
3.25
3.20
5.07
3.14
2.90
4.02
已知y与x具有线性相关关系,求出重量与跨度的回归方程.
=4
ො
165.85x-10 562.7
典例解析
1.已知对两个变量x、y的观测数据如下表:
x
35
40
42
39
45
46
42
50
58
48
y 5.90 6.20 6.30 6.55 6.53 9.52 6.99 8.72 9.49 7.50
i 1
y 2≈7227.2,
i 1
i 1
i 1
y
90.8 97.6 104.2 110.9 115.6 122.0 128.5
^
90.9 97.3 103.6 109.9 116.2 122.5 128.8
2019高考数学二轮复习专题七概率与统计2.7.3正态分布、统计与统计案例课件理
2.正态分布 X~N(μ,σ2)的三个常用数据 (1)P(μ-σ<X≤μ+σ)=0.6826; (2)P(μ-2σ<X≤μ+2σ)=0.9544; (3)P(μ-3σ<X≤μ+3σ)=0.9974.
[解题指导]
[解]
(1)抽取的一个零件的尺寸在(μ-3σ, μ+3σ)之内的概率
为 0.9974, 从而零件的尺寸在(μ-3σ, μ+3σ)之外的概率为 0.0026, 故 X~B(16,0.0026). 因此 P(X≥1)=1-P(X=0)=1-0.997416≈0.0408. X 的数学期望为 E(X)=16×0.0026=0.0416.
[对点训练]
2 1.(2018· 兰州检测)设 X~N(μ1,σ2 1),Y~N(μ2,σ2),这两个
正态分布密度曲线如图所示,下列结论中正确的是(
)
A. P(Y≥μ2)≥P(Y≥μ1) B.P(X≤σ2)≤P(X≤σ1) C.对任意正数 t,P(X≥t)≥P(Y≥t) D.对任意正数 t,P(X≤t)≥P(Y≤t)
3.方差公式 1 - - - s = [(x1- x )2+(x2- x )2+…+(xn- x )2] n
2
[对点训练] 1.(2018· 安徽皖南八校联考)某校为了解 1000 名高一新生的 健康状况, 用系统抽样法(按等距的规则)抽取 40 名同学进行检查, 将学生从 1~1000 进行编号,现已知第 18 组抽取的号码为 443, 则第一组用简单随机抽样抽取的号码为( A.16 B.17 C.18 D.19 )
[答案]
C
2. 某校组织了“2017 年第 15 届希望杯数学竞赛(第一试)”, 已知此次选拔赛的数学成绩 X 服从正态分布 N(72,121)(单位: 分), 此次考生共有 500 人,估计数学成绩在 72 分到 83 分之间的人数 约为(参数数据:P(μ-σ<X<μ+σ)=0.6826,P(μ-2σ<X<μ+2σ)= 0.9544.)( A.238 ) B.170 C.340 D.477
统计与统计案例PPT课件
走向高考 ·二轮专题复习 ·新课标版 ·数学
用样本估计总体
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
用样本估计总体 (文)某学校为了调查学生平均每周的上网时间(单 位:h)对学习产生的影响,从高三年级随机抽取了 100 名学生, 将所得数据整理后,画出频率分布直方图(如图),其中频率分 布直方图从左到右前 3 个小矩形的面积之比为 1:3:5,试估 计:
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
疑难误区警示 1.当总体数 N 不能被样本容量整除,用系统抽样法剔除 多余个体时,必须随机抽样. 2.注意中位数与平均数的区别,中位数可能不在样本数 据中.
专题七 第一讲
走向高考 ·二轮专题复习 ·新课工厂甲、乙、丙三个车
间生产了同一种产品,数量分别为 120 件,80 件,60 件,为
了解它们的产品质量是否存在显著差异,用分层抽样方法抽
取了一个容量为 n 的样本进行调查,其中从丙车间的产品中
抽取了 3 件,则 n=( )
A.9
B.10
C.12
D.13
[答案] D
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
某市有大型超市 200 家、中型超市 400 家、小型超市 1400 家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个 容量为 100 的样本,应抽取中型超市________家.
[答案] 20
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
[解析] 属简单题,关键是清楚每一层的抽取比例都一样 是Nn .
专题七 第一讲
走向高考 ·二轮专题复习 ·新课标版 ·数学
(精品教案)《统计》讲课稿
(精品教案)《统计》讲课稿《统计》讲课稿作为一名教师,就有也许用到讲课稿,讲课稿有助于提高教师理论素质和驾驭教材的能力。
讲课稿应该如何写呢?下面是小编收集整理的《统计》讲课稿,希翼对大伙儿有所帮助。
一、讲设计理念《数学课程标准》指出要让学生感觉日子中处处有数学,用数学知识解决日子中的实际咨询题。
基于这一理念,我在教学过程中力求联系学生日子实际和已有的知识经验,从学生感兴趣的素材,设计新颖的导入与例题教学,给数学课富予新的生命力。
课堂中力求构建一种自主探索、和谐合作的教学氛围,让学生记忆知识的探索过程,培养学生感觉日子中的数学和用数学知识解决日子咨询题的能力,体验数学的应用价值。
二、教材分析:(一)教材的地位和作用有关统计图的认识,小学时期要紧认识条形统计图、折线统计图和扇形统计图。
思考到扇形统计图在日常日子中的广泛应用,《标准》把它作何必学内容安排在本单元。
本单元是在前面学习了条形统计图和折线统计图的特点和作用的基础上举行教学的。
要紧经过熟悉的事例使学生体味到扇形统计图的有用价值。
(二)教学目标1、联系日子情境了解扇形统计图的特点和作用2、能读知道扇形统计图,从中猎取有效的信息。
3、让学生在观看、比较、讨论和交流中体味扇形统计图反映的是整体和部分的关系。
(三)教学重点:1、能读知道扇形统计图,明白扇形统计图的特点和作用,并能从中猎取有效信息。
2、认识折线统计图,了解折线统计图的特点。
(四)教学难点:1、能从扇形统计图中获得实用信息,并做出合理判断。
2、能依照统计图和数据举行数据变化趋势的分析。
三、学情分析本单元的教学是在学生已有统计经验的基础上,学习新知的。
六年级的学生差不多学习了条形统计图和折线统计图,懂他们的特点,并具有一定的概括、分析能力,在此基础上,经过新旧知识对照,自然生成新知识点。
四、设计理念和教法分析1、本堂课力争做到由“关注知识”转向“关注学生”,由“传授知识”转向“引导探究”,“教师是组织者、领导者。
(精品教案)《统计》讲课稿范文(通用5篇)
(精品教案)《统计》讲课稿范文(通用5篇)《统计》讲课稿范文(通用5篇)作为一名教学工作者,总归要编写讲课稿,借助讲课稿能够有效提升自个儿的教学能力。
优秀的讲课稿都具备一些啥特点呢?下面是小编收集整理的《统计》讲课稿范文(通用5篇),仅供参考,希翼可以帮助到大伙儿。
【教材分析】《统计》是义务教育课程标准实验教科书数学(人教版)下册第9单元的内容。
原教材上是一幅教师带领学生举行实地观看、统计的插图。
关于没有条件、别能实地统计的学校,这部分内容又该如何上呢?我将教材中的盆花变成纸花,一排一排钉在黑板上,便于学生数数、统计。
巩固练习中,原教材是让学生统计全班每人的生日。
但关于农村小学低年级的儿童来讲,大多数学生全然记别得自个儿的生日。
所以,我设计了几份统计表供学生举行练习。
【学生分析】全班54名学生。
学生的思维比较活跃,有一定合作交流学习的能力。
教师所要做的算是设计、组织学生举行有价值的统计活动。
【教学目标】1、初步体验数据的收集、整理、描述和分析过程,会用简单的办法收集整理数据。
2、初步认识条形统计图和简单的统计表;能依照统计表中的数据提出并回答简单的咨询题。
3、培养合作意识。
【教学流程】一、激趣、引入、感知。
师:小朋友,今天我们竞赛一下,看哪组同学表现得最好,老师将送给他们红五星。
你们看,(出示各XXX花)有一位一年级的小朋友在学校各方面的表现都别错,得到了那么多的花!这些花美丽吗?这些花有几种颜群?讲讲有哪些颜XXX?怎么样才干懂各种颜群的花有几朵?(让学生自个儿想方法。
)师生共同数出红花的朵数。
师:我们刚刚数数的过程算是对数据举行统计。
(板书:统计)师:大伙儿想把各群的花有几朵统计下来吗?老师给大伙儿请来一具好帮手,看例1。
【创设与学生日子实际相同的学习情境,激发了学生的学习积极性。
继续引入课题,朴实自然,也渗透了思想教育。
】二、教学例1。
教师出示条形统计图,并讲明:图中的四根条形柱分不表示下面所列花的朵数。
高三数学专题复习7.3统计、统计案例教案(第2课时)
100
将 2×2列联表中的数据代入公式计算,得
n ad- bc 2
-
2
k= a+ b c+ d a+ c b+ d = 75×25×45×55
课题
统计、统计案例
课 时 共 3 课时
本节第 2 课时
选用教材 教学目标 重点 难点 关键
教学方法 及课前准备
专题七 知识模块
概率与统计
课型
熟练掌握频率分布直方图等图和回归分析独立性检验
熟练掌握频率分布直方图等图和回归分析独立性检验 熟练掌握频率分布直方图等图和回归分析独立性检验 熟练掌握频率分布直方图等图和回归分析独立性检验
1
1n
80
解
(1) 由题意
n= 10,
x
=
ni
=
x
1
i
=
= 10
8,
1 10
20
y
=
ni
=
y
1
i
=
10=
2,
n
又 x2i - n x 2= 720-10×82= 80.
i =1
n
xiyi-n x
i =1
y = 184-10×8×2= 24.
10
xi yi - 10 x y
^
i =1
由此得 b =
10
单价 x( 元 )
8
8.2
8.4
8.6
8.8
9
销量 y( 件 )
90
84
83
80
75
68
2
^
^
^
^
^
^
(1) 求回归直线方程 y =b x+ a ,其中 b =- 20, a = y - b x ;
专题六第3讲统计与统计案例
A.10
考 点 核 心 突 破
B.11
C.12
D.16
训 练 高 效 提 能
菜
单
高考专题辅导与训练· 数学(理科)
第一部分 法
基 础 要 点 整 合
专题六
概率与统计、推理与证明、复数、算
解 题 规 范 流 程
考 点 核 心 突 破
[自主解答] (1)依表知 x+y+z=4 000-2 000 =2 000, x 4 000=0.2,于是 x=800, 1 y+z=1 200,高二抽取学生人数为 1 200×40=30. (2)因为 29 号、42 号的号码差为 13, 所以 3+13=16, 即另外一个同学的学号是 16,选 D.
考 点 核 心 突 破
A.- x 甲>- x 乙,y 甲>y 乙 C.- x 甲<- x 乙,y 甲>y 乙
菜 单
B.- x 甲<- x 乙,y 甲<y 乙 D.- x 甲>- x 乙,y 甲<y 乙
训 练 高 效 提 能
高考专题辅导与训练· 数学(理科)
第一部分 法
基 础 要 点 整 合
专题六
概率与统计、推理与证明、复数、算
考 点 核 心 突 破
训 练 高 效 提 能
菜
单
高考专题辅导与训练· 数学(理科)
第一部分 法
基 础 要 点 整 合
专题六
概率与统计、推理与证明、复数、算
解 题 规 范 流 程
(2)(2013·潍坊二模)某市为增强市民的节约粮食意识, 面向全市征召务宣传志愿者,现从符合条件的志愿者中 随机抽取100名按年龄分组:第 1组[20,25) ,第2组 [25,30), 第 3 组 [30,35) ,第 4 组 [35,40) ,第 5 组 [40,45] ,得到的频率 分布直方图如图所示.若用分层抽样的方法从第 3,4,5 组
统计与统计案例课件
箱产量<50 kg
箱产量≥50 kg
旧养殖法
62
38
新养殖法
34
66
15
K2=
≈15.705.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关. (3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+ 0.044)×5=0.34<0.5,箱产量低于55 kg的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5,
,=- .
18
解析 (1)由折线图中数据和附注中参考数据得
=4, (ti- )2=28,
=0.55,
(ti- )(yi- )= tiyi- yi=40.17-4×9.32=2.89,
r≈
≈0.99. (4分)
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟
种植收入 0.6a
0.74a
第三产业收入 0.06a
0.56a
养殖收入 0.3a
0.6a
根据上表可知B、C、D结论均正确,结论A不正确,故选A.
其他收入 0.04a
0.1a
3
2.(优质试题课标全国Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理 了优质试题年1月至优质试题年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是 ( ) A.月接待游客量逐月增加
B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月 D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
统计案例-讲义(教师版)
统计案例一、课堂目标1.能够利用相关系数判断两个变量之间的相关关系.2.熟练求解线性回归方程,并能够根据回归方程进行预测.3.掌握卡方计算公式,能够利用独立性检验判断两个变量是否相关.【备注】【教师指导】1.统计案例属于高考必考内容,在文科中常与统计与概率一起考查,以一道解答题出现在高考试卷中,在期中期末考试中也属于重点考查对象.本讲的重点是掌握相关系数,能够利用相关系数判断两个变量间的相关关系;能够根据题意熟练求解线性回归方程,并能够根据回归方程对变量进行预测;掌握卡方计算公式,能够利用独立性检验判断两个变量是否相关;重点题型是统计案例与统计、概率的综合.2.本讲的关联知识是统计、概率二、知识讲解1. 一元线性回归模型知识精讲(1)如果由变量的成对数据、散点图或直观经验可知,变量与变量之间的关系可以近似地用一次函数来刻画,则称与线性相关;(2)如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关;如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关.2. 回归直线方程知识精讲(1)用最小二乘法求线性回归方程对于一组具有线性相关关系的数据:,,,,,我们知道其回归直线的斜率和截距的最小二乘法估计分别为:其中,,称为样本点的中心,位于回归直线上.(2)相关系数对于变量与随机抽到的对数据,,,,,可以利用相关系数来衡量两个变量之间线性相关关系,样本相关系数的计算公式为:.具体评判结果如下:①时,表示两个变量正相关;②时,表示两个变量负相关;③越接近于,表明两个变量的线性相关程度越强;④越接近于,表明两个变量的线性相关程度越弱.(3)非线性回归①非线性相关关系研究两个变量的关系是,我们常常根据样本生成点坐标在平面直角坐标系中作出散点图,观察散点图中样本点的分布.从整体看,如果样本点并没有分布在某一条直线附近,我们就称这两个变量之间不具有线性相关关系,也就是非线性相关关系.②确定函数模型根据散点图的分布,若呈现出的是非线性相关关系,我们可以根据散点的分布形状选择其他函数模型),然后利用代数转化手段,将非线性函数转化为线性函数,再作出散点图或计算线性相关系数.(4)常见函数模型的转化①幂函数型移项:;取对数:;作变换:,此时上式变为线性函数.计算分析:先将原数据点计算转化为,然后根据线性回归模型求解出和.②指数函数型移项:;取对数:;作变换:,此时上式变为线性函数.计算分析:先将原数据点计算转化为,然后根据线性回归模型求解出和.经典例题A.万元B.万元C.万元D.万元1.某产品的广告费用与销售额的统计数据如下表广告费用(万元)销售额(万元)根据上表可得回归方程中的为,据此模型预报广告费用为万元时销售额为().【答案】B【解析】计算得,,所以回归方程为.当广告费用为万元时,销售额约为万元.故选.【标注】【知识点】线性回归方程过平均数点;线性回归方程的其他应用;残差分析【备注】【教师指导】熟练掌握线性回归方程中斜率和截距的公式,进而熟练求解线性回归方程.巩固练习A. B. C. D.2.登山族为了了解某山高与气温之间的关系,随机统计了次山高与相应的气温,并制作了对照表:气温山高由表中数据得到线性回归方程,由此估计出山高为处气温的度数为().【答案】D【解析】,,∵,∴,∴,令,得.故选.【标注】【知识点】线性回归方程的其他应用;线性回归方程过平均数点经典例题(1)(2)(3)3.某电脑公司有名产品推销员,其中名推销员的工作年限与年推销金额数据如下表所示:推销员编号工作年限(年)年推销金额(万元)求年推销金额与工作年限之间的相关系数(精确到小数点后两位);求年推销金额关于工作年限的线性回归方程;若第名推销员的工作年限为年,试估计他的年推销金额.【答案】(1)(2)(3)万元【解析】(1)(2)(3)由,,,可得.∴年推销金额与工作年限之间的相关系数约为.由()知,.∴可认为年推销金额关于工作年限之间具有较强的的线性相关关系.设所求的线性回归方程为,则,.∴年推销金额关于工作年限的线性回归方程为.由()可知,当时,【备注】【教师指导】熟练掌握相关系数的公式、线性回归方程,并能够根据回归方程进行预测.(万元).∴可以估计第名推销员的年推销金额为万元.【标注】【知识点】变量间的相关关系;残差分析巩固练习(1)(2)4.在某小区随机抽取名成年男子测量他们的体重,表示第一年的体重,表示第二年的体重,数据如下:对变量与进行相关性检验;如果与具有线性相关关系,求回归直线方程.【答案】(1)(2)与具有线性相关关系.【解析】(1)(2),,,,,,..又查表得,相应于显著水平和自由度的相关系数临界值,由,知与具有线性相关关系.设回归直线方程为,则,,所以回归直线方程为.【标注】【知识点】残差分析;线性回归方程的其他应用经典例题(1)12(2)5.近年来,随着汽车消费的普及,二手车流通行业得到迅猛发展.某汽车交易市场对年成交的二手车的交易前的使用时间(以下简称“使用时间”)进行统计,得到如图所示的频率分布直方图.在图对使用时间的分组中,将使用时间落入各组的频率视为概率.图使用时间年频率组距若在该交易市场随机选取辆年成交的二手车,求恰有辆使用年限在的概率.根据该汽车交易市场往年的数据,得到图所示的散点图,其中(单位:年)表示二手车的使用时间,(单位:万元)表示相应的二手车的平均交易价格.图平均交易价格万元使用时间年由散点图判断,可采用作为该交易市场二手车平均交易价格关于其使用年限的回归方程,相关数据如下表(表,):试选用表中数据,求出关于的回归方程.该汽车交易市场拟定两个收取佣金的方案供选择.甲:对每辆二手车统一收取成交价格的的佣金;乙:对使用年以内(含年)的二手车收取成交价格的的佣金,对使用时间年以上(不含年)的二手车收取成交价格的的佣金.假设采用何种收取佣金的方案不影响该交易市场的成交量,根据回归方程和图表,并用各时间组的区间中点值代表该组的各个值.判断该汽车交易市场应选择哪个方案能获得更多佣金.附注:.对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为,;.参考数据:,,,,.【答案】(1)12(2)..甲方案.【解析】(1)1(2)由频率分布直方图知,该汽车交易市场年成交的二手车使用时间在的频率为,使用时间在的频率为.所以在该汽车交易市场年成交的二手车随机选取辆,其使用时间在的概率为,所以所求的概率为.由得,则关于的线性回归方程为,由于,,则关于的线性回归方程为,所以关于的回归方程为.【备注】【教师指导】对于非线性函数要先转化成线性函数,然后再利用最小二乘法求线性回归方程.2根据频率分布直方图和①中的回归方程,对成交的二手汽车可预测:使用时间在的频率为,对应的成交价格的预测值为;使用时间在的频率为,对应的成交价格预测值为;使用时间在的频率为,对应的成交价格的预测值为;使用时间在的频率为,对应的成交价格的预测值为;使用时间在的频率为,对应的成交价格的预测值为;若采用甲方案,预计该汽车交易市场对于成交的每辆车可获得的平均佣金为万元;若采用乙方案,预计该汽车交易市场对于成交的每辆车可获得的平均佣金为万元;因为,所以采用甲方案能获得更多佣金.【标注】【知识点】频率分布直方图;残差分析;最小二乘法;线性回归方程过平均数点巩固练习(1)1(2)6.一只药用昆虫的产卵数与一定范围内的温度有关,现收集了该种药用昆虫的组观测数据如下表:温度产卵数个经计算得:,,,,,线性回归模型的残差平方和,,其中,分别为观测数据中的温度和产卵数,,,,,,.若用线性回归模型,求关于的回归方程(精确到).若用非线性回归模型求得关于的回归方程,且相关指数.试与()中的回归模型相比,用说明哪种模型的拟合效果更好.2用拟合效果好的模型预测温度为时该种药用昆虫的产卵数(结果取整数).【答案】(1)12(2).回归方程拟合效果更好.个.【解析】(1)12(2)由题意得,,∴,∴关于的线性回归方程为.由所给数据求得的线性回归方程为,相关指数为,因为,所以回归方程比线性回归方程拟合效果更好.由()得当温度时,.又∵,∴(个).【标注】【知识点】相关系数问题;线性回归方程的其他应用;最小二乘法;残差分析3. 随机误差与残差知识精讲(1)随机误差①概念:线性回归模型①来表示,其中和为模型的未知参数,称为随机误差.②产生随机误差的原因主要有以下几种:(ⅰ)所用的确定性函数不恰当引起的误差;(ⅱ)忽略了某些因素的影响;(ⅲ)存在观测误差.(2)残差①残差的定义在实际应用中,我们用回归方程中的估计①中的.由于随机误差,所以是的估计量.对于样本点而言,它们的随机误差为其估计值为称为相应于点的残差.()②残差图下表列出了女大学生身高和体重的原始数据以及相应的残差的数据.我们可以利用图形来分析残差特性.作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.如下图:编号12345678身高/165165157170175165155170体重/4857505464614359残差-6.3732.6272.419-4.6181.1376.627-2.8830.382【备注】【教师指导】从图中可以看出,第1个样本点和第6个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因.另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高 .③的计算常用来刻画回归的效果,其计算公式是:.知识点睛残差分析的一般方法:①作残差图.如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,线性回归方程的预报精度越高;如果残差点分布不均匀,应首先确认采集的样本点是否有误,如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型来拟合数据;如果数据的采集没有错误,那么需要寻找其他的原因.②计算相关指数.根据来刻画回归的效果.对于已经获取的样本数据,表达式中的为确定的数.因此:越大,残差平方和越小,即模型的拟合效果越好;越小,残差平方和越大,即模型的拟合效果越差.经典例题7.已知方程是根据女大学生的身高预报她的体重的回归方程,其中的单位是,的单位是,那么针对某个体的残差是 .【答案】【解析】因为回归方程为,所以当时,, 所以针对某个体的残差是, 故答案为:.【标注】【知识点】残差分析;线性回归方程的其他应用【备注】【教师指导】掌握残差的概念,会计算残差.A.甲B.乙C.丙D.丁8.甲、乙、丙、丁四位同学各自对,两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数与残差平方和,如下表:甲乙丙丁则哪位同学的试验结果体现,两变量有更强的线性相关性( ).【答案】D【解析】在验证两个变量之间的线性相关关系中,相关系数的绝对值越接近于,相关性越强,在四个选项中只有丁的相关系数最大,残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现、两变量有更强的线性相关性,故选:.【标注】【知识点】变量间的相关关系【备注】【教师指导】①相关系数的绝对值越接近于1,相关性越强;②残差平方和越小,相关性越强.巩固练习A.模型①的相关指数为B.模型②的相关指数为C.模型③的相关指数为D.模型④的相关指数为9.在两个变量与的回归模型中,分别选择了四个不同的模型,它们的相关指数如下,其中拟合效果最好的为( ).【答案】A【解析】根据相关指数的值越大,模型拟合的效果越好,比较、、、选项,的相关指数最大,∴模型①拟合的效果最好.故选.【标注】【知识点】残差分析A.B.C.D.10.在下列说法中,真命题的个数是( ).①随机误差是引起预报值与真实值之间误差的原因之一;②残差平方和越小,预报精度越高;③用相关指数来刻画回归的效果,的值越接近,说明模型的拟合效果越好;④因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.【答案】C【解析】随机误差是引起预报值与真实值之间存在误差的原因之一,故①正确;残差平方和越小,预报精度越高,故②正确;相关指数用来刻画回归效果,越接近于,则残差平方的和越小,模型的拟合效果越好,故③正确;因为由任何一组观测值都可以求得一个回归直线方程,检验有意义,必须进行相关性检验,故④错误.故选.【标注】【知识点】相关系数问题;变量间的相关关系;残差分析4. 建立回归模型的基本步骤知识精讲一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量 .(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程).(4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.经典例题11.运动员训练次数与运动成绩之间的数据关系如下:次数()成绩()(1)(2)(3)(4)(5)做出散点图.求出线性回归方程.做出残差图.计算.预试测该运动员训练次及次的成绩.【答案】(1)(2)(3)(4)(5)见解析.$.见解析..和.【解析】(1)(2)做出运动员训练次数和与成绩的散点图,如图所示,由散点图可知,它们之间具有相关关系.,,,,,∴,,【备注】【教师指导】进一步加深学生对建立回归模型基本步骤的掌握.(3)(4)(5)∴回归直线方程.残差分析:下面的表格列出了运动员训练次数和成绩的原始数据以及相应的残差数据.作残差图,如图所示,由图可知,残差点比较均匀地分布在水平带状区域内,说明选择的模型比较合适.计算相关指数,说明了该运动员的成绩的差异有是由训练次数引起的.做出预报:由上述分析可知,回归直线方程可以作为该运动员训练成绩的预报值.将和分别代入该方程可得、,故预测该运动员训练次和次的成绩分别为和.【标注】【知识点】残差分析;线性回归方程的其他应用;变量间的相关关系;散点图5. 独立性检验知识精讲(1)分类变量对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为“分类变量”.在现实生活中,分类变量是大量存在的,例如吸烟变量有吸烟和不吸烟两个“值”,月份变量有十二个“值”.【备注】【教师指导】分类变量中所谓的“变量”和“值”都应该作广义的理解,它们并不是指具体的数值.例如对于性别变量,“变量”指的是性别,而“值”指的是男和女.在日常生活中,我们常常关心两个分类变量之间是否有关系.例如,吸烟与患肺癌是否有关系?性别是否对喜欢数学课程有影响?等等.下面我们借助一个实例来体验一下:为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了人,得到如下结果:像上表这样列出的两个分类变量的频数表,称为列联表.由上表可以粗略估计出:在不吸烟样本中,有患肺癌;在吸烟样本中,有患肺癌,因此直观上可以得出结论:吸烟和患肺癌有关. 不患肺癌患肺癌总计不吸烟吸烟总计(2)独立性检验利用统计分析的手段作研究:先假设:吸烟与患肺癌没有关系.用表示不吸烟,表示不患肺癌,则“吸烟与患肺癌没有关系”等价于“吸烟与患肺癌独立”,即.把上表中的数字用字母代替,得到如下用字母表示的列联表:在上表中,恰好为事件发生的频数;和恰好分别为事件和事件发生的频数.因为频率接近于概率.所以在成立的条件下应该有:(其中为样本容量).将上式化简得到.因此,越小,说明吸烟与患肺癌之间关系越弱;越大,说明吸烟与患肺癌之间关系越强.不患肺癌患肺癌总计不吸烟吸烟总计为了使不同样本容量的数据有统一的评判标准,构造一个随机变量(其中为样本容量).若假设成立,即“吸烟与患肺癌没有关系”,则应该很小.根据数字列联表中的数据,计算得到的观测值约为.这个值到底能告诉我们什么呢?统计学家经过研究后发现,在成立的情况下,.即在成立的情况下,的观测值超过的概率非常小,近似为,是一个小概率事件.而现在的观测值约为,远远大于阀值.所以我们有理由断定不成立,即认为“吸烟与患肺癌有关系”.但这种判断需要承担不超过的风险(即这种判断犯错误的概率不超过).知识点睛独立性检验的具体步骤:(1)准确作出列联表;(2)统计假设成立;(3)计算;(4)将上一步计算得到的观测值与临界值比较,从而接收或拒绝假设.经典例题A.B.C.D.12.通过随机询问名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好不爱好总计由算得,.参照附表,得到的正确结论是().在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”有以上的把握认为“爱好该项运动与性别有关”有以上的把握认为“爱好该项运动与性别无关”【答案】C【备注】【教师指导】本题主要通过独立性检验判断两个变量是否相关.即在犯错误的概率不超过或有以上的把握认为“爱好该项运动与性别有关”.【标注】【知识点】列联表、卡方计算;独立性检验巩固练习A. B. C. D.13.为了增强环保意识,某校从男生中随机制取了人,从女生中随机制取了人参加环保知识测试,统计数据如表所示,经计算,则环保知识是否优秀与性别有关的把握为( ). 优秀非优秀总计男生女生总计附:.【答案】C 【解析】由题意,,所以,在犯错误不超过的情况下认为环保知识是否优秀与性别有关,即有的把握认为环保知识是否优秀与性别有关.故选:.【标注】【知识点】独立性检验;列联表、卡方计算A.B.C.D.14.某疾病研究所想知道吸烟与患肺病是否有关,于是随机抽取名成年人调查是否吸烟是否患有肺病,得到列联表,经计算的.已知在假设吸烟与患肺病无关的前提条件下,,,则该研究所可以( ).有以上的把握认为“吸烟与患肺病有关”有以上的把握认为“吸烟与患肺病无关”有以上的把握认为“吸烟与患肺病有关”有以上的把握认为“吸烟与患肺病无关”【答案】A经查对临界值表知,∴有的把握说患肺病与吸烟有关故选.【标注】【知识点】列联表、卡方计算;独立性检验经典例题15.某企业为了更好地了解设备改造与生产合格品的关系,随机抽取了件产品进行分析,其中设备改造前生产的合格品有件,不合格品有件;设备改造后生产的合格品有件,不合格品有件,根据上面的数据,计算的值约为(精确到).【答案】【解析】由已知数据得到下表:合格品不合格品合计设备改造后设备改造前合计根据公式.【标注】【知识点】独立性检验;列联表、卡方计算【备注】【教师指导】要求学生熟练掌握卡方计算公式.巩固练习A.B.16.在独立性检验中,统计量有两个临界值:和.当时,有的把握说明两个事件相关;当时,有的把握说明两个事件相关;当时,认为两个事件无关;在一项调查某种药是否对心脏病有治疗作用时,共调查了人,经计算,根据这一数据分析,认为此药物与心脏病之间().有的把握认为两者相关约有的心脏病患者使用药物有作用C.D.有的把握认为两者相关约有的心脏病患者使用药物有作用【答案】A 【解析】∵,∴有的把握认为“两者有关系”.故选.【标注】【知识点】列联表、卡方计算;独立性检验经典例题(1)(2)17.年底,湖北省武汉市等多个地区陆续出现感染新型冠状病毒肺炎的患者.为及时有效地对疫情数据进行流行病学统计分析,某地研究机构针对该地实际情况,根据该地患者是否有武汉旅行史与是否有确诊病例接触史,将新冠肺炎患者分为四类;有武汉旅行史(无接触史),无武汉旅行史(无接触史),有武汉旅行史(有接触史)和无武汉旅行史(有接触史),统计得到以下相关数据.请将列联表填写完整:有接触史无接触史总计有武汉旅行史无武汉旅行史总计能否在犯错误的概率不超过的前提下认为有武汉旅行史与有确诊病例接触史有关系?附:,,【答案】(1)有接触史无接触史总计有武汉旅行史无武汉旅行史总计【备注】【教师指导】第一步,要求学生会填列联表;第二步,要求学生掌握通过独立性检验判断两个变量是否相关.(2)在犯错误的概率不超过的前提下,认为有武汉旅行史与有确诊病例接触史有关系.【解析】(1)(2)请将该列联表填写完整:有接触史无接触史总计有武汉旅行史无武汉旅行史总计根据列联表中的数据,由于,因此,在犯错误的概率不超过的前提下,认为有武汉旅行史与有确诊病例接触史有关系.【标注】【知识点】总体、样本、样本容量;列联表、卡方计算;独立性检验巩固练习(1)18.为了调查某大学学生在某天上网的时间,随机对名男生和名女生进行了不记名的问卷调查.得到了如下的统计结果:表:男生上网时间与频数分布表上网时间(分钟)人数表:女生上网时间与频数分布表上网时间(分钟)人数完成下面的列联表:上网时间少于分钟上网时间不少于分钟合计男生女生,,,,,,,,,,。
名师导学2018届高三数学理二轮复习课件:专题3第7讲统计与统计案例 精品
2.高考真题 考题1 (2013 全国Ⅰ)为了解某地区的中小学生视力 情况,拟从该地区的中小学生中抽取部分学生进行调查, 事先已了解到该地区小学.初中.高中三个学段学生的视 力情况有较大差异,而男女生视力情况差异不大,在下面 的抽样方法中,最合理的抽样方法是( ) A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样
计综合的趋势.全卷统计与概率的考查分值比较稳定,近
五年均为 22 分,试题难度属容易题和中档题,是考生的 主要得分点之一.
第7讲 统计与统计案例源自1.考题展望高考对这部分内容注重基础知识和基本方法的考查,
要求考生理解数据处理的几种基本思想、方法和作用,并
能运用所学知识、方法去解决实际问题,对独立检验、回 归分析的理论推导不作要求;命题时常以一道客观题考查 抽样方法、频率分布直方图、茎叶图、用样本估计总体、 变量间的相关关系、线性回归方程、回归分析和独立检验 等考点中的一个或二个,试题难度中档偏易,同时将数据
【解析】选 A. 对应 μ1 的曲线对称轴靠左边,知 μ1<μ2;又对应
σ1 的曲线更陡峭一些,知 σ1<σ2,故选 A.
【点评】正态分布问题求解的切入点是充分利用 正态分布曲线的图象特征和相关量的统计意义分析思 考.
3.样本估计总体 例3甲、乙二人参加某体育项目训练,近期的五 次测试成绩得分情况如图.
2.总体估计
用样本估计总体,是研究统计问题的一个基本思想方
法,用样本的频率分布对总体进行估计. (1)频率分布直方图:利用直方图反映样本的频率分布
规律,这样的直方图称为频率分布直方图.画频率分布直 方图的一般步骤:1)计算一组数据中最大值与最小值的 差,即求极差;2)确定组距和组数;3)将数据分组;4)绘 制频率分布表;5)画频率分布直方图.
高三数学 统计与统计案例 教学教案 新人教版
舒城中学高三数学专题复习教与学一体化学案课题:统计与统计案例一、有的放矢、复习轻松1.理解用样本估计总体的思想,并会用样本的数字特征对总体进行估计;理解样本平均数和标准差的意义和作用,并会计算数据平均数和标准差。
2.理解独立性检验的基本思想、方法和初步应用。
3.会用简单随机抽样的方法从总体中抽取样本和了解分层抽样方法和系统抽样方法,并了解随机抽样的等可能性。
4.会作“一表三图”,并能利用“一表三图”分析样本的数字特征。
5.了解最小二乘法的思想和利用已知系数公式建立线性回归方程;了解回归分析的基本思想、方法及其简单应用。
二、知识结构,了然于胸三、复习定位,对症下药 1.重点(1)简单随机抽样的基本方法以及操作步骤。
(2)用茎叶图和频率分布直方图分析样本的基本数字特征。
(3)会根据茎叶图计算样本的基本数字特征;会用频率分布直方图估算样本的基本数字特征.2.难点(1)会用茎叶图和频率分布直方图分析样本的基本数字特征。
(2)体会用样本估计总体的思想;会用样本的基本数字特征估计总体的基本数字特征。
四、例题解析,理解深入【例题1】 某省打算对本省现行的高考方案做出优化改革,使之更好的考查考生的能力和素质,为增强改革的有效性,计划向5000名高三学生、3000名高校学生和4000名高中教师发放相关问卷,拟收回1200份做数据分析,请选择恰当的抽样方法收取这1200份问卷。
【解析】 本题适合采用分层抽样方法: 第一步:确定抽样比:1014000300050001200=++==N n k 第二步:确定每一层的子样本容量:4001014000,3001013000,5001015000321=⨯==⨯==⨯=n n n 第三步:在每一层按简单随机抽样的方法或系统抽样方法抽取相应样本。
采集数据处理数据实际应用【例题2】 为了综合分析我市高三理科数学的教学质量,某研究机构从参加“皖西五校联考(理)”的学生中利用电脑随机选择了20名学生成绩作分析,成绩茎叶图如下: 8 6 9 6 8 10 7 9 9 11 0 2 6 7 8 8 8 12 2 4 8 8 13 3 7 14 5(Ⅰ)请由图中给出的数据,求样本的众数、中位数、平均值和方差。
高中数学《统计与统计案例》课件
设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型y =99+17.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用 模型②得到的预测值更可靠.
13
考点整合
1.抽样方法 抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样, 体现了抽样的公平性,但又各有其特点和适用范围.
位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )
A.0.5
B.0.6
C.0.7
D.0.8
解析 法一 设调查的 100 位学生中阅读过《西游记》的学生人数为 x,则 x+80-60
=90,解得 x=70,所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计
值为17000=0.7.故选 C.
解 (1)由调查数据,男顾客中对该商场服务满意的比率为4500=0.8,因此男顾客对该商场
服务满意的概率的估计值为 0.8.女顾客中对该商场服务满意的比率为3500=0.6,因此女顾
客对该商场服务满意的概率的估计值为 0.6.
8
(2)K2 的观测值 k=100×5(0×405×0×207-0×303×010)2≈4.762. 由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务 的评价有差异.
^
利用模型②,该地区 2018 年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿 元).
12
(2)利用模型②得到的预测值更可靠. 理由如下: 从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y=-30.4+ 13.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型①不能很好地描述环境 基础设施投资额的变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加, 2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础
2015届高考数学(理)二轮专题配套练习:专题7_第3讲_统计与统计案例(含答案)
第3讲 统计与统计案例考情解读 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中、低档题.1.随机抽样(1)简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.(2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.(3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距×频率组距=频率; ②各小长方形的面积之和等于1;③小长方形的高=频率组距,所有小长方形的高的和为1组距.(2)茎叶图在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数(2)方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].标准差:s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 4.变量的相关性与最小二乘法(1)相关关系的概念、正相关和负相关、相关系数.(2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q =∑i =1n(y i -a -bx i )2最小时,得到线性回归方程y ^=b ^x +a ^的方法叫做最小二乘法. 5.独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是则K 2(χ2)=n (ad -bc )2(a +b )(c +d )(a +c )(b +d)(其中n =a +b +c +d 为样本容量).热点一 抽样方法例1 (1)(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14(2)(2014·石家庄高三调研)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.思维启迪 (1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)分层抽样最重要的是各层的比例.思维升华 (1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.(1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为( ) A .15 B .16 C .17 D .18(2)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A .200,20B .100,20C .200,10D .100,10 热点二 用样本估计总体例2 (1)(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A .6B .8C .12D .18(2)PM 2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个PM 2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是( )A .甲B .乙C .甲乙相等D .无法确定甲 乙 2 0.04 1 2 3 6 9 3 0.05 9 6 2 1 0.06 2 9 3 3 1 0.07 9 6 4 0.08 770.0924 6思维启迪 (1)根据第一组与第二组的人数和对应频率估计样本总数,然后利用第三组的频率和无疗效人数计算;(2)直接根据公式计算方差.思维升华 (1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.(1)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.(2)(2014·陕西)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( ) A .1+a,4 B .1+a,4+a C .1,4 D .1,4+a 热点三 统计案例例3 (1)以下是某年2月某地区搜集到的新房屋的销售价格y 和房屋的面积x 的数据.根据上表可得线性回归方程y =b x +a 中的b =0.196 2,则面积为150 m 2的房屋的销售价格约为________万元. (2)(2014·江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表4A .成绩B .视力C .智商 思维启迪 (1)回归直线过样本点中心(x ,y ); (2)根据列联表,计算K 2的值思维升华 (1)线性回归方程求解的关键在于准确求出样本点中心.回归系数的求解可直接把相应数据代入公式中求解,回归常数的确定则需要利用中心点在回归直线上建立方程求解;(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入K 2(χ2)计算公式求其值,根据K2(χ2)取值范围求解即可.(1)已知x 、y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a 等于( ) A .1.30 B .1.45 C .1.65 D .1.80(2)某研究机构为了研究人的脚的大小与身高之间的关系,随机抽测了20人,若“身高大于175厘米”的为“高个”,“身高小于等于175厘米”的为“非高个”,“脚长大于42码”的为“大脚”,“脚长小于等于42码”的为“非大脚”.得以下2×2列联表:则在犯错误的概率不超过 (附:P (K 2>k ) 0.05 0.01 0.001 k3.8416.63510.828)1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量明显较多时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样.系统抽样最重要的特征是“等距”,分层抽样,最重要的是各层的“比例”.2.用样本估计总体(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1.(2)众数、中位数及平均数的异同:众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布.①总体期望的估计,计算样本平均值x =1n ∑n i =1x i .②总体方差(标准差)的估计:方差=1n ∑n i =1 (x i-x )2,标准差=方差,方差(标准差)较小者较稳定.3.线性回归方程y ^=b ^x +a ^过样本点中心(x ,y ),这为求线性回归方程带来很多方便. 4.独立性检验(1)作出2×2列联表.(2)计算随机变量K 2(χ2)的值.(3)查临界值,检验作答.真题感悟1.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.2.(2014·重庆)已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A .y ^=0.4x +2.3 B .y ^=2x -2.4 C .y ^=-2x +9.5 D .y ^=-0.3x +4.4 1.24 2.A 1.20 2.24 3.3 4.C 押题精练1.某地区对某路段公路上行驶的汽车速度实施监控,从中抽取50辆汽车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速在70 km/h 以下的汽车有________辆.2.某教育出版社在高三期末考试结束后,从某市参与考试的考生中选取600名学生对在此期间购买教辅资料的情况进行调研,得到如下数据:人数为________.3.下表提供了某厂节能减排技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生产能耗y (吨)的几组对应数据:根据上表提供的数据,求出y 关于x 的线性回归方程为y =0.7x +0.35,那么表中t 的值为________. 4.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )参照附表,得到的正确结论是( )A .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”(推荐时间:40分钟)一、选择题1.(2014·湖南)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( ) A .p 1=p 2<p 3 B .p 2=p 3<p 1 C .p 1=p 3<p 2 D .p 1=p 2=p 32.某中学高中一年级有400人,高中二年级有320人,高中三年级有280人,现从中抽取一个容量为200人的样本,则高中二年级被抽取的人数为( ) A .28 B .32 C .40 D .643.(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08 B .07 C 4.为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120,则抽取的学生人数是( )A .240B .280C .320D .4805.某产品在某零售摊位上的零售价x (单位:元)与每天的销售量y (单位:个)的统计资料如下表所示:由上表可得线性回归方程y ^=b ^x +a ^中的b =-4,据此模型预计零售价定为15元时,每天的销售量为( ) A .48个 B .49个 C .50个 D .51个6.某校为了研究学生的性别和对待某一活动的态度(支持和不支持的两种态度)的关系,运用2×2列联表进行独立性检验,经计算K 2=7.069,则所得到的统计学结论是:有________的把握认为“学生性别与支持该活动有关系.”( ) 附:A.0.1% B .1% C 7.某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x 甲,x 乙和中位数y 甲,y 乙进行比较,下面结论正确的是( )A .x 甲>x 乙,y 甲>y 乙B .x 甲<x 乙,y 甲<y 乙C .x 甲<x 乙,y 甲>y 乙D .x 甲>x 乙,y 甲<y 乙 二、填空题8.从某中学高一年级中随机抽取100名同学,将他们的成绩(单位:分)数据绘制成频率分布直方图(如图).则这100名学生成绩的平均数、中位数分别为________.9.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是__________.10.(2013·辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________. 三、解答题11.(2014·课标全国Ⅱ)某地区2007年至2013年农村居民家庭人均纯收入y (单位:千元)的数据如下表:(1)求y (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b ^=∑i =1n(t i -t )(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .12.某城市随机抽取一年(365天)内100天的空气质量指数API 的监测数据,结果统计如下:(1S =⎩⎪⎨⎪⎧0, 0≤w ≤1004w -400,100<w ≤3002 000, w >300,试估计在本年度内随机抽取一天,该天经济损失S 大于200元且不超过600元的概率;(2)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染.完成下面2×2列联表,并判断能否有95%的把握认为该市本年空气重度污染与供暖有关?附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ).例1 (1)B (2)200 变式训练1 (1)C (2)A例2 (1)C (2)A 变式训练2 (1)10 (2)A 例3 (1)31.244 2 (2)D解析 (1)由表格可知x =15(115+110+80+135+105)=109,y =15(24.8+21.6+18.4+29.2+22)=23.2.所以a ^=y -b ^x =23.2-0.196 2×109=1.814 2.所以所求线性回归方程为y ^=0.196 2x +1.814 2.故当x =150时,销售价格的估计值为y ^=0.196 2×150+1.814 2=31.244 2(万元).(2)A 中,a =6,b =14,c =10,d =22,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(6×22-14×10)220×32×16×36=131 440.B 中,a =4,b =16,c =12,d =20,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(4×20-16×12)220×32×16×36=637360.C 中,a =8,b =12,c =8,d =24,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(8×24-12×8)220×32×16×36=1310.D 中,a =14,b =6,c =2,d =30,a +b =20,c +d =32,a +c =16,b +d =36,n =52,K 2=52×(14×30-6×2)220×32×16×36=3 757160. ∵131 440<1310<637360<3 757160, ∴与性别有关联的可能性最大的变量是阅读量. 变式训练3 (1)B (2)0.01解析 (1)依题意得,x =16×(0+1+4+5+6+8)=4,y =16(1.3+1.8+5.6+6.1+7.4+9.3)=5.25;又直线y ^=0.95x +a ^必过样本点中心(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ^,由此解得a ^=1.45. (2)由题意得K 2=20×(5×12-1×2)26×14×7×13≈8.802>6.635.而K 2>6.635的概率约为0.01,所以在犯错误的概率不超过0.01的前提下认为人的脚的大小与身高之间有关系.DDDDBCB 8.125,124 9.1 10.1011.解 (1)由所给数据计算得t =17(1+2+3+4+5+6+7)=4,y =17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,∑i =17=(t i -t )2=9+4+1+0+1+4+9=28,∑i =17(t i -t )(y i -y )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,b ^=∑i =17(t i -t )(y i -y )∑i =17(t i -t )2=1428=0.5, a ^=y -b ^t =4.3-0.5×4=2.3,所求线性回归方程为y ^=0.5t +2.3.(2)由(1)知,b ^=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t =9代入(1)中的线性回归方程,得y ^=0.5×9+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元.12.解 (1)设“在本年内随机抽取一天,该天经济损失S 大于200元且不超过600元”为事件A , 由200<S ≤600,得150<w ≤250,频数为39,所以P (A )=39100.(2)根据以上数据得到如下列联表:K 2的观测值k =100×(63×8-22×7)85×15×30×70≈4.575>3.841.所以有95%的把握认为空气重度污染与供暖有关.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题七第3讲统计与统计案例(理)(教师)专题七概率与统计(理)概率与统计应以随机变量及其分布列为中心,求解时应抓住建模、解模、用模这三个基本点.排列组合是求解概率的工具,利用排列组合解题时应抓住特殊元素或特殊位置,注意元素是否相邻及元素是否定序,同时还应注意题中是否还涉及两个计数原理.随机变量的均值和方差是概率初步的关键点,解决概率应用问题时,首先要熟悉几种常见的概率类型,熟练掌握其计算公式;其次还要弄清问题所涉及的事件具有什么特点、事件之间有什么联系;再次要明确随机变量所取的值,同时要正确求出所对应的概率.统计的主要内容是随机抽样、样本估计总体、变量的相关性,复习时应关注直方图、茎叶图与概率的结合,同时注意直方图与茎叶图的数据特点.第3讲 统计与统计案例考情解读 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中、低档题.1.明确直方图的三个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1.(3)小长方形的高=频率组距,所有小长方形高的和为1组距.2.把握统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即 x =1n (x 1+x 2+…+x n ).(4)方差与标准差方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].标准差: s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].热点一 抽样方法1.(1)(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为() A.11 B.12 C.13 D.14(2)(2014·石家庄高三调研)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.思维启迪(1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)分层抽样最重要的是各层的比例.答案(1)B(2)200解析(1)由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12.(2)本题属于分层抽样,设该学校的教师人数为x,所以1603 200=160-150x,所以x=200.思维升华(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.2.(1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为()A.15 B.16 C.17 D.18(2)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.200,20 B.100,20C.200,10 D.100,10答案(1)C(2)A解析(1)由系统抽样方法,知按编号依次每30个编号作为一组,共分49组,高二学生的编号为496到988,在第17组到第33组内,第17组抽取的编号为16×30+23=503,为高二学生,第33组抽取的编号为32×30+23=983,为高二学生,故共抽取高二学生人数为33-16=17,故选C.(2)该地区中、小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20,故选A.热点二用样本估计总体3.(1)(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6 B.8 C.12 D.18(2)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是()A.甲B.乙C.甲乙相等D.无法确定甲乙20.04123 6930.0596210.06293310.079640.08770.09246思维启迪(1)根据第一组与第二组的人数和对应频率估计样本总数,然后利用第三组的频率和无疗效人数计算;(2)直接根据公式计算方差.答案(1)C(2)A解析(1)志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.(2)x甲=(0.042+0.053+0.059+0.061+0.062+0.066+0.071+0.073+0.073+0.084+0.086+0.097)÷12≈0.068 9,x乙=(0.041+0.042+0.043+0.046+0.059+0.062+0.069+0.079+0.087+0.092+0.094+0.096)÷12≈0.067 5,s2=112[(0.042-0.068 9)2+(0.053-0.068 9)2+…+(0.097-0.068 9)2]≈0.000 212.s2=112[(0.041-0.067 5)2+(0.042-0.067 5)2+…+(0.096-0.067 5)2]≈0.000 429.所以甲、乙两地浓度的方差较小的是甲地.思维升华(1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.4.(1)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为 2.5万元,则11时至12时的销售额为________万元.(2)(2014·陕西)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( ) A .1+a,4 B .1+a,4+a C .1,4D .1,4+a答案 (1)10 (2)A解析 (1)由频率分布直方图可知: 0.100.40=2.5x,所以x =10. (2)x 1+x 2+…+x 1010=1,y i =x i +a ,所以y 1,y 2,…,y 10的均值为1+a ,方差不变仍为4. 故选A.热点三 统计案例5.(1)以下是某年2月某地区搜集到的新房屋的销售价格y 和房屋的面积x 的数据.根据上表可得线性回归方程y =b x +a 中的b =0.196 2,则面积为150 m 2的房屋的销售价格约为________万元.(2)(2014·江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表3表4A.成绩 B .视力 C 思维启迪 (1)回归直线过样本点中心(x ,y ); (2)根据列联表,计算K 2的值 答案 (1)31.244 2 (2)D解析 (1)由表格可知x =15(115+110+80+135+105)=109,y =15(24.8+21.6+18.4+29.2+22)=23.2.所以a ^=y -b ^x =23.2-0.196 2×109=1.814 2. 所以所求线性回归方程为y ^=0.196 2x +1.814 2.故当x =150时,销售价格的估计值为y ^=0.196 2×150+1.814 2=31.244 2(万元).(2)A 中,a =6,b =14,c =10,d =22,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(6×22-14×10)220×32×16×36=131 440. B 中,a =4,b =16,c =12,d =20,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(4×20-16×12)220×32×16×36=637360. C 中,a =8,b =12,c =8,d =24,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(8×24-12×8)220×32×16×36=1310.D 中,a =14,b =6,c =2,d =30,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2=52×(14×30-6×2)220×32×16×36=3 757160.∵131 440<1310<637360<3 757160, ∴与性别有关联的可能性最大的变量是阅读量.思维升华 (1)线性回归方程求解的关键在于准确求出样本点中心.回归系数的求解可直接把相应数据代入公式中求解,回归常数的确定则需要利用中心点在回归直线上建立方程求解;(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入K 2(χ2)计算公式求其值,根据K 2(χ2)取值范围求解即可. 6.(1)已知x 、y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a 等于( ) A .1.30 B .1.45 C .1.65 D .1.80(2)某研究机构为了研究人的脚的大小与身高之间的关系,随机抽测了20人,若“身高大于175厘米”的为“高个”,“身高小于等于175厘米”的为“非高个”,“脚长大于42码”的为“大脚”,“脚长小于等于42码”的为“非大脚”.得以下2×2列联表:(附:)答案 (1)B (2)0.01解析 (1)依题意得,x =16×(0+1+4+5+6+8)=4,y =16(1.3+1.8+5.6+6.1+7.4+9.3)=5.25;又直线y ^=0.95x +a ^必过样本点中心(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ^,由此解得a ^=1.45. (2)由题意得 K 2=20×(5×12-1×2)26×14×7×13≈8.802>6.635.而K 2>6.635的概率约为0.01,所以在犯错误的概率不超过0.01的前提下认为人的脚的大小与身高之间有关系.1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量明显较多时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样.系统抽样最重要的特征是“等距”,分层抽样,最重要的是各层的“比例”. 2.用样本估计总体(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1. (2)众数、中位数及平均数的异同:众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布. ①总体期望的估计,计算样本平均值x =1n ∑n i =1x i .②总体方差(标准差)的估计:方差=1n ∑ni =1 (xi -x )2,标准差=方差,方差(标准差)较小者较稳定.3.线性回归方程y ^=b ^x +a ^过样本点中心(x ,y ),这为求线性回归方程带来很多方便. 4.独立性检验(1)作出2×2列联表.(2)计算随机变量K 2(χ2)的值.(3)查临界值,检验作答. 真题感悟7.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案 24解析 底部周长在[80,90)的频率为0.015×10=0.15, 底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24.8.某地区对某路段公路上行驶的汽车速度实施监控,从中抽取50辆汽车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速在70 km/h 以下的汽车有________辆.答案 20解析 时速在70 km/h 以下的汽车所占的频率为0.01×10+0.03×10=0.4,共有0.4×50=20(辆).9.某教育出版社在高三期末考试结束后,从某市参与考试的考生中选取600名学生对在此期间购买教辅资料的情况进行调研,得到如下数据:购买图书情况只买试题类只买讲解类试题类和讲解类都买人数240200160类的学生应抽取的人数为________. 答案 24解析 只买试题类的学生应抽取的人数为60×240600=24.10.(2012·山东高考)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15[思路点拨] 由系统抽样的概念可以求解.[解析] 由系统抽样的特点知:抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.[答案] C11.某校共有学生2 000名,各年级男、女生人数如下表,已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19,现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生数为( )一年级 二年级 三年级 女生 373 x y 男生377370 zA.24 C .16D .12解析:选C 依题意可知,二年级女生有380人,则三年级的学生的人数应是500,即总体中各个年级的人数比例为3∶3∶2,故在分层抽样中应在三年级抽取到的学生人数为64×28=16.[配套课时作业]A 组12.(2012·济南模拟)某全日制大学共有学生5 600人,其中专科生有1 300人,本科生有3 000人,研究生1 300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则应在专科生,本科生与研究生这三类学生中分别抽取( )A .65人,150人,65人B .30人,150人,100人C .93人,94人,93人D .80人,120人,80人解析:选A 设应在专科生,本科生与研究生这三类学生中分别抽取x 人,y 人,z 人,则5 600280=1 300x =3 000y =1 300z,所以x =z =65,y =150.所以应在专科生,本科生与研究生这三类学生中分别抽取65人,150人,65人.13.(2012·陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析:选A 从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56.14.(2012·广州调研)设随机变量X ~N (1,52),且P (X ≤0)=P (X >a -2),则实数a 的值为( )A .4B .6C .8D .10解析:选A 由正态分布的性质可知P (X ≤0)=P (X ≥2),所以a -2=2,故a =4.15.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( )A.65B.65C. 2D .2解析:选D 由题可知样本的平均值为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.16.高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的办法抽取一个容量为4的样本.已知学号为6,34,48的同学在样本中,那么还有一个同学的学号应为________.解析:由题意可知,可将学号依次为1,2,3,…,56的56名同学分成4组,每组14人,抽取的样本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差14.故还有一个同学的学号应为6+14=20.答案:2017.(2012·济南模拟)随机变量ξ服从正态分布N (40,σ2),若P (ξ<30)=0.2,则P (30<ξ<50)=________.解析:根据正态分布曲线的对称性可得P (30<ξ<50)=1-2P (ξ<30)=0.6. 答案:0.618.(2012·江南十校联考)“低碳经济”是促进社会可持续发展的推进器.某企业现有100万元资金可用于投资,如果投资“传统型”经济项目,一年后可能获利20%,可能损失10%,也可能不赔不赚,这三种情况发生的概率分别为35,15,15;如果投资“低碳型”经济项目,一年后可能获利30%,也可能损失20%,这两种情况发生的概率分别为a 和b (其中a +b =1).(1)如果把100万元投资“传统型”经济项目,用ξ表示投资收益(投资收益=回收资金-投资资金),求ξ的概率分布及均值(数学期望)E (ξ);(2)如果把100万元投资“低碳型”经济项目,预测其投资收益均值会不低于投资“传统型”经济项目的投资收益均值,求a 的取值范围.解:(1)依题意,ξ的可能取值为20,0,-10, 则ξ的分布列为ξ 20 0 -10 P351515故ξ的均值E (ξ)=20×35+0×15+(-10)×15=10(万元).(2)设η表示100万元投资“低碳型”经济项目的收益,则η的分布列为η 30 -20 Pab依题意,需30a -20b ≥10,又a +b =1,则50a -20≥10, 所以35≤a ≤1.19. (2012·郑州质检)为加强中学生实践、创新能力和团队精神的培养,促进教育教学改革,郑州市教育局举办了全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:分组频数 频率 一 60.5~70.5 a 0.26 二 70.5~80.5 15 c 三 80.5~90.5 18 0.36 四90.5~100.5 b d 合计50e(1)000,001,002,…,199,试写出第二组第一位学生的编号;(2)求出a ,b ,c ,d ,e 的值(直接写出结果),并作出频率分布直方图;(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人.解:(1)依题意可知第二组第一位学生的编号为004. (2)a ,b ,c ,d ,e 的值分别为13,4,0.30,0.08,1. 频率分布直方图如下:(3)被抽到的学生中获二等奖的人数约为9+2=11,占样本的比例是1150=0.22,即获二等奖的概率为22%,所以参赛学生中获二等奖的人数估计为200×22%=44. 答:参赛学生中获得二等奖的学生大约有44人.20. (2014·湖南)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( ) A .p 1=p 2<p 3 B .p 2=p 3<p 1 C .p 1=p 3<p 2 D .p 1=p 2=p 3 答案 D解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3. 21. 某中学高中一年级有400人,高中二年级有320人,高中三年级有280人,现从中抽取一个容量为200人的样本,则高中二年级被抽取的人数为( ) A .28 B .32 C .40 D .64答案 D解析 由已知,得样本容量为400+320+280=1 000, 所以,高中二年级被抽取的人数为2001 000×320=64,选D.22.某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x 甲,x 乙和中位数y 甲,y 乙进行比较,下面结论正确的是( ) A.x 甲>x 乙,y 甲>y 乙 B.x 甲<x 乙,y 甲<y 乙 C.x 甲<x 乙,y 甲>y 乙 D.x 甲>x 乙,y 甲<y 乙 答案 B23.从某中学高一年级中随机抽取100名同学,将他们的成绩(单位:分)数据绘制成频率分布直方图(如图).则这100名学生成绩的平均数、中位数分别为________.答案 125,124解析 由图可知(a +a -0.005)×10=1-(0.010+0.015+0.030)×10,解得a =0.025,则x =105×0.1+115×0.3+125×0.25+135×0.2+145×0.15=125.中位数在120~130之间,设为x ,则0.01×10+0.03×10+0.025×(x -120)=0.5,解得x =124.24.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是__________. 答案 1解析 当x ≥4时,89+89+92+93+92+91+947=6407≠91,∴x <4,∴89+89+92+93+92+91+x +907=91,∴x =1.25.(2013·辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.答案 10解析 设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5, 则由题意知x 1+x 2+x 3+x 4+x 55=7,(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)2=20, 五个整数的平方和为20,则必为0+1+1+9+9=20, 由|x -7|=3可得x =10或x =4. 由|x -7|=1可得x =8或x =6.由上可知参加的人数分别为4,6,7,8,10, 故最大值为10.。