人教A版高中数学必修三第二章 统计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[例2] 下表给出了某校500名12岁男孩中用随机抽样得 出的120人的身高资料(单位:cm):
(1)列出样本的频率分布表; (2)画出频率分布直方图; (3)估计身高低于134 cm的人数占总人数的百分比.
[分析]
[解析] (1)列出样本的频率分布表如下:
分组
频数
频率
[122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158)
或系统抽样
成
研究统计问题的基本思想方法就是从总体中抽取样本, 用样本估计总体,因此选择适当的抽样方法抽取具有代表性 的样本对整个统计问题起着至关重要的作用.高考中主要考 查三种抽样方法的比较和辨析以及应用.
[例1] 某高级中学有学生270人,其中一年级108人, 二、三年级各81人.现要利用抽样方法抽取10人参加某项调 查,考虑选用简单随机抽样、分层抽样和系统抽样三种方 案,使用简单随机抽样和分层抽样时,将学生按一、二、三 年级依次统一编号为1,2,…,270;使用系统抽样时,将学 生统一随机编号为1,2,…,270,并将整个编号依次分为10 段.如果抽得号码有下列四种情况:
(1)求第二小组的频率,并补全这个频率分布直方图; (2)求这两个班参赛的学生人数.
[分析] 由频率分布直方图中各小组的频率之和为1,可 频数
求解第(1)问;根据频率=总数,可求解第(2)问.
[解析] (1)∵各小组的频率之和为1.00,且第一、三、 四、五小组的频率分别是0.30,0.15,0.10,0.05.
(2012~2013·山西模拟)如下图,图甲是某市有 关部门根据对当地干部的月收入情况调查后画出的样本频率 分布直方图,已知图甲中从左向右第一组的频数为4 000.在 样本中记月收入在[1 000,1 500),[1 500,2 000),[2 000,2 500),[2 500,3 000),[3 000,3 500),[3 500,4 000)的人数依 次为A1,A2,…,A6.图乙是统计图中月工资收入在一定范围 内的人数的程序框图,图乙输出的S=________(用数字作 答).
丙 80 90 86 99 95 分别从平均数、中位数和方差等方面分析甲与丙的成绩 谁好谁坏,并说明理由. [分析] 先按平均数和中位数的定义求出数据的平均数 和中位数.根据方差的公式求出它们的方差,判断成绩波动 大小.
[解析]
(1)平均分:
x
甲=
1 5
×(65+98+94+98+95)=
90,
x 乙=15×(62+98+99+100+71)=86.
频率 0.050 0.200
② 0.300 0.100 1.00
(1)频率分布表中的①和②位置应填什么数据? (2)补全频率分布直方图(如下图),再根据频率分布直方 图估计这500名志愿者中年龄在[30,35)的人数.
[解析] (1)100-5-35-30-10=20,所以①处填20; 1-0.050-0.200-0.300-0.100=0.35,所以②处填0.35. (2)补全频率分布直方图如下图所示.
D.^y=176
[答案] C
[解析] 由数据知,y与x之间是近似直线上升的,计算
易得
-
x
=176,
-
y
=176,而回归直线必过样本的中心(
-
x
,
-
y
),
代入选项验证,知C正确.
机器可以按各种不同速度运转.其生产的物件
中有一些会有缺点,每小时生产有缺点物件的多少随机器运
转的速度而变化,下列即为其试验结果:
[90,100],8
结合 ①可求众数:最高小长方形的 中点所对应的数据; ②可求中位数:中位数左边和 右边的直方图面积相等; ③可求平均数:每个小长方形 的面积乘以小长方形底边中点 的横坐标之和; ④可求落在各个区域内的频率
名称
数
总体密度 曲线
同上
形
结合
可精确地反映一个总
体在各个区域内取值
的百分比,如分数落
成才之路·数学
人教A版 ·必修3
路漫漫其修远兮 吾将上下而求索
第二章
统计
第二章
章末总结
知识结构
[答案]
专题突破
专题1 三种抽样方法的比较 简单随机抽样、系统抽样、分层抽样的比较如下表:
类别 共同点
各自特点
简单随 机抽样
抽样过程 中每个个 体被抽到
从总体中逐个抽 取
的可能性 将总体均分成几
(2012~2013·北京石景山模拟)为增强市民的节
能环保意识,某市面向全市征召义务宣传志愿者,从符合条
件的500名志愿者中随机抽取100名志愿者的年龄情况如下表
所示.
分组(单位:岁) [20,25) [25,30) [30,35) [35,40) [40,45] 合计
频数 5 ① 35 30 10 100
∴第二小组的频率为
1.00-(0.30+0.15+0.10+0.05)=0.40. 频率
∴落在59.5~69.5内的第二小组的长方形的高为 组距 =
0.40 10
=0.04,由此可补全频率分布直方图(如下图阴影部分所
示).
(2)设高一两个班参赛的学生人数为x, 因为第二小组的频数为40,频率为0.40, 所以4x0=0.40, 解得x=100. 故高一两个班参赛的学生人数为100.
系统 相等;每 部分,按预先制
抽样 次抽出个 定的规则在各部
体后不再 分中抽取
分层 抽样
将它放 将总体分成几 回,即不 层,分层进行抽 放回抽样 取
联系
适用范围 总体中个体无 差异且个数较 少
在第一组抽取样本 总体中个体无
时采用简单随机抽 差异且个数很
样
多
在各层抽取样本时 总体由差异明
采用简单随机抽样 显的几部分组
s
2
甲
=
1 5
×[(65-90)2+(98-90)2+(94-90)2+(98-90)2+
(95-90)2]=158.8.
由于两人的平均分相同,所以从平均分看,甲、丙成绩 同样好;从中位数看,甲的中位数高,甲的成绩高;从方差 看,丙的方差小,丙的成绩较稳定,所以丙的成绩好.
归纳总结:不同的数字特征代表着不同的信息.由于 需要不同信息而选择不同的数字特征,对同一组数据的评价 可能会相差很大.
甲的中位数是95,乙的中位数是98.
(2)从平均分看,甲的平均分高,甲的成绩较好;从中位
数看,乙的中位数大,乙的成绩较好.
(3)
x
丙=
1 5
×(80+90+86+99+95)=90,丙的中位数为
90.
s
2
丙
=
1 5
×[(80-90)2+(90-90)2+(86-90)2+(99-90)2+
(95-90)2]=44.4;
(12,8),(x3,y3)=(17,9),(x4,y4)=(16,11),则 x =12.5, y =
n
∑xiyi-n x y
8.25.回归直线的斜率
^
b
=
i=1
∑n x2i -n-x2
≈0.729,截距
^
a
=
y
-
^
b
i=1
x ≈-0.863.所以所求的回归直线方程为y^=0.729x-0.863.
在(a,b)内的百分比
是左图中阴影部分的
面积
名称
数
形
结合
茎叶图
甲的数据: 95,81,75,89,71,65,7 6,88,94; 乙的数据: 83,86,93,99,88,103, 98,114,98
①茎是十位和百位数字, 叶是个位数字; ②可以帮助分析样本数据 的大致频率分布; ③可用来求数据的一些数 字特征,如中位数、众数 等
A.②③都不能为系统抽样 B.②④都不能为分层抽样 C.①④都可能为系统抽样 D.①③都可能为分层抽样
[解析] 分层抽样时,在各层所抽取的样本个数与该层 个体数的比值等于抽样比;系统抽样抽取的号码从小到大排 列后,每一个号码与前一个号码的差都等于分段间隔.
[答案] D
专题2 用样本的频率分布估计总体分布 总体分布反映了总体在各个范围内取值的可能性的大 小.在实际问题中,总体分布可以为合理的决策提供依据, 因此问题的解答就转化为求总体的分布问题,其解决的途径 是通过样本来估计总体.
散点图 n个ຫໍສະໝຸດ Baidu据点(xi,yi)
可以判断两个变量之间有 无相关关系
在育民中学举行的电脑知识竞赛中,将高一两 个班参赛的学生成绩(得分均为整数)进行整理后分成五组, 绘制出如下图所示的频率分布直方图.已知图中从左到右的 第一、第三、第四、第五小组的频率分别是 0.30,0.15,0.10,0.05,第二小组的频数是40.
[例4] (2011·江西高考)为了了解儿子身高与其父亲身高 的关系,随机抽取5对父子身高数据如下表:
父亲身高x(cm) 174 176 176 176 177 儿子身高y(cm) 175 175 176 177 178
则y对x的线性回归方程为( )
A.^y=x-1
B.^y=x+1
C.^y=88+12x
5
0.04
8
0.07
10
0.08
22
0.18
33
0.28
20
0.17
11
0.09
6
0.05
5
0.04
(2)画出频率分布直方图,如下图所示.
(3)因为样本中身高低于134 cm的人数的频率为 5+182+0 10=12230≈0.19, 所以估计身高低于134 cm的人数约占总人数的19%.
专题3 用样本的数字特征估计总体的数字特征 样本的数字特征可分为两大类,一类是反映样本数据的 集中趋势,包括样本平均数、众数、中位数,另一类是反映 样本数据的波动大小,包括样本方差及标准差.通常,我们 用样本的数字特征估计总体的数字特征.有关样本平均数及 方差的计算和应用是高考考查的热点.
(2)根据回归直线方程
^
y
=0.729x-0.863,要使
^
y
≤10,即
0.729x-0.863≤10,解得x<14.901,即机器的速度不能超过
14.901 r/s.
专题5 思想方法总结
思想1 数形结合思想
名称
数
形
数据分组及频
数:
[40,50),2; 频率分布直 [50,60),3;
方图 [60,70),10; [70,80),15; [80,90),12;
[例3] 某学校高一(3)班甲、乙两名同学的最近5次数学
测验成绩(单位:分)统计如下:
甲 65 98 94
98
95
乙 62 98 99 100 71
(1)分别写出甲、乙成绩的平均数和中位数;
(2)分别用平均数和中位数分析甲、乙两位同学中,哪位
同学成绩较好;
(3)又知同班同学丙的最近5次数学测验成绩(单位:分)如 下:
速度(r/s)
每小时生产有缺点物件数
8
5
12
8
14
9
16
11
(1)求出由于机器速度的影响,每小时生产有缺点物件数 的回归直线方程.
(2)若实际生产中允许每小时最多生产有缺点物件数为 10,那么机器的速度不得超过多少转每秒?
[解析] (1)用x来表示机器速度,y表示每小时生产的有
缺点的物件数,4个样本数据为(x1,y1)=(8,5),(x2,y2)=
i=1
i=1
(2)计算回归方程的系数a^,b^,
n xiyi-n-x -y
i=1
b^=
公式为
n x2i -n-x 2
i=1
a^=-y -b^-x ;
(3)写出回归方程^y=b^x+a^. 利用回归方程,我们可以进行估计和预测.若回归直线 方程为^y=b^x+a^,则x=x0处的估计值为^y0=b^x0+a^. 由于回归直线将部分观测值所反映的规律进行了延伸, 所以它在情况预报、资料补充等方面有着广泛的应用.
专题4 回归直线与回归方程 除了函数关系这种确定性的关系外,还有大量因变量的 取值带有一定随机性的两个变量之间的关系——相关关 系.分析两个变量的相关关系时,我们可根据样本数据的散 点图给出判断.若是线性相关,还可以利用最小二乘法求出 回归方程.
求回归方程的步骤:
n
n
(1)由已知数据计算出 x , y ,x2i ,xiyi;
①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,91,119,146,173,200,227,154; ④30,57,84,111,138,165,192,219,246,270. 关于上述样本的下列结论中,正确的是( )
500名志愿者中,年龄在[30,35)的人数为0.35×500=175.
思想2 转化与化归思想 转化与化归思想的实质是揭示联系,实现转化.除极简 单的数学问题外,每个数学问题的解决都是通过转化为已知 的问题实现的.转化与化归思想是解决数学问题的根本思 想,解题的过程实际上就是一步步转化的过程.统计中充分 体现了转化与化归的思想方法,如部分与整体的转化、数与 图的转化、随机性问题与确定性问题的转化等.