新人教A版高中数学第二册(必修2)课件:第九章统计章末复习课
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
要点三 样本的百分位数 1.四分位数:第25分位数,第50分位数,第75分位数,这三个分位数把一组由小到大
排列后的数据分成四等份,因此称为四分位数. 2.由频率分布直方图求百分位数时,一般采用方程的思想,设出第p百分位数,根据
其意义列出方程求解.
【例3】 欧洲联盟委员会和荷兰环境评估署公布了2013年全球主要20个国家和地区 的二氧化碳排放总量及人均二氧化碳排放量,结果如下表:
(2)由频率分布直方图可知,样本中“贫困户”的频率为0.06,所以估计该县100 万户家庭中“贫困户”的数量为100×0.06=6(万户).
【训练4】 某市有210名初中生参加数学竞赛预赛,随机调阅了60名学生的答卷, 成绩如下表:
成绩 1分 2分 3分 4分 5分 6分 7分 8分 9分 10分
【例2】 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料(单位: cm):
区间界限 [122,126) [126,130)
人数
5
8
区间界限 [142,146) [146,150)
人数
20
11
[130,134) 10
[150,154) 6
[134,138) [138,142)
22
1n∑ i=n1 (xi--x)2.
要点一 抽样方法的应用 1.抽样方法有:简单随机抽样、分层随机抽样. 2.两种抽样方法比较
【例1】 一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320 人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层 随机抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别 是( )
33
[154,158]
5
(1)列出样本的频率分布表(频率保留两位小数); (2)画出频率分布直方图; (3)估计身高低于134 cm的人数占总人数的百分比.
解 (1)列出样本频率分布表: 分组
[122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158]
合计
频数 5 8 10 22 33 20 11 6 5 120
频率 0.04 0.07 0.08 0.18 0.28 0.17 0.09 0.05 0.04 1.00
(2)画出频率分布直方图,如图所示.
(3)因为样本中身高低于 134 cm 的人数的频率为5+182+0 10=12230≈0.19. 所以估计身高低于134 cm的人数约占总人数的19%.
答案 44.5
要点四 用样本的集中趋势、离散程度估计总体
为了从整体上更好地把握总体规律,我们还可以通过样本数据的众数、中位数、平
均数估计总体的集中趋势,通过样本数据的方差或标准差估计总体的离散程度.众数
就是样本数据中出现次数最多的那个值;中位数就是把样本数据按照由小到大(或由
大到小)的顺序排列,如果数据的个数是奇数,则中位数为处于中间位置的数,如果
550 000
15.7
510 000
2.6
国家和地区 沙特阿拉伯
巴西 英国 墨西哥 伊朗 澳大利亚 意大利 法国 南非 波兰
排放总量/千吨 人均排放量/吨
490 000
16.6
480 000
2.0
480 000
7.5
470 000
3.9
410 000
5.3
390 000
16.9
390 000
6.4
370 000
9.众数、中位数和平均数的定义
(1)众数:一组数据中出现次数最多的数. (2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则 取中间两个数据的平均数. (3)平均数:一组数据的和除以数据个数所得到的数.
10.一组数据x1,x2,…,xn的方差和标准差 数据 x1,x2,…,xn 的方差为1n∑ i=n1 (xi--x)2=1n∑ i=n1x2i --x2,标准差为
所以这20个国家和地区的人均二氧化碳排放量的四分位数为:
25%分位数 5.5吨
50%分位数 7.45吨
75%分位数 12.65吨
【训练3】 某产品售后服务中心随机选取了10个工作日,分别记录了每个工作日接 到的客户服务电话的数量(单位:次):
63 38 25 42 56 48 53 39 28 47 则上述数据的50%分位数为________. 解析 把这组数据从小到大排序:25,28,38,39,42,47,48,53,56,63, 则10×50%=5. 所以 50%分位数为42+2 47=829=44.5.
480户,低收入家庭120户,为了了解有关家用轿车购买力的某个指标,要从中抽取
一个容量为100的样本;②从10名学生中抽取3人参加座谈会.方法:(1)简单随机抽
样;(2)分层随机抽样.则问题与方法配对正确的是( )
A.①(1),②(2)
B.①(2),②(1)
C.①(1),②(1)
D.①(2),②(2)
国家和地区 中国 美国 欧盟 印度
俄罗斯 日本 德国 韩国
加拿大 印度尼西亚
排放总量/千吨 人均排放量/吨
10 330 000
7.4
5 300 000
16.6
3 740 000
7.3
2 070 000
1.7
1 800 000
12.6
1 360 000
10.7
840 000
10.2
630 000
12.7
章末复习课
[网络构建]
[核心归纳] 1.简单随机抽样
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样(除非特殊声明,本 章所称的简单随机抽样指不放回简单随机抽样).通过简单随机抽样获得的样本称为 简单随机样本.
2.抽签法
先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以 是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌. 最后从盒中不放回地抽取号签,使与号签上的编号对应的个体进入样本,直到抽足 样本所需要的个体数.
5.7
330 000
6.2
320 000
8.5
则这些国家和地区人均二氧化碳排放量的四分位数是多少. 解 把这20个国家和地区的人均二氧化碳排放量按从小到大的顺序排列: 1.7,2.0,2.6,3.9,5.3,5.7,6.2,6.4,7.3,7.4,7.5,8.5,10.2,10.7,12.6, 12.7,15.7,16.6,16.6,16.9. 而 20×25%=5,所以这 20 个数的 25%分位数为5.3+2 5.7=5.5. 而 20×50%=10,所以 50%分位数为7.4+2 7.5=7.45, 而 20×75%=15,所以 75%分位数为12.6+2 12.7=12.65.
【训练2】 某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据 的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15, 则该班的学生人数是( )
A.45
B.50
C.55
D.60
解析 由频率分布直方图,知低于 60 分的频率为(0.010+0.005)×20=0.3.∴该班学 生人数 n=01.53=50. 答案 B
5.获取数据的基本途径
(1)通过调查获取数据;(2)通过观察获取数据;(3)通过试验获取数据;(4)通过查询获 取数据.
6.常用的统计图表 扇形图、条形图、频数分布直方图、折线图、频率分布直方图.
7.画频率分布直方图的步骤
(1)求极差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布 直方图.
(1)求这 200 户家庭的全年收入的样本均值-x和方差 s2; (2)用样本的频率分布估计总体分布,估计该县 100 万户家庭中“贫困户”的数量. 解 (1)这 200 户家庭的全年收入的样本均值-x=1×0.06+2×0.10+3×0.14+ 4×0.31+5×0.30+6×0.06+7×0.02+8×0.01=4, 方 差 s2 = ( - 3)2×0.06 + ( - 2)2×0.10 + ( - 1)2×0.14 + 02×0.31 + 12×0.30 + 22×0.06+32×0.02+42×0.01=1.96.
2、既然人生的幕布已经拉开,就一定要积极的演出; 既然脚步已经跨出,风雨坎坷也不能退步;既然我已把希 望播在这里,就一定要坚持到胜利的谢幕……
3、我们可以失望,但不能盲目。 4、自己选择的路、就要把它走完。 5、业精于勤,荒于嬉;行成于思,毁于随。 6、原以为“得不到”和“已失去”是最珍贵的,可…原 来把握眼前才是最重要的。 7、我不去想是否能够成功,既然选择了远方,便只 顾风雨兼程! 8、我走得很慢,但我从不后退! 9、志在山顶的人,不会念山腰的风景. 10、不要轻易用过去来衡量生活的幸与不幸!每个人 的一生都是可以绽放美丽的——只要你珍惜。
数据的个数是偶数,则中位数为中间两个数据的平均数;平均数就是所有样本数据
的平均值,用-x表示;标准差是反映样本数据分散程度大小的最常用统计量,其计算
公式是 s=
1n[(x1--x)2+(x2--x)2+…+(xn--x)2].有时也用标准差的平方
(方差)来代替标准差.
【例4】 根据某市所在地区的收入水平、消费水平等情况,拟将家庭年收入低于1.5 万元的家庭确定为“贫困户”,家庭年收入在[6.5,7.5)万元的家庭确定为“小康 户”,家庭年收入在[7.5,8.5]万元的家庭确定为“富裕户”,该市扶贫办为了打 好精准脱贫攻坚战,在所辖某县的100万户家庭中随机抽取200户家庭,对其2018年 的全年收入进行调查,抽查结果的频率分布直方图如图所示.
所以s≈1.22, 故样本的平均成绩为6分,标准差约为1.22分. (2)在 60 名选手中,有 12+3+3=18(名)学生预赛成绩在 7 分或 7 分以上,所以估 计 210 人中有1680×210=63(名)学生的预赛成绩在 7 分或 7 分以上,故大约有 63 名 学生可以进入复赛.
励志
1、当世界给草籽重压时,它总会用自己的方法破土 而出。
解析 问题①中的总体是由差异明显的几部分组成的,故可采用分层随机抽样
方法;问题②中总体的个数较少,故可采用简单随机抽样.故匹配正确的是B.
答案 B
要点二 用样本的取值规律估计总体的取值规律 与频率分布直方图有关问题的常见类型及解题策略 (1)已知频率分布直方图中的部分数据,求其他数据,可利用频率和等 于1求解. (2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围 结合求解.
人数 0
0
0
6 15 21 12 3
3
0
(1)求样本的平均成绩和标准差(精确到0.01分); (2)若规定预赛成绩在7分或7分以上的学生参加复赛,试估计有多少名学生可以进 入复赛?
解 (1)-x=610×(4×6+5×15+6×21+7×12+8×3+9×3)=6, s2=610×[6×(4-6)2+15×(5-6)2+21×(6-6)2+12×(7-6)2+3×(8-6)2+3×(9 -6)2]=1.5,
A.12,24,15,9
B.9,12,12,7
C.8,15,12,5
D.8,16,10,6
解析 因为抽样比为84000=210,故各层中依次抽取的人数分别是12600=8,32200=16,
22000=10,12200=6.
答案 D
【训练1】 问题:①某小区有800户家庭,其中高收入家庭200户,中等收入家庭
8.第p百分位数
(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少 有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值. (2)计算一组n个数据的第p百分位数的步骤 第1步,按从小到大排列原始数据. 第2步,计算i=n×p%. 第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整 数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.随机数法
先把总体中的个体编号,用随机数工具产生与总体中个体数量相等的整数随机数, 把产生的随机数作为抽中的编号,并剔除重复的编号,直到抽足样本所需要的个 体数.
4.分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于 一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取 的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体 称为层.