新教材2020人教B版数学必修第二册教师用书:第5章 5.1.2 数据的数字特征
人教B版高中数学必修第二册5-1-2数据的数字特征课件
3.中位数
如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位
数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称
xn
xn1 2
为这组数的中位
数.
4.百分位数
(1)一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有p%的数据不大于
高中数学
必修第二册 人教B版
5.1.2 数据的数字特征
知识 清单破
知识点 数据的数字特征 1.最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.一
般地,最大值用max表示,最小值用min表示.
2.平均数
(1)如果给定的一组数是x1,x2,…,xn,则这组数的平均数为
x
=
解析 由甲得分的极差为32,得30+x-6=32,
解得x=8,A正确;
甲得分的平均数为 1 ×(6+14+28+34+38)=24,
5
故甲得分的方差为 1 ×[(6-24)2+(14-24)2+(28-24)2+(34-24)2+(38-24)2]= 736 ,故B错误;
5
5
由乙得分的平均数为24,得 1 ×(12+25+26+20+y+31)=24,解得y=6,
5
所以乙得分的中位数、众数都是26,故C错误;
乙得分的方差为 1 ×[(12-24)2+(25-24)2+(26-24)2+(26-24)2+(31-24)2]= 202, 202< 736 ,
新教材2020人教B版数学必修第二册教师用书:第5章 5.1.4 用样本估计总体
5.1.4用样本估计总体1.用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.大数定律可以保证,当样本的容量越来越大时,估计的误差很小的可能性将越来越大.在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.2.用样本的分布估计总体的分布如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多.特别地,每一组的频率与总体对应的频率相差不会太大.同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,p n,一般来说,1 ni=1n(πi-p i)2=1n[(π1-p1)2+(π2-p2)2+…+(πn-p n)2]不等于零.同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来越大.1.如图是总体密度曲线,下列说法正确的是()A.组距越大,频率分布折线图越接近于它B.样本容量越小,频率分布折线图越接近于它C.阴影部分的面积代表总体在(a,b)内取值的百分比D.阴影部分的平均高度代表总体在(a,b)内取值的百分比C[当样本容量越大,组距越小时,频率分布折线图越接近总体密度曲线,但它永远达不到总体密度曲线.在总体密度曲线中,阴影部分的面积代表总体在(a,b)内取值的百分比.]2.对于数据3,3,2,3,6,3,10,3,6,3,2,有下列结论:①这组数据的众数是3;②这组数据的众数与中位数的数值不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等.其中正确结论的个数为()A.1B.2C.3D.4A[在这一组数据中,3出现次数最多,有6次,故众数是3;将数据按从小到大顺序排列后,最中间的数据是3,故中位数是3;平均数x=2×2+3×6+6×2+10=4,故只有①正确.]113.为了解中学300名男生的身高情况,随机抽取若干名男生进行身高测量,将所得数据整理后,画出频数分布直方图(如图).估计该校男生的身高在169.5 cm~174.5 cm之间的人数有()A.12B.48C.72 D.96C[根据图形,身高在169.5 cm~174.5 cm之间的人数的百分比为:12×100%=24%,6+10+16+12+6∴该校男生的身高在169.5 cm~174.5 cm之间的人数有300×24%=72(人).故选C.]4.从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两组的最高成绩分别是________,________,从图中看,________班的平均成绩较高.9692乙[由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在60~80之间,乙班成绩集中在70~90之间,故乙班的平均成绩较高.]【例1图所示:(1)填写下表:(2)①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力.[解] (1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10,所以x 乙=110(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:(2)①甲、乙的平均数相同,均为7,但s 甲<s 乙,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好. ③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.在日常生活中,当面对一组数据时,相比每一个观测值,有时我们更关心的是能反映这组数据特征的一些值,例如上述数据,我们可以从平均数、中位数、百分位数、众数、极差、方差、标准差等角度进行比较.1.某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群:13,13,14,15,15,15,15,16,17,17;乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?[解](1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+3+4+4+5+6+6+6+6+5610=15(岁),中位数为6岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.【例2】 相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:从中选出一位参加数学竞赛.[解] 设甲、乙二人成绩的平均数分别为x 甲、x 乙,方差分别为s 2甲、s 2乙.则x 甲=130+16(-3+8+0+7+5+1)=133,x 乙=130+16(3-1+8+4-2+6)=133,s 2甲=16[(-6)2+52+(-3)2+42+22+(-2)2]=473,s 2乙=16[02+(-4)2+52+12+(-5)2+32]=383.因此,甲、乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应选乙参加竞赛较合适.极差、方差与标准差的区别与联系,数据的离散程度可以通过极差、方差或标准差来描述.(1)极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.(2)方差或标准差则反映了一组数据围绕平均数波动的大小,为了得到以样本数据的单位表示的波动幅度通常用标准差,即样本方差的算术平方根,是样本数据到平均数的一种平均距离.2.甲、乙、丙、丁四名射手在选拔赛中所得的平均环数x及其方差s2如下表所示,则选送决赛的最佳人选应是()A.甲C.丙D.丁B[∵x乙=x丙>x甲=x丁,且s2甲=s2乙<s2丙<s2丁,故应选择乙进入决赛.]1.观察频率分布直方图,能获得样本数据的原始信息吗?[提示]把样本数据做成频率分布直方图后就失去了原始数据.2.给出样本数据的频率分布直方图,可以求出数据的众数,中位数和平均数吗?[提示]可以近似求出.【例3】统计局就某地居民的月收入(元)情况调查了10 000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[500,1 000)内.(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样的方法抽出100人作进一步分析,则月收入在[2 000,2 500)内的应抽取多少人?(2)根据频率分布直方图估计样本数据的中位数;(3)根据频率分布直方图估计样本数据的平均数.[思路探究]结合频率分布直方图求解.[解](1)因为(0.000 2+0.000 4+0.000 3+0.000 1)×500=0.5,所以a=0.51 000=0.000 5,月收入在[2 000,2 500)内的频率为0.25,所以100人中月收入在[2 000,2 500)内的人数为0.25×100=25.(2)因为0.000 2×500=0.1,0.000 4×500=0.2.0.000 5×500=0.25.0.1+0.2+0.25=0.55>0.5,所以样本数据的中位数是1 500+0.5-(0.1+0.2)0.000 5=1 900(元).(3)样本平均数为(750×0.000 2+1 250×0.000 4+1 750×0.000 5+2 250×0.000 5+2 750×0.000 3+3 250×0.000 1)×500=1 900(元).(变结论)本例条件不变.(1)若再从这10 000人中用分层抽样的方法抽出若干人,分析居民收入与幸福指数的关系,已知月收入在[2 000,2 500)内的抽取了40人.则月收入在[3 000,3 500]内的该抽多少人?(2)根据频率分布直方图估计样本数据的众数.[解](1)因为(0.000 2+0.000 4+0.000 3+0.000 1)×500=0.5.所以a=0.51 000=0.000 5.故月收入在[2 000,2 500)内的频率为0.000 5×500=0.25.∴新抽样本容量为400.25=160(人).∴月收入在[3 000,3 500]内的该抽:160×(0.000 1×500)=8(人).(2)由题图知众数为2 000元.1.利用频率分布直方图求数字特征(1)众数是最高的矩形的底边的中点;(2)中位数左右两侧直方图的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.(教师独具)1.本节课的重点是方差、标准差的计算,难点是利用频率分布直方法对总体进行估计的应用.2.学习本节课需要掌握的规律方法(1)利用样本数据求方差.(2)利用频率分布直方图求出的众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.3.本节课的易错点(1)计算标准差或方差时易将公式记错而致误.(2)利用频率分布直方图求数字特征时易出现理解错误而致错.1.思考辨析(1)在一组样本数据中,众数一定是唯一的.()(2)中位数是样本数据中最中间的那个数.()(3)方差的值越小,数据的离散程度越小.()[答案](1)×(2)×(3)√2.数据101,98,102,100,99的标准差为()A.2B.0C.1 D.2A[x=15(101+98+102+100+99)=100.∴s=15[(101-100)2+(98-100)2+(102-100)2+(100-100)2+(99-100)2= 2.]3.在某市2019年“创建文明城市”知识竞赛中,考评组从中抽取200份试卷进行分析,其分数的频率分布直方图如图所示,则分数在区间[60,70)上的人数大约有________.80[根据频率分布直方图,分数在区间[60,70)上的频率为0.04×10=0.4,∴分数在区间[60,70)上的人数为200×0.4=80.]4.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.11(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?[解] (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08. 又因为第二小组的频率=第二小组的频数样本容量, 所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由频率分布直方图可估计,该校高一年级学生的达标率为: 17+15+9+32+4+17+15+9+3×100%=88%.。
(原创)人B版(2019)数学-必修第二册-第五章+概率与统计-§1.2数据的数字特征PPT
(4)实际应用中,除了中位数外,经常使用的是 25% 分位数(简 称为第一四分位数)与 75% 分位数(简称为第三四分位数).
例1.计算上述尝试与发现中甲、乙两组数的75%分位数.
解:因为数据个数为 20,而且: 20 75% 15
因此,甲组数的
75%
分位数为:
x15
2
x16
9 10 2
9.5
(2)按照定义可知, p% 分位数可能不唯一.
(3)设一组数按照从小到大排列后为 x1, x2,..., xn ,计算 i np% 的值,
如果 i 不是整数,设 i0 为大于 i 的最小整数,取 xi0 为 p% 分位数:
如果
i
是整数,取
xi
xi1 2
为
p%
分位数.
规定:0 分位数是 x1(是最小值),100% 分位数是 xn(即最大值).
xi
nb)
a(1 n
n i 1
xi ) b
axb
【即时训练】
某同学使用计算器求30个数据的平均数时,错将其中一个数
据105输入为15,则由此求出的平均数与实际平均数的差是( B )
A.3.5
B.-3
C.3 D.-0.5
2.已知一组数据为20,30,40,50,50,60,70,80.则这组数据的平 均数是____5_0___.
探究点2 平均数
如果给定的一组数是 x1, x2,..., xn ,则这组数的平均数为:
1 x n (x1 x2 ... xn )
这一公式在数学中常简记为: x
1 n
n i 1
xi
.
注:(1)其中的符号 表示求和,读作“西格玛“, 右边式子
新教材2020人教B版数学必修第二册教师用书:第5章 统计与概率 章末复习课
【例1】 10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( )A.14B.13C.514D.1027(2)假设要检查某企业生产的袋装牛奶的质量是否达标,现从500袋牛奶中抽取60袋进行检验,利用随机数表法抽取样本时,先将500袋牛奶按000,001,…,499进行编号,使用随机数表中各个5位数组的后3位,选定第7行第5组数开始,取出047作为抽取的代号(从左向右读取数字),随后抽到的5袋牛奶的号码分别是(下面摘取了某随机数表第7行至第9行)________.84421 75331 57245 50688 77047 44767 2176335025 83921 20676 63016 47859 16955 5671998105 07185 12867 35807 44395 23879 33211(1)C(2)025,016,105,185,395[(1)根据题意,9n-1=13,解得n=28.故在整个抽样过程中每个个体被抽到的概率为1028=5 14.(2)由已知读取号码的初始值为第7行第5组数中的后3位,第一个号码为047.凡不在000~499中的数跳过去不取,前面已经取过的也跳过去不取,从而随后抽到的5袋牛奶的编号为025,016,105,185,395.]随机抽样有简单随机抽样和分层抽样两种.其共同点是在抽样过程中每个个体被抽到的机会相等,当总体中的个体数较少时,常采用简单随机抽样;当已知总体由差异明显的几部分组成时,常采用分层抽样.其中简单随机抽样是最简单、最基本的抽样方法.分层抽样时都要用到简单随机抽样.,应用各种抽样方法抽样时要注意以下问题(1)利用抽签法时要注意把号签放在不透明的容器中且搅拌均匀;(2)利用随机数表法时注意编号位数要一致;(3)在分层抽样中,若在某一层抽到的个体数不是整数,应在该层剔除部分个体,使抽取个体数为整数.1.某品牌白酒公司在甲、乙、丙三个地区分别有30个、120个、180个代理商.公司为了调查白酒销售的情况,需从这330个代理商中抽取一个容量为11的样本,记这项调查为①;在甲地区有10个特大型超市代理销售该品牌的白酒,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①②这两项调查宜采用的抽样方法依次是________.分层抽样,简单随机抽样[由于甲、乙、丙三个地区有明显差异,所以在完成①时,需用分层抽样.在甲地区有10个特大型超市代理销售该品牌的白酒,没有显著差异,所以完成②宜采用简单随机抽样.]【例2】中的环数如下表:赛后甲、你将给出怎样的评判?[解]为了分析的方便,先计算两人的统计指标如下表所示.规则1看方差,方差小者胜,则甲胜.规则2:平均环数与中位数相结合,平均环数高者胜.若平均环数相等,则再看中位数,中位数大者胜,则乙胜.规则3:平均环数与命中10环次数相结合,平均环数高者胜.若平均环数相等,则再看命中10环次数,命中10环次数多者胜,则乙胜.以上规则都是以平均环数为第一标准,如果比赛规则是看命中7环以上或10环的次数,那么就不需要先看平均环数了.样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括平均数、众数、中位数;另一类是反映样本数据的波动大小,包括样本方差及标准差.通常,在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,质量越稳定.2.甲、乙两人数学成绩的茎叶图如图所示:(1)求出这两名同学的数学成绩的平均数、标准差;(2)比较两名同学的成绩,谈谈你的看法.[解] (1)x 甲=110(65+70+80+86+89+95+91+94+107+113)=89.s 2甲=110[(65-89)2+(70-89)2+(80-89)2+(86-89)2+(89-89)2+(95-89)2+(91-89)2+(94-89)2+(107-89)2+(113-89)2]=199.2,∴s 甲≈14.1. x 乙=110(79+86+83+88+93+99+98+98+102+114)=94.s 2乙=110[(79-94)2+(86-94)2+(83-94)2+(88-94)2+(93-94)2+(99-94)2+(98-94)2+(98-94)2+(102-94)2+(114-94)2]=96.8.∴s 乙≈9.8.(2)由(1)得x 甲<x 乙且s 甲>s 乙.∴乙同学的平均成绩较高且标准差较小;说明乙同学比甲同学的成绩扎实,稳定.【例3】 w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.[解](1)如题图所示,用水量在[0.5,3)的频率的和为:(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为:(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).即该市居民该月的人均水费估计为10.5元.总体分布中相应的统计图表主要包括:频率分布表、频率分布直方图、频率分布折线图等.通过这些统计图表给出的相应统计信息可以估计总体.3.为了了解某校高一学生的视力情况,随机地抽查了该校100名高一学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A.64B.54C.48D.27B[[4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-(0.62+0.05+0.11)=1-0.78=0.22,∴a=(0.22+0.32)×100=54.]择题3个,判断题2个,甲、乙两人各抽一题.(1)甲、乙两人中有一个抽到选择题,另一个抽到判断题的概率是多少?(2)甲、乙两人中至少有一人抽到选择题的概率是多少?[思路探究]用列举法把所有可能的情况列举出来,或考虑互斥及对立事件的概率公式.[解]把3个选择题记为x1,x2,x3,2个判断题记为p1,p2.“甲抽到选择题,乙抽到判断题”的情况有:(x1,p1),(x1,p2),(x2,p1),(x2,p2),(x3,p1),(x3,p2),共6种;“甲抽到判断题,乙抽到选择题”的情况有:(p1,x1),(p1,x2),(p1,x3),(p2,x1),(p2,x2),(p2,x3),共6种;“甲、乙都抽到选择题”的情况有:(x1,x2),(x1,x3),(x2,x1),(x2,x3),(x3,x1),(x3,x2),共6种;“甲、乙都抽到判断题”的情况有:(p1,p2),(p2,p1),共2种.总的事件数为20.(1)“甲抽到选择题,乙抽到判断题”的概率为620=310,“甲抽到判断题,乙抽到选择题”的概率为620=310,故“甲、乙两人中有一个抽到选择题,另一个抽到判断题”的概率为310+3 10=3 5.(2)“甲、乙两人都抽到判断题”的概率为220=110,故“甲、乙两人至少有一人抽到选择题”的概率为1-110=9 10.互斥和对立都是反映事件相互关系的重要概念.互斥事件、对立事件的概率公式是基本公式,必须学会正确运用.运用互斥事件的概率加法公式时,首先要确定各事件是否彼此互斥,如果彼此互斥,分别求出各事件发生的概率,再求和.求复杂事件的概率通常有两种方法:一是将所求事件转化成彼此互斥的事件的和,运用互斥事件的概率加法公式P(A∪B)=P(A)+P(B)求解;二是先求其对立事件的概率,然后再运用公式P(A)=1-P(A)求解.4.甲、乙、丙、丁四人同时参加一等级考试,已知恰有1人过关(事件A)的概率为0.198,恰有2人过关(事件B)的概率为0.38,恰有3人过关(事件C)的概率为0.302,4人都过关(事件D)的概率为0.084.求:(1)至少有2人过关的概率P1;(2)至多有3人过关的概率P2.[解]由条件知,事件A、B、C、D彼此互斥.(1)P1=P(B∪C∪D)=P(B)+P(C)+P(D)=0.766.(2)P2=P(D)=1-P(D)=1-0.084=0.916.【例5】12每次取出后不放回,连续取两次.(1)求取出的两件产品中恰有一件次品的概率;(2)如果将“每次取出后不放回”这一条件换成“每次取出后放回”,则取出的两件产品中恰有一件次品的概率是多少?[思路探究](1)“不放回”是指抽取物体时,在每一次抽取后,把抽取的物体放到一边,并不放回到原处,这样,前后两次抽取时,后一次被抽取的物体总数较前一次被抽取的物体总数少.(2)“有放回”是指抽取物体时,每次抽取之后,都把抽取的物体放回原处,这样前后两次抽取时,被抽取的物体的总数是一样的.[解](1)每次取一件,取出后不放回,则连续取两次的所有基本事件共有6个,分别是(a1,a2),(a1,b),(a2,a1),(a2,b),(b,a1),(b,a2),其中小括号内左边的字母表示第1次取出的产品,右边的字母表示第2次取出的产品.可以确定这些基本事件的出现是等可能的.用A表示“取出的两件产品中恰有一件次品”,则A包含的基本事件是(a1,b),(a2,b),(b,a1),(b,a2).因为A中的基本事件的个数为4,所以P(A)=46=2 3.(2)有放回地连续取出两件产品,则所有的基本事件共有9个,分别是(a1,a1),(a1,a2),(a1,b),(a2,a1),(a2,a2),(a2,b),(b,a1),(b,a2),(b,b).由于每一件产品被取到的机会均等,因此可以确定这些基本事件的出现是等可能的.用B表示“取出的两件产品中恰有一件次品”,则B包含的基本事件是(a1,b),(a2,b),(b,a1),(b,a2).因为B中的基本事件的个数为4,所以P(B)=49.古典概型是一种最基本的概率模型,也是学习其他概率模型的基础,在高考题中,经常出现此种概率模型的题目.解题时要紧紧抓住古典概型的两个基本特征,即有限性和等可能性.在应用公式P(A)=mn时,关键是正确理解基本事件与事件A的关系,求出n,m.但列举时必须按某一顺序做到不重复、不遗漏.5.从{1,2,3,4,5}中随机选取一个数为a,从{1,2,3}中随机选取一个数为b,则b>a的概率是()A.45 B.35C.25 D.15D[∵当b=1时,没有满足条件的a值;当b=2时,a=1;当b=3时,a可以是1,可以是2,∴共3种情况.而从{1,2,3,4,5}中随机取一个数a,再从{1,2,3}中随机取一个数b,共有3×5=15种不同取法,∴b>a的概率为315=15.]。
人教B版高中数学必修第二册5-1-3数据的直观表示课件
(3)
频数 样本容量
=频率,此关系式的变形为
频数 频率
=样本容量,样本容量×频率=频数.
典例 (多选)某学校为了调查学生一周内在生活方面的支出情况,抽取了一个容量为n的样本, 其频率分布直方图如图所示,其中支出(单位:元)在[50,60]内的学生有60人,则下列说法正确
的是 ( BC )
A.样本中支出在[50,60]内的频率为0.03
高中数学
必修第二册 人教B版
5.1.3 数据的直观表示
知识 清单破
知识点 1 柱形图(条形图)、折线图与扇形图
类型 柱形图 (条形图) 折线图 扇形图
作用 形象地比较各种数据之间的数量关系,柱形 图中每一矩形都是等宽的
形象地表示数据的变化情况 形象地表示出各部分数据在全部数据中所 占的比例情况
知识点 2 茎叶图
1.一般来说,茎叶图中,所有的茎都竖直排列,而叶沿水平方向排列.若数据是两位数,则茎上的 数字表示十位上的数字,叶上的数字表示个位上的数字.茎叶图也可以只表示一组数. 2.用茎叶图表示数据的优缺点 (1)优点:①从茎叶图上可以看出所有的原始数据及数据的分布情况;②茎叶图可以在收集完 数据后描述,也可以在收集数据的过程中描述,即一边收集数据,一边记录. (2)缺点:①茎叶图只便于表示比较集中的数据;②茎叶图只方便比较两组数据.
知识辨析 判断正误,正确的画“√”,错误的画“✕”.
1.当数据量很大时,柱形图能够直观地反映数据分布的大致情况. ( √ )
2.画频率分布直方图时,分组越多越好.( ✕ ) 提示 组数越多、组距越小时,保留了较多的原始数据信息,但由于小矩形较多,有时图形会 变得非常不规则,不容易从中看出总体数据的分布特点.
(3)若固定分组数,则随着样本容量的增加,频率分布直方图中的各个矩形的高度会趋于特定
新教材高中数学第五章统计与概率5-1统计-数据的收集课件新人教B版必修第二册
题型2 简单随机抽样的应用[经典例题] 例2 (1)要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请 选择合适的抽样方法,写出抽样过程; (2)某车间工人加工了一批零件共40件.为了了解这批零件的质量情 况,要从中抽取10件进行检验,如何采用随机数表法抽取样本,写出 抽样步骤.
(2)在随机数表法抽样的过程中要注意: ①编号要求位数相同,读数时应结合编号特点进行读取,如:编号 为两位,则两位、两位地读取;编号为三位,则三位、三位地读取. ②第一个数字的抽取是随机的. ③读数的方向是任意的,且事先定好.
跟踪训练2 (1)第十三届中国(徐州)国际园林博览会于2021年9月开 幕.为做好徐州园博园运营管理工作,2022年春节期间,还需要从30 名大学生中随机抽取8人作为志愿者,请写出抽取样本的过程;
A.100 B.150 C.200 D.250
答案:A
解析:方法一:由题意可得 70 =3
n−70 1
550000,解得n=100,故选A.
方法二:由题意,抽样比为
3
75000=510,总体容量为3
500+1
500=5
000,故n=
5 000×510=100.
4.甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生,
新知初探·自主学习
教材要点
知识点一 总体与样本 所 考 察 问 题 涉 及 的 对 象 全 体 是 ___总_体____ , 总 体 中 每 个 对 象 都 是 ___个__体___,抽取的部分对象组成总体的一个样本,一个样本中包含的 个体数目是__样__本____容量. 知识点二 简单随机抽样 1.简单随机抽样的意义:一般地,简单随机抽样(也称为纯随机抽 样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个 体.简单随机抽样是其它各种抽样形式的基础.通常只是在总体单位
2019_2020学年新教材高中数学第五章统计与概率5.1.2数据的数字特征课件新人教B版必修第二册
3.1,2,3,4,5,6,7,8,9,10 的 25%分位数为________. 解析:因为数据个数为 10,而且 10×25%=2.5,故 25% 分位数为 3. 答案:3
5.1.2 数据的数字特征
1.结合实例,理解集中趋势参数平均数、中位数、众数 新课程 的统计含义,理解离散程度参数
标准差、方差、极差 标准 的统计含义,理解百分位数的统计含义.
2.通过学习,提高学生数据分析、逻辑推理的核心素养.
知识点一 最值与平均数 (一)教材梳理填空 1.最值:一组数据的最值指的是其中的最大值与 最小值 , 最值反映的是这组数最极端的情况. 一般地,最大值用 max 表 示,最小值用 min 表示.
C.标准差
D.中位数
解析:方差与标准差反映一组数据的离散程度.
答案:C
2.样本中共有五个个体,其值分别为 a,0,1,2,3,若该样本的平 均值为 1,则样本方差为________. 解析:由题意知15(a+0+1+2+3)=1,解得 a=-1. 所以样本方差为 s2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2 +(3-1)2]=2. 答案:2
2.平均数:如果给定的一组数是 x1,x2,… ,xn,则这组 数的平均数为 x =__n1_(_x_1+__x_2_+__…__+__x_n_)_.这一公式在数学中常简
记为 x =n1i=n1xi,其中的符号“∑”表示求和,读作“西格玛”,
新教材2020人教B版数学必修第二册教师用书:第5章 5.1.3 数据的直观表示
5.1.3 数据的直观表示学习目标核心素养1.了解柱形图、折线图、扇形图的定义.(一般)2.能够利用茎叶图解决实际问题.(重点)3.会列频数分布直方图,会列频率分布直方图.(难点)1.通过频率分布直方图及频率分布折线图的学习,培养数据分析的核心素养.2.借助茎叶图及频率分布直方图解决实际问题,提升数学运算的核心素养.1.柱形图一般地,柱形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,柱形图中每一矩形都是等宽的.2.折线图一般地,如果数据是随时间变化的,想了解数据的变化情况,可将数据用折线图来表示.3.扇形图扇形图也称为饼图、饼形图,它可以形象的表示各部分数据在全部数据中所占的比例情况.扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.4.茎叶图(1)定义将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).(2)茎叶图的优点与不足①优点:一是原始数据信息在图中能够保留,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.②不足:当样本数据较多时,茎叶图就显得不太方便.思考1:一般情况下,茎叶图中的“茎”“叶”分别指哪些数?[提示]“叶”是数据的最后一个数字,其前面的数字作为“茎”.5.作直方图步骤(1)找出最值,计算极差.(2)合理分组,确定区间.(3)整理数据.(4)作出有关图示.思考2:频率分布表与频率分布直方图各有什么特点?[提示]频率分布表反映具体数据在各个不同区间的取值频率,但不直观,数据的总体态势不明显.频率分布直方图能直观地表明数据分布的形状态势,但失去了原始数据.1.一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为()A.10组B.9组C.8组D.7组A[由题意可知,152-6010=9.2,故应将数据分为10组.]2.四种统计图:①条形图;②扇形图;③折线图;④直方图.四个特点:(a)易于比较数据之间的差异;(b)易于显示各组之间的频数的差别;(c)易于显示数据的变化趋势;(d)易于显示每组数据相对于总数的大小.统计图与特点选配方案分别是:①与(a);②与(c);③与(d);④与(b).其中选配方案正确的有() A.1个B.2个C.3个D.4个B[条形图易于比较数据之间的差异,故①与(a);扇形图易于显示每组数据相对于总数的大小,故②与(d);折线图易于显示数据的变化趋势,故③与(c);直方图易于显示各组之间的频数的差别,故④与(b).正确的有2个,故选B.]3.关于如图所示的统计图中(单位:万元),下列说法正确的是()A.第一季度总产值4.5万元B.第二季度平均产值6万元C.第二季度比第一季度增加5.8万元D.第二季度比第一季度增长33.5%C[依次分析选项可得:A.第一季度总产值3+4+4.5=11.5万元,错误;B.第二季度平均产值为4.5+6+6.83≈5.77万元,错误;C.第二季度比第一季度增加(4.5+6+6.8)-(3+4+4.5)=5.8万元,正确;D.第二季度比第一季度增长5.811.5≈50%,错误;故选C.]4.如图是一个班的语文成绩的茎叶图(单位:分),则优秀率(90分以上)是________,最低分是________.5 1 560 3 4 4 6 7 8 8 97 3 5 5 5 6 7 980 2 3 3 5 7914%51[由茎叶图知,样本容量为25,90分以上的有1人,故优秀率为1 25=4%,最低分为51分.]条形图、折线图、扇形图的应用【例1】现在的青少年由于沉迷电视、手机、网络游戏等,视力日渐减退,某市为了了解学生的视力变化情况,从全市九年级随机抽取了1 500名学生,统计了每个人连续三年视力检查的结果,根据视力在4.9以下的人数变化制成折线统计图,并对视力下降的主要因素进行调查,制成扇形统计图.解答下列问题:(1)图中D所在扇形的圆心角度数为________.(2)若2019年全市共有30 000名九年级学生,请你估计视力在4.9以下的学生约有多少名?(3)根据扇形统计图信息,你觉得中学生应该如何保护视力?[思路探究](1)由扇形统计图中的数据求出D占的百分比,乘以360°即可得到结果;(2)由样本中视力在4.9以下的人数占的百分比,乘以30 000即可得到结果;(3)根据扇形统计图中影响视力的因素,提出合理化建议即可.[解](1)根据题意得:360°×(1-40%-25%-20%)=54°.(2)根据题意得:30 000×8001 500=16 000(名),则估计视力在4.9以下的学生约有16 000名.(3)建议中学生应少看电视,少玩游戏,少看手机,才能保护视力.1.扇形统计图的特点(1)用扇形的面积表示部分在总体中所占的百分比.(2)易于显示每组数据相对于总数的大小.2.条形统计图的特点(1)条形统计图能清楚地表示出每个项目中的具体数目.(2)易于比较数据之间的差别.3.折线统计图的特点(1)能清楚地反映事物的变化情况.(2)显示数据变化趋势.1.某校公布了该校反映各年级学生体育达标情况的两张统计图(如图),该校七、八、九三个年级共有学生800人,甲、乙、丙三个同学看了这两张统计图后,甲说:“七年级的体育达标率最高”.乙说:“八年级共有学生264人.”丙说:“九年级的体育达标率最高.”甲、乙、丙三个同学中,说法正确的是()A.甲和乙B.乙和丙C.甲和丙D.甲、乙和丙B[由扇形统计图可以看出:八年级共有学生800×33%=264人;七年级的达标率为260×100%≈87.8%;800×37%九年级的达标率为235×100%≈97.9%;800×30%八年级的达标率为250264×100%≈94.7%.则九年级的达标率最高.则乙、丙的说法是正确的,故选B.]茎叶图及其应用【例2】良品种B进行对照试验.两种小麦各种植了25亩,所得亩产量数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,43 4,443,445,445,451,454.品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,41 0,412,415,416,422,430.(1)画出茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,得出统计结论.[解](1)茎叶图如图.(2)样本容量不大,画茎叶图很方便,此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息丢失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A亩产量的平均数比品种B亩产量的平均数大;②品种A的亩产量波动比品种B的亩产量波动大,故品种A的亩产量稳定性较差.1.绘制茎叶图关键是分清茎和叶.一般地说,当数据是两位数时,十位上的数字为“茎”,个位上的数字为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据的特点合理地选择茎和叶.2.应用茎叶图可以对两组数据进行比较,画图时,要找到两组数据共同的茎,分析时要从数据分布的对称性、中位数、稳定性等方面比较.3.茎叶图的优点是保留了原始信息,并可以随时记录数据,但当样本容量较大时就不适合了.2.如图茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,则污损的数字是________.3[设污损的叶对应的成绩为x,由茎叶图可得,89×5=83+83+87+x+90+99,∴x=3.故污损的数字是3.]频率分布直方图的绘制及应用[1.我们抽取样本的目的是什么?把抽出的样本数据做成频率分布表,需要对数据做什么工作?[提示]用样本去估计总体,为决策提供依据.分组、频数累计、计算频数和频率.2.画频率分布直方图时,如何决定组数与组距?[提示]组数与样本容量大小有关,当样本容量不超过100时,按数据的多少,常分成5~12组,组距的选择应力求取整,一般运用“极差组距=组数”.3.同一组数据,如果组距不同,得到的频率分布直方图相同吗? [提示] 不相同.对同一组数据,不同的组距与组数对结果有一定的影响. 4.频率分布直方图的纵轴表示频率吗? [提示] 不.表示频率组距.【例3】 某省为了了解和掌握2019年高考考生的实际答卷情况,随机地取出了100名考生的数学成绩,数据如下:(单位:分)135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 105 124 87 131 97 102 123 104 104 128 109 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108 (1)列出频率分布表;(2)画出频率分布直方图和折线图;(3)估计该省考生数学成绩在[100,120)分之间的比例.[思路探究] 先求极差.根据极差与数据个数确定组距、组数,然后按频率分布直方图的画法绘制图形.[解] 100个数据中,最大值为135,最小值为80,极差为135-80=55.取组距为5,则组数为555=11.(1)频率分布表如下:分组频数频率频率/组距[80,85)10.010.002[85,90)20.020.004[90,95)40.040.008[95,100)140.140.028[100,105)240.240.048[105,110)150.150.030[110,115)120.120.024[115,120)90.090.018[120,125)110.110.022[125,130)60.060.012[130,135]20.020.004合计100 1.000.200注:表中加上“它是频率分布直方图的纵坐标.(2)根据频率分布表中的有关信息画出频率分布直方图及折线图,如图所示:(3)从频率分布表中可知,这100名考生的数学成绩在[100,120)分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在[100,120)分之间的比例为60%.(0.60=60%)1.在列频率分布表时,极差、组距、组数有如下关系(1)若极差组距为整数,则极差组距=组数;(2)若极差组距不为整数,则极差组距的整数部分+1=组数.2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.3.有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)求样本数据不足0的频率.[解](1)频率分布表如下:分组频数频率[-20,-15)70.035[-15,-10)110.055[-10,-5)150.075[-5,0)400.200[0,5)490.245[5,10)410.205[10,15)200.100[15,20]170.085合计200 1.000(2)频率分布直方图和频率分布折线图如图所示:(3)样本数据不足0的频率为:0.035+0.055+0.075+0.200=0.365.(教师独具)1.本节课的重点是会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,难点是理解用样本的频率分布估计总体分布的方法.2.本节课要重点掌握的规律方法(1)绘制频率分布直方图的步骤.(2)绘制茎叶图的步骤及其意义.(3)会应用频率分布直方图的意义解决问题.3.本节课的易错点将频率分布直方图中的纵轴的单位看错而致错,是本节课的主要易错点.1.思考辨析(1)样本容量越大,估计的越准确.()(2)频率分布直方图的纵轴表示频率.()(3)茎叶图不能增加数据.()[答案](1)√(2)×(3)×2.某市广播电视局欲招聘播音员一名,对A,B两名候选人进行了两项素质测试,两人的两项测试成绩如下表所示.根据实际需要,广播电视局将面试、综合知识测试的得分按3∶2的比例计算两人的总成绩,那么________(填A或B)将被录用.测试成绩测试项目A B面试9095综合知识测试8580B[A的成绩=(90×3+85×2)÷5=88(分),B的成绩=(95×3+80×2)÷5=89(分).因此B将被录用.]3.某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107;乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.[解]甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.。
人教B版高中数学必修第二册5.1 5.1.2 数据的数字特征【课件】
所以
(2x1-2-x )2+(2x2-2-nx )2+…+(2xn-2-x )2=2s.故选 D.
5.[多选]若某同学连续3次考试的名次(3次考试均没有出现并列名 次的情况)不超过3,则称该同学为班级的尖子生.根据甲、乙、丙、丁 四位同学过去连续3次考试名次的数据,推断一定是尖子生的是( )
A.甲同学:均值为1,众数为1 B.乙同学:均值为2,方差小于1 C.丙同学:中位数为2,众数为2 D.丁同学:众数为2,方差大于1
(2)甲、乙两组成绩的中位数、平均数都是80,其中甲组成绩在80 分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从 这一角度看,甲组成绩总体较好.
(3)从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成 绩大于或等于90分的有24人,所以乙组成绩在高分段的人数多.同 时,乙组满分比甲组多6人,从这一角度看,乙组成绩较好
B.84,78,83
C.84,81,84
D.78,81,84
解析 将所给数据按从小到大的顺序排列是68,70,77,78,79,
83,84,84,85,95,显然众数为84,而本组数据共10个,中间两位是
79,83,它们的平均数为81,即中位数为81.因为10×75%=7.5,所以这
一组数据的75%分位数为84.故选C.
解析 去掉一个最高分 95 分与一个最低分 89 分后,所得的 5 个得分
90+90+93+94+93
分别是 90,90,93,94,93,所以该选手的最后得分为
5
=4560=92(分).故选 C.
3.某校为了解学生的课外阅读情况,随机抽取了一个班级的学
生,对他们一周的读书时间进行了统计,统计数据如下表所示:
高一上学期数学人教B版()必修第二册第五章5.1.2数据的数字特征-课件
尝试与发现3:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 甲 1 2 2 2 2 3 3 3 5 5 6 6 8 8 9 10 10 12 13 13 乙 0 0 0 0 1 1 2 3 4 5 6 6 7 7 10 14 14 14 14 15
高一(1)班:69 84 69 80 75 70 75 71 87 70 80 84 73 81 81 73 66 78 68 79 73 75 76 76 70 74 71 86 63 88
高一(1)班的最大值是88,最小值是63,平均数是75.5,中位数75, 第一四分位数70,第三四分位数80.
70 72 81 89 81 77 72 77 67 67 72 79 81 75 75 84
上述情境中的两个班的语文成绩,可以从哪些角度进行对照?
上述情境中的两个班的语文成绩,可以从最值、平均数、中位数 等角度进行对照.
最值 :
一组数据的最值指的是其中的最大值和最小值,反应数据 最极端的情况.一般地,最大值用max表示,最小值用min表示.
指出甲乙两组数的中位数.
尝试与发现3:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 甲 1 2 2 2 2 3 3 3 5 5 6 6 8 8 9 10 10 12 13 13 乙 0 0 0 0 1 1 2 3 4 5 6 6 7 7 10 14 14 14 14 15
尝试与发现2:
有甲乙两个组,每组有6名成员,他们暑假读书的本数如下:
甲组:1,2,3,3,4,5
平均数为 3
乙组:0,0,1,2,3,12 平均数为 3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.1.2 数据的数字特征1.数据的最值、平均数、中位数、百分位数、众数(1)最值 一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.一般地,最大值用max 表示,最小值用min 表示.(2)平均数①公式:指样本数据的平均数,即x =1n (x 1+x 2+…+x n )=1n ∑i =1n x i . 一般地,利用平均数的计算公式可知,如果x 1,x 2,…,x n 的平均数为x ,且a ,b 为常数,则 ax 1+b ,ax 2+b ,…,ax n +b 的平均数为a x -+b . ②求和的性质∑i =1n (x i +y i )=∑i =1n x i +∑i =1n y i ;∑i =1n (kx i )=k ∑i =1n x i ;∑i =1nt =nt . (3)中位数一般地,有时也可以借助中位数来表示一组数的中心位置:如果一组数有奇数个数,且按照从小到大排列后为x 1,x 2,…,x 2n +1,则称x n +1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x 1,x 2,…,x 2n ,则称x n +x n +12为这组数的中位数.(4)百分位数①定义 直观来说,一组数的p %分位数指的是,将这组数按照从小到大的顺序排列后,处于p %位置的数.中位数就是一个50%分位数.②意义 一组数的p %(p ∈(0,100))分位数指的是满足下列条件的一个数值:至少有p %的数据不大于该值,且至少有(100-p )%的数据不小于该值.规定:0分位数是x 1(即最小值),100%分位数是x n (即最大值).(5)众数一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.2.极差、方差、标准差数据的离散程度可以用极差、方差或标准差来描述.(1)极差一组数的极差指的是这组数的最大值减去最小值所得的差.(2)方差如果x 1,x 2,…,x n 的平均数为x -,则方差可用求和符号表示为s 2=1n i =1n (x i-x -)2.此时,如果a ,b 为常数,则ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2.(3)标准差方差的算术平方根称为标准差.思考:方差与标准差的大小与样本数据有什么关系?[提示] 标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.1.下列各数字特征中,能反映一组数据离散程度的是()A.众数B.平均数C.标准差D.中位数C[方差与标准差反映一组数据的离散程度.]2.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值约为() A.4.55B.4.5C.12.5D.1.64A[x=4×3+3×2+5×4+6×23+2+4+2≈4.55.]3.己知一组数据10,30,50,50,60,70,80.其中平均数、中位数和众数的大小关系是()A.平均数>中位数>众数B.平均数<中位数<众数C.中位数<众数<平均数D.众数=中位数=平均数D[由所给数据可得平均数为50,中位数为50,众数为50,因此众数=中位数=平均数.]4.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________;(2)命中环数的标准差为________.(1)7(2)2[(1)x=7+8+7+9+5+4+9+10+7+410=7.(2)s2=110[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s=2.]【例甲:18 19 20 20 21 22 23 31 31 35乙:11 17 19 21 22 24 24 30 30 32则这10天甲的日加工零件的平均数为________;乙的日加工零件的众数与中位数分别为________和________.[思路探究]由甲、乙的数值求出甲、乙10天中每天加工零件的个数,然后求平均数,众数与中位数.2424与3023[甲每天加工零件的个数分别为:18,19,20,20,21,22,23,31,31,35,所求平均数为x甲=110×(18+19+20+20+21+22+23+31+31+35)=24.乙每天加工零件的个数分别为:11,17,19,21,22,24,24,30,30,32,故众数为24与30.中位数为12×(22+24)=23.]1.求平均数时要注意数据的个数,不要重计或漏计.2.求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两个数据的平均数.3.若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.1.十名工人某天生产同一零件,生产的件数是:15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有() A.a>b>c B.c>b>aC.c>a>b D.b>c>aB[从小到大排列此数据为:10,12,14,14,15,15,16,17,17,17.平均数为110(10+12+14×2+15×2+16+17×3)=14.7;数据17出现了三次,17为众数;在第5位、第6位均是15,故15为中位数.所以这组数据的平均数是14.7,中位数是15,众数是17.]【例中抽取6件测量数据为:甲:9910098100100103乙:9910010299100100(1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定.[思路探究][解](1)x甲=16×(99+100+98+100+100+103)=100,x乙=16×(99+100+102+99+100+100)=100,s2甲=16×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s2乙=16×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)由(1)知x甲=x乙,比较它们的方差,∵s2甲>s2乙,故乙机床加工零件的质量更稳定.1.在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差),方差大说明取值分散性大,方差小说明取值分散性小或者取值集中、稳定.2.关于统计的有关性质及规律:(1)若x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,…,mx n+a的平均数是m x+a;(2)数据x1,x2,…,x n与数据x1+a,x2+a,…,x n+a的方差相等;(3)若x1,x2,…,x n的方差为s2,那么ax1,ax2,…,ax n的方差为a2s2.2.为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如下表:(1)求这50(2)求这50户居民每天丢弃旧塑料袋的标准差.[解](1)平均数x=150×(2×6+3×16+4×15+5×13)=18550=3.7.众数是3,中位数是4.(2)这50户居民每天丢弃旧塑料袋的方差为s2=150×[6×(2-3.7)2+16×(3-3.7)2+15×(4-3.7)2+13×(5-3.7)2]=150×48.5=0.97.所以标准差s≈0.985.[探究问题]1.平均数、中位数、众数中,哪一个量与样本的每一个数据都有关,它的缺点是什么?[提示]平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但它的缺点是受数据中极端值的影响较大.2.在电视大奖赛中,计算评委打分的平均值时,为什么要去掉一个最高分和一个最低分?[提示]为了避免平均值受数据中个别极端值的影响,增大它在估计总体时的可靠性.【例3】据了解,某公司的33名职工月工资(单位:元)如下:________更能反映这个公司员工的工资水平.[思路探究]求出中位数与平均数,再根据其反映的数字特征进行判断.5 333,4 000中位数[把工资数据由小到大排列,得到中位数为4 000元.平均数x=11 000+10 000+9 000×2+8 000+6 500×5+5 500×3+4 000×2033≈5 333元.由数字知,中位数更能反映该公司员工的工资水平,平均数受少数人工资额的影响较大,不能反映这个公司员工的工资水平.]因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息.但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低.3.设矩形的长为a ,宽为b ,其比满足b ∶a =5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中,下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 ( )A .甲批次的总体平均数与标准值更接近B .乙批次的总体平均数与标准值更接近C .两个批次的总体平均数与标准值接近程度相同D .两个批次的总体平均数与标准值接近程度不能确定A [x 甲=0.598+0.625+0.628+0.595+0.6395=0.617, x 乙=0.618+0.613+0.592+0.622+0.6205=0.613, ∴x 甲与0.618更接近.](教师独具)1.本节课的重点是会求样本的众数、中位数、平均数、标准差、方差,难点是理解用样本的数字特征来估计总体数字特征的方法.2.本节课要掌握的几类问题(1)当平均数大于中位数时,说明数据中存在较大的极端值;反之,说明数据中存在较小的极端值.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.3.本节课的易错点是计算标准差和方差时公式记错致误.1.思考辨析(1)样本的平均数描述了样本数据的平均水平.()(2)方差越大、数据越集中在平均数左右.()(3)中位数是样本数据中最中间位置的数据.()[答案](1)√(2)×(3)×2.2019年某高一学生下学期政治考试成绩为79798484868487909097则该生政治考试成绩的平均数和众数依次为()A.8584B.8485C.8684D.8486C[由题意可知,平均数x=79+79+84+84+86+84+87+90+90+97=86,10众数为84.]3.国家射击队要从甲、乙、丙、丁四名队员中选出一名选手去参加射击比赛,四人的平均成绩和方差如下表:则应派________丙[由表可知,丙的平均成绩较高,且发挥比较稳定,应派丙去参赛最合适.]4.甲、乙两台机床在相同的条件下同时生产一种零件,现在从中各抽测10个,它们的尺寸分别为(单位:mm)甲:10.210.110.98.99.910.39.7109.910.1乙:10.310.49.69.910.1109.89.710.210分别计算上面两个样本的平均数与标准差.如果图纸上的设计尺寸为10 mm,从计算结果看,用哪台机床加工这种零件较合适.[解]x甲=110(10.2+10.1+10.9+…+10.1)=10,x乙=110(10.3+10.4+9.6+…+10)=10,s甲=110[(10.2-10)2+(10.1-10)2+…+(10.1-10)2]=0.228≈0.477,s乙=110[(10.3-10)2+(10.4-10)2+…+(10-10)2]=0.06≈0.245,∵x甲=x乙=10,s甲>s乙,∴乙比甲稳定,用乙较合适.。