(学习指导) 分层随机抽样的均值与方差43 百分位数Word版含解析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.2分层随机抽样的均值与方差
4.3百分位数
学习目标核心素养
1.结合具体实例,掌握分层随机抽样的样本均值和样本方差.(难点、重点) 2.结合实例,能用样本估计百分位数,理解百分位数的统计含义.(难点、重点)1.通过计算分层随机抽样的样本的均值和方差,培养数学运算素养.
2.通过学习分层随机抽样的样本均值和样本方差的意义,培养数据分析素养.
设样本中不同层的平均数和相应权重分别为x1,x2,…,x n和w1,w2, …,w n,则这个样本的平均数为w1x1+w2x2+…+w n x n.为了简化表示,引进求和符号,记作w1x1+w2x2+…+w n x n=∑
n
i=1
w i x i.
2.分层随机抽样的方差
设样本中不同层的平均数分别为x1,x2,…,x n,方差分别为s21,s22,…s2n,相应的权重分别为w1,w2,…,w n,则这个样本的方差为s2=∑
n
i=1
w i[s2i+(x i-x)2] ,其中x为样本平均数.
3.百分位数
(1)定义:一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p.
(2)常用的百分位数:
①四分位数:25%,50%,75%,
②其它常用的百分位数:1%,5%,10%,90%,95%,99%.
(3)计算一组n个数据的p分位数的一般步骤如下:
第1步,按照从小到大排列原始数据;
第2步,计算i=np;
第3步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
思考:1.甲班和乙班各有学生20人、40人,甲班的数学成绩的平均数为80分,方差为2,乙班的数学成绩的平均数为82分,方差为4,那么甲班和乙班这
60人的数学成绩的平均分是80+82
2
=81分吗?方差是
2+4
2
=3吗?为什么?
[提示]不是,因为甲班和乙班在这60人中的权重是不同的.
2.“这次数学测试成绩的70%分位数是85分”这句话是什么意思?
提示:有70%的同学数学测试成绩小于或等于85分.
1.下列一组数据的25%分位数是()
2.1, 3.0, 3.2, 3.8, 3.4, 4.0, 4.2, 4.4, 5.3, 5.6.
A.3.2B.3.0C.4.4D.2.5
A[把该组数据按照由小到大排列,可得:
2.1, 3.0, 3.2, 3.4, 3.8, 4.0, 4.2, 4.4, 5.3, 5.6.
由i=10×25%=2.5,不是整数,则第3个数据3.2是25%分位数.]
2.某单位共有员工100人,其中年轻人有20人,平均年薪为5万元,中年人有80人,平均年薪为8万元,则该单位员工的平均年薪为() A.5万元B.8万元C.6.5万元D.7.4万元
D[由题意可知x=20
100×5+
80
100×8=7.4(万元).]
3.利用分层随机抽样抽得A,B两组数据,其平均数分别是x A=2.3,x B=2.8,这两组数据的平均数x=2.4,则A组数据在两组数据中的权重w A=________.
4
5[由x=w A x A+w B x B可得2.4=w A×2.3+(1-w A)×2.8,解得w A=4 5.]
分层随机抽样的平均数
【例1】某公益组织在某社区调查年龄在[20,50]内的居民熬夜时间,得到如下表格:
夜时长.
[解]由表可知该社区在[20,50]内的居民人数为3.6÷30%=12(百人),则年龄在[30,40)的居民所占比例为6÷12=50%,年龄在[40,50]的居民人数所占比例为1-30%-50%=20%,故该社区所调查居民的平均熬夜时长为x=4×30%+2×50%+1×20%=1.2+1+0.2=2.4(h).
分层随机抽样的平均数的计算方法
(1)第i层的权重w i、第i层的个体数x i,样本容量n,三者满足w i=x i
n,已知
其中2个可求另外1个.
(2)在利用公式x=w1x1+w2x2+…+w n x n求分层随机抽样的平均数时,要清楚公式中各符号的含义,避免代入数据时出现失误,同时要仔细运算,按照要求保留有效小数.
[跟进训练]
1.某市有大、中、小型商店的数量之比为1∶5∶9,其中大型商店的年纳税额为300万元,中型商店的年纳税额为25万元,小型商店的年纳税额为0.4万元,求该市所有商店的年平均纳税额.(结果保留一位小数)
[解]由题意知,该市所有商店的年平均纳税额为
x=
1
1+5+9
×300+
5
1+5+9
×25+
9
1+5+9
×0.4≈28.6(万元),
所以该市所有商店的年平均纳税额为28.6万元.分层随机抽样的方差
【例2】 甲、乙两支田径队体检结果为:甲队体重的平均数为60 kg ,方差为200,乙队体重的平均数为70 kg ,方差为300,又已知甲、乙两队的队员人数之比为1∶4,那么甲、乙两队全部队员的平均体重和方差分别是什么?
[解] 由题意可知x 甲=60,甲队队员在所有队员中所占权重为w 甲=
11+4=15, x 乙=70,乙队队员在所有队员中所占权重为w 乙=41+4
=45, 则甲、乙两队全部队员的平均体重为x =w
甲x 甲+w 乙x 乙=15×60+45×70
=68(kg),
甲、乙两队全部队员的体重的方差为 s 2=w 甲[s 2甲+(x 甲-x )2]+w 乙[s 2乙+(x 乙-x )2]
=15[200+(60-68)2]+45[300+(70-68)2]=296.
计算分层随机抽样的方差s 2的步骤
(1)确定x 1,x 2,…,x n ,s 21,s 22,…,s 2n ,w 1,w 2,…,w n ;
(2)确定x ;
(3)应用公式 s 2=∑n
i =1
w i [s 2i +(x i -x )2]计算s 2.
[跟进训练]
2.已知某省二、三、四线城市数量之比为1∶3∶6,2019年6月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10, 8,则二线城市的房价的方差为________.
118.52[设二线城市的房价的方差为s 2,由题意可知
20=
11+3+6[s 2+(1.2-2.4)2]+31+3+6[10+(1.2-1.8)2]+61+3+6[8+(1.2-
0.8)2], 解得s 2=118.52,即二线城市的房价的方差为118.52.]
百分位数
[探究问题]
1.p 分位数有什么特点?
提示:总体数据中的任意一个数小于或等于它的可能性是p .
2.某组数据的p 分位数在此组数据中一定存在吗?为什么?
提示:不一定.因为按照计算p 分位数的步骤,第2步计算所得的i =np 如果是整数,则p 分位数为第i 项与第(i +1)项数据的平均数,若第i 项与第(i +1)项数据不相等,则p 分位数在此组数据中就不存在.
【例3】 从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9, 9.0, 8.9, 8.6, 8.4, 8.5, 8.5, 8.5, 9.9, 7.8, 8.3, 8.0,
分别求出这组数据的25%,75%,95%分位数.
[思路点拨]按照从小到大排列数据→计算i =np →按照规则确定百分位数
[解] 将所有数据按从小到大排列,得
7.8, 7.9, 8.0, 8.3, 8.4, 8.5, 8.5, 8.5, 8.6, 8.9, 9.0, 9.9,
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,
则25%分位数是8.0+8.32
=8.15, 75%分位数是8.6+8.92
=8.75, 95%分位数是第12个数据,为9.9.
计算一组n个数据的p分位数的一般步骤
(1)排列:按照从小到大排列原始数据;
(2)算i:计算i=np;
(3)定数:若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
1.本节的重点和难点是对两个公式的理解与应用:
n
w i x i.计算分层随机抽样的平均数的公式:x=w1x1+w2x2+…+w n x n=∑
i=1
n
w i[s2i+(x i-x)2].
计算分层随机抽样的方差的公式:s2=∑
i=1
2.求一组数据的百分位数时,掌握其步骤:①按照从小到大排列原始数据;
②计算i=np;③若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
1.思考辨析(正确的画“√”,错误的画“×”)
(1)若一组样本数据各不相等,则75%分位数大于25%分位数.()
(2)计算分层随机抽样的均值与方差时,必须已知各层的权重.()
(3)若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.()
[提示](1)正确.
(2)正确.
(3)错误.若一组样本数据的10%分位数是23,则在这组数据中有10%的数据小于或等于23.
[答案](1)√(2)√(3)×
2.下列关于50%分位数的说法正确的是()
A.50%分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是50%
C.它是四分位数
D.它适用于总体是离散型的数据
A[由百分位数的意义可知选项B,C,D错误.]
3.已知甲、乙两地人口之比为2∶3,其中甲地人均年收入为8万元,乙地人均年收入为10万元,则甲、乙两地的人均年收入为________万元.
9.2[x=2
5×8+
3
5×10=9.2(万元).]
4.农科院在试验田中种植了两个小麦品种,亩数、亩均产量和标准差如下:
[解]甲、乙两个品种的平均亩产量为10
18×540+
8
18×576=556 kg;
甲、乙两个品种的亩产量的方差是
s2=w甲[s2甲+(x甲-x)2]+w乙[s2乙+(x乙-x)2]
=10
18[3
2+(540-556)2]+818[22+(576-556)2]≈326.78.
即甲、乙两个品种的平均亩产量和方差分别是556 kg,326.78.。