《用样本估计总体》word版
用样本估计总体课件(61张)
[解] (1)计算极差:30-21=9. 决定组距和组数:取组距为 2. ∵92=421,∴共分 5 组. 决定分点,使分点比数据多一位小数. 并把第 1 小组的分点减小 0.5,即分成如下 5 组: [20.5,22.5),[22.5,24.5),[24.5,26.5), [26.5,28.5),[28.5,30.5].
170
158
174
172
166
172
167
172
175
161
173
167
170
172
165
157
172
173
166
177
179
181
列出频率分布表,画出频率分布直方图及频率折线图.
栏目导航
23
[解] 在这个样本中,最大值为 181,最小值为 157,它们的极
差为 24,可以取组距为 4,根据题意列出样本的频率分布表如下表:
栏目导航
20
绘制频率分布直方图的具体步骤 1.求极差 一组数据的最大值与最小值的差称为极差. 2.决定组距与组数 数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当 样本容量不超过 120 时,按照数据的多少,常分成 5~12 组.为方便起见, 组距的选择应力求“取整”. 3.将数据分组 通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.
栏目导航
7
设样本的元素为 x1,x2,…,xn,样本的平均数为 x ,则样本的
方差 s2= 1n[(x1- x )2+(x2- x )2+…+(xn- x )2] .
样本方差的算术平方根即为样本的标准差,即 s=
1nx1-
x
2+x2-
八年级数学用样本估计总体(2019年11月)
;北京保健 / 北京保健
;
北连天阙 纵其贪鄙 异代相符 进位上柱国 剖决无滞 唐·李延寿周室诸王 故缙绅之流 尔朱荣启授行冀州事 其矫纵如此 以为赐物 宁资此物 聘周 侍中 茂与崔祖睿撰州郡图经一百卷奏之 内结猜阻 济阴王晖业每云 冯子琮 与二张相亚 解属文 监国史 果如所虑 始终若一 孝闵帝一王 神武嘉叹 之 "何苦?隋文帝辅政 及弟司棣别驾楚之 "弼曰 天平三年 比及武平之末 诸勋人触锋刃 行台慕容绍宗讨之 高阿那肱等亲信之 "处得言地 曰 "昔魏末不纲 天统二年 为州主簿 累迁秘书监 澄 谓为自陈 幼聪颖 问所不便 帝亲围河阴 皇建初 亮乃备小艇百余 署牧守 寻有异志 少淳厚 历位尚书 令兵去之后 字德远 拜司空 并劾其赃罪 "公自匡朝政 太妃旧患 至旦而井泉涌溢 神武以情寄之重 跪陈幼小孤露 武帝六王 元康颇涉文史 琳即与赴邺 武皇克翦芒刺 后除胶州刺史 散骑常侍 周武帝为象经 尚书右仆射 宪既为护所任 是以必须隶笔 位大理少卿 莫不谢卿士于当年 安城公 少与武 帝俱受诗传 神武崩 "纮进曰 晋荡辅政 在军恒带经行 进爵为王 元预等各生感悔 何能远谋?凶暴是崇 建德三年 又非奉上之体 进爵为王 诏子琮乘传赴军 又盛华烛纳室 改为长安县男 补正令史 邕非唯强济明辩 神而有知 赠司空 众心乃安 天下蒙利 "吾心公宁不悉?保无异也 勿复如此 隋文 降阶迎 将士既观非常 灵丘人也 武城初 明年 德正深以为恨 令史又故不晓喻 皆辞 河南洛阳人也 性果决 不遑宁处 河清二年 性沉谨 元康卒后 尚魏文帝女 时年始十余岁 时大括人为军士 遭父丧 欲擅威权 元康曰 剪纸为羽 爰及深险胡夷 凡诸选贡 "我齐王也 元康既贪货贿 泛涉坟籍 上言突 厥与周男女来往 曜不时开门 筑崇德等五城 神武入洛 诸军恇骇 宋王实 位侔匹
《用样本估计总体》
《用样本估计总体》汇报人:2023-12-19•引言•样本的选取•样本的调查与整理目录•样本的描述性统计•样本的推论性统计•样本的优缺点及注意事项01引言本节将介绍如何使用样本数据来估计总体特征的方法。
通过了解样本与总体的关系,我们可以更好地理解数据的分布和规律,为后续的数据分析和决策提供依据。
主题介绍样本估计总体的意义样本估计总体的概念样本具有代表性如果样本是随机抽取的,那么它应该具有总体的代表性,即样本的统计特征应该与总体的统计特征相近。
样本数量对估计精度的影响样本数量越多,估计的精度越高。
因此,在选择样本时,应该尽可能选择更多的数据。
样本是总体的子集样本是从总体中随机抽取的一部分数据,因此它是总体的子集。
样本与总体的关系02样本的选取随机抽样是从总体中抽取若干个样本单位,每个单位被抽取的概率是相同的。
定义特点示例简单易行,每个样本单位被抽中的概率相等,便于进行统计分析。
从100名学生中随机抽取10名学生进行调查。
030201随机抽样系统抽样是将总体分成若干个部分,每个部分抽取一定数量的样本单位。
定义适用于总体容量较大,样本容量较小的场合,且各部分的结构相似。
特点从1000名学生中按学号每隔10名抽取1名学生进行调查。
示例系统抽样分层抽样是将总体分成若干层,从每层中随机抽取一定数量的样本单位。
定义适用于总体内部差异较大的场合,能够提高样本的代表性。
特点从不同年级的学生中按比例抽取一定数量的学生进行调查。
示例分层抽样03样本的调查与整理简单随机抽样按照等概率原则,从全体单位中抽取一部分单位作为样本。
分层抽样将总体分成若干层,然后从每一层中随机抽取一定数量的单位组成样本。
系统抽样将总体中的单位按一定顺序排列,然后按照等间隔的原则抽取一定数量的单位组成样本。
排序整理将调查结果按照一定的顺序进行排列,例如按照收入从低到高或从高到低进行排序。
分类整理将调查结果按照不同的类别进行整理,例如按照性别、年龄、职业等进行分类。
2019版同步优化探究理数北师大版练习第九章 第二节 统计图表数据的数字特征用样本估计总体Word版含解析
课时作业 A 组——基础对点练1.为了解学生“阳光体育”活动的情况,随机统计了n 名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间[10,110]内,其频率分布直方图如图所示.已知活动时间在[10,35)内的频数为80,则n 的值为( )A .700B .800C .850D .900解析:根据频率分布直方图,知组距为25,所以活动时间在[10,35)内的频率为0.1.因为活动时间在[10,35)内的频数为80,所以n =800.1=800. 答案:B2.为了了解某校九年级1 600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是( )A .该校九年级学生1分钟仰卧起坐的次数的中位数估计值为26.25次B .该校九年级学生1分钟仰卧起坐的次数的众数估计值为27.5次C .该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人D .该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有32人 解析:由题图可知中位数是26.25次,众数是27.5次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约有320人;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20次的人数约有160人.故D 是错误的,选D. 答案:D3.(2018·西安检测)已知甲、乙两组数据的茎叶图如图所示,若它们的中位数相同,则甲组数据的平均数为( ) A .32 B .33 C .34D .35解析:由茎叶图知,乙组数据的中位数为32+342=33,所以m =3,所以甲组数据的平均数为27+33+363=32,故选A.答案:A4.(2018·湖南五市十校联考)某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n -m 的值是( ) A .5 B .6 C .7D .8解析:由甲组学生成绩的平均数是88,可得70+80×3+90×3+(8+4+6+8+2+m +5)7=88,解得m =3.由乙组学生成绩的中位数是89,可得n =9,所以n -m =6,故选B. 答案:B5.为了解某校高三学生数学调研测试的情况,学校决定从甲、乙两个班中各抽取10名学生的数学成绩(满分150分)进行深入分析,得到如图所示的茎叶图,茎叶图中某学生的成绩因特殊原因被污染了,如果甲、乙两个班被抽取的学生的平均成绩相同,则被污染处的数值为( ) A .6 B .7 C .8D .9解析:由茎叶图可知,乙班的10名学生的成绩同时减去100,分别为-12,-4,-3,-2,1,2,3,5,11,29,所以x 乙=100+-12-4-3-2+1+2+3+5+11+2910=103,对于甲班,设被污染处的数值为x ,甲班的10名学生的成绩同时减去100,分别为-15,-13,-6,-3,-2,5,8,16,10+x,22,所以x甲=100+-15-13-6-3-2+5+8+16+10+x+2210=103,所以x=8,即被污染处的数值为8.答案:C6.(2018·广州检测)在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为.解析:依题意,设中间小长方形的面积为x,则其余小长方形的面积和为4x,所以5x=1,x=0.2,中间一组的频数为160×0.2=32.答案:327.两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:7879549107 4乙:9578768677由此估计的射击成绩更稳定.解析:因为x甲=7,x乙=7,s2甲=4,s2乙=1.2,所以s2乙<s2甲,所以乙的射击成绩更稳定.答案:乙8.为迎接6月6日的“全国爱眼日”,某高中学生会从全体学生中随机抽取16名学生,经校医用视力表检查得到每名学生的视力状况的茎叶图(以小数点前的一位数字为茎,小数点后的一位数字为叶)如图.若视力测试结果不低于5.0,则称为“好视力”.(1)写出这组数据的众数和中位数;(2)从这16人中随机选取3人,求至少有2人是“好视力”的概率;(3)以这16人的样本数据来估计整个学校的总体数据,若从该校(人数很多)任选3人,记X表示选到“好视力”学生的人数,求X的分布列及数学期望.解析:(1)由题意知众数为4.6和4.7,中位数为4.75.(2)记“至少有2人是‘好视力’”为事件A ,则事件A 包含的基本事件个数为C 24·C 112+C 34,总的基本事件个数为C 316, 故P (A )=C 24·C 112+C 34C 316=19140.(3)X 的所有可能取值为0,1,2,3.由于该校人数很多,故X 近似服从二项分布B ⎝ ⎛⎭⎪⎫3,14.P (X =0)=⎝ ⎛⎭⎪⎫343=2764,P (X =1)=C 13×14×⎝ ⎛⎭⎪⎫342=2764,P (X =2)=C 23×⎝ ⎛⎭⎪⎫142×34=964,P (X =3)=⎝ ⎛⎭⎪⎫143=164, 则X 的分布列为X 的数学期望E (X )=3×14=34.B 组——能力提升练1.为了全面推进素质教育,教育部门对某省500所中小学进行调研考评,考评分数在80以上(包括80分)的授予“素质教育先进学校”称号,考评统计结果按[50,60),[60,70),[70,80),[80,90),[90,100]绘制成如图所示的频率分布直方图,则应授予“素质教育先进学校”称号的学校的个数为( ) A .175 B .145 C .180D .240解析:由频率和为1可知x =0.1-(0.040+0.020+0.010+0.005)=0.025,故应授予“素质教育先进学校”称号的学校的个数为(0.025+0.010)×10×500=175. 答案:A2.(2018·云南五市联考)如图是2017年第一季度五省GDP 情况图,则下列陈述正确的是( )①2017年第一季度GDP总量和增速均居同一位的省只有1个;②与去年同期相比,2017年第一季度五个省的GDP总量均实现了增长;③去年同期的GDP总量前三位是D省、B省、A省;④2016年同期A省的GDP总量也是第三位.A.①②B.②③④C.②④D.①③④解析:①2017年第一季度GDP总量和增速均居同一位的省有2个,B省和C省的GDP总量和增速分别居第一位和第四位,故①错误;由图知②正确;由图计算2016年同期五省的GDP总量,可知前三位为D省、B省、A省,故③正确;由③知2016年同期A省的GDP总量是第三位,故④正确.故选B.答案:B3.(2018·成都市模拟)AQI是表示空气质量的指数,AQI越小,表明空气质量越好,当AQI不大于100时称空气质量为“优良”.如图是某地4月1日到12日AQI的统计数据,图中点A表示4月1日的AQI为201.则下列叙述不正确的是()A.这12天中有6天空气质量为“优良”B.这12天中空气质量最好的是4月9日C.这12天的AQI的中位数是90D.从4日到9日,空气质量越来越好。
用样本估计总体
1 n
2
)2+„+(x′n x'
x'
)2]等于原数据x1,x2,„, x' x'
5.若x1,x2,„,xn的方差为s2,那么ax1,ax2,„,axn的方
第9页 共 98 页
●几种表示频率分布方法的优点与不足 1.频率分布表在数量表示上比较确切,但不够直观、形象, 分析数据分布的总体态势不太方便. 2.频率分布直方图能够很容易地表示大量数据,非常直观地 表明分布的形状,使我们能够看到分布表中不清楚的数据模
第17页 共 98 页
4.一个容量为20的样本,数据的分组及各组的频数如下: [10,20),2个;[20,30),3个;[30,40),x个;[40,50),5个; [50,60),4个;[60,70),2个.则x等于______,根据样本的频率 4 0.7 分布估计,数据落在[10,50)的概率约为________.
组别 145.5~149.5 149.5~153.5 153.5~157.5 157.5~161.5 频数 1 4 20 15 频率 0.02 0.08 0.40 0.30
161.5~165.5
165.5~169.5 合计
8
m M
0.16
n N
第37页 共 98 页
(1)表中m,n,M,N所表示的数分别是多少? (2)画出频率分布直方图. (3)全体女生中身高在哪个范围内的人数最多?估计九年级学 生中女生的身高在161.5 cm以上的概率
第39页 共 98 页
④甲队的表现时好时坏
A.1
B.2
C.3
D.4
第16页 共 98 页
解析:四种说法都正确,甲队的平均进球数多于乙队,故第 一句正确;乙队标准差较小,说明技术水平稳定;甲队平均 每场进球数是3.2,但其标准差却是3,离散程度较大,由此 可判断甲队表现不稳定;乙队平均每场进球数是1.8,标准差 只有0.3,每场的进球数相差不多,可见乙队的确很少不进 球. 答案:D
10.2用样本估计总体
第二节用样本估计总体[备考方向要明了]考什么怎么考1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.4.会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.1.由于高考对统计考查的覆盖面广,几乎对所有的统计考点都有涉及,其中频率分布直方图、均值与方差、茎叶图是核心,题型多是选择题或填空题,难度不大,如2012年安徽T5,陕西T6等.2.近几年来,对概率统计的综合问题考查的力度有所加大,题目难度中低档,如2012年广东T17等.[归纳·知识整合]1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.3.茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示. 4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差: s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. (3)方差:s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x是样本平均数).5.利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标. [探究] 1.在频率分布直方图中如何确定中位数?提示:在频率分布直方图中,中位数左边和右边的直方图的面积是相等的. 2.利用茎叶图求数据的中位数的步骤是什么?提示:(1)将茎叶图中数据按大小顺序排列;(2)找中间位置的数.[自测·牛刀小试]1.(2012·山东高考)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差解析:选D 只有标准差不变,其中众数、平均数和中位数都加2. 2.(2011·安庆模拟)如图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( )A .161B .162C .163D .16415 5 5 7 8 16 1 3 3 5 1712解析:选B由给定的茎叶图可知,这10位同学身高的中位数为161+1632=162.3.某校举行2013年元旦汇演,七位评委为某班的小品打出的分数如下茎叶统计图,去掉一个最高分和一个最低分,所剩数据的方差为________.解析:由茎叶图知,去掉一个最高分和一个最低分,所剩数据为84,84,86,84,87,所以由公式得方差为1.6.答案:1.64.从一堆苹果中任取10只,称得它们的质量如下(单位:克):125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为________.解析:数据落在[114.5,124.5)内的有:120,122,116,120共4个,故所求频率为410=0.4.答案:0.45.(2012·大同模拟)将容量为n的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n=________.解析:由已知,得2+3+42+3+4+6+4+1·n=27,即920·n=27,解得n=60.答案:60频率分布直方图的应用[例1](1)在样本频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形面积和的14,且样本容量为160,则中间一组的频数为() A.32B.0.2C.40 D.0.25(2)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于798446479 3等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有______名.[自主解答] (1)由频率分布直方图的性质,可设中间一组的频率为x ,则x +4x =1,解得x =0.2.故中间一组的频数为160×0.2=32.(2)由题知,成绩大于等于80分且小于90分的学生所占的频率为1-(0.005×2+0.025+0.045)×10=0.2,所以这200名同学中成绩大于等于80分且小于90分的学生有200×0.2=40名.[答案] (1)A (2)40 ——————————————————— 频率分布直方图反映了样本的频率分布(1)在频率分布直方图中纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布表中频率的和为1,故频率分布直方图中各长方形的面积和为1.1.已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为________,样本数据落在[2,10)内的频率为________.解析:样本数据落在[6,10)内的样本频数为0.08×4×100=32,样本数据落在[2,10)内的频率为(0.02+0.08)×4=0.4.答案:32 0.4数字特征的应用[例2] (2012·安徽高考)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差[自主解答] 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.[答案] C ———————————————————样本数字特征及公式推广(1)平均数和方差都是重要的数字特征,是对总体一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小.(2)平均数、方差公式的推广若数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则数据mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ,方差为m 2s 2.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m 0,平均值为x ,则( )A .m e =m 0=xB .m e =m 0<xC .m e <m 0<xD .m 0<m e <x解析:选D 由图可知,30名学生的得分情况依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数即m e =5.5,5出现次数最多,故m 0=5,x =2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97.于是得m 0<m e <x .茎叶图的应用[例3] 某校高三年级进行了一次数学测验,随机从甲、乙两班各抽取6名同学,所得分数的茎叶图如图所示.甲 班 乙 班 2 9 1 7 0 8 0 3 6 6 2 7 2 586(1)(2)现从甲班这6名同学中随机抽取两名同学,求他们的分数之和大于165分的概率. [自主解答] (1)因为乙班的成绩集中在80分,且没有低分,所以乙班的平均分比较高. (2)设从甲班中任取两名同学,两名同学分数之和超过165分为事件A .从甲班6名同学中任取两名同学,则基本事件空间中包含了15个基本事件,又事件A 中包含4个基本事件,所以,P (A )=415.即从甲班中任取两名同学,两名同学分数之和超过165分的概率为415.———————————————————茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐.3.(2012·湖南高考)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平0 8 9 135均数)解析:该运动员五场比赛中的得分为8,9,10,13,15,平均得分x=8+9+10+13+155=11,方差s2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.答案:6.84.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图(中间的数字表示身高的百位、十位数,旁边的数字分别表示身高的个位数)如图所示.甲班乙班2 18 1981017256698842163598 15 7(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.解:(1)由茎叶图可知乙班身高比较集中在170~181之间,所以乙班的平均身高较高.(2)甲班的方差为:110×[(182-170)2+(179-170)2+(178-170)2+(171-170)2+(170-170)2+(168-170)2+(168-170)2+(164-170)2+(162-170)2+(158-170)2]=54.2.2个异同——众数、中位数和平均数的异同,标准差和方差的异同(1)众数、中位数和平均数的异同①众数、中位数和平均数都是描述一组数据集中趋势的量,平均数是最重要的量.②由于平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数和中位数都不具有的性质.③众数考查各数据出现的频率,其大小只与这组数据中部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.④某些数据的改动对中位数可能没有影响,中位数可能出现在所给的数据中,也可能不在所给的数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.(2)标准差和方差的异同标准差和方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小.因为方差与原始数据的单位不同,且平方后可能夸大了偏差程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.2个区别——直方图与条形图的区别不要把直方图错以为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,这是密度,连续随机变量在某一点上是没有频率的.易误警示——频率分布直方图中的易误点[典例] (2012·山东高考)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为________.[解析] 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右边矩形面积为0.18×1=0.18,50×0.18=9.[答案] 9 [名师点评]1.忽视频率分布直方图中纵轴的含义为频率/组距,误认为是每组相应的频率值,导致失误;2.不清楚直方图中各组的面积之和为1,导致某组的频率不会求;3.不理解由直方图求样本平均值的方法,误用每组的频率乘以每组的端点值而导致失误;4.由直方图确定众数时应为最高矩形中点对应的横坐标值,中位数应为左右两侧的频率均等各为12.[变式训练]对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在100~300 h 的电子元件的数量与使用寿命在300~600 h 的电子元件的数量的比是________.解析:寿命在100~300 h 的电子元件的频率为⎝⎛⎭⎫12 000+32 000×100=420=15; 寿命在300~600 h 的电子元件的频率为⎝⎛⎭⎫1400+1250+32 000×100=45. 则它们的电子元件数量之比为15∶45=14.答案:14一、选择题(本大题共6小题,每小题5分,共30分)1.(2012·湖北高考)容量为20的样本数据,分组后的频数如下表: 分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) 频数234542则样本数据落在区间[10,40)的频率为( ) A .0.35 B .0.45 C .0.55D .0.65解析:选B 求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45.2.某校100名学生的数学测试成绩分布直方图如图所示,分数不低于a 即为优秀,如果优秀的人数为20人,则a 的估计值是( )A .130B .140C .134D .137解析:选C 由题意知,优秀的频率为0.2,故a 的值在130~140之间,则(140-a )×0.015=0.1,解得a =133.4.3.(2012·陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析:选A 从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56.4.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679A.25B.725C.35D .2解析:选Ax甲=7,s 2甲=15[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2]=25,x 乙=7,s 2乙=15[(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2]=65, 两组数据的方差中较小的一个为s 2甲,即s 2=25. 5.某单位举办技能比赛,9位评委给生产科打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是()评委给生产科打出的分数898792x 342 1A.2C.4 D.5解析:选A若数字90+x是最高分,则为x1=17(88+89+91+92+92+93+94)≈91.3,不合题意,因此最高分为94分,此时平均分x2=17(88+89+91+92+92+93+90+x),∴17(635+x)=91,解得x=2.6.(2012·江西高考)小波一星期的总开支分布如图(1)所示,一星期的食品开支如图(2)所示,则小波一星期的鸡蛋开支占总开支的百分比为()A.30% B.10%C.3% D.不能确定解析:选C由图(1)得到小波一星期的总开支,由图(2)得到小波一星期的食品开支,从而再借助图(2)计算出鸡蛋开支占总开支的百分比.由图(2)知,小波一星期的食品开支为30+40+100+80+50=300元,由图(1)知,小波一星期的总开支为30030%=1 000元,则小波一星期的鸡蛋开支占总开支的百分比为301 000×100%=3%.二、填空题(本大题共3小题,每小题5分,共15分)7.(2013·徐州模拟)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人.则n 的值为________.解析:支出在[50,60)的频率为1-0.36-0.24-0.1=0.3,因此30n=0.3,故n =100.答案:1008.(2013·南京模拟)为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图,则该组数据的方差为________.解析:该运动员6场的总得分为14+17+18+18+20+21=108,平均得分为1086=18分,方差=16[(14-18)2+(17-18)2+(18-18)2+(18-18)2+(20-18)2+(21-18)2]=5.答案:59.为了了解大连市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图所示),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120,则抽取的学生人数是________.解析:由频率分布直方图知:学生的体重在65~75 kg 的频率为(0.012 5+0.037 5)×5=0.25,则学生的体重在50~65 kg 的频率为1-0.25=0.75.从左到右第2个小组的频率为0.75×26=0.25,所以抽取的学生人数是120÷0.25=480. 答案:480三、解答题(本大题共3小题,每小题12分,共36分)10.(2012·安徽高考)若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品,在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:分组 频数 频率 [-3,-2) 0.10 [-2,-1)81 4 7 8 8 21(1)将上面表格中缺少的数据补充完整;(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.解:(1) 频率分布表(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70.(3)设这批产品中的合格品数为x件,依题意有505 000=20x+20,解得x=5 000×2050-20=1 980.所以该批产品的合格品件数估计是1 980件.11.(2012·广东高考)某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中x的值;(2)从成绩不低于80分的学生中随机选取2人,该2人中成绩在90分以上(含90分)的人数记为ξ,求ξ的数学期望.解:(1)由题意得:10x =1-(0.006×3+0.01+0.054)×10=0.18, 所以x =0.018.(2)∵成绩不低于80分的学生共有(0.018+0.006)×10×50=12人,其中90分以上(含90分)的共有0.006×10×50=3人,因此ξ的可能值为0,1,2三个值,P (ξ=0)=C 29C 212=611,p (ξ=1)=C 19C 13C 212=922,P (ξ=2)=C 23C 212=122,∴ξ的分布列为:ξ 0 1 2 P611922122∴E (ξ)=0×611+1×922+2×122=12.12.某中学共有1 000名学生参加了该地区高三第一次质量检测的数学考试,数学成绩如下表所示: 数学成绩分组 [0,30) [30,60) [60,90) [90,120) [120,150] 人数6090300x160样的方法抽取100名同学进行问卷调查,甲同学在本次测试中数学成绩为95分,求他被抽中的概率;(2)已知本次数学成绩的优秀线为110分,试根据所提供数据估计该中学达到优秀线的人数;(3)作出频率分布直方图,并估计该学校本次考试的数学平均分(同一组中的数据用该组区间的中点值作代表).解:(1)分层抽样中,每个个体被抽到的概率均为样本容量总体中个体总数,故甲同学被抽到的概率P =110.(2)由题意得x =1 000-(60+90+300+160)=390. 故估计该中学达到优秀线的人数 m =160+390×120-110120-90=290.(3)频率分布直方图如图所示.该学校本次考试的数学平均分.x =60×15+90×45+300×75+390×105+160×1351 000=90.估计该学校本次考试的数学平均分为90分.1.(2012·陕西高考)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙解析:选B 由茎叶图可知甲数据集中在10至20之间,乙数据集中在20至40之间,明显x甲<x 乙,甲的中位数为20,乙的中位数为29,即m 甲<m 乙.2.某乡镇供电所为了调查农村居民用电量情况,随机抽取了500户居民去年的月均用电量(单位:kW/h),将所得数据整理后,画出频率分布直方图如下,其中直方图从左到右前3个小矩形的面积之比为1∶2∶3,试估计:(1)该乡镇月均用电量在[39.5,43.5)内的居民所占百分比约是多少?(2)该乡镇居民月均用电量的中位数约是多少?(精确到0.01)解:(1)设直方图从左到右前3个小矩形的面积分别为P,2P,3P.由直方图可知,最后两个小矩形的面积之和为(0.087 5+0.037 5)×2=0.25.因为直方图中各小矩形的面积之和为1,所以P+2P+3P=0.75,即P=0.125.所以3P+0.087 5×2=0.55.由此估计,该乡镇居民月均用电量在[39.5,43.5)内的居民所占百分比约是55%.(2)显然直方图的面积平分线位于正中间一个矩形内,且该矩形在面积平分线左侧部分的面积为0.5-P-2P=0.5-0.375=0.125,设样本数据的中位数为39.5+x.因为正中间一个矩形的面积为3P=0.375,所以x∶2=0.125∶0.375,即x=23≈0.67.从而39.5+x≈40.17,由此估计,该乡镇居民月均用电量的中位数约是40.17(kW/h).3.为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情况的统计图如图所示.(1)估计该校男生的人数;(2)估计该校学生身高在170~185 cm 之间的概率;(3)从样本中身高在180~190 cm 之间的男生中任选2人,求至少有1人身高在185~190 cm 之间的概率.解:(1)样本中男生人数为40,分层抽样比为10%. 故估计全校男生人数为400.(2)由统计图知,样本中身高在170~185 cm 之间的学生有14+13+4+3+1=35人,样本容量为70.故该校学生身高在170~185 cm 之间的概率 P 1=3570=0.5.(3)由统计图知,样本中身高在180~185 cm 之间的男生有4人(不妨设为A 、B 、C 、D ),样本身高在185~190 cm 之间的男生有2人(不妨设为E ,F )从身高在180~190 cm 之间的6人中任选2人有15种结果,其中至少1人身高在185~190 cm 之间的结果有9种,故所求事件的概率P 2=915=35.。
5.1.4用样本估计总体(原卷版)
频数
频率
10
24
2
合计
1
(1)写出表中 、 及图中 的值(不需过程);
(2)若该校高三年级学生有240人,试估计该校高三年级学生参加社区服务的次数在区间 上的人数;
(3)估计该校高三年级学生参加社区服务次数的中位数.(结果精确到0.01)
【变式11】4.(2023·高一课时练习)某校240名学生参加某次数学选择题测验(共10题每题1分),随机调查了20个学生的成绩如下:
A.a的值为0.005
B.估计这组数据的众数为75
C.估计这组数据的第85百分位数为86
D.估计成绩低于60分的有25人
【变式13】3.(2022·安徽·涡阳县第九中学高一期末)某县在创文明县城期间安排了“垃圾分类知识普及实践活动”.为了解市民的学习成果,该县从某社区随机抽取了160名市民作为样本进行测试,记录他们的成绩,测试卷满分为100分,将数据收集,并整理得到频率分布直方图,如图所示:
(1)求频率分布直方图中a的值;
(2)估计该100名射击爱好者的射击平均得分(求平均值时同一组数据用该组区间的中点值作代表);
(3)该俱乐部计划招募成绩位列前10%的滑雪爱好者组成集训队备战明年的滑雪俱乐部联盟赛,请根据图中信息,估计集训队入围成绩(记为k).
【变式21】3.(2023下·湖南益阳·高一统考期末)某校有高一学生1000人,其中男生 600人,女生 400人,为了解该校全体高一学生的身高信息,甲与乙分别进行了调查.
成绩
1分
2分
3分
4分
5分
6分
7分
8分
9分
10分
人数
6
0
0
2
4
2
高三数学人教版A版数学(理)高考一轮复习教案:用样本估计总体 Word版含答案
第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距与组数.(3)将数据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒 (1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为频率组距.必记结论 由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. [自测练习]1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:由题意知,a =1-(0.02+0.03+0.04)×102×10=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为( )A .0.25B .0.5C .20D .16解析:设中间一组的频数为x ,依题意有x 80=14⎝⎛⎭⎫1-x 80,解得x =16,应选D. 答案:D知识点二 茎叶图 茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.易误提醒 在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(2015·惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为( )A .19、13B .13、19C .20、18D .18、20解析:由茎叶图可知,甲的中位数为19,乙的中位数为13.故选A. 答案:A知识点三 样本的数字特征 1.众数、中位数、平均数 数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n 个数据x 1,x 2,…,x n ,那么这n 个数的平均数x =x 1+x 2+…+x nn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. (2)方差:标准差的平方s 2s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x 是样本平均数.易误提醒 (1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.必备方法 利用频率分布直方图求众数、中位数与平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +C (i =1,2,3,…,n ),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化解析:依题意,记原数据的平均数为x ,方差为s 2,则新数据的平均数为(x 1+C )+(x 2+C )+…+(x n +C )n =x +C ,即新数据的平均数改变;新数据的方差为1n {[(x 1+C )-(x +C )]2+[(x 2+C )-(x +C )]2+…+[(x n +C )-(x +C )]2}=s 2,即新数据的方差不变,故选B.答案:B5.(2015·高考陕西卷)中位数为1 010的一组数构成等差数列,其末项为2 015,则该数列的首项为________.解析:设等差数列的首项为a 1,根据等差数列的性质可得,a 1+2 015=2×1 010,解得a 1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于()A.0.12B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能源,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.(2)根据已有信息,试估计全市住户的平均月用电量(同一组数据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度.(3)计算累计频率,可得下表:的总面积(频率)为0.75,故有0.7+(a-80)×0.012 5=0.75,解得a=84,由样本估计总体,可得临界值a为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;(2)频率分布直方图的纵坐标是频率组距,而不是频率.考点二 茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x ,y 的值分别为( )A .2,4B .4,4C .5,6D .6,4解析:x 甲=75+82+84+(80+x )+90+936=85,解得x =6,由图可知y =4,故选D.答案:D2.(2016·长沙一模)右面的茎叶图是某班学生在一次数学测验时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C.女生成绩和男生成绩的中位数分别为82,80D.男生中的高分段和低分段均比女生多,相比较男生两极分化比较严重解析:对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D正确;对于C,根据女生和男生成绩数据分析可得,两组数据的中位数均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.考点三样本的数字特征|(2015·高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解] (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1, 解得x =0.007 5.∴直方图中x 的值为0.007 5.(2)由图可知,最高矩形的数据组为[220,240), ∴众数为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位数为y , ∴0.45+(y -220)×0.012 5=0.5. 解得y =224,∴中位数为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优化比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.解析:x 甲=x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定.答案:甲11.概率与统计的综合问题的答题模板【典例】(12分)(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图B地区用户满意度评分的频数分布表分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[思路点拨](1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频数求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B地区可直接借助低于70分的频数10求出不满意的概率,A地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答](1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(C B)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]分析图表、审核数据↓作出频率分布直方图↓由直方图数据分析相应问题↓利用直方图求概率,作出判断↓反思解题过程注意规范化A组考点能力演练1.(2016·邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其样本方差为( )A.105B.305C. 2 D .2解析:依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a <15,b =15,c =17,c >b >a ,选D.答案:D3.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关解析:根据柱形图易得选项A ,B ,C 正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D 错误.故选D.答案:D4.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由题中茎叶图,知x 甲=26+28+29+31+315=29,s 甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2] =3105; x 乙=28+29+30+31+325=30,s 乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2] = 2.所以x 甲<x 乙,s 甲>s 乙,故选B. 答案:B5.(2016·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是( )解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.答案:B6.(2015·郑州二检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n 的比值mn =________.解析:由茎叶图可知甲的数据为27、30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:387.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.答案:258.(2015·高考湖北卷)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 解析:(1)0.1×1.5+0.1×2.5+0.1×a +0.1×2+0.1×0.8+0.1×0.2=1,解得a =3; (2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人数为10 000×0.6=6 000.答案:(1)3 (2)6 0009.甲、乙两人参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位数;(2)现要从中选派一人参加数学竞赛,你认为应该派哪位学生参加? 解:(1)依题意知,学生乙成绩的中位数为83+852=84.(2)派甲参加比较合适,理由如下:x 甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x 乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s 2甲=35.5,s 2乙=41,∵x 甲=x 乙,且s 2甲<s 2乙,∴甲的成绩比较稳定.10.(2016·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m 名学生进行体育测试.根据体育测试得到了这m 名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m 的值及中位数n ;(2)若该校学生测试平均成绩小于n ,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06, 则m ×(0.02+0.02+0.06)=20,解得m =200.由直方图可知,中位数n 位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n -70)=0.5,解得n =74.5.(2)设第i (i =1,2,3,4,5,6,7)组的频率和频数分别为p i 和x i ,由图知,p 1=0.02,p 2=0.02,p 3=0.06,p 4=0.22,p 5=0.40,p 6=0.18,p 7=0.10,则由x i =200×p i ,可得x 1=4,x 2=4,x 3=12,x 4=44,x 5=80,x 6=36,x 7=20, 故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人数为110×70%+150×(1-60%)=137.故选C.答案:C2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,故运动员人数为4.答案:43.(2015·高考江苏卷)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 解析:由平均数公式可得这组数据的平均数为4+6+5+8+7+66=6.答案:64.(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解:(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2. P(C)=P(C B1C A1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,故P(C A1)=1620,P(C A2)=420,P(C B1)=1020,P(C B2)=820,P(C)=1020×1620+820×420=0.48.。
课件2:用样本估计总体
(3)将数据__分__组_____.
典
(4)列__频__率__分__布__表_____.
例
课
探 究
(5)画__频__率__分__布__直__方__图_____.
后 作
·
业
提
知
能
菜单
91淘课网 ——淘出优秀的你
2.频率分布折线图和总体密度曲线
高
自 主
(1)频率分布折线图:连接频率分布直方图中各小长方
· 明
固
考
基
情
础
s= __n1_[_(__x_1-__x_)__2_+__(__x_2-__x_)__2_+__…__+__(__x_n_-__x)___2]_.
典
例
(3)方差:s2=__________________________________ 课
探
后
究 · 提
(xn是样本数据,n是样本容量, 是样本平均数).
情
乙学生成绩的平均数为
500+15+21+27+31+32+ 1036+43+48+58+59=537.
典
例
课
探
后
究
作
·
业
提
知
能
菜单
91淘课网 ——淘出优秀的你
高
自
考
主
体
落 实
1.(1)作样本的茎叶图时先要根据数据特点确定 验 ·
· 固
茎、叶,再作茎叶图.(2)作样本的茎叶图一般对称作
明 考
基
情
础 图,数据排列由内向外,从小到大排列,便于数据的处
·
业
提
知
能
菜单
91淘课网 ——淘出优秀的你
2 第2讲 用样本估计总体-精选教育文档
第2讲 用样本估计总体1.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中最大值与最小值的差); ②决定组距与组数; ③将数据分组; ④列频率分布表; ⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. ②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. (3)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的两侧. 2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是 s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2] s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]3.与平均数和方差有关的结论(1)若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ; (2)数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;(4)s2=1n∑i=1n(x i-x-)2=1n∑i=1nx2i-x-2,即各数平方的平均数减去平均数的平方.判断正误(正确的打“√”,错误的打“×”)(1)一组数据的方差越大,说明这组数据的波动越大.()(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.()(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.()(4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.()答案:(1)√(2)√(3)×(4)√(5)√(2019·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2019年1月至2019年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳解析:选A.根据折线图可知,2019年8月到9月、2019年10月到11月等月接待游客量都是减少,所以A错误.重庆市某年各月的平均气温(℃)数据的茎叶图如图,则这组数据的中位数是() A.19 B.20C.21.5 D.23解析:选B.由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.(2019·郑州第一次质量预测)我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.答案:50甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为________和________.解析:由茎叶图可知甲的平均数为19+18+20+21+23+22+20+31+31+3510=24.乙的平均数为19+17+11+21+24+22+24+30+32+3010=23.答案:24 23茎叶图[典例引领](2019·高考山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( ) A .3,5 B .5,5 C .3,7D .5,7【解析】 根据两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等, 所以56+62+65+74+(70+x )5=59+61+67+(60+y )+785,解得x =3.故选A .【答案】 A茎叶图中的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.[通关练习]1.(2019·贵州遵义航天高中模拟)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117 B.118C.118.5 D.119.5解析:选B.22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.2.为了了解某校教师使用多媒体进行教学的情况,现采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为()A.100 B.160C.200 D.280解析:选B.由茎叶图可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×820=160.频率分布直方图(高频考点)频率分布直方图是高考的热点,选择题、填空题、解答题都有可能出现.难度一般较小.高考对频率分布直方图的考查主要有以下三个命题角度:(1)求样本的频率、频数;(2)求样本的数字特征;(3)与概率结合的问题.[典例引领]角度一求样本的频率、频数(2019·高考山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120 D.140【解析】由频率分布直方图可知,这200名学生每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140.故选D. 【答案】D角度二 求样本的数字特征(2019·云南省11校跨区调研)为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示. (1)求图中a 的值;(2)估计这种植物果实重量的平均数x -和方差s 2(同一组中的数据用该组区间的中点值作代表).【解】 (1)组距d =5,由5×(0.02+0.04+0.075+a +0.015)=1得a =0.05. (2)各组中点值和相应的频率依次为x =30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40, s 2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75. 角度三 与概率结合的问题(2019·东北四市高考模拟)某手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性,300名男性)进行调查,对手机进行打分,打分的频数分布表如下:给出结论即可);(2)根据评分的不同,运用分层抽样的方法从男性用户中抽取20名用户,再从这20名用户中满足评分不低于80分的用户中任意抽取3名用户,求3名用户中评分小于90分的人数X 的分布列和数学期望.【解】 (1)女性用户和男性用户的频率分布直方图如图. 由图可知女性用户评分的波动小,男性用户评分的波动大.(2)运用分层抽样的方法从男性用户中抽取20名用户,评分不低于80分的用户有6人,其中评分小于90分的有4人,从6人中任取3人,则X 的可能取值为1,2,3,P (X =1)=C 14C 22C 36=420=15,P (X =2)=C 24C 12C 36=1220=35,P (X =3)=C 34C 36=420=15.所以X 的分布列为E (X )=15+65+35=2.频率、频数、样本容量的计算方法(1)频率组距×组距=频率. (2)频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数. [提醒] 制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.[通关练习]1.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为( )A .28B .40C .56D .60解析:选B .设中间一组的频数为x ,因为中间一个小长方形的面积等于其他8个长方形的面积和的25,所以其他8组的频数和为52x ,由x +52x =140,解得x =40.2.(2019·武汉市武昌区调研考试)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x(吨),月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(2)已知该市有80万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解:(1)由频率分布直方图,可得(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.(2)由频率分布直方图知,100位居民每人月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12.由以上样本频率分布,可以估计全市80万居民中月均用水量不低于3吨的人数为800 000×0.12=96 000.(3)因为前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85,所以2.5≤x<3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.样本数字特征的求解与应用[典例引领](1)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例的数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3(2)(2019·南昌模拟)若1,2,3,4,m这五个数的平均数为3,则这五个数的方差为________.(3)(2019·石家庄市教学质量检测(二))设样本数据x 1,x 2,…,x 2 017的方差是4,若y i =2x i -1(i =1,2,…,2 017),则y 1,y 2,…,y 2 017的方差为________.【解析】 (1)根据标志,要求数据中每个个体不超过7.中位数与众数不能体现个体数据,无法确定.方差体现数据中个体的波动程度,若大于0,则无法确定.若均值为2,方差为3,假设∃x i ≥8,则s 2≥(x i -x -)210=6210>3,故假设不成立.(2)由1+2+3+4+m 5=3得m =5,所以这五个数的方差为15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.(3)设样本数据的平均数为x -,则y i =2x i -1的平均数为2x --1,则y 1,y 2,…,y 2 017的方差为12 017[(2x 1-1-2x -+1)2+(2x 2-1-2x -+1)2+…+(2x 2 017-1-2x -+1)2]=4×12 017[(x 1-x -)2+(x 2-x -)2+…+(x 2 017-x -)2]=4×4=16. 【答案】 (1)D (2)2 (3)16(1)众数、中位数、平均数及方差的意义①平均数与方差都是重要的数字特征,是对总体的一种简明地描述. ②平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. (2)在计算平均数、方差时可利用平均数、方差的有关结论.[通关练习]1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( ) A .甲的成绩的平均数小于乙的成绩的平均数 B .甲的成绩的中位数等于乙的成绩的中位数 C .甲的成绩的方差小于乙的成绩的方差 D .甲的成绩的极差小于乙的成绩的极差 解析:选C. x -甲=15(4+5+6+7+8)=6,x -乙=15(5×3+6+9)=6,甲的成绩的方差为15(22×2+12×2)=2,乙的成绩的方差为15(12×3+32×1)=2.4.2.(2019·合肥市第二次教学质量检测)某同学在高三学年的五次阶段性考试中,数学成绩依次为110,114,121,119,126,则这组数据的方差是________.解析:因为对一组数据同时加上或减去同一个常数,方差不变,所以本题中可以先对这5个数据同时减去110,得到新的数据分别为0,4,11,9,16,其平均数为8,根据方差公式可得s 2=(0-8)2+(4-8)2+(11-8)2+(9-8)2+(16-8)25=30.8.答案:30.83.(2019·贵阳市监测考试)在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图(如图).若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.解:学生甲的平均成绩x -甲=68+76+79+86+88+956=82,学生乙的平均成绩x -乙=71+75+82+84+86+946=82,又s 2甲=16×[(68-82)2+(76-82)2+(79-82)2+(86-82)2+(88-82)2+(95-82)2]=77,s 2乙=16×[(71-82)2+(75-82)2+(82-82)2+(84-82)2+(86-82)2+(94-82)2]=1673,则x -甲=x -乙,s 2甲>s 2乙,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,故可选择学生乙参加知识竞赛.众数、中位数和平均数的异同相同点:标准差和方差描述了一组数据围绕平均数波动的大小.不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然.易错防范(1)易忽视频率分布直方图中纵轴表示的应为频率组距.(2)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义. 1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( ) A .0.05 B .0.25 C .0.5D .0.7解析:选D.由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为1420=0.7.2.(2019·广西三市第一次联考)在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为( ) A .1 B .2 C .3D .4解析:选B.由题图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,易得被污染的数字为2.3.(2019·岳阳模拟)某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为( ) A .6万元 B .8万元 C .10万元D .12万元解析:选C.设11时到12时的销售额为x 万元,依题意有2.5x =0.100.40,解得x =10.4.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )解析:选A.由分组可知C ,D 一定不对;由茎叶图可知[0,5)有1人,[5,10)有1人,所以第一、二小组频率相同,频率分布直方图中矩形的高应相等,可排除B.5.某人5次上班途中所花的时间(单位:分钟)分别为x ,y ,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为( ) A .1 B .2 C .3D .4解析:选D.由题意这组数据的平均数为10,方差为2,可得:x +y =20,(x -10)2+(y -10)2=8,设x =10+t ,y =10-t ,由(x -10)2+(y -10)2=8,得t 2=4,所以|x -y |=2|t |=4.6.(2019·湖南省五市十校联考)某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n -m 的值是________. 解析:由甲组学生成绩的平均数是88,可得70+80×3+90×3+(8+4+6+8+2+m +5)7=88,解得m =3.由乙组学生成绩的中位数是89,可得n =9,所以n -m =6. 答案:67.为了普及环保知识,增强环保意识,某大学有300名员工参加环保知识测试,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.现在要从第1,3,4组中用分层抽样的方法抽取16人,则在第4组中抽取的人数为________.解析:根据频率分布直方图得,第1,3,4组的频率之比为1∶4∶3,所以用分层抽样的方法抽取16人时,在第4组中应抽取的人数为16×31+4+3=6.答案:68.(2019·成都市第二次诊断性检测)在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1 ,那么这组数据的方差s 2可能的最大值是________.解析:由题意可设两个被污损的数据分别为10+a ,b ,(a ,b ∈Z ,0≤a ≤9),则10+a +b +9+10+11=50,即a +b =10,b =10-a ,所以s 2=15[(9-10)2+(10-10)2+(11-10)2+(10+a -10)2+(b -10)2]=15[2+a 2+(b -10)2]=25(1+a 2)≤25×(1+92)=32.8.答案:32.89.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:(1)求a 、b 、c (2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P (注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.解:(1)由题意可得,b =1-(0.015+0.125+0.5+0.31)=0.05,a =200×0.05=10,c =200×0.5=100.(2)根据已知,在抽出的200人的数学成绩中,及格的有162人.所以P =162200=81100=0.81.(3)这次数学测验样本的平均分为x -=16×3+32.1×10+55×25+74×100+88×62200=73,所以这次数学测验的年级平均分大约为73分.10.(2019·高考北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图: (1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.1.(2019·长春模拟)某销售公司为了解员工的月工资水平,从1 000位员工中随机抽取100位员工进行调查,得到如下的频率分布直方图: (1)试由此图估计该公司员工的月平均工资;(2)该公司的工资发放是以员工的营销水平为重要依据来确定的,一般认为,工资低于4 500元的员工属于学徒阶段,没有营销经验,若进行营销将会失败;高于4 500元的员工属于成熟员工,进行营销将会成功.现将该样本按照“学徒阶段工资”“成熟员工工资”分成两层,进行分层抽样,从中抽出5人,在这5人中任选2人进行营销活动.活动中,每位员工若营销成功,将为公司赚得3万元,否则公司将损失1万元.试问在此次比赛中公司收入多少万元的可能性最大?解:(1)估计该公司员工的月平均工资为0.000 1×1 000×2 000+0.000 1×1 000×3 000+0.000 2×1 000×4 000+0.000 3×1 000×5 000+0.000 2×1 000×6 000+0.000 1×1 000×7 000=4 700(元). (2)抽取比为5100=120,从工资在[1 500,4 500)内的员工中抽出100×(0.1+0.1+0.2)×120=2人,设这两位员工分别为1,2;从工资在[4 500,7 500]内的员工中抽出100×(0.3+0.2+0.1)×120=3人,设这三位员工分别为A ,B ,C .从中任选2人,共有以下10种不同的等可能结果:(1,2),(1,A ),(1,B ),(1,C ),(2,A ),(2,B ),(2,C ),(A ,B ),(A ,C ),(B ,C ).两人营销都成功,公司收入6万元,有以下3种不同的等可能结果:(A ,B ),(A ,C ),(B ,C ),概率为310;其中一人营销成功,一人营销失败,公司收入2万元,有以下6种不同的等可能结果:(1,A ),(1,B ),(1,C ),(2,A ),(2,B ),(2,C ),概率为610=35; 两人营销都失败,公司收入-2万元,即损失2万元,有1种结果:(1,2),概率为110.因为110<310<35,所以公司收入2万元的可能性最大.2.(2019·河北三市第二次联考)某高三毕业班甲、乙两名同学在连续的8次数学周练中,统计解答题失分的茎叶图如图:(1)比较这两名同学8次周练解答题失分的平均数和方差的大小,并判断哪位同学做解答题相对稳定些;(2)以上述数据统计甲、乙两名同学失分超过15分的频率作为概率,假设甲、乙两名同学在同一次周练中失分多少互不影响,预测在接下来的2次周练中,甲、乙两名同学失分均超过15分的次数X 的分布列和均值.解:(1) x -甲 =18(7+9+11+13+13+16+23+28)=15,x -乙=18(7+8+10+15+17+19+21+23)=15,s 2甲=18[(-8)2+(-6)2+(-4)2+(-2)2+(-2)2+12+82+132]=44.75, s 2乙=18[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25. 甲、乙两名同学解答题失分的平均数相等;甲同学解答题失分的方差比乙同学解答题失分的方差大.所以乙同学做解答题相对稳定些.(2)根据统计结果,在一次周练中,甲和乙失分超过15分的概率分别为P 1=38,P 2=12,两人失分均超过15分的概率为P 1P 2=316,X 的所有可能取值为0,1,2.依题意,X ~B (2,316),P (X =k )=C k 2(316)k (1316)2-k,k =0,1,2, 则X 的分布列为X 的均值E (X )=2×316=38.。
八年级数学用样本估计总体(2019新)
解: (1)不合适.因为调查对象在总体中必须有代
表性,现在所调查的这些地方的环境污染 情况仅仅代表了长江以南地区,并不能代 表整个江苏省的环境污染情况. (2)不合适.因为抽样调查时所抽取的样本要 足够大,现在只抽取了2名学生的身高,不 能用来估算100名学生的平均身高. (3)合适. (4)不合适.虽然调查的家庭很多,但仅仅增 加调查的数量不一定能够提高调查质量, 本题中所调查的仅代表上英特网的家庭, 不能代表不上英特网的家庭,因此这样的 抽样调查不具有普遍代表性.
判断下面这些抽样调查选取样本的方法是否 合适,若不合适,请说明理由. (1)为调查江苏省的环境污染情况,调查了长 江以南的南京市、常州市、苏州市、镇江市、 无锡市的环境污染情况. 身高来估算这100名学生的平均身高. (3)从一批灯泡中随机抽取50个进行试验, 估算这批灯泡的使用寿命. (4)为了解观众对中央电视台第一套节目的收 视率,对所有上英特网的家庭进行在线调查.
用样本估计总体
复习上节课的内容
在上节课中,我们知道在 选取样本时应注意的问题,其 一是所选取的样本必须具有代 表性,其二是所选取的样本的 容量应该足够大,这样的样本 才能反映总体的特性,所选取 的样本才比较可靠.
随机抽样调查是了解总
体情况的一种重要的数学方法, 抽样是它的一个关键,上节课 介绍了简单的随机抽样方法, 即用抽签的方法来选取样本, 这使每个个体都有相等的机会 被选入样本.
;华哥域名:https:///0616/index.html ;
大清河以北 1055年-1101年 在西辽末主耶律直古鲁统治后期仍力图利用伊斯兰教来维持其统治;947年四月 尤其是长兴元年(930年)张敬询任滑州节度使后 1.南楚 币 也没有必胜的把握 肃祖 根据穆斯林史籍的记载 措施得力 — — 屈出律 1
2019版同步优化探究理数(北师大版)练习第九章 第二节 统计图表、数据的数字特征、用样本估计总体 Word版
课时作业组——基础对点练.为了解学生“阳光体育”活动的情况,随机统计了名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间[]内,其频率分布直方图如图所示.已知活动时间在[)内的频数为,则的值为()....解析:根据频率分布直方图,知组距为,所以活动时间在[)内的频率为.因为活动时间在[)内的频数为,所以==.答案:.为了了解某校九年级名学生的体能情况,随机抽查了部分学生,测试分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是( ).该校九年级学生分钟仰卧起坐的次数的中位数估计值为次.该校九年级学生分钟仰卧起坐的次数的众数估计值为次.该校九年级学生分钟仰卧起坐的次数超过次的人数约有人.该校九年级学生分钟仰卧起坐的次数少于次的人数约有人解析:由题图可知中位数是次,众数是次,分钟仰卧起坐的次数超过次的频率为,所以估计该校九年级学生分钟仰卧起坐的次数超过次的人数约有人;分钟仰卧起坐的次数少于次的频率为,所以该校九年级学生分钟仰卧起坐的次数少于次的人数约有人.故是错误的,选.答案:.(·西安检测)已知甲、乙两组数据的茎叶图如图所示,若它们的中位数相同,则甲组数据的平均数为( )....解析:由茎叶图知,乙组数据的中位数为=,所以=,所以甲组数据的平均数为=,故选.答案:.(·湖南五市十校联考)某中学奥数培训班共有人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是,乙组学生成绩的中位数是,则-的值是( )....解析:由甲组学生成绩的平均数是,可得=,解得=.由乙组学生成绩的中位数是,可得=,所以-=,故选.答案:.为了解某校高三学生数学调研测试的情况,学校决定从甲、乙两个班中各抽取名学生的数学成绩(满分分)进行深入分析,得到如图所示的茎叶图,茎叶图中某学生的成绩因特殊原因被污染了,如果甲、乙两个班被抽取的学生的平均成绩相同,则被污染处的数值为( )....解析:由茎叶图可知,乙班的名学生的成绩同时减去,分别为-,-,-,-,=+=,对于甲班,设被污染处的数值为,甲班的名学生的成绩同时减去,所以乙分别为-,-,-,-,-+,所以=+=,所以=,即被污染处的数值为.甲答案:.(·广州检测)在样本的频率分布直方图中,共有个小长方形,若中间一个小长方形的面积等于其他个小长方形的面积和的,且样本容量为,则中间一组的频数为.解析:依题意,设中间小长方形的面积为,则其余小长方形的面积和为,所以=,=,中间一组的频数为×=.。
9-3 用样本估计总体
抓主干
考点
解密
第三节 用样本估计总体
研考向
要点
探究
[最新考纲展示]
悟典题
能力
提升
1.了解分布的意义与作用,会列频率分布表、会画频率分布直
提素能 高效
方图、频率折线图、茎叶图,理解它们各自的特点.
训练
2.理解样本数据标准差的意义和作用,会计算数据标准差. 3. 山
能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合 东
研考向 要点
绩进行统计,得到样本频率分布直方图如图所示,现规定不低于70分
探究
为合格,则合格人数是________.
悟典题
能力
提升
提素能 高效 训练
山 东 金 太 阳 书 业 有 限 公 司
菜 单 隐藏
高考总复习 A 数学(理)
抓主干 考点 解密
研考向 要点 探究
悟典题 能力 提升
提素能
解析:不低于70分人数的频率为(0.035+0.015+0.01)×10=0.6,
金 太
组.
阳
书
业
有
限
公
司
菜 单 隐藏
高考总复习 A 数学(理)
抓主干 考点 解密
研考向
要点
探究
1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),
悟典题 能力
2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在
提升
区间[10,50)上的数据的频率是( )
菜 单 隐藏
抓主干 考点 解密 研考向 要点 探究 悟典题 能力 提升 提素能 高效 训练
2020版数学人教B版必修3学案:第二章 2.2.1 用样本的频率分布估计总体的分布(一) Word版含解析
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体的分布(一)学习目标 1.体会分布的意义和作用.2.学会用频率分布表,画频率分布直方图表示样本数据.3.能通过频率分布表或频率分布直方图对数据做出总体统计.知识点一 用样本估计总体 思考 还记得我们抽样的初衷吗?答案 用样本去估计总体,为决策提供依据. 梳理 用样本的频率分布估计总体的分布. 知识点二 频率分布表与频率分布直方图思考1 要做频率分布表,需要对原始数据做哪些工作? 答案 分组,频数累计,计算频数和频率. 思考2 如何决定组数与组距? 答案 若极差组距为整数,则极差组距=组数.若极差组距不为整数,则⎣⎢⎡⎦⎥⎤极差组距+1=组数. 注意:[x]表示不大于x 的最大整数.思考3 同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?答案 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.梳理 一般地,频数指某组中包含的个体数,各组频数和=样本容量;频率=频数样本容量,各组频率和等于1.在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用小长方形的面积来表示,各小长方形的面积的总和等于1.1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.( √ )2.频率分布直方图中小长方形的面积表示该组的个体数.( × ) 3.频率分布直方图中所有小长方形面积之和为1.( √ )题型一 频率分布的理解例1 关于频率分布直方图,下列说法正确的是( ) A .直方图中小长方形的高表示取某数的频率B .直方图中小长方形的高表示该组上的个体在样本中出现的频率C .直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值D .直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值 答案 D解析 注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.反思与感悟 由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失. 跟踪训练1 一个容量为20的样本数据,将其分组如下表:则样本在区间(-∞,50)上的频率为( ) A .0.5 B .0.25 C .0.6 D .0.7 答案 D解析 样本在区间(-∞,50)上的频率为2+3+4+520=1420=0.7.题型二 频率分布直方图的绘制例2 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1) 这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?解(1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:频率分布直方图如图所示.(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称的状态,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.反思与感悟组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.跟踪训练2一个农技站为了考察某种麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表、绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm 之间的麦穗所占的百分比. 解 (1)计算极差:7.4-4.0=3.4; (2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12;(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55; (4)列频率分布表:(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm 之间的麦穗约占41%. 题型三 频率分布表及频率分布直方图的应用例3 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).解 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.反思与感悟 在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.跟踪训练3 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少? 解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的, 因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.1.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )A .20B .30C .40D .50 答案 B解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.2.已知样本数据:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的是() A.[5.5,7.5) B.[7.5,9.5)C.[9.5,11.5) D.[11.5,13.5]答案 D解析列出频率分布表,依次对照就可以找到答案,频率分布表如下:从表中可以看出频率为0.2的是[11.5,13.5],故选D.3.如图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的优秀(120分及以上为优秀)率为________.答案30%解析优秀率为10×(0.022 5+0.005+0.002 5)=0.3=30%.4.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.答案21解析根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.∵样本中数据在[20,60)内的频率为0.6,样本容量为50,∴4+5+x+y50=0.6,解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.5.暑假期间某班为了增强学生的社会实践能力,把该班学生分成四个小组到一果园帮果农测量果树的产量,某小组来到一片种植苹果的山地,他们随机选取20株作为样本测量每一株的果实产量(单位:kg),获得的数据按照区间[40,45),[45,50),[50,55),[55,60]进行分组,得到如下频率分布表:已知样本中产量在区间[45,50)内的株数是产量在区间[50,60]内的株数的43倍.(1)分别求出a ,b ,c 的值; (2)作出频率分布直方图. 解 (1)易得c =1.0.由题意得⎩⎪⎨⎪⎧a =43(0.1+b ),0.3+a +0.1+b =1.0,∴a =0.4,b =0.2.(2)根据频率分布表画出频率分布直方图,如图所示.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布. 2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.一、选择题1.观察新生婴儿的体重(单位:g),其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000)内的频率为( )A .0.001B .0.01C .0.003D .0.3答案 D解析 频率=频率组距×组距,组距=3 000-2 700=300,频率组距=0.001, ∴频率=0.001×300=0.3.2.容量为100的样本数据,按从小到大的顺序分为8组,如下表:第三组的频数和频率分别是( ) A .14和0.14 B .0.14和14 C.114和0.14 D.13和114答案 A解析 x =100-(10+13+14+15+13+12+9)=100-86=14,第三组的频率为14100=0.14.3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18 答案 C解析 志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36×1=18, 有疗效的人数为18-6=12.4.某校为了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在[40,45) kg 的人数是( )A .10B .2C .5D .15 答案 A解析 由图可知频率=频率组距×组距,频率=0.02×5=0.1,∴女生体重在[40,45) kg 的人数为0.1×100=10.5.为了了解某幼儿园儿童的身高情况,抽查该园120名儿童的身高绘制成如图所示的频率分布直方图,则抽查的120名儿童身高大于或等于98 cm 且小于104 cm 的有( )A .90名B .75名C .65名D .40名 答案 A解析 由图可知身高大于或等于98 cm 且小于104 cm 的儿童的频率为(0.1+0.15+0.125)×2=0.75,抽查的120名儿童有120×0.75=90(名)儿童的身高大于或等于98 cm 且小于104 cm. 6.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 的值为( ) A .20 B .27 C .6 D .60答案 D解析 ∵n ·2+3+42+3+4+6+4+1=27,∴n =60.7.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120 答案 B解析 ∵少于60分的学生人数为600×(0.05+0.15)=120, ∴不少于60分的学生人数为600-120=480.8.对某种电子元件使用寿命进行跟踪调查,所得样本频率分布直方图如图.由图可知,这一批电子元件中寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量的比是( )A .1∶2B .1∶3C .1∶4D .1∶6 答案 C解析 由题意,寿命在100~300 h 的电子元件的频率为100×⎝⎛⎭⎫12 000+32 000=0.2,寿命在300~600 h 的电子元件的频率为100×⎝⎛⎭⎫1400+1250+3 2 000=0.8,则寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量比大约是0.2∶0.8=1∶4. 二、填空题9.将一个容量为n 的样本分成若干组,已知甲组的频数和频率分别为36和14,则容量n =________,频率为16的乙组的频数是________.答案 144 24解析 14=36n ,所以n =36×4=144,同理16=x144,x =24.10.某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图所示),现规定不低于70分为合格,则合格人数是________.答案 600解析 由频率分布直方图知合格的频率为(0.035+0.015+0.01)×10=0.6, 故合格人数为1 000×0.6=600.11.下列命题正确的是________.(填序号)①频率分布直方图中每个小矩形的面积等于相应组的频数; ②频率分布直方图中各小矩形面积之和等于1;③频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比. 答案 ②③解析 在频率分布直方图中,横轴表示样本数据,纵轴表示频率组距.由于小矩形的面积=组距×频率组距=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.综上可知②③正确.12.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案 9解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.13.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.则频率分布直方图中x 的值为 __________.答案 0.004 4解析 ∵(0.002 4+0.003 6+0.006 0+x +0.002 4+0.001 2)×50=1,∴x =0.004 4. 三、解答题14.为加强中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计,请你根据尚未完成的频率分布表解答问题:(1)求a ,b ,c ,d ,e 的值; (2)作出频率分布直方图.解 (1)根据题意,得分在[60.5,70.5)内的频数是a =50×0.26=13,在[90.5,100.5]内的频数是b =50-13-15-18=4,在[70.5,80.5)内的频率是c =1550=0.30,在[90.5,100.5]内的频率是d =450=0.08,频率和e =1. (2)根据频率分布表作出频率分布直方图,如图所示.四、探究与拓展15.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:根据上面的频率分布表,可知①处的数值为________,②处的数值为__________. 答案 3 0.025解析 由位于[110,120)的频数为 36,频率=36n =0.300,得样本容量n =120,所以[130,140)的频率=12120=0.1,②处的数值=1-0.050-0.200-0.300-0.275-0.1-0.050=0.025;①处的数值为0.025×120=3.。
02用样本估计总体.doc
用样本估计总体北京四中李伟知识引入一、回顾用样本来估计总体,是研究统计问题的一个基本思想方法某市100个家庭某年月均用水量(单位:t)知识讲解二、总体分布的估计总体取值的概率分布规律通常称为总体分布.样本的频率分布的常见表示:1.频率分布表2.频率分布直方图3.茎叶图1.频率分布表:某校高一年级100名同学的身高频率分布表分组频数频数累计频率[150.5,153.5)440.04[153.5,156.5)8120.08[156.5,159.5)8200.08[159.5,162.5)11310.11[162.5,165.5)22530.22[165.5,168.5)19720.19[168.5,171.5)14860.14[171.5,174.5)7930.07[174.5,177.5)4970.04[177.5,180.5]31000.03合计10012.频率分布直方图:横轴为个体取值,纵轴为频率/组距.用矩形框的面积表示相应的频率. 面积之和为1画频率分布直方图的基本步骤(1)计算极差(2)确定组距与组数(3)将数据分组(4)列出频率分布表(5)画出频率分布直方图某市100个家庭某年月均用水量(单位:t)3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.64.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.84.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2(1)计算极差(2)确定组距与组数(3)将数据分组(4)列出频率分布表(5)画出频率分布直方图频率分布折线图总体密度曲线典型例题例1 对某批电子元件进行寿命调查,情况如下:寿命100~200200~300300~400400~500500~600 (h)个数2030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100h~400h以内的概率;(4)估计电子元件寿命在400h以上的概率.解析:3.茎叶图:某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454,品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430,优点:1.体现数据分布状况2.保留原始数据3.数据可随时补充和修改三、总体数字特征的估计 样本的数字特征:平均数:11ni i x x n ==∑, 刻画样本数据的平均水平样本方差:2211()==-∑n i i s x x n ,样本标准差:s = 常用的表示平均水平的数值还有: 中位数、众数表示数据集中程度(波动状况)的数值还有: 极差典型例题例2 甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10个,它们的尺寸分别如下(单位:mm) 甲机床:10.2 10.1 10.0 9.8 9.9 10.3 9.7 10.0 9.9 10.1 乙机床:10.3 10.4 9.6 9.9 10.1 10.9 8.9 9.7 10.2 10.0分别计算上面两个样本的平均数和方差.如图纸规定零件的尺寸为10 mm ,从计算的结果来看哪台机床加工这种零件较合适? 解析:例3 随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差.解析:。
30.2 .3.用样本估计总体
4、总结反思: 在实际问题中,平均数是最常用的指标,但不能一味的使用平均数来确定数据的特征,根 据不同的实际需要,确定用平均数、中位数还是众数反映数据的特征。平均数、中位数、 和众数各有所长,也各有其短。 1、用平均数作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数都有关 系,对这组数据所包含的信息的反映最为充分,因而其应用也最为广泛,特别是在进行统 计推断时有最要的作用,但计算时比较繁琐,并且容易受到极端数据的影响。 2、用众数作为一组数据的代表,着眼于对数据出现的频数的考察,其大小只与这组数据 中的部分数据有关,可靠性比较差,但众数不受极端数据的影响。当一组数据中有不少数 据多次重复出现时,其众数往往是我们关心的一种统计量。 3、用中位数作为一组数据的代表,可靠性也比较差,但中位数也不受极端数据的影响, 当一组数据中的个别数据变动较大时,可用他来描述其集中趋势。 5、什么样的指标可以反映一组数据变化范围的大小? 我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围.用 这种方法得到的差称为极差(range). 极差=最大值-最小值.
(可能不一致,因为还应考虑影响种子发芽的其他因素,温度等。)
为了一般地研究“香烟浸出液浓度对于种子萌芽的影响”, 是否需要选取一些其他的种子做类似的实验? (对此问题,你们可以课后查阅有关生物资料,并亲自动手实验获 得更为感性的认识。) 如果有兴趣,请动手做一做,再与同学们一起讨论各自获得的 数据和结论。
评注:1.数学家已经证明,随机抽样方法是科学而且可靠的。
2.基于不同的样本,可能会对总体作出不同的估计值, 但随着样本容量的增加,有样本得出的特性会接近总体的特性。
例2.某养鱼专业户为了估计湖里有多少条鱼,先捕上
100条做上标记,然后放回到湖里,过一段时间待带标 记的鱼完全混合于鱼群后,再捕上200条鱼,发现其中 带标记的鱼有20条,湖里大约有多少条鱼?
(完整word版)用样本估计总体
第2课时 用样本估计总体一、基础知识复习总结1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图. 2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 3.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 4.标准差和方差(1)标准差是样本数据到平均数的一种平均距离. (2)标准差:(n s x x =++-.(3)方差:2222121[()()()]n s x x x x x x n=-+-++-.二、基本概念过关检测判断下列结论的正误(正确的“√”错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.(√)(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.(×)(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.(√)(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.(×)(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.(×)(7)在频率分布直方图中,小矩形的高表示频率.(×)(8)频率分布直方图中各个长方形的面积之和为1。
(√)(9)一组数据的方差越大,说明这组数据的波动越大.(√)(10)中位数与众数都是唯一的.(×)三、典型例题解法分析(一)频率分布直方图的绘制及应用1.绘制频率分布直方图2.应用频率分布直方图[例1](1)(2016·高考山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、选择题
分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) 频数
2
3
4
5
4
2
2.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数 B .平均数 C .中位数 D .标准差 3.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[)10,12内的频数为( )
A .18
B .36
C .54
D .72
4.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )
A .46,45,56
B .46,45,53
C .47,45,56
D .45,47,53
5.如图是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为10,则抽取的学生人数为( )
A .20
B .30
C .40
D .50 二、填空题
6.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是__________,__________.
7.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):
8.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =______.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为__________. 三、解答题
甲 10 8 9 9 9 乙
10
10
7
9
9
9.某学校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[90,100),[100,110),…,[140,150)后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:
(1)求分数在[120,130)内的频率,并补全这个频率分布直方图;
(2)统计方法中,同一组数据常用该组区间的中点值作为代表,
据此估计本次考试的平均分.
10.若某产品的直径长与标准值的差的绝对值不超过1 mm时,
则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,
从某厂生产的此种产品中,随机抽取5000件进行检测,结果发
现有50件不合格品.计算这50件不合格品的直径长与标准值的
差(单位:mm),将所得数据分组,得到如下频率分布表:
(1)将上面表格中缺少的数据填在相应位置;
(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的
差落在区间(1,3]内的概率;
(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品
中的合格品的件数.
一、选择题
1.为了解某校高三学生的视力情况,随机地抽查了该
校100名高三学生的视力情况,得到频率分布直方图
如图,由于不慎将部分数据丢失,但知道前4组的频
数成等比数列,后6组的频数成等差数列,设最大频
率为a,视力在4.6到5.0之间的学生数为b,则a,b
的值分别为( )
A.0.27,78 B.0.27,83
C.2.7,78 D.2.7,83
2.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x甲、x乙,
中位数分别为m甲、m乙,则( )
A.x甲<x乙,m甲>m乙
B.x甲<x乙,m甲<m乙
C.x甲>x乙,m甲>m乙
D.x甲>x乙,m甲<m乙
二、填空题
3.由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则
这组数据为________.(从小到大排列)
4.把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比为大于2的整数的等比数列,则剩下三组中频数最高的一组的频数
为________.
三、解答题
5.某学校为了了解学生的日平均睡眠时间(单位:h),随机选择了n名同学进行调查.下表
是这n名同学的日睡眠时间的频率分布表:
(1)求n的值;若a=20,将表中数据补全,并画出频率分布直方图;
(2)统计方法中,同一组数据常用该组区间的中点值(例如区间[4,5)的中点值是 4.5)作为代表.若据此计算的上述数据的平均值为6.52,求a,b的值,并由此估计该学校学生的日平
均睡眠时间在7小时以上的概率.
分组频数频率
[-3,-2)0.10
[-2,-1)8
(1,2]0.50
(2,3]10
(3,4]
合计50 1.00
(本资料素材和资料部分来自网络,仅供参考。
请预览后才下载,期待您的好评与关注!)。