2019-2020学年高中数学 2.2.1 用样本的频率分布估计总体分布(第1课时)学案新人教A版必修3.doc
人教版高中数学必修三《2.2.1用样本的频率分布估计总体分布》训练评估
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布双基达标(限时20分钟)1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是 ( ).A .总体容量越大,估计越精确B .总体容量越小,估计越精确C .样本容量越大,估计越精确D .样本容量越小,估计越精确 解析 由用样本估计总体的性质可得. 答案 C2.频率分布直方图中,小长方形的面积等于 ( ). A .组距 B .频率 C .组数 D .频数解析 根据小长方形的宽及高的意义,可知小长方形的面积为一组样本数据的频率. 答案 B3.一个容量为100的样本,其数据的分组与各组的频数如下表组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70] 频数1213241516137A .0.13B .0.39C .0.52D .0.64解析 由题意可知频数在(10,40]的有:13+24+15=52,由频率=频数÷总数可得0.52. 答案 C4.一个容量为n 的样本,分成若干组,已知甲组的频数和频率分别为36和14,则容量n =________,且频率为16的乙组的频数是________.解析 抽样时要保证每个个体被抽到的机会均等,14=36n ,所以n =36×4=144,同理16=x144,x =24. 答案 144 245.为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们捐款数(单位:元)如下:19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是________.若取组距为2,则应分成________组;若第一组的起点定为18.5,则在[26.5,28.5)内的频数为________.解析 由题意知,极差为30-19=11;由于组距为2,则112=5.5不是整数,所以取6组;捐款数落在[26.5,28.5)内的有27,27,28,28,27共5个,因此频数为5. 答案 11 6 56.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图. (2)用自己的语言描述一下历届美国总统就任时年龄的分布情况. 解 (1)以4为组距,列表如下:分组 频数累计频数 频率 [41.5,45.5) 2 0.045 5 [45.5,49.5) 7 0.159 1 [49.5,53.5) 8 0.181 8 [53.5,57.5)16 0.363 6 [57.5,61.5) 5 0.113 6 [61.5,65.5) 4 0.090 9 [65.5,69.5] 2 0.045 5 合计441.00(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.综合提高(限时25分钟)7.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为().A.20% B.69% C.31% D.27%解析由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.答案 C8.(2012·烟台高一检测)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是().A.90 B.75 C.60 D.45解析∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.答案 A9.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.解析∵n×2+3+42+3+4+6+4+1=27,∴n=60.答案6010.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知________.甲运动员的成绩好于乙运动员;②乙运动员的成绩好于甲运动员;③甲、乙两名运动员的成绩没有明显的差别;④甲运动员的最低得分为0分.解析从这个茎叶图可以看出甲运动员的得分大致对称,平均得分是30多分,乙运动员的得分除一个52分外,也大致对称,平均得分20多分.因此,甲运动员发挥比较稳定,总体得分情况比乙好.答案①11.(2012·合肥高一检测)在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?解(1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.12.(创新拓展)如图是一个样本的频率分布直方图,且在[15,18)内频数为8.(1)求样本容量;(2)若[12,15)一组的小长方形面积为0.06,求[12,15) 一组的频数;(3)求样本在[18,33)内的频率.解 (1)由图可知[15,18)一组对应的纵轴数值为475,且组距为3,所以[15,18)一组对应的频率为475×3=425.又已知[15,18)一组的频数为8,所以样本容量n =8425=50.(2)[12,15)一组的小长方形面积为0.06,即[12,15)一组的频率为0.06,且样本容量为50,所以[12,15)一组的频数为50×0.06=3.(3)由(1)、(2)知[12,15)一组的频数为3,[15,18)一组的频数为8,样本容量为50,所以[18,33)内频数为50-3-8=39,所以[18,33)内的频率为3950=0.78.。
高中数学人教新课标B版必修3--《2.2.1用样本的频率分布估计总体的分布》课件4
1
解1:总睡眠时间约为 6.25×5+6.75×17 +7.25×33+7.75×37+8.25×6+8.75×2 =739(h)
故平均睡眠时间约为7.39h 解2:求各组中值与对应频率之积的和, 6.25×0.05+6.75×0.17+7.25×0.33+7.75× 37+8.25×0.06+8.75×0.02 =7.39(h)
解:估计该单位职工的平均年收入为 12500×10%+17500×15%+22500×20%+ 27500×25%+32500×15%+37500×10%+ 45000×5%=26125(元) 答:估计该单位人均年收入约为26125元.
练习题: 1.若M个数的平均数是x,N个数的平均数
Mx Ny
(2)中位数不受少数几个极端数据的影 响,容易计算,它仅利用了数据中排在中 间的数据的信息。当样本数据质量比较差, 即存在一些错误数据时,应该用抗极端数 据强的中位数表示数据的中心值。
(3)平均数受样本中的每一个数据的影 响,“越离群”的数据,对平均数的影响 也越大,与众数和中位数相比,平均数代 表了数据更多的信息,当样本数据质量比 较差时,使用平均数描述数据的中心位置 可能与实际情况产生较大的误差。
2.2.2 用样本的数字特征估计 总体的数字特征(一)
一、众数、中位数、平均数
(1)众数:在样本数据中,频率散布最 大值所对应的样本数据或出现次数最多的 那个数据。
(2)中位数:样本数据中,累计频率为 0.5时所对应的样本数据或将数据按大小 排列,位于最中间的数据(如果数据的个 数为偶数,就取当中两个数据的平均数作 为中位数)。
人教版高中数学必修三2.2.1用样本的频率分布估计总体分布
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布[读教材·填要点]1.用样本估计总体的两种情况 (1)用样本的频率分布估计总体的分布. (2)用样本的数字特征估计总体的数字特征. 2.绘制频率分布直方图的步骤3.频率分布折线图和总体密度曲线频率分布直方图――――――――→连接各小长方形上端的中点频率分布折线图 ――――――――――――→样本容量不断增大,频率折线图接近于一条光滑曲线总体密度曲线 4.茎叶图的制作步骤 (1)将数据分为茎和叶两部分;(2)将最大茎和最小茎之间数据按大小次序排成一列; (3)将各个数据的“叶”按大小次序写在茎右(左)侧.[小问题·大思维]1.频率分布直方图直观形象地表示了频率分布表,在频率分布直方图中是用哪些量来表示各组频率的?提示:在频率分布直方图中用每个矩形的面积表示相应组的频率,即频率组距×组距=频率,各组频率的和等于1,因此各小矩形的面积的和等于1.2.从甲、乙两个班级中各随机选出15名同学进行测试,成绩的茎叶图如图,你能说出甲、乙两班的最高成绩,以及哪个班的平均成绩较高吗?甲 乙6 4 8 57 9 4 16 2 5 9 87 5 4 2 17 2 5 7 8 9 7 4 48 1 4 4 7 9 692提示:甲、乙两班的最高成绩各是96,92,从图中看,乙班的平均成绩较高.列频率分布表、画频率分布直方图、折线图[例42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图. (2)用自己的语言描述一下历届美国总统就任时年龄的分布情况. [自主解答] (1)以4为组距,列表如下:分组 频数 频率 [41.5,45.5) 2 0.045 5 [45.5,49.5) 7 0.159 1 [49.5,53.5) 8 0.181 8 [53.5,57.5) 16 0.363 6 [57.5,61.5) 5 0.113 6 [61.5,65.5) 4 0.090 9 [65.5,69.5]20.045 5合计44 1.00(2)从频率分布表中可以看出60%左右的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.根据频率分布表,求美国总统就任时年龄落在区间[61.5,69.5)人数占总人数的比例.解:区间[61.5,69.5)包含了[61.5,65.5),[65.5,69.5),两个组,两小组的频率和为0.090 9+0.045 5=0.136 4,故而所占比例为13.64%.——————————————————1.在列频率分布表时,极差、组距、组数有如下关系:(1)若极差组距为整数,则极差组距=组数.(2)若极差组距不为整数,则极差组距的整数部分+1=组数.2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.——————————————————————————————————————1.一个农技站为了考察某种麦穗长的分布情况,在一块试验地里抽取了100个麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.05.4 4.6 5.8 5.5 6.0 6.5 5.1 6.55.3 5.9 5.5 5.8 6.2 5.4 5.0 5.06.8 6.0 5.0 5.7 6.0 5.5 6.8 6.06.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.45.77.4 6.0 5.4 6.5 6.0 6.8 5.86.3 6.0 6.3 5.6 5.3 6.4 5.7 6.76.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表、绘出频率分布直方图,并估计长度在5.75~6.05 cm 之间的麦穗在这批麦穗中所占的百分比.解:步骤是:(1)计算极差:7.4-4.0=3.4(cm). (2)决定组距与组数若取组距为0.3 cm ,由于3.40.3=1113,需分成12组,组数合适.于是取定组距为0.3 cm ,组数为12.(3)将数据分组使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是:3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频率分布表对各个小组作频数累计,然后数频数,算频率,列频率分布表,如下表所示:分组 频数累计频数 频率 3.95~4.25 1 0.01 4.25~4.55 1 0.01 4.55~4.85 2 0.02 4.85~5.15 正 5 0.05 5.15~5.45 正正 11 0.11 5.45~5.75 正正正 15 0.15 5.75~6.05 正正正正正28 0.28 6.05~6.35 正正 13 0.13 6.35~6.65正正110.116.65~6.95正正100.106.95~7.2520.027.25~7.5510.01合计100 1.00(5)画频率分布直方图.如图所示.从表中看到,样本数据落在5.75~6.05之间的频率是0.28,于是可以估计,在这块地里,长度在5.75 ~6.05 cm之间的麦穗约占28%.茎叶图及应用[例2]某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记下抽查记录如下(单位:千克):甲:52514948534849乙:60654035256560画出茎叶图,并说明哪个车间的产品质量比较稳定.[自主解答]茎叶图如图所示(茎为十位上的数字):甲乙2 53 599884032156005 5所以甲车间的产品质量比较稳定.——————————————————画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、中位数、稳定性等几方面来比较.绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.——————————————————————————————————————2.在某电脑杂志的一篇文章中,每个句子中所含字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,21,24,27,17,29.在某报纸的一篇文章中,每个句子中所含字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22,18,32.(1)分别用茎叶图表示上述两组数据;(2)将这两组数据进行比较分析,你能得到什么结论?解:(1)茎叶图如图所示:电脑杂志报纸9 8 7 7 5 5 4 1 01 2 3 8 8 99 8 7 7 7 6 5 4 4 3 2 1 02 2 2 3 4 7 7 7 86 13 2 2 2 3 3 5 6 94 1 1 6(2)从茎叶图可看出:电脑杂志的文章中每个句子所含字数集中在10~30之间;报纸的文章中每个句子所含字数集中在20~40之间,且电脑杂志的文章中每个句子所含字的平均个数比报纸的文章中每个句子所含字的平均个数要少,因此电脑杂志的文章较简明.频率分布直方图的应用[例3]5月1日至31日,评委会把同学们上交作品的件数按5天一组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12.(1)本次活动中一共有多少件作品参评?(2)上交作品数量最多的一组有多少件?(3)经过评比,第四组和第六组分别有10件,2件作品获奖,这两组获奖率较高的是第几组?[自主解答] 在频率分布直方图中各小长方形的面积=组距×频率组距=频率,即各小长方形的面积等于相应各组的频率,且它们的面积和等于1.(1)依题意知第三组的频率为42+3+4+6+4+1=15.又因为第三组的频数为12,所以本次活动的参评作品数为12÷15=60(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有:60×62+3+4+6+4+1=18(件).(3)第四组的获奖率是1018=59;第六组上交的作品数量为60×12+3+4+6+4+1=3(件),所以第六组的获奖率是23=69>59,故第六组的获奖率较高. ——————————————————频率分布直方图的性质 (1)因为小矩形的面积=组距×频率组距=频率,所以各小矩形面积表示相应各组的频率,这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1. (3)频数/相应的频率=样本容量.——————————————————————————————————————3.(2012·济宁高一检测)为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少? 解:(1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.故第二小组的频率是0.08,样本容量是150. (2)由图可估计该校高一学生的达标率约为 17+15+9+32+4+17+15+9+3×100%=88%.故高一学生达标率是88%.某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg 的人数是( )A .10B .2C .5D .15[错解] 0.02×100=2人.选B. [错因] 误认为纵轴表示频率. [正解] 由图可知频率=频率组距×组距,知频率=0.02×5=0.1. ∴0.1×100=10人. [答案] A1.(2012·湖北高考)容量为20的样本数据,分组后的频数如下表:分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数23454 2A.0.35B.0.45C.0.55 D.0.65解析:求出样本数据落在区间[10,40)中的频数,再除以样本容量得频率.求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45.答案:B2.100辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速在[60,70)的汽车大约有()A.30辆B.40辆C.60辆D.80辆解析:0.04×10×100=40.答案:B3.从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm),根据数据估计()A.甲种玉米比乙种玉米不仅长得高而且长得整齐B.乙种玉米比甲种玉米不仅长得高而且长得整齐C.甲种玉米比乙种玉米长得高但长势没有乙整齐D.乙种玉米比甲种玉米长得高但长势没有甲整齐解析:乙的平均株高为14+27+36+38+44+456=2046=34 cm.甲乙61 45 2 1277 53 6 84 4 5甲的平均株高为16+21+22+25+35+376=1566=26 cm.答案:D4.为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们捐款数如下:(单位:元)19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是________,若取组距为2,则应分成________组;若第一组的起点定为18.5,则在[26.5,28.5]范围内的频数为________.解析:30-19=11 112=5.5,∴分6组. 在[26.5,28.5]之间的数有5个. 答案:11 6 55.将一个容量为n 的样本分成若干组,已知某组的频数和频率分别是30和0.25,则n =________.解析:30n =0.25,∴n =30×4=120.答案:1206.为了了解学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):(1)求出表中a ,m 的值; (2)画出频率分布直方图.解:(1)由题意得:6+21+27+m =60 ∴m =6. a =2760=0.45 ∴a =0.45. (2)如图所示:一、选择题1.学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60]元的同学有30人,则n 的值为( )A .90B .100C .900D .1 000解析:n ×0.030×10=30. n =100. 答案:B2.在抽查某产品尺寸的过程中,将其尺寸分成若干组,[a ,b )是其中一组,抽查出的个体数在该组内的频率为m ,该组直方图的高为h ,则|a -b |的值等于( )A .h ·m B.m hC.h mD .与m ,h 无关 解析:小长方形的高=频率组距,∴|a -b |=频率小长方形的高=mh.答案:B3.(2012·陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53解析:从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56.答案:A4.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间调查了某地10 000位居民,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10 000位居民中再用分层抽样抽出100位居民做进一步调查,则在[2.5,3)(小时)时间段内应抽出的人数是()A.25 B.30C.50 D.75解析:0.5×0.5×100=25人答案:A二、填空题5.青年歌手大奖赛共有10名选手参赛,并请了7名评委,如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为________.解析:甲=78+84+85+86+885=84.2乙=84+84+84+86+875=85.答案:84.2856.(2011·浙江高考)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽甲乙8 5798 6 5 48 4 4 4 6 729 3取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.解析:由题意知,在该次数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,故这3 000名学生在该次数学考试中成绩小于60分的学生数是3 000×0.2=600.答案:6007.10个小球分别编号1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,则0.4是指1号球占总体分布的________.解析:0.4=410为1号球占总体分布的频率.答案:频率8.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是______.作品A88 9 99 2 3 x 2 1 4解析:当x≤4时,89+89+92+93+(90+x)+92+917=91,解之得x=1.当x>4时,易证不合题意.答案:1三、解答题9.某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107,;乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.解:甲、乙两人数学成绩的茎叶图如图所示.甲乙5 6615798896183684159398871036 1011 4从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况;也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.10.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛,为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:分组频数频率[50,60)40.08[60,70)0.16[70,80)10[80,90)160.32[90,100]合计50(1)填充频率分布表的空格(将答案直接填在表格内);(2)补全频率分布直方图;(3)若成绩在[70,90)分的学生为二等奖,问获得二等奖的学生约为多少人?解:(1)分组频数频率[50,60)40.08[60,70)80.16[70,80)100.20[80,90)160.32[90,100]120.24合计50 1.00 (2)频率分布直方图如图所示:(3)∵成绩在[70,80)间的学生频率为0.20;成绩在[80,90)间的学生频率为0.32.∴在[70,90)之间的频率为0.20+0.32=0.52.又∵900名学生参加竟赛,∴该校获二等奖的学生为900×0.52=468(人).。
2.2.1用样本的频率分布估计总体分布
分 组 [0,0.5) [0,0.5) [0.5, [0.5,1) [1,1.5) [1,1.5) [1.5, [1.5,2) [2,2.5) [2,2.5) [2.5, [2.5,3) [3,3.5) [3,3.5) [3.5, [3.5,4) [4, [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100
1.9 0.3 0.5 0.6 0.8 0.7 0.9 0.5 0.8 0.6
1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2
思考1 上述100个数据中的最大值和最 思考1:上述100个数据中的最大值和最 100 小值分别是什么? 小值分别是什么?由此说明样本数据的 变化范围是什么? 变化范围是什么? 0.2~ 0.2~4.3 思考2:样本数据中的最大值和最小值 思考2 的差称为极差 如果将上述100 极差. 100个数据 的差称为极差.如果将上述100个数据 组距为0.5进行分组 进行分组, 按组距为0.5进行分组,那么这些数据 共分为多少组? 共分为多少组? 4.3-0.2) (4.3-0.2)÷0.5=8.2
上图称为频率分布直方图, 上图称为频率分布直方图,其中横轴 频率分布直方图 表示月均用水量,纵轴表示频率/组距. 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高 度在数量上有何特点? 度在数量上有何特点?
思考2 思考2:频率分布直方图中各小长方形的 面积表示什么? 面积表示什么?各小长方形的面积之和 为多少? 为多少?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
2.2.1用样本的频率分布估计总体分布
总体密度曲线
反映了总体在各个范围内取值的百分比,精确地 反映了总体的分布规律。是研究总体分布的工具. 用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布 规律,即越精确地反映了总体在各个范围内取值 百分比。
定额管理,即确定一个居民月用水量标准a, 用水量不超过a的部分按平价收费,超出a的 部分按议价收费.那么①标准a定为多少比较合 理呢? ②为了较合理地确定这个标准,你认 为需要做哪些工作?
通过抽样,我们获得了100位居民某年的月平均 用 水量(单位: t) ,如下表:
思考:由上表,大家可以得到什么信息?
2019/4/10
二、画频率分布直方图的步骤
1.求极差(即一组数据中最大值与最小值的差)
4.3 - 0.2 = 4.1
极差 4.1 2.决定组距与组数: = 组距= = 0.5 8 组数
当数据在100个以内时,常分8-12组.
3.将数据分组
[0,0.5 ),[0.5,1 ),…,[4,4.5]
4.列频率分布表
月均用水量 /t 4.5
归纳: 作频率分布直方图的方法为:
把横轴分成若干段,每一段对应一个组 的组距,以此线段为底作矩形,高等于 该组的频率/组距, 这样得到一系列矩形, 每一个矩形的面积恰好是该组上的频率, 这些矩形构成了频率分布直方图.
三、频率分布直方图再认识 1、小长方形
频率
的面积总和=?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/t
2019/4/10
当总体中的个体数很多时(如抽样调查全国城市 居民月均用水量) ,随着样本容量的增加,作图时 所分的组数增多,组距减少,你能想象出相应的 频率分布折线图会发生什么变化吗?
用样本估计总体2.2.1用样本的频率分布估计总体分布
频率 组距
0.1
0.2
0.3
0.4
0.5
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
平均数是频率分布直方图的“重心”. 用频率分布直方图估计平均数方法是
01
平均数≈图中每一个小矩形的面积×小矩形底边中点的横坐标之和
8 4 6 3 6 8 3 8 9 1
叶就是从茎的旁边生长出来的数,表示得分的个位数。
茎是指中间的一列数,表示得分的十位数
茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。 从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。 在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。
人数
2
3
2
3
4
1
1
1
平均数: 一组数据的算术平均数,即 x= 练习: 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示: 分别求这些运动员成绩的众数,中位数与平均数 平均数: 一组数据的算术平均数,即 x=
1
解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;
0.5 1 1.5 2 2.5 3 3.5 4 4.5
5.画频率分布直方图
思考 : 如果当地政府希望使 85% 以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗? 注意 小正方形的面积=组距×频率/组距=频率 各小正方形的面积之和等于1. 每一小组频率实际上反映样本数据落在各个小组的比例大小。
2.2.1 用样本的频率分布估计总体分布 课件(人教A版必修3) (1)
)
【做一做 2-2】 在画频率分布直方图时, 某组的频数为 10, 样本容量为 50, 总体容量为 600, 则该组的频率是( A.
1 5
) C.
1 10
B.
1 6 10 1
D.不确定
解析: 该组的频率是50 = 5. 答案: A
3.频率分布折线图和总体密度曲线 ( 1) 类似于频数分布折线图, 连接频率分布直方图中各个小长方形上端的中 点, 就得到频率分布折线图. 一般地, 当总体中的个体数较多时, 抽样时样本容量就不能太小.例如, 如果 要抽样调查一个省乃至全国的居民的月均用水量, 那么样本容量就应比调查一 个城市的时候大.可以想像, 随着样本容量的增加, 作图时所分的组数增加, 组距 减小, 相应的频率折线图会越来越接近于一条光滑曲线, 统计中称这条光滑曲线 为总体密度曲线.
频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围 内取值的百分比, 它能给我们提供更加精细的信息.
( 2) 估计方法: 实际上, 尽管有些总体密度曲线是客观存在的, 但是在实际应 用中我们并不知道它的具体表达形式, 需要用样本来估计.由于样本是随机的, 不同的样本得到的频率分布折线图不同; 即使对于同一个样本, 不同的分组情况 得到的频率分布折线图也不同.频率分布折线图是随样本容量和分组情况的变 化而变化的, 因此不能用样本的频率分布折线图得到准确的总体密度曲线.
2.2
用样本估计总体
2.2.1
用样本的频率分布估计总体分布
1.了解分析数据的方法,知道估计总体频率分布的方法. 2.了解频率分布折线图和总体密度曲线,会画频率分布直方图和茎叶图. 3.理解频率分布直方图和茎叶图及其应用.
1.分析数据的方法 ( 1) 借助于图形. 用图将各个数据画出来, 作图可以达到两个目的, 一是从数据中提取信息; 二是利用图形传递信息. ( 2) 借助于表格. 用紧凑的表格改变数据的构成方式, 为我们提供解释数据的新方式.
2020版数学人教B版必修3学案:第二章 2.2.1 用样本的频率分布估计总体的分布(一) Word版含解析
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体的分布(一)学习目标 1.体会分布的意义和作用.2.学会用频率分布表,画频率分布直方图表示样本数据.3.能通过频率分布表或频率分布直方图对数据做出总体统计.知识点一 用样本估计总体 思考 还记得我们抽样的初衷吗?答案 用样本去估计总体,为决策提供依据. 梳理 用样本的频率分布估计总体的分布. 知识点二 频率分布表与频率分布直方图思考1 要做频率分布表,需要对原始数据做哪些工作? 答案 分组,频数累计,计算频数和频率. 思考2 如何决定组数与组距? 答案 若极差组距为整数,则极差组距=组数.若极差组距不为整数,则⎣⎢⎡⎦⎥⎤极差组距+1=组数. 注意:[x]表示不大于x 的最大整数.思考3 同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?答案 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.梳理 一般地,频数指某组中包含的个体数,各组频数和=样本容量;频率=频数样本容量,各组频率和等于1.在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用小长方形的面积来表示,各小长方形的面积的总和等于1.1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.( √ )2.频率分布直方图中小长方形的面积表示该组的个体数.( × ) 3.频率分布直方图中所有小长方形面积之和为1.( √ )题型一 频率分布的理解例1 关于频率分布直方图,下列说法正确的是( ) A .直方图中小长方形的高表示取某数的频率B .直方图中小长方形的高表示该组上的个体在样本中出现的频率C .直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值D .直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值 答案 D解析 注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.反思与感悟 由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失. 跟踪训练1 一个容量为20的样本数据,将其分组如下表:则样本在区间(-∞,50)上的频率为( ) A .0.5 B .0.25 C .0.6 D .0.7 答案 D解析 样本在区间(-∞,50)上的频率为2+3+4+520=1420=0.7.题型二 频率分布直方图的绘制例2 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1) 这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?解(1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:频率分布直方图如图所示.(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称的状态,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.反思与感悟组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.跟踪训练2一个农技站为了考察某种麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表、绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm 之间的麦穗所占的百分比. 解 (1)计算极差:7.4-4.0=3.4; (2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12;(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55; (4)列频率分布表:(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm 之间的麦穗约占41%. 题型三 频率分布表及频率分布直方图的应用例3 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).解 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.反思与感悟 在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.跟踪训练3 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少? 解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的, 因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.1.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )A .20B .30C .40D .50 答案 B解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.2.已知样本数据:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的是() A.[5.5,7.5) B.[7.5,9.5)C.[9.5,11.5) D.[11.5,13.5]答案 D解析列出频率分布表,依次对照就可以找到答案,频率分布表如下:从表中可以看出频率为0.2的是[11.5,13.5],故选D.3.如图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的优秀(120分及以上为优秀)率为________.答案30%解析优秀率为10×(0.022 5+0.005+0.002 5)=0.3=30%.4.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.答案21解析根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.∵样本中数据在[20,60)内的频率为0.6,样本容量为50,∴4+5+x+y50=0.6,解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.5.暑假期间某班为了增强学生的社会实践能力,把该班学生分成四个小组到一果园帮果农测量果树的产量,某小组来到一片种植苹果的山地,他们随机选取20株作为样本测量每一株的果实产量(单位:kg),获得的数据按照区间[40,45),[45,50),[50,55),[55,60]进行分组,得到如下频率分布表:已知样本中产量在区间[45,50)内的株数是产量在区间[50,60]内的株数的43倍.(1)分别求出a ,b ,c 的值; (2)作出频率分布直方图. 解 (1)易得c =1.0.由题意得⎩⎪⎨⎪⎧a =43(0.1+b ),0.3+a +0.1+b =1.0,∴a =0.4,b =0.2.(2)根据频率分布表画出频率分布直方图,如图所示.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布. 2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.一、选择题1.观察新生婴儿的体重(单位:g),其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000)内的频率为( )A .0.001B .0.01C .0.003D .0.3答案 D解析 频率=频率组距×组距,组距=3 000-2 700=300,频率组距=0.001, ∴频率=0.001×300=0.3.2.容量为100的样本数据,按从小到大的顺序分为8组,如下表:第三组的频数和频率分别是( ) A .14和0.14 B .0.14和14 C.114和0.14 D.13和114答案 A解析 x =100-(10+13+14+15+13+12+9)=100-86=14,第三组的频率为14100=0.14.3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18 答案 C解析 志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36×1=18, 有疗效的人数为18-6=12.4.某校为了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在[40,45) kg 的人数是( )A .10B .2C .5D .15 答案 A解析 由图可知频率=频率组距×组距,频率=0.02×5=0.1,∴女生体重在[40,45) kg 的人数为0.1×100=10.5.为了了解某幼儿园儿童的身高情况,抽查该园120名儿童的身高绘制成如图所示的频率分布直方图,则抽查的120名儿童身高大于或等于98 cm 且小于104 cm 的有( )A .90名B .75名C .65名D .40名 答案 A解析 由图可知身高大于或等于98 cm 且小于104 cm 的儿童的频率为(0.1+0.15+0.125)×2=0.75,抽查的120名儿童有120×0.75=90(名)儿童的身高大于或等于98 cm 且小于104 cm. 6.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 的值为( ) A .20 B .27 C .6 D .60答案 D解析 ∵n ·2+3+42+3+4+6+4+1=27,∴n =60.7.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120 答案 B解析 ∵少于60分的学生人数为600×(0.05+0.15)=120, ∴不少于60分的学生人数为600-120=480.8.对某种电子元件使用寿命进行跟踪调查,所得样本频率分布直方图如图.由图可知,这一批电子元件中寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量的比是( )A .1∶2B .1∶3C .1∶4D .1∶6 答案 C解析 由题意,寿命在100~300 h 的电子元件的频率为100×⎝⎛⎭⎫12 000+32 000=0.2,寿命在300~600 h 的电子元件的频率为100×⎝⎛⎭⎫1400+1250+3 2 000=0.8,则寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量比大约是0.2∶0.8=1∶4. 二、填空题9.将一个容量为n 的样本分成若干组,已知甲组的频数和频率分别为36和14,则容量n =________,频率为16的乙组的频数是________.答案 144 24解析 14=36n ,所以n =36×4=144,同理16=x144,x =24.10.某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图所示),现规定不低于70分为合格,则合格人数是________.答案 600解析 由频率分布直方图知合格的频率为(0.035+0.015+0.01)×10=0.6, 故合格人数为1 000×0.6=600.11.下列命题正确的是________.(填序号)①频率分布直方图中每个小矩形的面积等于相应组的频数; ②频率分布直方图中各小矩形面积之和等于1;③频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比. 答案 ②③解析 在频率分布直方图中,横轴表示样本数据,纵轴表示频率组距.由于小矩形的面积=组距×频率组距=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.综上可知②③正确.12.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案 9解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.13.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.则频率分布直方图中x 的值为 __________.答案 0.004 4解析 ∵(0.002 4+0.003 6+0.006 0+x +0.002 4+0.001 2)×50=1,∴x =0.004 4. 三、解答题14.为加强中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计,请你根据尚未完成的频率分布表解答问题:(1)求a ,b ,c ,d ,e 的值; (2)作出频率分布直方图.解 (1)根据题意,得分在[60.5,70.5)内的频数是a =50×0.26=13,在[90.5,100.5]内的频数是b =50-13-15-18=4,在[70.5,80.5)内的频率是c =1550=0.30,在[90.5,100.5]内的频率是d =450=0.08,频率和e =1. (2)根据频率分布表作出频率分布直方图,如图所示.四、探究与拓展15.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:根据上面的频率分布表,可知①处的数值为________,②处的数值为__________. 答案 3 0.025解析 由位于[110,120)的频数为 36,频率=36n =0.300,得样本容量n =120,所以[130,140)的频率=12120=0.1,②处的数值=1-0.050-0.200-0.300-0.275-0.1-0.050=0.025;①处的数值为0.025×120=3.。
(人教b版)数学必修三练习:2.2.1(第1课时)用样本的频率分布估计总体的分布1(含答案)
第二章 2.2 2.2.1 第1课时一、选择题1.从某批零件中抽出若干个,然后再从中抽出40个进行合格检查,发现合格产品有36个,则该批产品的合格率为( )A .36%B .72%C .90%D .25%[答案] C[解析] 用样本的合格率近似代替总体的合格率为3640×100%=90%.2.在用样本估计总体分布的过程中,下列说法正确的是( ) A .总体容量越大,估计越精确 B .总体容量越小,估计越精确 C .样本容量越大,估计越精确 D .样本容量越小,估计越精确 [答案] C[解析] 用样本估计总体分布时,样本容量越大,估计越精确.3.(2013·重庆文,6)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )1 8 92 1 2 2 7 9 30 0 3A.0.2 B .0.4 C .0.5 D .0.6[答案] B[解析] 由题意知,这10个数据落在区间[22,30)内的有22,22,27,29,共4个,∴其频率为410=0.4,故选B4.(2013·辽宁理,5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45 B.50C.55 D.60[答案] B[解析] 根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,∴该班的学生人数是150.3=50.5.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其他7个小长形的面积和的14,且样本容量为200,则第8组的频数为( )A.40 B.0.2C.50 D.0.25[答案] A[解析] 设最后一个小长方形的面积为x,则其他7个小长方形的面积为4x,从而x+4x=1,所以x=0.2.故第8组的频率为200×0.2=40.6.一个容量为20的样本数据分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.则样本在(-∞,50]上的频率为( ) A.90% B.70%C.50% D.25%[答案] B[解析] 样本在(-∞,50]上的频数为2+3+4+5=14,故在(-∞,50]上的频率为14÷20=70%,故选B.二、填空题7.(2013·湖北理,11)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示________.(1)直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250]内的户数为________.[答案] (1)0.004 4 (2)70[解析] 本题考查频率分布直方图和用样本估计总体.∵50×(0.002 4+0.003 6+0.006+x+0.002 4+0.0012)=1,∴x=0.0044.用户在区间[100,250]内的频率为50×(0.003 6+0.006+0.004 4)=0.7,∴户数为100×0.7=70(户).点评:频率分布直方图中各个小矩形的面积之和为1.8.(2014·江苏,6)为了解一处经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.[答案] 24[解析] 由题意在抽测的60株树木中,底部周长小于100cm的株数为(0.015+0.025)×10×60=24.三、解答题9.为了了解商场某日旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得的数据整理后,画出频率分布直方图(如图所示).已知从左至右前3个小组的频率之比为123,第4小组与第5小组的频率分别为0.175和0.075,第二小组的频数为10,求抽取顾客多少人?[解析] 前三组频率和为1-0.075-0.175=0.75.又前三组频率之比为123,所以第二组频率为 26×0.75=0.25.又知第二组频数为10,则100.25=40(人),故所抽取顾客为40人.一、选择题1.某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重(单位: g)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100 g 的个数是36,则样本中净重大于或等于98 g 并且小于104 g 的产品个数是( )A .90B .75C .60D .45[答案] A[解析] 本小题主要考查了频率分布直方图,考查了读图用图的能力.产品净重小于100 g 的频率P =(0.050+0.10)×2=0.3,设样本容量为n ,由已知36n=0.3,∴n =120.而净重大于或等于98 g 而小于104 g 的产品的频率P ′=(0.100+0.150+0.125)×2=0.75.∴个数为0.75×120=90.故选A.2.(2014·山东理,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6 B.8 C.12 D.18 [答案] C[解析] 第一、二两组的频率为0.24+0.16=0.4,∴志愿者的总人数为200.4=50(人).第三组的人数为:50×0.36=18(人),有疗效的人数为18-6=12(人).二、填空题3.一个社会调查机构就某地居民的月收入调查10 000人,并根据所得数据画了样本的频率分布直方图(如图所示).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.[答案] 25[解析] 从10 000人中用分层抽样的方法抽出100人,∴抽取比例为100 1.由图可知,0.000 5×500×10 000=2 500,∴月收入在[2 500,3 000)内的人数为2 500人,∴从中应抽出2 500×1100=25(人).4.从某自动包装机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g) 492 496 494 495 498497 501 502 504 496497 503 506 508 507492 496 500 501 499根据频率分布估计总体分布的原理,该自动包装机包装的袋盐食盐质量在497.5g~501.5g之间的概率约为____________.[答案] 0.25[解析] 袋装食盐质量在497.5~501.5g之间的共有5袋,所以其概率为520=0.25.三、解答题5.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午800~1000间各自的点击量,得如图所示的茎叶图.根据统计图:(1)甲、乙两个网站点击量s的极差分别是多少?(2)甲网站点击量在[10,40]间的频率是多少?(3)甲、乙两个网站哪个更受欢迎?并说明理由.[解析] (1)甲网站的极差为:73-8=65;乙网站的极差为:71-5=66.(2)甲网站点击量在[10,40]间的频率为414=27=0.285 71.(3)甲网站的点击量集中在茎叶图的下方(较大),而乙网站的点击量集中在茎叶图的上方(较小).从数据的分布情况来看,甲网站更受欢迎.6.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高:(单位:cm)区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)[146,150)[150,154)[154,158)人数58102233201165(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.[解析] (1)样本频率分布表如下:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201(2)(3)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.希望对大家有所帮助,多谢您的浏览!。
2.2.1用样本的频率分布估计总体分布
新课导入前面研究学习了三种抽样收集数据,数据收集后,必须从中寻找包含的信息,以使我们能追求样本的估计总体,但是由于数据多而杂,所以需要通过一定的方法去分析.可以通过表、图、计算方法来分析.1. 通过实例体会分布的意义和作用;2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.知识与技能教学目标过程与方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.情感态度与价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.重点会列频率分布表,画频率分布直方图、频率折线图和茎叶图.能通过样本的频率分布估计总体的分布. 难点教学重难点我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?实际问题为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设我们通过抽样,得到100为居民月用水量,如下:100位居民的月均用水量(单位:t)3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.64.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2观察?上面的数字能告诉我们什么呢很容易发现的是一个居民月均用水量的最小值是0.2t,最大值是4.3t.其他值在0.2—4.3t之间.除此之外,很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理和分析.知识要点频率分布直方图频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.方法画频率分布直方图的一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.(1)求极差 因为用水最小值为0.2t ,最大值为4.3t 所以:4.3-0.2=4.1 说明样本数据的变化范围是4.1t.将上述抽样的100户居民月用水量,画出频率分布直方图.解:(2)决定组距与组数数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5—12组.为了方便起见,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么组数=极差/组距=4.1/0.5=8.2因此可将数据分成9组,这个组数是较合适的,于是去组距为0.5.组数为9.(3)将数据分组以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5).(4)列频率分布表按照组距为0.5将数据分组,分成以下9组:[0,0.5),[0.5,1),…,[4,4.5). 图如下:100位居民月均用水量的频率分布表分组频数频率[0,0.5)40.04[0.5,1)80.08[1,1.5)150.15[1.5,2)220.22 [2,2.5)250.25 [2.5,3)140.14 [3,3.5)60.06 [3.5,4)40.04 [4,4.5)20.02合计1001频数等于样本数,频率恒为1(5)画频率分布直方图 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/to 0.100.200.300.400.50频率/组距特征频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布的总体趋势.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.知识要点频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.总体密度曲线的定义在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.茎叶图数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.特征茎叶图的特征:1. 用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.2. 茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.课堂小结1.频率分布直方图的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.2.频率分布折线图的概念连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.高考链接1(2009四川)设矩形的长为a ,宽为b ,其比满足 51b :a 0.6182-=≈这种矩形给人以美感,称为黄金矩形,黄金矩形常应用用于工艺品设计中,下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样品来估计两个批次的总体平均数,与标准值0.618比较,正确结论是()AA.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值跟接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定解析:本题考查平均数的求法,用样本估计总体,经计算甲、乙批次的总体平均数0.6170.613甲乙,x x ==知甲批次的总体平均数与标准值0.618更接近.2(2009湖北)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[6,10]内的频数为_______,数据落在[2,10)内的概率约为_____. 64 0.4解析:本题考查频率分布直方图,样本数据落在[6,10)内的频数为0.08×(10-6)×200=64.样本数据落在[2,10)内的概率约为(0.02+0.08)×4=0.4.区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)人数5810223320区间界限[146,150)[150,154)[154,158)人数11651.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位c m)(1)列出样本频率分布表﹔ (2)一画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.随堂练习分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201解:(1)样本频率分布表如下:前面的过程省略!122 126 130 134 138 142 146 150 158 154 身高(cm )o 0.010.020.030.040.050.060.07频率/组距(2)其频率分布直方图如下:0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为:2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.90 100 110 120 130 140 150 次数o 0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036解:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1. (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.0824171593=+++++121500.08===第二小组频数样本容量第二小组频率又因为频率=频数/ 样本容量所以 (2)由图可估计该学校高一学生的达标率约为 171593100%88%24171593+++⨯=+++++(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.。
用样本的频率分布估计总体分布(一)
人教b版数学必修三:2.2.1《用样本的频率分布估计、总体的分布》导学案
§2.2用样本估计总体2.2.1用样本的频率分布估计总体的分布自主学习学习目标1.通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体的分布,初步体会样本频率分布的随机性.自学导引1.极差的概念极差是一组数据的________________的差,它反映了一组数据____________,极差又叫________.2.频数、频率的概念将一批数据按要求分为若干组,对落在各个小组内数据的________进行累计,这个累计数叫做各个小组的______,各个小组的______除以________,即得该小组的______.3.频率分布直方图在频率分布直方图中,纵轴表示________________,各小长方形的面积等于________________,所有长方形面积之和等于________.4.频率分布折线图连接频率分布直方图中各个小长方形的____________,就得到频率分布折线图.5.总体密度曲线如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近总体在各个小组内所取值的________________的大小;当样本容量不断增大,分组的组距不断缩小时,频率分布直方图实际上越来越接近于____________,它可以用一条____________来描绘,这条光滑曲线就叫做________________.6.茎叶图用茎叶图表示数据的两个优点在于:一是从茎叶图上没有____________的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时____________,方便记录与表示.对点讲练知识点一画频率分布直方图、频率分布折线图例1某中学同年级40名男生的体重数据如下(单位:千克):61605959595858575757575656565656565655555555545454545353525252525251515150504948列出样本的频率分布表,画出频率分布直方图,画出频率分布折线图.变式迁移1有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20),17.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)求样本数据不足0的频率.知识点二用样本的频率分布估计总体分布寿命(2)画出频率分布直方图及折线图;(3)估计电子元件寿命在400 h以上的概率.变式迁移2为了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)问参加这次测试的学生人数是多少?(3)问在这次测试中,学生跳绳次数的中位数落在第几小组内?例3某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲的得分12,15,24,25,31,31,36,36,37,39,44,49,50;乙的得分8,13,14,16,23,26,28,33,38,39,51.(1)画出甲、乙两名运动员得分数据的茎叶图;(2)根据茎叶图分析甲、乙两运动员的水平.变式迁移3在某电脑杂志的一篇文章中,每个句子所含的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17;在某报纸的一篇文章中,每个句子所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?几种表示频率分布的方法的优点与不足(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.(3)频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体密度曲线.(4)用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.课时作业一、选择题1.关于频率分布直方图中的有关数据,下列说法正确的是()A.小矩形的高表示取某数的频率B.小矩形的高表示该组上的个体在样本中出现的频率C.小矩形的高表示该组上的个体数与组距的比值D.小矩形的高表示该组上个体在样本中出现的频率与组距的比值2.关于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是()A.频率分布直方图与总体密度曲线无关B.频率分布直方图就是总体密度曲线C.样本容量很大的频率分布直方图就是总体密度曲线D.如果样本容量无限增大,分组的组距无限减小,那么相应的频率分布折线图会越来越接近一条光滑曲线,则这条光滑曲线为总体密度曲线3.已知10个数据如下:63,65,67,69,66,64,66,64,65,68.如果对这些数据绘制频率分布表,那么其中在64.5~66.5这组的频率是()A.0.4 B.0.5 C.5 D.4A.0.5 B.0.24 C.0.6 D.0.7二、填空题5.在求频率分布时,把数据分为5组,若已知其中的前四组频率分别为0.1,0.3,0.3,0.1,则第五组的频率是______,这五组的频数之比为________.6.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本容量是________.三、解答题7.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为6月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?8.有关部门从甲,乙两个城市所有的自动售货机中分别随机抽取了16台,记录下一上午各自的销售情况如下:(单位:元)甲18,8,10,43,5,30,10,22,6,27,25,58,14,18,30,41乙22,31,32,42,20,27,48,23,38,43,12,34,18,10,34,23(1)请画出这两组数据的茎叶图.(2)将这两组数据进行比较分析,你能得到什么结论?§2.2用样本估计总体2.2.1用样本的频率分布估计总体的分布自学导引1.最大值与最小值变化的幅度全距2.个数频数频数样本容量频率3.频率与组距的比值相应各组的频率 14.上边的中点5.个数与总数比值总体的分布光滑曲线y=f(x)总体密度曲线6.原始信息随时记录对点讲练例1解(1)计算:61-48=13;(2)决定组距与组数,取组距为2,∵132=612,∴共分7组;(3)决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下7组:47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,55.5~57.5,57.5~59.5,59.5~61.5.(4)51.5~53.5 7 0.175 53.5~55.5 8 0.20 55.5~57.5 11 0.275 57.5~59.5 5 0.125 59.5~61.5 2 0.05 合计4040 1.00(5)(6)取各小长方形上边的中点并用线段连接就构成了频率分布折线图. 变式迁移1 解 (1)分组 频数 频率[-20,-15)7 0.035 [-15,-10)11 0.055 [-10,-5)15 0.075 [-5,0)40 0.200 [0,5) 49 0.245 [5,10) 41 0.205 [10,15) 20 0.100 [15,20) 17 0.085合计200 (2)(3)样本数据不足0的频率为7+11+15+40200=0.365.例2 解 (1)寿命(h ) 频数 频率100~20020 0.10 200~30030 0.15 300~40080 0.40 400~50040 0.20 500~60030 0.15 合计200 1.00 (2)(3)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的频率为0.35.变式迁移2 解 (1)第四小组的频率为1-(0.1+0.3+0.4)=0.2. (2)n =第一小组的频数÷第一小组的频率=5÷0.1=50.(3)由0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,得第一、第二、第三、第四小组的频数分别为5,15,20,10.所以学生跳绳次数的中位数落在第三小组内. 例3 解 (1)作出茎叶图如下图:(2)由上面的茎叶图可以看出,甲运动员的得分情况是大致对称的,中位数是36分;乙运动员的得分情况除一个特殊得分外,也大致对称,中位数是26分.因此甲运动员的发挥比较稳定,总体得分情况比乙运动员好.变式迁移3 解 (1)茎叶图如图所示:(2)电脑杂志上每个句子的字数集中在10~30之间,报纸上每个句子的字数集中在20~40之间,说明电脑杂志上每个句子的平均字数要比报纸上每个句子的平均字数要少.课时作业 1.D 2.D3.A [∵在这组中的数只有4个,∴频率=410=0.4.]4.D5.0.2 1∶3∶3∶1∶2 6.40解析 可知中间长方形的面积是所有长方形面积的14,即频率为14,∴样本容量为1014=40.7.解 (1)依题意知第三组的频率为42+3+4+6+4+1=15,又∵第三组的频数为12,∴本次活动的参评作品数为1215=60(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1=18(件)(3)第四组的获奖率是1018=59,第六组上交的作品数量为60×12+3+4+6+4+1=3(件)∴第六组的获奖率为23=69,显然第六组的获奖率较高. 8.解 (1)茎叶图如图所示.(2)由图可以看出乙城市的销售额分布较对称,集中程度较高,故乙城市一上午的销售情况比较稳定且销售额较高.。
2.2.1用样本的频率分布估计总体
频率/组距
0.4 0.3 0.2 0.1 0 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5
用水量范围
连接频率分布直方图中各个小长方形上端的中点,频率分布折线图
随着样本容量的增加,作图时所分的组数也会增加,相应的频 率折线图会越来越接近于一条光滑的曲线,统计学中称这条光滑的 曲线为总体密度曲线
(3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少?
解:(1)组距为3,列频率分布表
分组 频数 频率 频率/ 组距
[12.5, [15.5, [18.5, [21.5, [24.5, [27.5, [30.5,
15.5) 3 18.5) 8 21.5) 9 24.5) 11 27.5) 10 30.5) 5 33.5) 4
甲 8 4 6 3 3 6 8 3 8 9 1 0 1
乙
2 5 5 4 1 1 6 6 7 9 4 9 0
2
3 4 5
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上没 有原始数据信息的损失,所有数据信息都可以从茎叶图 中得到;二是茎叶图中的数据可以随时记录,随时添加, 方便记录与表示; (2)茎叶图只便于表示两位(或一位)有效数字的数据, 对位数多的数据不太容易操作;而且茎叶图只方便记录 两组的数据,两个以上的数据虽然能够记录,但是没有 表示两个记录那么直观,清晰; (3)茎叶图对重复出现的数据要重复记录,不能遗漏.
[0,0.5 ),[0.5,1 ),…,[4,4.5]
分组时,通常对组内数值所在区间取左 闭右开区间,最后一组取闭区间,当然也 可以采用其他分组方法。
4.列频率分布表
2.2.1用样本的频率分布估计总体分布(1)
[21.5, 24.5) 11
(1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在 [15.5, 24.5)的百分比是多少?
注意
第几组频数 (1)第几组频率= 样本容量
频率 (2)纵坐标为: 组距
(3)理解面积表示频率
作业:P81
A2
40.5
50.560.5 70.580.5 90.5 100.5
画频率分布直方图的步骤
1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围100-48=52 2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的“距离”。 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 极差 52 组数= 5.2 取整,分为6组,合适 组距 10 极差 52 组数= 13 取整,分为13组, 组距 4 不太合适 3、将数据分组 4、列出频率分布表.(分组、频数、频率、频率/ 组距) 5、画出频率分布直方图。
学生分数频率分布表 分组 频数累计 频数 频率
[40.5 ,50.5)
[50.5 , 60.5 ) [60.5 , 70.5 ) [70.5 , 80.5) [80.5 , 90.5)
2
2 7 16 8
0.05
0.05 0.175 0.40 0.20
[90.5 , 100.5)
合计
5
40
0.125
每组头 数 40 80 160 80 32 8
每组总质 量 1920 4240 9280 5040 2176 584 23240
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学法指导
一.知识点
1.频率分布的概念:
频率分布:频率分布是指一个样本数据 在各个小范围 内所占的大小。一般用频率分布直方图反映样本的频率分布。
频数及频率:将一批数据按要求分为若干个组,叫做该组的频数,每组的叫做该组的频率。
2.频率分布Biblioteka 方图(1)绘制步 骤:①求,即一组数据中的最大值与最小值的差。
2019-2020学年高中数学2.2.1用样本的频率分布估计总体分布(第1课时)学案新人教A版必修3
学习目标
(1)通过实例体会分布的意义和作 用。
(2)在表示样本数据的过 程中,学会列频率分布表,画频率分布直方图。
学习重点
会列频率分布表,画频率 分布直方图
学习难点
能通过样本的频率分布估计总体的 分布
②决定与。③将数据。④列出表。
⑤画出频率分布直方图。其中横轴表示,纵轴表示 的比。
(2)意义:频率分布直方图中,每个小矩形的面积表示相应组的,
所有小矩形的面积的总和等于。
二.典型例题
例1:某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:
42,38,29,36,41,43,54,43,34,44,
三.当堂检测
1.为了解一批数据在各个范围内所占的比例大小,将这批数 据分组,落在各个小组里的数据个数叫做()
A、频数B、样本容量C、频率D、频数累计
2.在频率分布直方图中,各个小长方形的面积表示()
A、落在相应各组的数据的频数B、相应各组的频率
C、该样本所分成的组数D、该样本的容量
3.为了了解某地区高三学生的身体发育情况,抽查了该地区10 0名年龄为17岁~18岁的男生体重(kg),得到频率分布直方图,如图,据图可得这100名学生中体重在[56.5, 64.5) kg的学生人数是( )
A.20B.30C.40D.50
注意掌握
本题中关键是列出频率分别表
要牢固掌握列频率分别表及画频率分布直方图的步骤与方法
检测
40,59,39,42,44,50,37,44,45,29,
48,45,53,48,37,28,46,50,37,44,
42,39,51,52,62,47,59,46,45,67,
53,49,65,47,54,63,57,43,46,58.
(1)列出样本频率分布表;(2)画出频率分布直方图;
(3)估计年龄在33~53岁的知识分子所占的比例约是多少.