2.2.1(一)用样本的频率分布估计整体分布

合集下载

2.2.1用样本的频率分布估计总体分布(1)

2.2.1用样本的频率分布估计总体分布(1)
[15.5, 18.5) [18.5, 21.5) 8 9 [24.5, 27.5) [27.5, 30.5) [30.5, 33.5) 10 5 4
[21.5, 24.5) 11
(1)列出样本的频率分布表; (2)画出频率分布直方图; (3)根据频率分布直方图估计,数据落在 [15.5, 24.5)的百分比是多少?
注意
第几组频数 (1)第几组频率= 样本容量
频率 (2)纵坐标为: 组距
(3)理解面积表示频率
作业:P81
A2
40.5
50.560.5 70.580.5 90.5 100.5
画频率分布直方图的步骤
1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围100-48=52 2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的“距离”。 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 极差 52 组数= 5.2 取整,分为6组,合适 组距 10 极差 52 组数= 13 取整,分为13组, 组距 4 不太合适 3、将数据分组 4、列出频率分布表.(分组、频数、频率、频率/ 组距) 5、画出频率分布直方图。
学生分数频率分布表 分组 频数累计 频数 频率
[40.5 ,50.5)
[50.5 , 60.5 ) [60.5 , 70.5 ) [70.5 , 80.5) [80.5 , 90.5)
2
2 7 16 8
0.05
0.05 0.175 0.40 0.20
[90.5 , 100.5)
合计
5
40
0.125
每组头 数 40 80 160 80 32 8
每组总质 量 1920 4240 9280 5040 2176 584 23240

2.2.1用样本的频率分布估计总体的分布课件(刘爱娟,2014.2.26)

2.2.1用样本的频率分布估计总体的分布课件(刘爱娟,2014.2.26)

• • • • • • • • • •
25.39 25.41 25.40 25.37 25.35 25.40 25.36 25.41 25.47 25.40
25.36 25.43 25.39 25.44 25.32 25.43 25.42 25.32 25.34 25.35
25.34 25.44 25.41 25.33 25.45 25.44 25.39 25.38 25.30 25.41
1.将每个数据分为茎(高位)和叶(低位) 两部分,在此例中,茎为十位上的数字, 叶为个位上的数字. 2.将最小茎和最大茎之间的数按大小次序 排成一列,写在中间. 3.将各个数据的叶按大小次序写在其茎的 左(右)侧.
用茎叶图表示数据的优点
一是从统计图上没有原始信息的损失,所 有的数据信息都可以从茎叶图中得到; 二是茎叶图可以在比赛是随时记录,方便 记录与表示。但茎叶图只便于表示两位有 效数字的数据,虽然可以表示两个人以上 的比赛结果(或两个以上的记录),但没 有表示两个记录那么直观、清晰
二、频率分布折线图
把频率分布直方图各个长方形上边的中点用线段 连接起来,就得到分布折线图。
三、总体密度曲线
• 频率分布直方图表明了所抽取的100件产品中, 尺寸落在各个小组内的频率大小.样本容量越大, 所分组数越多,各组的频率就越接近于总体在相 应各组取值的概率.设想样本容量无限增大,分
组的组距无限缩小,则频率分布直方图就会无限 接近于一条光滑曲线——总体密度曲线.它反映 了总体在各个范围内取值的规率.总体密度曲线
3、甲乙两个小组各10名学生的英语口语测试成绩如下(单位:分)
甲组 76 乙组 82 90 84 84 85 86 89 81 79 87 80 86 91 82 89 85 79 83 74

用样本估计总体2.2.1用样本的频率分布估计总体分布

用样本估计总体2.2.1用样本的频率分布估计总体分布

频率 组距
0.1
0.2
0.3
0.4
0.5
O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)
平均数是频率分布直方图的“重心”. 用频率分布直方图估计平均数方法是
01
平均数≈图中每一个小矩形的面积×小矩形底边中点的横坐标之和
8 4 6 3 6 8 3 8 9 1
叶就是从茎的旁边生长出来的数,表示得分的个位数。
茎是指中间的一列数,表示得分的十位数
茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。 从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。 在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。
人数
2
3
2
3
4
1
1
1
平均数: 一组数据的算术平均数,即 x= 练习: 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示: 分别求这些运动员成绩的众数,中位数与平均数 平均数: 一组数据的算术平均数,即 x=
1
解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75. 上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;
0.5 1 1.5 2 2.5 3 3.5 4 4.5
5.画频率分布直方图
思考 : 如果当地政府希望使 85% 以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗? 注意 小正方形的面积=组距×频率/组距=频率 各小正方形的面积之和等于1. 每一小组频率实际上反映样本数据落在各个小组的比例大小。

高中数学2.2.1 用样本的频率分布估计总体分布优秀课件

高中数学2.2.1 用样本的频率分布估计总体分布优秀课件

四、总体密度曲线
反映了总体分布,即反映了总体在各个范围内 取值的百分比
频率 组距
身高
ab
〔图中阴影局部的面积,表示总体在 区间 (a, b) 内取值的百分比〕。
说明:总体密度曲线是客观存在的,但在实际中,
我们只能用样本来估计。由于样本是随机的,不同 的样本得到的频率分布折线图不同;即使是同一样 本,不同的分组得到的频率分布折线图也不同。
4.从图可以清楚看到数据分布总体态势,但是原 有的具体数据信息被抹掉了
二、频率分布直方图 画频率分布直方图的一般步骤: 1、求极差〔最大值与最小值的差〕
2、决定组距与组数〔将数据分组〕
组数=极差/组距 当样本容量不超过100时,组数一般为5~12组
3、将数据分组 4、画频率分布表 5、画频率分布直方图
0.06 0.16 0.18 0.22 0.20 0.10 0.08
频率/ 组距
0.020 0.053 0.060 0.073 0.067 0.033 0.027
(2)画频率分布直方图:
频率 组距 0.070 0.060 0.050 0.040 0.030 0.020 0.010 12.5 15.5
128.1 144.4 150.3 146.2 140.6 126.0 125.6 127.7
154.4
142.7 141.2 142.7 137.6 136.9 132.3
131.8 147.7 138.4 136.6 136.2 141.6 141.1 133.1
142.8 136.8 133.1 144.5 142.4 140.8 127.7 150.7
二、频率分布直方图
5、画频率分布直方图
频率 组距
0.02 0.01

2.2.1 用样本的频率分布估计总体分布 课件(人教A版必修3) (1)

2.2.1 用样本的频率分布估计总体分布 课件(人教A版必修3) (1)

)
【做一做 2-2】 在画频率分布直方图时, 某组的频数为 10, 样本容量为 50, 总体容量为 600, 则该组的频率是( A.
1 5
) C.
1 10
B.

1 6 10 1
D.不确定
解析: 该组的频率是50 = 5. 答案: A
3.频率分布折线图和总体密度曲线 ( 1) 类似于频数分布折线图, 连接频率分布直方图中各个小长方形上端的中 点, 就得到频率分布折线图. 一般地, 当总体中的个体数较多时, 抽样时样本容量就不能太小.例如, 如果 要抽样调查一个省乃至全国的居民的月均用水量, 那么样本容量就应比调查一 个城市的时候大.可以想像, 随着样本容量的增加, 作图时所分的组数增加, 组距 减小, 相应的频率折线图会越来越接近于一条光滑曲线, 统计中称这条光滑曲线 为总体密度曲线.
频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围 内取值的百分比, 它能给我们提供更加精细的信息.
( 2) 估计方法: 实际上, 尽管有些总体密度曲线是客观存在的, 但是在实际应 用中我们并不知道它的具体表达形式, 需要用样本来估计.由于样本是随机的, 不同的样本得到的频率分布折线图不同; 即使对于同一个样本, 不同的分组情况 得到的频率分布折线图也不同.频率分布折线图是随样本容量和分组情况的变 化而变化的, 因此不能用样本的频率分布折线图得到准确的总体密度曲线.
2.2
用样本估计总体
2.2.1
用样本的频率分布估计总体分布
1.了解分析数据的方法,知道估计总体频率分布的方法. 2.了解频率分布折线图和总体密度曲线,会画频率分布直方图和茎叶图. 3.理解频率分布直方图和茎叶图及其应用.
1.分析数据的方法 ( 1) 借助于图形. 用图将各个数据画出来, 作图可以达到两个目的, 一是从数据中提取信息; 二是利用图形传递信息. ( 2) 借助于表格. 用紧凑的表格改变数据的构成方式, 为我们提供解释数据的新方式.

2020版数学人教B版必修3学案:第二章 2.2.1 用样本的频率分布估计总体的分布(一) Word版含解析

2020版数学人教B版必修3学案:第二章 2.2.1 用样本的频率分布估计总体的分布(一) Word版含解析

2.2 用样本估计总体2.2.1 用样本的频率分布估计总体的分布(一)学习目标 1.体会分布的意义和作用.2.学会用频率分布表,画频率分布直方图表示样本数据.3.能通过频率分布表或频率分布直方图对数据做出总体统计.知识点一 用样本估计总体 思考 还记得我们抽样的初衷吗?答案 用样本去估计总体,为决策提供依据. 梳理 用样本的频率分布估计总体的分布. 知识点二 频率分布表与频率分布直方图思考1 要做频率分布表,需要对原始数据做哪些工作? 答案 分组,频数累计,计算频数和频率. 思考2 如何决定组数与组距? 答案 若极差组距为整数,则极差组距=组数.若极差组距不为整数,则⎣⎢⎡⎦⎥⎤极差组距+1=组数. 注意:[x]表示不大于x 的最大整数.思考3 同样一组数据,如果组距不同,得到的频率分布直方图也会不同吗?答案 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.梳理 一般地,频数指某组中包含的个体数,各组频数和=样本容量;频率=频数样本容量,各组频率和等于1.在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用小长方形的面积来表示,各小长方形的面积的总和等于1.1.频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.( √ )2.频率分布直方图中小长方形的面积表示该组的个体数.( × ) 3.频率分布直方图中所有小长方形面积之和为1.( √ )题型一 频率分布的理解例1 关于频率分布直方图,下列说法正确的是( ) A .直方图中小长方形的高表示取某数的频率B .直方图中小长方形的高表示该组上的个体在样本中出现的频率C .直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值D .直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值 答案 D解析 注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.反思与感悟 由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失. 跟踪训练1 一个容量为20的样本数据,将其分组如下表:则样本在区间(-∞,50)上的频率为( ) A .0.5 B .0.25 C .0.6 D .0.7 答案 D解析 样本在区间(-∞,50)上的频率为2+3+4+520=1420=0.7.题型二 频率分布直方图的绘制例2 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1) 这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?解(1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:频率分布直方图如图所示.(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称的状态,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.反思与感悟组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5至12组.跟踪训练2一个农技站为了考察某种麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表、绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm 之间的麦穗所占的百分比. 解 (1)计算极差:7.4-4.0=3.4; (2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12;(3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55; (4)列频率分布表:(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm 之间的麦穗约占41%. 题型三 频率分布表及频率分布直方图的应用例3 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).解 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在[4,6)组内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在[8,10)组内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.反思与感悟 在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.跟踪训练3 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少? 解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的, 因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.1.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )A .20B .30C .40D .50 答案 B解析 样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.2.已知样本数据:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的是() A.[5.5,7.5) B.[7.5,9.5)C.[9.5,11.5) D.[11.5,13.5]答案 D解析列出频率分布表,依次对照就可以找到答案,频率分布表如下:从表中可以看出频率为0.2的是[11.5,13.5],故选D.3.如图是将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的优秀(120分及以上为优秀)率为________.答案30%解析优秀率为10×(0.022 5+0.005+0.002 5)=0.3=30%.4.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是________.答案21解析根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.∵样本中数据在[20,60)内的频率为0.6,样本容量为50,∴4+5+x+y50=0.6,解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.5.暑假期间某班为了增强学生的社会实践能力,把该班学生分成四个小组到一果园帮果农测量果树的产量,某小组来到一片种植苹果的山地,他们随机选取20株作为样本测量每一株的果实产量(单位:kg),获得的数据按照区间[40,45),[45,50),[50,55),[55,60]进行分组,得到如下频率分布表:已知样本中产量在区间[45,50)内的株数是产量在区间[50,60]内的株数的43倍.(1)分别求出a ,b ,c 的值; (2)作出频率分布直方图. 解 (1)易得c =1.0.由题意得⎩⎪⎨⎪⎧a =43(0.1+b ),0.3+a +0.1+b =1.0,∴a =0.4,b =0.2.(2)根据频率分布表画出频率分布直方图,如图所示.1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布. 2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.一、选择题1.观察新生婴儿的体重(单位:g),其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000)内的频率为( )A .0.001B .0.01C .0.003D .0.3答案 D解析 频率=频率组距×组距,组距=3 000-2 700=300,频率组距=0.001, ∴频率=0.001×300=0.3.2.容量为100的样本数据,按从小到大的顺序分为8组,如下表:第三组的频数和频率分别是( ) A .14和0.14 B .0.14和14 C.114和0.14 D.13和114答案 A解析 x =100-(10+13+14+15+13+12+9)=100-86=14,第三组的频率为14100=0.14.3.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18 答案 C解析 志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36×1=18, 有疗效的人数为18-6=12.4.某校为了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了如图所示的频率分布直方图,则所抽取的女生中体重在[40,45) kg 的人数是( )A .10B .2C .5D .15 答案 A解析 由图可知频率=频率组距×组距,频率=0.02×5=0.1,∴女生体重在[40,45) kg 的人数为0.1×100=10.5.为了了解某幼儿园儿童的身高情况,抽查该园120名儿童的身高绘制成如图所示的频率分布直方图,则抽查的120名儿童身高大于或等于98 cm 且小于104 cm 的有( )A .90名B .75名C .65名D .40名 答案 A解析 由图可知身高大于或等于98 cm 且小于104 cm 的儿童的频率为(0.1+0.15+0.125)×2=0.75,抽查的120名儿童有120×0.75=90(名)儿童的身高大于或等于98 cm 且小于104 cm. 6.将容量为n 的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 的值为( ) A .20 B .27 C .6 D .60答案 D解析 ∵n ·2+3+42+3+4+6+4+1=27,∴n =60.7.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )A .588B .480C .450D .120 答案 B解析 ∵少于60分的学生人数为600×(0.05+0.15)=120, ∴不少于60分的学生人数为600-120=480.8.对某种电子元件使用寿命进行跟踪调查,所得样本频率分布直方图如图.由图可知,这一批电子元件中寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量的比是( )A .1∶2B .1∶3C .1∶4D .1∶6 答案 C解析 由题意,寿命在100~300 h 的电子元件的频率为100×⎝⎛⎭⎫12 000+32 000=0.2,寿命在300~600 h 的电子元件的频率为100×⎝⎛⎭⎫1400+1250+3 2 000=0.8,则寿命在100~300 h 的电子元件的数量与寿命在300~600 h 的电子元件的数量比大约是0.2∶0.8=1∶4. 二、填空题9.将一个容量为n 的样本分成若干组,已知甲组的频数和频率分别为36和14,则容量n =________,频率为16的乙组的频数是________.答案 144 24解析 14=36n ,所以n =36×4=144,同理16=x144,x =24.10.某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图所示),现规定不低于70分为合格,则合格人数是________.答案 600解析 由频率分布直方图知合格的频率为(0.035+0.015+0.01)×10=0.6, 故合格人数为1 000×0.6=600.11.下列命题正确的是________.(填序号)①频率分布直方图中每个小矩形的面积等于相应组的频数; ②频率分布直方图中各小矩形面积之和等于1;③频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比. 答案 ②③解析 在频率分布直方图中,横轴表示样本数据,纵轴表示频率组距.由于小矩形的面积=组距×频率组距=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.综上可知②③正确.12.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.答案 9解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.13.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.则频率分布直方图中x 的值为 __________.答案 0.004 4解析 ∵(0.002 4+0.003 6+0.006 0+x +0.002 4+0.001 2)×50=1,∴x =0.004 4. 三、解答题14.为加强中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计,请你根据尚未完成的频率分布表解答问题:(1)求a ,b ,c ,d ,e 的值; (2)作出频率分布直方图.解 (1)根据题意,得分在[60.5,70.5)内的频数是a =50×0.26=13,在[90.5,100.5]内的频数是b =50-13-15-18=4,在[70.5,80.5)内的频率是c =1550=0.30,在[90.5,100.5]内的频率是d =450=0.08,频率和e =1. (2)根据频率分布表作出频率分布直方图,如图所示.四、探究与拓展15.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:根据上面的频率分布表,可知①处的数值为________,②处的数值为__________. 答案 3 0.025解析 由位于[110,120)的频数为 36,频率=36n =0.300,得样本容量n =120,所以[130,140)的频率=12120=0.1,②处的数值=1-0.050-0.200-0.300-0.275-0.1-0.050=0.025;①处的数值为0.025×120=3.。

【课件】新课标人教A版数学必修3:2.2.1用样本的频率分布估计总体分布课件

【课件】新课标人教A版数学必修3:2.2.1用样本的频率分布估计总体分布课件

频率分布
样本中所有数据(或数据组)的频数和样 本容量的比,叫做该数据的频率.
所有数据(或数据组)的频数的分布变化 规律叫做样本的频率分布.
频率分布的表示形式有: ①样本频率分布表 ②样本频率分布条形图 ③样本频率分布直方图
2.2.1用样本的频率分布 估计总体分布(1)
我国的缺水情况
• 我国是世界上严重缺水的国家之一。
茎叶图


8 463 368 389
1
0 1 25 2 54 3 1 61679 4 49 50
注:中间的数字表示得分的十位数字。
旁边的数字分别表示两个人得分的 个位数。
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上 没有原始数据信息的损失;二是茎叶图中的数据可 以随时记录,随时添加,方便记录与表示;
极差 组距
4.1 0.5
8.2
3.将数据分组(8.2取整,分为9组)
4.列出频率分布表.
5.画出频率分布直方图
画频率分布直方图
步骤:
1.求极差: 4.3 - 0.2 = 4.1
2.决定组距与组数:组数=
极差 组距
=
4.1 0.5
= 8.2
3.将数据分组
[0,0.5 ),[0.5,1 ),…,[4,4.5]
组距0.5
0.6 0.5 0.4 0.3 0.2 0.1
0 123456789
组距0.5
0.6 0.5 0.4 组距0.5 0.3 0.2 0.1
0 123456789
组距0.5
所得到的结论的统计意义
• 3t这个标准一定能保证85%以上的居民用水 不超标吗?
• 不一定! • 原因1、样本只是总体的代表,并且具有随

2.2.1用样本的频率分布估计总体分布

2.2.1用样本的频率分布估计总体分布

2.2.1用样本的频率分布估计总体分布(导学案)教学目标1.通过实例体会分布的意义和作用2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。

一.创设情境,引入新课。

问题:怎样通过上表中的数据,分析比较两时间段内的高温(33C)状况?二.自主感悟,合作探究。

阅读课本~回答下列问题一、频率分布直方图频率分布是指一个样本数据在各个小范围内所占比例的大小。

一般用频率分布直方图反映样本的频率分布。

其一般步骤为:(1)求极差,即计算(2)决定(3)将数据(4)列(5)画频率分布直方图牛刀小试:1.为了了解一大片经济林的生长情况,随机测量其中的100 株的底部周长,得到如下数据表(长度单位:cm):画出频率分布直方图表;56P70P解:1.求极差135-80=552..决定组距与组数:可将其分为11组, 组距为53.将数据分组: [80,85) ;[85,90);[90,95);[95,100) ;[100,105);[105,110);[110,115) [115,120);[120,125) ;[125,130);[130,135)①横坐标为样本数据尺寸,纵坐标为频率/组距②从频率分布直方图可以清楚的看出数据分布的总体趋势。

③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。

④直方图是用小长方形面积的大小来表示在各个区间内取值的频率,总面积为1.注意如果将频率分布直方图中各相邻的矩形的底边的中点顺次连结起来, 就得到一条折线, 我们称这条折线为本组数据的频率折线图,组距取得足够小, 则这条折线将趋于一条曲线, 我们称这一曲线为总体分布的密度曲线.二.茎叶图频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况.【问题】 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39. 在比赛中将这些数据记录为如下形式:思考1:你能理解这个图是如何记录这些数据的吗?你能通过该图说明哪个运动员的发挥更稳定,平均水平高吗?思考2:在统计中,上图叫做茎叶图,它也是表示样本数据分布情况的一种方法,其中“茎”指的是哪些数,“叶”指的是哪些数? 思考3:用茎叶图表示数据的分布情况是一种好方法,你认为茎叶图有哪些优点?三. 课堂例题巩固例1. 绿色出行越来越受到社会的关注,越来越多的消费者对新能源汽车感兴趣 但是消费者比较关心的问题是汽车的续驶里程 某研究小组从汽车市场上随机抽取20辆纯电动汽车调查其续驶里程 单次充电后能行驶的最大里程 ,被调查汽车的续驶里程全部介于50公里和300公里之间,将统计结果分成5组: ,绘制成如图所示的频率分布直方图. 求直方图中m 的值; 求本次调查中续驶里程在 的车辆数;例2..为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为 2∶4∶17∶15∶9∶3,第二小组的频数为12. (1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?甲乙8 4 6 3 3 6 8 3 8 9 1 0123452 55 41 6 1 6 7 9 4 9四.实践落实,巩固提升1.、在频率分布直方图中,小矩形的高表示( )A、频率/样本容量B、组距×频率C、频率D、频率/组距2、频率分布直方图中,小长方形的面积等于( )A、相应各组的频数B、相应各组的频率C、组数D、组距3、一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为()A、2B、4C、6D、84.一个容量100的样本,其数据的分组与各组的频数如下表:则样本数据落在上的频率为A. B. C. D.5.某校高二班一次阶段考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在内的人数分别为( )A. 20,2B. 24,4C. 25,2D. 25,46.对某同学的6次数学测试成绩满分100分进行统计,作出的茎叶如图所示,给出关于该同学数学成绩的以下说法:中位数为83;众数为83;平均数为85;极差为12.其中正确说法序号是( )A. B. C. D.7.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图如图,已知图中从左到右的前3个小组的频率之比为1:2:3,第1小组的频数为6,则报考飞行员的学生人数是( ) A. 32 B. 40 C. 48 D. 56五.课堂小结六.作业布置:固学案相应部分。

(人教b版)数学必修三练习:2.2.1(第1课时)用样本的频率分布估计总体的分布1(含答案)

(人教b版)数学必修三练习:2.2.1(第1课时)用样本的频率分布估计总体的分布1(含答案)

第二章 2.2 2.2.1 第1课时一、选择题1.从某批零件中抽出若干个,然后再从中抽出40个进行合格检查,发现合格产品有36个,则该批产品的合格率为( )A .36%B .72%C .90%D .25%[答案] C[解析] 用样本的合格率近似代替总体的合格率为3640×100%=90%.2.在用样本估计总体分布的过程中,下列说法正确的是( ) A .总体容量越大,估计越精确 B .总体容量越小,估计越精确 C .样本容量越大,估计越精确 D .样本容量越小,估计越精确 [答案] C[解析] 用样本估计总体分布时,样本容量越大,估计越精确.3.(2013·重庆文,6)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )1 8 92 1 2 2 7 9 30 0 3A.0.2 B .0.4 C .0.5 D .0.6[答案] B[解析] 由题意知,这10个数据落在区间[22,30)内的有22,22,27,29,共4个,∴其频率为410=0.4,故选B4.(2013·辽宁理,5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A.45 B.50C.55 D.60[答案] B[解析] 根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,∴该班的学生人数是150.3=50.5.在样本的频率分布直方图中,共有8个小长方形,若最后一个小长方形的面积等于其他7个小长形的面积和的14,且样本容量为200,则第8组的频数为( )A.40 B.0.2C.50 D.0.25[答案] A[解析] 设最后一个小长方形的面积为x,则其他7个小长方形的面积为4x,从而x+4x=1,所以x=0.2.故第8组的频率为200×0.2=40.6.一个容量为20的样本数据分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.则样本在(-∞,50]上的频率为( ) A.90% B.70%C.50% D.25%[答案] B[解析] 样本在(-∞,50]上的频数为2+3+4+5=14,故在(-∞,50]上的频率为14÷20=70%,故选B.二、填空题7.(2013·湖北理,11)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示________.(1)直方图中x的值为________.(2)在这些用户中,用电量落在区间[100,250]内的户数为________.[答案] (1)0.004 4 (2)70[解析] 本题考查频率分布直方图和用样本估计总体.∵50×(0.002 4+0.003 6+0.006+x+0.002 4+0.0012)=1,∴x=0.0044.用户在区间[100,250]内的频率为50×(0.003 6+0.006+0.004 4)=0.7,∴户数为100×0.7=70(户).点评:频率分布直方图中各个小矩形的面积之和为1.8.(2014·江苏,6)为了解一处经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.[答案] 24[解析] 由题意在抽测的60株树木中,底部周长小于100cm的株数为(0.015+0.025)×10×60=24.三、解答题9.为了了解商场某日旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得的数据整理后,画出频率分布直方图(如图所示).已知从左至右前3个小组的频率之比为123,第4小组与第5小组的频率分别为0.175和0.075,第二小组的频数为10,求抽取顾客多少人?[解析] 前三组频率和为1-0.075-0.175=0.75.又前三组频率之比为123,所以第二组频率为 26×0.75=0.25.又知第二组频数为10,则100.25=40(人),故所抽取顾客为40人.一、选择题1.某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重(单位: g)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100 g 的个数是36,则样本中净重大于或等于98 g 并且小于104 g 的产品个数是( )A .90B .75C .60D .45[答案] A[解析] 本小题主要考查了频率分布直方图,考查了读图用图的能力.产品净重小于100 g 的频率P =(0.050+0.10)×2=0.3,设样本容量为n ,由已知36n=0.3,∴n =120.而净重大于或等于98 g 而小于104 g 的产品的频率P ′=(0.100+0.150+0.125)×2=0.75.∴个数为0.75×120=90.故选A.2.(2014·山东理,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6 B.8 C.12 D.18 [答案] C[解析] 第一、二两组的频率为0.24+0.16=0.4,∴志愿者的总人数为200.4=50(人).第三组的人数为:50×0.36=18(人),有疗效的人数为18-6=12(人).二、填空题3.一个社会调查机构就某地居民的月收入调查10 000人,并根据所得数据画了样本的频率分布直方图(如图所示).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.[答案] 25[解析] 从10 000人中用分层抽样的方法抽出100人,∴抽取比例为100 1.由图可知,0.000 5×500×10 000=2 500,∴月收入在[2 500,3 000)内的人数为2 500人,∴从中应抽出2 500×1100=25(人).4.从某自动包装机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g) 492 496 494 495 498497 501 502 504 496497 503 506 508 507492 496 500 501 499根据频率分布估计总体分布的原理,该自动包装机包装的袋盐食盐质量在497.5g~501.5g之间的概率约为____________.[答案] 0.25[解析] 袋装食盐质量在497.5~501.5g之间的共有5袋,所以其概率为520=0.25.三、解答题5.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午800~1000间各自的点击量,得如图所示的茎叶图.根据统计图:(1)甲、乙两个网站点击量s的极差分别是多少?(2)甲网站点击量在[10,40]间的频率是多少?(3)甲、乙两个网站哪个更受欢迎?并说明理由.[解析] (1)甲网站的极差为:73-8=65;乙网站的极差为:71-5=66.(2)甲网站点击量在[10,40]间的频率为414=27=0.285 71.(3)甲网站的点击量集中在茎叶图的下方(较大),而乙网站的点击量集中在茎叶图的上方(较小).从数据的分布情况来看,甲网站更受欢迎.6.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高:(单位:cm)区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)[146,150)[150,154)[154,158)人数58102233201165(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.[解析] (1)样本频率分布表如下:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201(2)(3)由样本频率分布表可知身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.希望对大家有所帮助,多谢您的浏览!。

2.2.1用样本的频率分布估计总体分布(1)

2.2.1用样本的频率分布估计总体分布(1)
4.用频率分布直方图估计总体有什么优缺 点?
1.画频率分布直方图的基本步骤:
1.求极差
4.3 - 0.2 = 4.1
一组数据中最大值与最小值的差
2.决定组距与组数
组数:将数据分组,当数据在100个以内时,
按数据多少常分5-12组。
组距:指每个小组的两个端点的距离,
3.将组数数据= 分组极组距差(=左40闭..15右=开8).2 [0,0.5 ),[0.5,1 ),…,[4,4.5]
=频率
∴在频率直方图中,各小矩形的面积的总和等于1.
频率分布条形图和频率分布直方图是两个 相同的概念吗? 有什么区别?
频率分布的条形图和频率分布直方图的区别
两者是不同的概念; 横轴:两者表示内容相同 纵轴:两者表示的内容不相同 频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示频率与 组距的比值。
[40,50),2;[50,60),3;[60,70),10; [70,80),15;[80,90),12;[90,100],8;
(1)列出样本的频率分布表;
(2)画出频率分布直方图.
解析:(1)样本的频率分布表如下
成绩分组 [40,50) [50,60) [60,70) [70,80) [80,90) [90,100] 合计
例 3.世界卫生组织指出青少年的身体健康状况是一个应该引 起大家足够重视的问题,某校为了解学生的体能情况,抽取了一 个年级的部分学生进行一分钟跳绳测试.将所得数据整理后,画 出了频率分布直方图,如图所示.已知图中从左到右前三个小组 的频率分别为 0.1,0.3,0.4,第一小组的频数为 5.
(1)求第四小组的频率; (2)求参加这次测试的学生人数是多少? (3)若在 75 次以上(含 75 次)为达标,试估计该年级学生跳绳 测试的达标率是多少?

2.2.1用样本的频率分布估计总体分布

2.2.1用样本的频率分布估计总体分布

新课导入前面研究学习了三种抽样收集数据,数据收集后,必须从中寻找包含的信息,以使我们能追求样本的估计总体,但是由于数据多而杂,所以需要通过一定的方法去分析.可以通过表、图、计算方法来分析.1. 通过实例体会分布的意义和作用;2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.知识与技能教学目标过程与方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.情感态度与价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.重点会列频率分布表,画频率分布直方图、频率折线图和茎叶图.能通过样本的频率分布估计总体的分布. 难点教学重难点我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?实际问题为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设我们通过抽样,得到100为居民月用水量,如下:100位居民的月均用水量(单位:t)3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.64.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2观察?上面的数字能告诉我们什么呢很容易发现的是一个居民月均用水量的最小值是0.2t,最大值是4.3t.其他值在0.2—4.3t之间.除此之外,很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理和分析.知识要点频率分布直方图频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.方法画频率分布直方图的一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.(1)求极差 因为用水最小值为0.2t ,最大值为4.3t 所以:4.3-0.2=4.1 说明样本数据的变化范围是4.1t.将上述抽样的100户居民月用水量,画出频率分布直方图.解:(2)决定组距与组数数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5—12组.为了方便起见,组距的选择应力求“取整”.在本问题中,如果取组距为0.5(t),那么组数=极差/组距=4.1/0.5=8.2因此可将数据分成9组,这个组数是较合适的,于是去组距为0.5.组数为9.(3)将数据分组以组距为0.5将数据分组时,可以分成以下9组:[0,0.5),[0.5,1),…,[4,4.5).(4)列频率分布表按照组距为0.5将数据分组,分成以下9组:[0,0.5),[0.5,1),…,[4,4.5). 图如下:100位居民月均用水量的频率分布表分组频数频率[0,0.5)40.04[0.5,1)80.08[1,1.5)150.15[1.5,2)220.22 [2,2.5)250.25 [2.5,3)140.14 [3,3.5)60.06 [3.5,4)40.04 [4,4.5)20.02合计1001频数等于样本数,频率恒为1(5)画频率分布直方图 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量/to 0.100.200.300.400.50频率/组距特征频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布的总体趋势.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.知识要点频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.总体密度曲线的定义在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.茎叶图数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.特征茎叶图的特征:1. 用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.2. 茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.课堂小结1.频率分布直方图的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.2.频率分布折线图的概念连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.高考链接1(2009四川)设矩形的长为a ,宽为b ,其比满足 51b :a 0.6182-=≈这种矩形给人以美感,称为黄金矩形,黄金矩形常应用用于工艺品设计中,下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样品来估计两个批次的总体平均数,与标准值0.618比较,正确结论是()AA.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值跟接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定解析:本题考查平均数的求法,用样本估计总体,经计算甲、乙批次的总体平均数0.6170.613甲乙,x x ==知甲批次的总体平均数与标准值0.618更接近.2(2009湖北)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[6,10]内的频数为_______,数据落在[2,10)内的概率约为_____. 64 0.4解析:本题考查频率分布直方图,样本数据落在[6,10)内的频数为0.08×(10-6)×200=64.样本数据落在[2,10)内的概率约为(0.02+0.08)×4=0.4.区间界限[122,126)[126,130)[130,134)[134,138)[138,142)[142,146)人数5810223320区间界限[146,150)[150,154)[154,158)人数11651.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位c m)(1)列出样本频率分布表﹔ (2)一画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.随堂练习分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158)50.04合计1201解:(1)样本频率分布表如下:前面的过程省略!122 126 130 134 138 142 146 150 158 154 身高(cm )o 0.010.020.030.040.050.060.07频率/组距(2)其频率分布直方图如下:0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为:2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.90 100 110 120 130 140 150 次数o 0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036解:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1. (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.0824171593=+++++121500.08===第二小组频数样本容量第二小组频率又因为频率=频数/ 样本容量所以 (2)由图可估计该学校高一学生的达标率约为 171593100%88%24171593+++⨯=+++++(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.。

2.2.1用样本的频率分布估计总体的分布

2.2.1用样本的频率分布估计总体的分布

⑤上例中,如果规定,钢管内径的尺寸在 区间25.325~25.475内为优等品,我们可依 据抽样分析统计出产品中优等品的比例, 也就是它的频率。从上表或上图容易看出, 这个频率值等于0.12+0.18+0.25+0.16 +0.13=0.84,于是可以估计出所有生产的 钢管中有84%的优等品。工厂可以根据质 量规范,看看是否达到优等品率的要求, 如果没有达到,就需要进一步分析原因, 解决问题。
分组时,通常对组内数值所在区间取左 闭右开区间,最后一组取闭区间,当然也 可以采用其他分组方法。
④登记频数,计算频率,列出频率分布表 频数 频率= —————,如第1小组的频率 样本容量 1 为——— =0.01. 100
频率分布表:
⑤ 绘制频率分布直方图 利用直方图反映样本的频率分布规律, 这样的直方图称为频率分布直方图,简称 频率直方图。 下面仍以上例中的数据加 以说明。 (1)频率分布直方图的绘制方法与步骤 S1 先制作频率分布表,然后作直角坐标 系,以横轴表示产品内径尺寸,纵轴表示 频率/组距.
运用上面的算法得出这组样本数据的最 大值是25.56,用类似的算法可以得出最 小值是25.24它们的差为 25.56-25.24= 0.32,所以极差等于0.32mm. ②决定组距与组数 样本数据有100个,由上面算得极差为 0.32,取组距为0.03, 极差 那么组数= ——— =10.67,于是分成11组。 组距
4.列频率分布表的步骤
下面我们通过一个具体的实例来阐述这 一方法。 某钢铁加工厂生产内径为25.40mm的钢 管,为了掌握产品的生产状况,需定期对 产品进行检测,下面的数据是一次抽样中 的100件钢管的内径尺寸:
最大值
最小值
列频率分布表的方法步骤: ①求极差(也称全距,即一组数据中最 大值与最小值的差): 计算极差时,需要找出这组数据的最 大值和最小值,当数据很多时,可借助 如下算法(最大值): S1 把这100个数据命名为A(1)、A(2)、 A(3)、……、A(100); S2 设变量x=A(1); S3 把A(i) (i=2,3,……,100)逐个与x比 较,如果A(i)>x,则x=A(i);

2.2.1用样本的频率分布估计总体

2.2.1用样本的频率分布估计总体
0.6 0.5
频率/组距
0.4 0.3 0.2 0.1 0 0-0.5 0.5-1 1-1.5 1.5-2 2-2.5 2.5-3 3-3.5 3.5-4 4-4.5
用水量范围
连接频率分布直方图中各个小长方形上端的中点,频率分布折线图
随着样本容量的增加,作图时所分的组数也会增加,相应的频 率折线图会越来越接近于一条光滑的曲线,统计学中称这条光滑的 曲线为总体密度曲线
(3)根据频率分布直方图估计,数据落在[15.5, 24.5)的百分比是多少?
解:(1)组距为3,列频率分布表
分组 频数 频率 频率/ 组距
[12.5, [15.5, [18.5, [21.5, [24.5, [27.5, [30.5,
15.5) 3 18.5) 8 21.5) 9 24.5) 11 27.5) 10 30.5) 5 33.5) 4
甲 8 4 6 3 3 6 8 3 8 9 1 0 1

2 5 5 4 1 1 6 6 7 9 4 9 0
2
3 4 5
茎叶图的特征:
(1)用茎叶图表示数据有两个优点:一是从统计图上没 有原始数据信息的损失,所有数据信息都可以从茎叶图 中得到;二是茎叶图中的数据可以随时记录,随时添加, 方便记录与表示; (2)茎叶图只便于表示两位(或一位)有效数字的数据, 对位数多的数据不太容易操作;而且茎叶图只方便记录 两组的数据,两个以上的数据虽然能够记录,但是没有 表示两个记录那么直观,清晰; (3)茎叶图对重复出现的数据要重复记录,不能遗漏.
[0,0.5 ),[0.5,1 ),…,[4,4.5]
分组时,通常对组内数值所在区间取左 闭右开区间,最后一组取闭区间,当然也 可以采用其他分组方法。
4.列频率分布表

2.2.1用样本的频率分布估计总体分布

2.2.1用样本的频率分布估计总体分布
(1)列出样本频率分布表﹔ )列出样本频率分布表﹔ (2)一画出频率分布直方图 一画出频率分布直方图; 一画出频率分布直方图 (3)估计身高小于 134cm的人数占总人数的百分比 。 cm的人数占总人数的百分比 估计身高小于 cm的人数占总人数的百分比.。 分析:根据样本频率分布表、频率分布直方图的一般步骤解题。 分析:根据样本频率分布表、频率分布直方图的一般步骤解题。 (1 样本频率分布表如下: 解: 1)样本频率分布表如下: (
1
板出课题 1 分钟
让学生展开讨论 2 分钟
填空 2 分钟
以课本 P66 制定 居民用水标准问 题为例, 题为例,经过以 上几个步骤画出 频率分布直方 图。 学生动手作 ( 图)10 分钟 让学生仔细观察 表和图, 表和图,得出结 论 2 分钟
心灵寄语 :后悔过去,不如奋斗将来。——马克思 (1) 从频率分布直方图可以清楚的看出数据分布的总体趋势。 ) 从频率分布直方图可以清楚的看出数据分布的总体趋势。 不出原始的数据内容, (2) 从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有 ) 从频率分布直方图得不出原始的数据内容 把数据表示成直方图后, 的具体数据信息就被抹掉了。 的具体数据信息就被抹掉了。 探究〗 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。 :同样一组数据 〖探究〗 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。 : 不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断, 不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以 0.1 和 1 为组距 重新作图,然后谈谈你对图的印象? 重新作图,然后谈谈你对图的印象? 思考〗 :如果当地政府希望使 以上的居民每月的用水量不超出标准, 〖思考〗 如果当地政府希望使 85%以上的居民每月的用水量不超出标准,根据频率分布表 2-2 : 以上的居民每月的用水量不超出标准 和频率分布直方图 2.2-1,你能对制定月用水量标准提出建议吗? ,你能对制定月用水量标准提出建议吗? 频率分布折线图、 〈二〉频率分布折线图、总体密度曲线 1.频率分布折线图的定义: .频率分布折线图的定义: 连接频率分布直方图中各小长方形上端的中点 就得到频率分布折线图。 中各小长方形上端的中点, 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。 2.总体密度曲线的定义: .总体密度曲线的定义: 在样本频率分布直方图中, 相应的频率折线图会越来越接近于一条光滑曲线, 在样本频率分布直方图中, 相应的频率折线图会越来越接近于一条光滑曲线, 统计中 称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比, 称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比, 它能给我们提供更加精细的信息。 它能给我们提供更加精细的信息。 思考〗 〖思考〗 : 对于任何一个总体,它的密度曲线是不是一定存在?为什么? 1.对于任何一个总体,它的密度曲线是不是一定存在?为什么? 对于任何一个总体,它的密度曲线是否可以被非常准确地画出来? 2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么 实际上,尽管有些总体密度曲线是饿、客观存在的, 实际上,尽管有些总体密度曲线是饿、客观存在的,但一般很难想函数图象那样准确 地画出来,我们只能用样本的频率分布对它进行估计 一般来说,样本容量越大, 进行估计, 地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估 计就越精确. 计就越精确. 〈三〉茎叶图 茎叶图的概念: 1.茎叶图的概念: 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字, 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数 字表示个位数,即第二个有效数字,它的中间部分像植物的茎, 字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出 来的叶子,因此通常把这样的图叫做茎叶图。 来的叶子,因此通常把这样的图叫做茎叶图。 2.茎叶图的特征: .茎叶图的特征: 用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失, (1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据 信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加, 信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记 录与表示。 录与表示。 茎叶图只便于表示两位有效数字的数据, 且茎叶图只方便记录两组的数据, (2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个 以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 三、典型例题 例题精析】 【例题精析】 人的身高(单位cm cm) 例 1 下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120 人的身高(单位cm) 观察表和图, 观察表和图,得 出结论 2 分钟

2.2.1-1用样本的频率分布估计整体分布(1)

2.2.1-1用样本的频率分布估计整体分布(1)

知识探究( ):频率分布直方图 知识探究(二):频率分布直方图 思考1:为了直观反映样本数据在各组中 思考1 的分布情况,我们将上述频率分布表中 的分布情况, 的有关信息用下面的图形表示: 的有关信息用下面的图形表示:
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
2.2 用样本估计总体
2.2.1用样本的频率分布估计总体分布 .2.1用样本的频率分布估计总体分布 第一课时

问题提出
1.随机抽样是收集数据的方法, 1.随机抽样是收集数据的方法,如何通过样本数 随机抽样是收集数据的方法 据所包含的信息,估计总体的基本特征, 据所包含的信息,估计总体的基本特征,即用样 本估计总体,是我们需要进一步学习的内容. 本估计总体,是我们需要进一步学习的内容. 2.高一某班有50名学生,在数学必修② 2.高一某班有50名学生,在数学必修②结业考试 高一某班有50名学生 后随机抽取10 10名 其考试成绩如下: 后随机抽取10名,其考试成绩如下: 82, 75, 61, 93, 62, 82, 75, 61, 93, 62, 55, 70, 68, 85, 55, 70, 68, 85, 78. 如果要求我们根据上述抽样数据, 如果要求我们根据上述抽样数据,估计该班对数 学模块②的总体学习水平, 学模块②的总体学习水平,就需要有相应的数学 方法作为理论指导, 方法作为理论指导,本节课我们将学习用样本的 频率分布估计总体分布. 频率分布估计总体分布.
频数累计
频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1.00
上表称为样本数据的频率分布表,由此可以推测该市全体 上表称为样本数据的频率分布表, 频率分布表 居民月均用水量分布的大致情况, 居民月均用水量分布的大致情况,给市政府确定居民月用 水量标准提供参考依据. 水量标准提供参考依据

2.2.1用样本的频率分布估计总体分布3

2.2.1用样本的频率分布估计总体分布3
56.5 69.5 65 61.5 64.5 66.5 64 64.5 76 58.5 72 73.5 56 67 70 57.5 65.5 68 71 75 62 68.5 62.5 66 59.5 63.5 64.5 67.5 73 68 54 72 66.5 74 63 60 55.5 70 64.5 58 64 70.5 57 62.5 65 69 71.5 73 62 58 77 71 66 63.5 56 59.5 63.5 65 70 74.5 68.5 64 55.5 72.5 66.5 68 76 57.5 60 71.5 57 69.5 74 64.5 59 61.5 67 68 63.5 58 59 65.5 62.5 69.5 72 64.5 75.5 68.5 64 62 65.5 58.5 67.5 70.5 65 66 66.5 70 63 59.5
小华: 62,78,86, 94, 95, 98, 98.
小明: 62, 62, 67,82,98, 99, 100.
他们都认为自己的成绩比另两位同学好,你看呢?
小华
小明
60 70 80 90 100

F
频数 2 6 10 10 14 16 13 11 8 7 5 3
100
频率 0.02 0.06 0.10 0.10 0.14 0.16 0.13 0.11 0.08 0.07 0.05 0.03 1.00
频率/组距
频率分布直方图
体重(kg) 54 56 58 60 62 64 66 68 70 72 74 76 78
154 157 162 166 159 153 154 167 173 168 解: (1)求极差(最大值与最小值的差):
在上述数据中,最大值是175,最小值是151,它们的差是 175 — 151 = 24 (2)确定组距和组数 如果取组距为4,由24÷4=6,组数为6 (3)将数据分组:[151,155),[155,159),[159,163), [163,167),[167,171),[171,175].

2.2.1用样本的频率分布估计总体分布(1)

2.2.1用样本的频率分布估计总体分布(1)
峰”状的,而且是 “单峰”的; (2)大部分居民的月均用水量集中在一个中间值附近,
只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性. 频率分布直方图非常直观地表明了样本数据的分布情况, 使我们能够看到频率分布表中看不太清楚的数据模式,但 原始数据不能在图中表示出来.
准a,用水量不超过a的部分按平价收费,超出a的部分按
议价收费. 那么a定为多少比较合理呢?你认为,为了较为合理地确 定出这个标准,需要做哪些工作?
100位居民的月均用水量(单位:t)
3.1 2.6 2.3 2.2 1.8 1.3 1.3 1.5 0.8 2.2 2.5 2.2 2.1 1.7 1.4 1.4 1.6 0.5 2.4 2.0 2.2 1.6 1.3 3.5 1.8 0.9 2.4 2.8 2.0 1.5 1.2 3.6 1.9 0.7 2.3 2.5 2.5 1.5 1.2 3.7 1.7 0.8 2.0 2.6 2.6 2.2 1.0 0.2 1.5 0.6 4.3 2.5 2.7 2.3 2.0 1.6 0.4 0.5 4.1 3.0 2.8 2.4 2.1 1.5 1.8 0.3 3.8 3.2 2.9 2.3 2.1 1.6 1.0 1.9 0.4 3.3 2.9 2.4 2.3 1.7 1.0 1.2 1.6 3.2 2.8 2.4 2.4 1.8 1.4 1.0 1.8 3.4 2.7 2.3 2.3 1.9 1.3 1.2 1.7 0.6
(5)频率分布直方图 第一步:画平面直角坐标系. 第二步:在横轴上均匀标出各组分点,在纵轴上标出单 位长度. 第三步:以组距为宽,各组的频率与组距的商为高,分 别画出各组对应的小长方形.
频率 组距 0.5 0.4 0.3 0.2 0.1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

知识探究(二):频率分布直方图
思考1:为了直观反映样本数据在各组 中的分布情况,我们将上述频率分布 表中的有关信息用下面的图形表示:
频率 组距
0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
频率 组距 0.5 0.4 0.3 0.0.8 0.7 0.9 0.5 0.8 0.6
1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2
思考1:上述100个数据中的最大值和最 小值分别是什么?由此说明样本数据的 变化范围是什么? 0.2~4.3 思考2:样本数据中的最大值和最小值 的差称为极差.如果将上述100个数据 按组距为0.5进行分组,那么这些数据 共分为多少组?
(2)样本频率分布直方图:
频率 组距
0.06 0.05 0.04 0.03 0.02 0.01
O 27 32 37 42 47 52 57 62 67 年龄
(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.
小结
1. 频率分布是指一个样本数据在各个小范围内 所占比例的大小,总体分布是指总体取值的频 率分布规律.我们通常用样本的频率分布表或频 率分布直方图去估计总体的分布. 2. 频率分布表和频率分布直方图,是对相同数 据的两种不同表达方式.用紧凑的表格改变数据 的排列方式和构成形式,可展示数据的分布情 况.通过作图既可以从数据中提取信息,又可以 利用图形传递信息.
(4.3-0.2)÷0.5=8.2
思考3:以组距为0.5进行分组,上述100 个数据共分为9组,各组数据的取值范围 可以如何设定? [0,0.5),[0.5,1),[1,1.5), …,[4,4.5].
思考4:如何统计上述100个数据在各 组中的频数?如何计算样本数据在各 组中的频率?你能将这些数据用表格 反映出来吗?
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
各小长方形的面积=频率 各小长方形的面积之和=1
思考3:频率分布直方图非常直观地表明 了样本数据的分布情况,使我们能够看 到频率分布表中看不太清楚的数据模式, 但原始数据不能在图中表示出来.你能根 据上述频率分布直方图指出居民月均用 水量的一些数据特点吗?
3.本数据的频率分布表和频率分布直方图, 是通过各小组数据在样本容量中所占比例 大小来表示数据的分布规律,它可以让我 们更清楚的看到整个样本数据的频率分布 情况,并由此估计总体的分布情况.
频率 组距 0.5 0.4 0.3 0.2 0.1
O
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
思考4:样本数据的频率分布直方图是 根据频率分布表画出来的,一般地,频 率分布直方图的作图步骤如何? 第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点, 在纵轴上标出单位长度.
思考8:对样本数据进行分组,其组数 是由哪些因素确定的?
思考9:对样本数据进行分组,组距的确定没 有固定的标准,组数太多或太少,都会影响 我们了解数据的分布情况.数据分组的组数与 样本容量有关,一般样本容量越大,所分组 数越多.按统计原理,若样本的容量为n,分 组数一般在(1+3.3lgn)附近选取.当样本容 量不超过100时,按照数据的多少,常分成 5~12组.若以0.1或1.5为组距对上述100个样 本数据分组合适吗?
思考5:上表称为样本数据的频率分布 表,由此可以推测该市全体居民月均 用水量分布的大致情况,给市政府确 定居民月用水量标准提供参考依据, 这里体现了一种什么统计思想?
用样本的频率分布估计总体分布.
思考6:如果市政府希望85%左右的居民每 月的用水量不超过标准,根据上述频率分 布表,你对制定居民月用水量标准(即a的 取值)有何建议? 88%的居民月用水量在3t以下,可建议取a=3. 思考7:在实际中,取a=3t一定能保证85%以 上的居民用水不超标吗?哪些环节可能会导 致结论出现偏差? 分组时,组距的大小可能会导致结论出现偏 差,实践中,对统计结论是需要进行评价的.
1
2
3
4
5 月均用水量/t
理论迁移
例.某地区为了了解知识分子的年龄结构, 随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58. (1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计年龄在32~52岁的知识分子所占的比例 约是多少.
1.5 1.5 1.6 1.7 1.8 1.9 1.8 1.7 1.6 1.5
1.0 1.2 1.2 1.3 1.4 1.3 1.3 1.4 1.0 1.0
1.6 0.2 3.7 3.6 3.5 1.4 1.3 1.2 1.0 1.2
1.8 0.4 1.5 1.7 1.9 1.8 1.6 1.5 1.7 1.8
2.2
用样本估计总体
2.2.1用样本的频率分布估计总体分布
问题提出
1.随机抽样有哪几种基本的抽样方法? 简单随机抽样、系统抽样、分层抽样. 2.随机抽样是收集数据的方法,如何通 过样本数据所包含的信息,估计总体的 基本特征,即用样本估计总体,是我们 需要进一步学习的内容.
3.高一某班有50名学生,在数学结业考 试后随机抽取10名,其考试成绩如下: 82, 75, 61, 93, 62, 55, 70, 68, 85, 78.
思考10:一般地,列出一组样本数据的频率 分布表可以分哪几个步骤进行? 第一步,求极差. (极差=样本数据中最大值与最小值的差) 第二步,决定组距与组数. (设k=极差÷组距,若k为整数,则组 数=k,否则,组数=k+1) 第三步,确定分点,将数据分组. 第四步,统计频数,计算频率,制成表格. (频数=样本数据落在各小组内的个数, 频率=频数÷样本容量)
(1)极差为67-28=39,取组距为5,分为8组.
样本频率分布表: 分 组 [27,32) [32,37) [37,42) [42,47) [47,52) [52,57) [57,62) [62,67) 合 计 频数 3 3 9 16 7 5 4 3 50 频率 0.06 0.06 0.18 0.32 0.14 0.10 0.08 0.06 1.00
O
宽度:组距
高度:
频率 组距
0.5 1 1.5 2 2.5 3 3.5 4 4.5
月均用水量/t
上图称为频率分布直方图,其中横轴 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的和高 度在数量上有何特点?
思考2:频率分布直方图中各小长方形的 面积表示什么?各小长方形的面积之和 为多少?
如果要求我们根据上述抽样数据,估计该班 对数学的总体学习水平,就需要有相应的数 学方法作为理论指导,本节课我们将学习用 样本的频率分布估计总体分布.
知识探究(一):频率分布表 【问题】 我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过a的部 分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的 月均用水量如下表(单位:t):
第三步,以组距为宽,各组的频率与 组距的商为高,分别画出各组对应的 小长方形.
思考5:对一组给定的样本数据,频率分 布直方图的外观形状与哪些因素有关? 在居民月均用水量样本中,你能以1为组 距画频率分布直方图吗?
与分组数(或组距)及坐标系的单位长度有关.
0.4 0.3 0.2 0.1
O 频率 组距
3.1 3.4 3.2 3.3 3.2 3.0 2.5 2.6 2.5 2.8
2.5 2.6 2.7 2.8 2.9 2.9 2.8 2.7 2.6 2.5
2.0 2.2 2.3 2.3 2.4 2.4 2.3 2.4 2.3 2.2
2.0 2.2 2.1 2.2 2.3 2.4 2.3 2.1 2.1 2.0
0.5 0.4 0.3 0.2 0.1
O
频率 组距
0.5 1 1.5 2 2.5 3 3.5 4 4.5月均用水量/t
(1)居民月均用水量的分布是“山峰”状的,而 且是“单峰”的; (2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少; (3)居民月均用水量的分布有一定的对称性等.
相关文档
最新文档