频率分布直方图与概率密度曲线
高考必备-2020年高考数学一轮复习对点提分专题9.2 用样本估计总体及统计图表 (文理科通用)(学生版)
第九篇 统计
专题9.02 用样本估计总体及统计图表
【考试要求】
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性;
2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义;
3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义;
4.了解样本估计总体的取值规律;
5.能用样本估计百分位数,理解百分位数的统计含义. 【知识梳理】 1.频率分布直方图 (1)频率分布表的画法:
第一步:求极差,决定组数和组距,组距=极差
组数
;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:反映样本频率分布的直方图(如图)
横轴表示样本数据,纵轴表示频率
组距,每个小矩形的面积表示样本落在该组内的频率.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 3.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把a 1+a 2+…+a n
n
称为a 1,a 2,…,a n 这n 个数的平均数.
风电功率波动特性研究
风电功率波动特性研究
摘要:本文着力研究了风电功率的波动特性。本文结合统计学、风电等相关知识,利用回归分析,时间序列分析等多种方法,建立了概率分布模型、核平滑半参数回归模型和自回归滑动平均(ARMA)预测模型。通过对假设的检验,得到了其波动的概率分布,基于此对不同空间尺度和时间尺度的风电机组功率波动进行了波动特性分析和风电场功率在长短时段的预测,并对结果进行了多角度的对比和分析。关键词:风电功率波动特性;概率统计;正态分布;ARMA模型
随着资源环境约束的日趋严苛,以化石能源为主的能源发展模式必须根本转变。近年来,可再生能源开发的热潮遍及全球。我国已经规划了8个千万kW级的大型风电基地。截至2012年底,我国风电装机容量已超过7000万kW,居世界第1位。风力发电不消耗任何燃料,来源于大气运动,不会因为开发风电而枯竭,是一种可再生能源。风电机组发出的功率主要与风速有关。由于风的不确定性、间歇性以及风电场内各机组间尾流的影响,使得风力发电机不能像常规发电机组那样根据对电能的需求来确定发电。大规模风电基地通常需接入电网来实现风电功率的传输与消纳。风电功率的随机波动被认为是对电网带来不利影响的主要因素。研究风电功率的波动特性,不论对改善风电预测精度还是克服风电接入对电网的不利影响都有重要意义。
一、风电功率概率分布模型
1.风电功率分布模型建立
因为风电机组风电功率波动具有随机性和不可控性,大量的实验数据表明风电功率并不满足常见的概率分布。我们通过假设检验算法得出最佳概率分布,将处理后数据通过统计算法得出风电功率概率密度曲线和频率分布直方图。最后用所得数据进行曲线拟合和精度分析。因为我们所求为电功率波动的概率分布,而对于电功率波动实为单位时间内电功率变化情况。对于某风电场中某个1.5MW风电机组中随机抽取出30天中的60000个数据,我们运用一阶差分算法。首先分别得出每5秒内每个风电机组的功率变化情况,并以此为横坐标,通过统计算法得出风电功率波动频率分布直方图。根据所得频率分布直方图,观察概率密度曲线回归拟合结果。
高考数学总体分布的估计
人数
5
8
10
22
33
区间界限 142,146 146,150
)
)
(1)列出样本的频率分布表;
(2)画出人频数率分布直方2图0
11
150,154 ) 6
154,158 ) 5
第19页,共24页。
解:(1)样本频率分布表:
区间分组 122,126) 126,130) 130,134) 134,138) 138,142) 142,146) 146,150) 150,154) 154,158)
第23页,共24页。
合计
人数 5 8 10 22 33 20 11 6 5
120
频率 0.04 0.07 0.08 0.18 0.28 0.17 0.09 0.05 0.04
1
(2) 频率分布直方图
频率 组距
122 130 138 146 154 158
身高(cm)
第20页,共24页。
例2.对某电子元件进行寿命追踪调查,情况如下:
总体密度曲线反映了总体在各个范围内取值的概率,精确地反映了总 体的分布规律。是研究总体分布的工具.
用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率 分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布
规律,即越精确地反映了总体在各个范围内取值概率。
频率直方图
样本均值、顺序统计量的首项及末项、样本中位数描述了样本在数轴上 的大致位置;样本方差与样本极差描述了样本的分散程度.
第六章 数理统计的基本知识
数理统计是以概率论为基础,根据试验或观察 得到的数据,来研究随机现象.通过统计分析,对 研究对象的客观规律性作出合理的估计和推断.
第一节 总体与样本
在一个统计问题中,我们把所研究对象的全体称为一个总体.总体中 的每个元素(即每一个研究对象)称为个体. 若总体中包含有限个个体,则称这个总体为有限总体,否则称为无限 总体,总体中所包含的个体总数称为总体容量.
一般来说,恰当的方法是按一定的规则从总体中抽取若干个个体进行测 试,为了使测试到的数据能很好地反映总体的情况,当然应该要求总体中每 一个个体被抽到的可能性是均等的 .并且在抽取一个个体后总体的成分不改 变.这种抽取个体的方法称为简单随机抽样.被抽出的部分个体,叫做总体 的一个样本. 假设我们从总体 X 中抽取 n 个个体进行测试(简单抽样),把测试结果分别 记作X1,X2,…, Xn.由于抽样的随机性,Xi 可以取 X 所有可能的值,是与 X 具有相同分布的随机变量,且 X1,X2,…,Xn 相互独立.这样的 n 个个体称 为总体 X 的一个简单随机样本.
高二8-1统计(随机抽样、直方图、茎叶图)知识点、经典例题及练习题带答案
环球雅思教育学科教师讲义
讲义编号: ______________ 副校长/组长签字:签字日期:
【考纲说明】
1、理解随机抽样的必要性和重要性,了解分布、样本数据标准差的意义和作用,理解用样本估计总体的思想。
2、会画频率分布直方图、频率折线图、茎叶图,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题
【趣味链接】
U2合唱团在17分钟内得赶到演唱会场,途中必需跨过一座桥,四个人从桥的同一端出发,你得帮助他们到达另一端,天色很暗,而他们只有一只手电筒。一次同时最多可以有两人一起过桥,而过桥的时候必须持有手电筒,所以就得有人把手电筒带来带去,来回桥两端。手电筒是不能用丢的方式来传递的。四个人的步行速度各不同,若两人同行则以较慢者的速度为准。BONO需花1分钟过桥,EDGE需花2分钟过桥,ADAM需花5分钟过桥,LARRY需花10分钟过桥,他们要如何在17分钟内过桥呢?
【知识梳理】
一、抽样方法与总体分布的估计
1、随机抽样
(1)总体:在统计学中, 把研究对象的全体叫做总体,把每个研究对象叫做个体,把总体中个体的总数叫做总体容量.总体与个体之间的关系类似于集合与元素的关系.
(2)样本:从总体中随机抽取一部分个体叫做总体的一个样本,样本中个体的数目称为样本的容量,样本和总体之间
的关系类似于子集和集合之间的关系.
(3)简单随机抽样:一般地,从元素个数为N 的总体中不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 常用的方法有抽签法和随机数表法.
2021高考数学第复习考案:第74课抽样方法与统计图表文
3.系统抽样的步骤
假设要从容量为 N 的总体中抽取容量为 n 的样本.
(1)编号:先将总体的 N 个个体_编__号__(b.iān hào)
(2)分段:确定_分__段__(_fē_n__d_u,àn对)间编隔号k进行分段.
当 N ( n 样本容量)是整数时,取 k N .
n
n
(3) 确定首个个体:在第 1 段用 简单(jiǎndān)随确机定抽第样一个个体编号 l(l k) .
A. 40
B. 39
C. 38
D. 37
【答案】B
【解析】16 2 7 39 ,故选 B.
第十二页,共21页。
考点(kǎo diǎn)2 系统抽样与 分层抽样
【例 2】(2012 惠州一模)某校对全校男女学生共 1600 名进行健康调查,选用 分层抽样法抽取一个容量为 200 的样本.已知女生比男生少抽了 10 人,则 该校的女生人数应是 人.
恰好是高三学生的答卷的概率是( )
A. 1 10
B. 1 40
【答案】D
【解析】 P 400 2 . 1000 5
C. 2 3
D. 2 5
第七页,共21页。
2.(2012 湖北高考)容量为 20 的样本数据,分组后的频数如下表
分组 [10, 20) [20,30) [30, 40) [40,50) [50, 60) [60, 70)
高中数学概率统计知识点全归纳
高中数学《概率与统计》知识点总结
一、统计
1、抽样方法:
①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显)
注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N
n 。 2、总体分布的估计: ⑴一表二图:
①频率分布表——数据详实 ②频率分布直方图——分布直观
③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图:
①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计:
⑴平均数:n
x x x x x n
++++= 321;
取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2
1
2)(1
∑=−=
n
i i
x x
n
s ;
标准差:2
1
)(1∑=−=
n
i i
x x
n
s
注:方差与标准差越小,说明样本数据越稳定。
平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程
①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系
③线性回归方程:a bx y +=∧
(最小二乘法)
1
221n
i i i n
i
i x y nx y b x nx a y bx
==⎧
−⎪
⎪=⎪⎨−⎪⎪=−⎪⎩∑∑ 注意:线性回归直线经过定点),(y x 。
题高考数学概率与统计知识点
高考数学第18题(概率与统计)
1、求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识:
(1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =n m
;
等可能事件概率的计算步骤: 计算一次试验的基本事件总数n ;
设所求事件A ,并计算事件A 包含的基本事件的个数m ; 依公式
()m
P A n =
求值;
答,即给问题一个明确的答复.
(2)互斥事件有一个发生的概率:P(A +B)=P(A)+P(B); 特例:对立事件的概率:P(A)+P(A )=P(A +A )=1. (3)相互独立事件同时发生的概率:P(A ·B)=P(A)·P(B); 特例:独立重复试验的概率:Pn(k)=
k
n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的
概率,此式为二项式[(1-P)+P]n 展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结合”: 求概率的步骤是:
第一步,确定事件性质⎧⎪
⎪⎨
⎪⎪⎩等可能事件 互斥事件 独立事件 n 次独立重复试验
即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算
⎧⎨
⎩和事件积事件
即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.
第三步,运用公式()()()()()()()()(1)
k k n k n n m P A n
P A B P A P B P A B P A P B P k C p p -⎧
=⎪⎪⎪+=+⎨
⎪⋅=⋅⎪=-⎪⎩等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解
2019-2020年高中数学随机变量及其分布列版块一离散型随机变量及其分布列2完整讲义(学生版)(可
2019-2020 年高中数学随机变量及其分布列版块一离散型随机变量及其分
布列 2 完整讲义(学生版)
知识内容
1.离散型随机变量及其分布列
⑴离散型随机变量
如果在试验中,试验可能出现的结果可以用一个变量来表示,并且是随着试验的结果的不同而变化的,我们把这样的变量叫做一个随机变量.随机变量常用大写字母表
示.如果随机变量的所有可能的取值都能一一列举出来,则称为离散型随机变量.
⑵离散型随机变量的分布列
2.几类典型的随机分布
⑴两点分布
如果随机变量的分布列为
二点分布举例:某次抽查活动中,一件产品合格记为,不合格记为,已知产品的合格率为,随机变量为任意抽取一件产品得到的结果,则的分布列满足二点分布.
两点分布又称分布,由于只有两个可能结果的随机试验叫做伯努利试验,所以这种分布又称为伯努利分布.
⑵超几何分布
一般地,设有总数为件的两类物品,其中一类有件,从所有物品中任取件,这件中所含这类物品件数是一个离散型随机变量,它取值为时的概率为
,为和中较小的一个.
我们称离散型随机变量的这种形式的概率分布为超几何分布,也称服从参数为,的超几何分布.在超几何分布中,只要知道,和,就可以根据公式求出取不同值时的概率,从而列出的分布列.
⑶二项分布
1.独立重复试验
如果每次试验,只考虑有两个可能的结果及,并且事件发生的概率相同.在相同的条件下,重复地做次试验,各次试验的结果相互独立,那么一般就称它们为次独立重复试验.次独立重复试验中,事件恰好发生次的概率为.
2.二项分布
若将事件发生的次数设为,事件不发生的概率为,那么在次独立重复试验中,事件恰好发生
2.4正态分布
1 所以 P(3<X<5)=2[P(-3<X<5)-P(-1<X<3)]
1 =2[P(1-4<X<1+4)-P(1-2<X<1+2)] 1 =2[P(μ-2σ<X<μ+2σ)-P(μ-σ<X<μ+σ)] 1 =2×(0.954-0.683)≈0.136.
解答
(3)P(X>5).
1 解 P(X>5)=P(X<-3)=2[1-P(-3<X<5)] 1 =2[1-P(1-4<X<1+4)]=0.023.
x (,)
式中的实数μ、σ(σ>0)是参数,分别表示 总体的平均数与标准差,称f( x)的图象称为正态曲线
如果随机变量X服从正态分布, 则记作 X~ N( μ,σ2)
方差相等、均数不等的正态分布图示
μ=0 μ= -1 μ= 1
σ=0.5
若s 固定, 随值 的变化而 沿x轴平 移, 故 称为位置 参数;
P(ξ<4)=0.8,则P(0<ξ<2)等于
A.0.6 C.0.3 B.0.4 D.0.2
解析 ∵随机变量X服从正态分布N(2,σ2), ∴μ=2,对称轴是x=2. ∵P(ξ<4)=0.8, ∴P(ξ>4)=P(ξ<0)=0.2,
∴P(0<ξ<4)=0.6,
高中数学复习典型题专题训练118---频率直方图
高中数学复习典型题专题训练118
频率直方图
列出样本数据的频率分布表和频率分布直方图的步骤: ①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:取组距,用极差
组距
决定组数;
③决定分点:决定起点,进行分组;
④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以频率
组距
的值为纵坐标绘制直方图,
知小长方形的面积=组距×频率
组距
=频率.
频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.
总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x 来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.
题型一 频率分布直方图
【例1】 (2010西城二模)
某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.
知识内容
典例分析
板块二.频率直方图
则这200名同学中成绩大于等于80分且小于90分的学生有______名.
【例2】 (2010东城二模)
已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内
概率统计知识点汇总
概率统计知识点汇总
1.分类加法计数原理
完成一件事有n类不同的方案,在第一类方案中有m1种不同的方法,在第二类方案中有m2种不同的方法,……,在第n类方案中有m n种不同的方法,则完成这件事情,共有N=m1+m2+…+m n种不同的方法.
2.分步乘法计数原理
完成一件事情需要分成n个不同的步骤,完成第一步有m1种不同的方法,完成第二步有m2种不同的方法,……,完成第n步有m n种不同的方法,那么完成这件事情共有N=m1×m2×…×m n种不同的方法.
3.两个原理的区别
分类加法计数原理与分步乘法计数原理,都涉及完成一件事情的不同方法的种数.它们的区别在于:分类加法计数原理与分类有关,各种方法相互独立,用其中的任一种方法都可以完成这件事;分步乘法计数原理与分步有关,各个步骤相互依存,只有各个步骤都完成了,这件事才算完成.
4.排列与排列数公式
(1)排列与排列数
从n个不同元
素中取出
m(m≤n)个元素――――――――→
按照一定的顺序
排成一列
排
列
―――――→
所有不同
排列的个数
排
列
数
(2)排列数公式
A m n=n(n-1)(n-2)…(n-m+1)=
n!
(n-m)!
.
(3)排列数的性质
①A n n=n!;②0!=1. 5.组合与组合数公式
(1)组合与组合数
从n个不同元
素中取出
m(m≤n)个元素――――→
合成一组
组
合
――――――→
所有不同
组合的个数
组合数
(2)组合数公式
C m n=A m n
A m m=n(n-1)(n-2)…(n-m+1)
m!
=
n!
m!(n-m)!
.
(3)组合数的性质
①C0n=1;②C m n=C n-m
正态分布(1)
2.把一个正态曲线 沿着横轴方向向右移动 个 把一个正态曲线a沿着横轴方向向右移动 把一个正态曲线 沿着横轴方向向右移动2个 单位,得到一个新的曲线 得到一个新的曲线b,下列说法不正确的是 单位 得到一个新的曲线 下列说法不正确的是 (A)曲线 仍然是正态曲线 曲线b仍然是正态曲线 曲线 (B)曲线 和曲线 的最高点的纵坐标相等 曲线a和曲线 曲线 和曲线b的最高点的纵坐标相等 (C)以曲线 为概率密度曲线的总体的方差比 以曲线a为概率密度曲线的总体的方差比 以曲线 以曲线b为概率密度曲线的总体的方差大 为概率密度曲线的总体的方差大2 以曲线 为概率密度曲线的总体的方差大 (D)以曲线 为概率密度曲线的总体的期望比 以曲线a为概率密度曲线的总体的期望比 以曲线 以曲线b为概率密度曲线的总体的期望小 为概率密度曲线的总体的期望小2 以曲线 为概率密度曲线的总体的期望小
正 态 分 布
知识回顾
1.样本的频率分布与总体分布之间的关系 . 2.频率分布直方图 与总体密度曲线. . 与总体密度曲线. 3.总体密度曲线的形状特征. 总体密度曲线的形状特征. 中间高, 中间高,两头低 频率 总体密度曲线 组距 总体在区间 (a , b)内取值的概率
a
b
产品 尺寸 (mm) )
�
3.设随机变量ζ~N(2,4),则D( 2 )等于 (A)1 (B)2 (C)0.5 (D)4
专题27 统计图表的应用(学生版)
方法技巧专题27 统计图表的应用
【一】频率分布直方图
1.例题
【例1】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
(3)估计居民月均用水量的中位数.
【例2】(2019年高考全国Ⅲ卷文数)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
2.巩固提升综合练习
【练习1】某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人),现用分层抽样方法(按A类、B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).
(Ⅲ)求甲、乙两工人都被抽到的概率,其中甲为A类工人,乙为B类工人;
真诚推荐数学必修三频率分布直方图
(2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
第14页/共22页
思考4:样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方 图的作图步骤如何?
第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.
用样本的频率分布估计总体分布.
第6页/共22页
思考6:如果市政府希望85%左右的居民每月 的用水量不超过标准,根据上述频率分布表, 你对制定居民月用水量标准(即a的取值) 有何建议?
88%的居民月用水量在3t以下,可建议取a=3.
思考7:在实际中,取a=3t一定能保证85%以 上的居民用水不超标吗?哪些环节可能会导 致结论出现偏差?
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
高三 复习 频率分布直方图
4
8 15 22 25 14
0.04
0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1.00
0.08
0.16 0.30 0.44
[2,2.5) [2.5,3) [3,3.5) [3.5,4)
[4,4.5] 合计
频率=
样本容量
0.50 0.28
0.12 0.08 0.04
注意频数的合计应 是样本容量,频率 合计应是1
6 4
2 100
5. 画频率分布直方图 : 分组 频数 频率 频率/组距
[0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计 4 8 15 22 25 14 6 4 2 100 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 0.08 0.16 0.30 0.44 0.50 0.28 0.12 0.08 0.04
考点梳理
2.用样本的数字特征估计总体的数字特征
(1)众数:在一组数据中,出现次数_______的数据叫做这组数据的众数.体现 最多 了样本数据的最大集中点,不受极端值的影响而且不唯一. (2)中位数: 将一组数据按大小依次排列, 把处在_________位置的一个数据(或 最中间 最中间两个数据的平均数)叫做这组数据的中位数.它不受极端值的影响,仅 利用了排在中间数据的信息,只有一个,且在频率分布直方图中,中位数左 边和右边的直方图的面积应该相等. 1 (x +x2+„+xn) (3)平均数:样本数据的算术平均数,即 x =__________________,它与每一 n 1 个样本数据有关,仅有一个. (4)极差:一组数值中最大值与最小值的差,它反映一组数据的波动情况,但 极值只考虑两个极端值,可靠性极差. (5)标准差:①考查样本数据的分散程度的大小,最常用的统计量是标准差, 标准差是样本数据到平均数的一种平均距离,一般用 s 表示. 1 [x1- x 2+x2- x 2+„+xn- x 2] . n 1 ②标准差的平方 s2 叫做方差 s2= [(x1- x )2+(x2- x )2+„+(xn- x )2]. n s=
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如果把这堆产品中产品 尺寸的全体看作一个总体, 那么左边数据就是从总体 中抽取的一个容量为100的 样本.
25.35 25.32 25.45 25.40 25.27 25.43 25.54 25.39 25.45 25.43 25.40 25.43 25.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.38 25.35 25.31 25.34 25.40 25.36 25.41 25.32
2.频率分布直方图
④列频率分布表:
分组
个数累计
[25.235,25.265)
[25.265,25.295) [25.295,25.325) [25.325,25.355) [25.355,25.385) [25.385,25.415) [25.415,25.445) [25.445,25.475)
累计频率 0.01 0.03 0.08 0.20 0.38 0.63 0.79 0.92 0.96 0.98 1.00
2.频率分布直方图
⑤频率分布直方图:
频率密
小矩形的高:
度
0.01÷0.03 0.02÷0.03
频率 组距 0.03
0.25
每一个小矩形的 面积恰好就是其 对应的频率,这些 小矩形的面积和
25.37 25.33 25.40 25.35 25.41 25.37 25.47 25.39 据的频率分布表和频率分布
25.42 25.47 25.38 25.39
直方图.
①计算极差R:最大值25.56与最小值25.24的差为0.32;
②决定组距与组数:组距为0.03与组数为11;
③决定分点:起点为25.235,终点为25.565.
6 7 8 9 10 11 12
第 5 6 7 8 9 10 11 二 4 5 6 7 8 9 10
枚3 4 5 6 7 8 9
骰 子
2
3
4
5
6
7
8
12 3 4 5 6 7
离散型:当总体中的个体所 取的不同数值较少时,其随 机变量是离散型的.
条形图要点:
①各直方长条的宽度要Βιβλιοθήκη Baidu同;
②相邻长条之间的间隔要适当
与前例子不同的是,这里 的总体可以在一个实数区间 内取值(称为连续型总体).运
25.38 25.42 25.40 25.33 25.37 25.41 25.49 25.35 用在初中“统计初步”里学
25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40 过的方法,可以得到这些数
点数和 2 3 4 5 6 7 8 9 10 11 12
频 数 203 407 591 805 994 1218 989 813 602 381 197
频 率 0.028 0.057 0.082 0.112 0.138 0.169 0.137 0.113 0.084 0.053 0.027
掷两枚骰子的等可能性结果
0.04
0.02
产品
尺寸
(mm)
o 0.02÷0.03
25.235
25.295
25.325
25.415
25.475
25.535 25.565
3.频率分布条形图和频率分布直方图的区别
两者是不同的概念.虽然它们的横坐标表示的
内容是相同的,但是频率分布条形图的纵轴
(矩形的高)表示频率;
频率分布直方图的纵轴(矩形的高)表示
123456 第一枚骰子
③高度就是对应的频率值.
1.同时掷两枚骰子,共掷7200次,点数和的分布频数如下表所示, 计算各个结果的频率,作出频率分布条形图:
点数和 2 3 4 5 6 7 8 9 10 11 12
频 数 203 407 591 805 994 1218 989 813 602 381 197
统计学中有两个核心问题,一是如何从整 体中抽取样本?二是如何用样本估计总体?
经过前面的学习,我们已经了解了一些常 用的抽样方法:
简单随机抽样、系统抽样和分层抽样.
本节课,我们在初中学过样本的频率分 布的基础上,研究总体的分布及其估计.
1.频率分布条形图
1.同时掷两枚骰子,共掷7200次,点数和的分布频数如下表所示, 计算各个结果的频率,作出频率分布条形图:
正 正正 正正正 正正正正正 正正正 正正
[25.475,25.505)
[25.505,25.535)
[25.535,25.565) 合计
频数 1 2 5 12 18 25 16 13 4 2 2 100
频率 0.01 0.02 0.05 0.12 0.18 0.25 0.16 0.13 0.04 0.02 0.02 1.00
0.05÷0.03 0.12÷0.03 0.18÷0.03 0.25÷0.03
0.18 0.12
为1.
0.16
0.13
连续型:当总体中的 个体所取的数值较多,
0.16÷0.03 0.13÷0.03 0.04÷0.03 0.02÷0.03
0.05 0.02 0.01
甚至无限时,其随机 变量是连续型的.
2.频率分布直方图
从规定尺寸为25.40 mm的一堆产品中任取 100件,测得它们的
实际尺寸如下:
25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.47 25.35 25.41 25.43 25.44 25.48 25.45 25.43 25.46 25.40 25.51 25.45 25.40 25.39 25.41 25.36 25.38 25.31 25.56 25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.49 25.34 25.42 25.50 25.37
频率与组距的比值,其相应组距上的频率
等于该组距上的面积
离散型总体
每一个小矩
频率
形的面积恰
组距
好就是其对
应的频率,
这些小矩形
的面积和为
频 率 0.028 0.057 0.082 0.112 0.138 0.169 0.137 0.113 0.084 0.053 0.027
6 频率
36 5 36 4 36 3 36 2 36 1 36
频率分布的条形图 每一个小矩形的高 就是对应的频率
离散型总体
2 3 4 5 6 7 8 9 10 11 12 点数和