2统计小结与复习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
必修三第二章:统计复习
一、抽样方法:
(一)简单随机抽样(适用范围:总体个数较少) 1抽签法:
(1) 将总体中的所有个体编号(号码可以从 1到N );
(2) 将1到N 这N 个号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等) ;(3)将
号签放在同一箱中,并搅拌均匀;
(4) 从箱中每次抽出1个号签,并记录其编号,连续抽取 k 次;
(5) 从总体中将与抽到的签的编号相一致的个体取出 2. 随机数表法:
(1) 对总体中的个体进行编号(每个号码位数一致) ; (2) 在随机数表中任选一个数作为开始;
(3) 从选定的数开始按一定的方向读下去, 得到的数码若不在编号中, 则跳过;若在编号中,则取出; 如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满为止 (4) 根据选定的号码抽取样本•
(二)系统抽样(等距抽样).J (适用范围:总体个数较多) (1) 采用随机的方式将总体中的个体编号;
(2) 将整个的编号按一定的间隔(设为 k )分段,当 —(N 为总体中的个体数,n 为样本容量)是
n
整数时,k =N ;当N 不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数
N ,能被n
n n N /
整除,这时k
,并将剩下的总体重新编号;
n
(3) 在第一段中用简单随机抽样确定起始的个体编号 I ;
(4) ........................... 将编号为l,l ∙k,l ∙2k, ,I (n- 1)k 的个体抽出. (三)•分层抽样:(适用范围:总体中由差异明显的几部分构成)
(1)将总体按一定标准分层;
(3) 按各层个体数占总体的个体数的比确定各层应抽取的样本容量;
每层抽取个数=每层的总数×抽取比例
(4) 在每一层进行抽样(可用简单随机抽样或系统抽样)
注意:不管哪种抽样方法,在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会 (概 率)均为—。 ....N
1. 众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
2. 中位数:将一组数据按大小依次排列,
(2)计算各层的个体数与总体的个数的比;抽取比例
抽取的样本个数n 总体个数N
(1)数据个数为奇数时,处在最中间位置的一个数据叫这组数据的中位数
(2)数据个数为偶数时,处在最中间两个数据的平均数叫这组数据的中位数
3.平均数:X1X2X3亠亠X n
X 二
n
(一)频率分布直方图
1编制频率分布表的步骤如下:
(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
(3)登记频数,计算频率,列出频率分布表.
作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为
频率
底作矩形,它的高等于该组的,这样得出一系列的矩形;
组距
(2)各个小矩形的面积和为1
2.在频率分布直方图中
1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
2中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。
3.平均数是频率分布直方图的重心”是直方图的平衡点.
平均数等于频率分布直方图中每一个小长方形的面积乘以小长方形底边中点的横坐标之和。
(二).频率折线图:
1•如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.
2. ①频率分布表一一数据详实
②频率分布直方图- 分布直观
③频率分布折线图一一便于观察总体分布趋势
(1)求极差,决定组数和组距,组距
极差
组数
频率分布直方图如下图
频率
(三)茎叶图
1•制作茎叶图的方法是:将所有两位数的十位数字作为“茎” ,个位数字作为“叶”,茎按从小到大的 顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出 •相同的数重复写。 2•在茎叶图中,茎也可以放两位,
3•茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 茎叶图做法:
四、总体特征数的估计: 一组样本数据X 1, X 2, ,X n
注:方差与标准差越小,说明样本数据越稳定。
平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 4.平均数和方差的运算性质:
如果数据X i , X 2,……,Xn 的平均数为X ,方差为S 2 ,则
(1) 新数据X 1 b,X 2 bJH,X n b 的平均数为X b ,方差仍为s 2 ; (2) 新数据a%, ax ?, H ∣,aX 1的平均数为ax ,方差为a 2s 2 ; (3) 新数据aX 1 b, aX 2 ∙ b, IH,aX n b 的平均数为aX b ,方差为a 2s 2.
1. 平均数,中位数和众数都是总体的数字特征,从不同角度反映了分布的集中趋势,平均数是最常用 的指标,也是数据点的“重心”位置,它易受极端值(特别大或特别小的值)的影响,中位数位于数据 序列的中间位置,不受极端值的影响,在一组数据中,可能没有众数,也可能有多个众数 .
2. 方差和标准差是总体的数字特征,反映了分布的分散程序(波动大小) ,标准差也会受极端值(特别
大或特别小的值)的影响• ⑶线性回归方程
①变量之间的两类关系:函数关系与相关关系;
甲 茎 乙 9 4
2 5 9 97 6 78 92 7 1
3 410 8 4578
1 9 8
从茎叶图可以看出, 乙组数据分布相对集中,
因此稳定性比甲组好;同时,乙组的数据平均值也 1.平均数: -X 1 亠X 2 亠X 3, 亠
X n
X 二
I
J(Xi -X) n i 吕
、:[(X i
—X )2 (X
2 —X
)2
(X^X )2
.... (X n —X )2]
3.方差
I n
S 2
(X i
n
V
1
[(X 1 -X )2
n
(X 2 - X
)2
2 2
(X 3-
χ)
.... (X n -X
)]
大于甲,故乙组实力高于甲组实力。 2.标准差: 2
2