样本与统计量数据的简单处理PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据整理(分组)——
(1)根据样本容量 n 确定分组数 k
一般地,
当 30 n 4时0, 当 40 n 6时0, 当 60 n 10时0, 当 100 n 50时0,
5k 6 6k 8 8 k 10 10 k 20
(2)计算组距(一般采用等距分组,也可据实际情况分组) 组距等于比极差(原始数据中的最大值M与最小值m 之差)除以组数 k 略大的测量单位的整数倍。
X1, X2 ,....的..一X个n观
样本(子样)容量——
样本中所含的个体的数目。
第2页/共39页
总体与样本
为保证抽取出来的样本能够反映出总体的性质,要求
样本具有代表性,即每个 Xi 与 X 同分布;还要求具有独
立性,即
是相互独立的。满足以上条件
的样本(子样)X称1,作X简2单,随...机..样.X本n(子样)。
四分位差Qd——满足 其中:
Qd
Q3 Q1 2
Q1为第 1 四分位数——满足
PX Q1 0.25
即当数据按大小顺序排列后排在第一个四分之一位的数。
Q3为第 3 四分位数——满足
PX Q3 0.75
第12页/共39页
计算样本均值和方差时,可利用均值和方差的性质 将数据化简后再运算。
例1 从某班抽取10个男同学,测其身高如下(单位cm):
y 98 100
0.978
样本的方差
s
2 X
sY2 10000
125.7 10000
0.0126
样本的标准差 sX 0.0126 0.1122
第14页/共39页
数据的简单处理可利用MINITAB软件操作完成。
输入数据
第15页/共39页
第16页/共39页
第17页/共39页
第18页/共39页
175.5, 172, 168, 173, 172.5, 169, 169.5, 178, 171.5, 172.
试计算此样本的均值和方差。
解:记题目所给数据为
xi i 1, 2令,...10, yi xi 172
y 则 的i 数值分别为:3.5, 0, -4, 1, 0.5, -3, -2.5, 6, -0.5, 0.
第38页/共39页
感谢您的观看!
第39页/共39页
通常作为总体 X 的均值的一个估计值。
样本方差—— S 2 1 n n 1 i1
Xi X
2
通常作为总体 X 的方差的一个估计值。
估计量的 无偏性
样本标准差(均方差)—— S
1n n 1 i1
Xi X
2
通常作为总体 X 的标准差(均方差)的一个估计值。
第5页/共39页
数据的简单处理
总体与样本
总体(母体)—— 研究对象的全体。 个体—— 总体中的每一个元素。
在数理统计学中,我们是对总体的一个或若干个数量 指标进行研究,这样,对总体的研究就归结为对随机变量 的研究。以后说到总体时,指的就是它对应的某个或某些 随机变量。
欲研究或推断总体 X 的性质,似乎应对每一个个体逐 一测定,但这样的做法很多时候是不必要或是不可行的。 比如考察广州人的身高、体重,某种导弹的爆炸威力,某 电子元件的寿命等。我们只能在总体中随机抽取部分个体 出来测定。这就是——抽样。
则组距 100 65 4.375 5 8
组距 组数 40 100 65 35
取 a 62.5 m, b 102.5 M 得分组如下:
62.5, 67.5 67.5, 72.5 72.5, 77.5 77.5, 82.5 82.5, 87.5 87.5, 92.5 92.5, 97.5 97.5,102.5
如: M m 100 65 4.375 5 则取组距为 5。
8
8
第6页/共39页
数据整理(分组)——
(3)确定组限和组中点值
一般地,组的上限与下限应比数据多一位小数。这样可 保证每组所含的原绐数据不重叠。(可据实际问题另作要求)
设现有 50 个原始数据(均是整数),决定分作 8 个小组, 数据中的最大值是 100,最小值是 65 ,
平均数 中位数 众数 标准差 标准误
n
第19页/共39页
第20页/共39页
频数 频率 累计频数 累计频率
第21页/共39页
频数 频率 累计频数 累计频率
第22页/共39页
第23页/共39页
第24页/共39页
第25页/共39页
第26页/共39页
第27页/共39页
第28页/共39页
也可在此作图
组中点值分别为: 65, 70, 75, 80, 85, 90, 95, 100
一般遵循“上限不在内”的原则
(解决实际问题时,也有出现开口组的情形)
第7页/共39页
数据的简单处理
数据整理(分组)——
(4)计算各组频数和频率,作频数和频率分布表
f i 频数 指落在第 组的数据个数,频率为频数与总数据量 i
频率直方图示意图:
第9页/共39页
数据的简单处理
计算样本的特征数(统计量)——
常用的描述集中趋势的特征数——
样本均值——
X
1 n
n i 1
Xi
中位数——数据按大小顺序排列后位于中间位置的那个数。
众数——样本中出现次数最多的那个数。
样本几何均值——
X g n X1X2...Xn
第10页/共39页
之比:
wi
fi n
(5)作频率直方图
要把每一小组的频率用一小矩形的面积去表示,方法是:
以样本值为横坐标,频率/组距为纵坐标,以分组区间为 底,以频率/组距为高作一系列矩形。
第8页/共39页
要把每一小组的频率用一小矩形的面积去表示,方法是: 以样本值为横坐标,频率/组距为纵坐标,以分组区间为 底,以频率/组距为高作一系列矩形。
y 1 3.5 0 4 1 0.5 3 2.5 6 0.5 0 0.1
10
sY2
1 9
3.5 0.12
......
0
0.12
8.99
所以样本的均值 x y 172 172.1
样本的方差
sX2Leabharlann s2 Y 172sY2
8.99
第13页/共39页
例2 设从总体中抽取一组观察值为 0.98, 1.01, 0.99, 1.11, 0.8.
第1页/共39页
总体与样本
样本(子样)——
从总体中随机抽取出来的部分个体作成的集合。记为:
X1, X2,......Xn
注意到这里每个 Xi 因随机抽取而随机取值,所以也是 随机变量。抽样完成后得到的确切结果:
x1, x2,......xn n 是 维随机变量
察值。称为样本值或子样观察值。
要获得简单随机样本(子样),对有限总体, 应作有放回的随机抽样,对无限总体或总体相当大 时,也可作无放回的随机抽样。
第3页/共39页
统计量
当我们不能完全掌握某一总体的分布函数时,只要掌握 了总体的某些数字特征(总体参数),就可基本上确定该总 体的分布,当总体参数也未知时,就只能依据样本对未知数 进行推断。通常我们利用样本构造出某种函数作为推断的基 础。这就是所谓的统计量。
第29页/共39页
第30页/共39页
第31页/共39页
第32页/共39页
第33页/共39页
数据的输入有时在 DOS 状态下较为方便
先点击Session 窗口,然后——
第34页/共39页
进入了Dos 状态
第35页/共39页
第36页/共39页
保存整个文件
保存数据表 保存图形
第37页/共39页
试计算此样本的均值和标准差。
解:记题目所给数据为
xi i 1, 2令,...5, yi 102 xi 98
y 则 的i 数值分别为:0, 3, 1, 13, -18.
y 1 0 3 113 18 0.2
5
sY2
1 4
0
0.22
...... 18
0.2
2
125.7
所以样本的均值
x
y 98 100
统计量——
样本 X1, X2,......X对应n 的不含未知参数的实值函数, 记作: f X1, X2,......Xn . 它本身也是一随机变量。它的分布
称作抽样分布。
第4页/共39页
常用统计量
设 X1, X2,......X是n随机变量 X 的一个样本。
样本均值——
1n X n i1 X i
数据的简单处理
计算样本的特征数(统计量)——
常用的描述分散程度的特征数——
样本方差——
S2 1 n n 1 i1
Xi X
2
样本标准差——
1 n
2
S n 1 i1 X i X
极差(全距)——
RM m
标准误——
n
第11页/共39页
数据的简单处理
计算样本的特征数(统计量)——
常用的描述分散程度的特征数——
相关文档
最新文档