统计学讲义(精华版)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例: 15,18,20,15,15,20,25,15
15 15 15 15 18 20 20 25 => 15为众数
平均数 (随机变量的期望值) 所有数值数据相加除以数值资料笔数(X1+X2+X3+X4+…+XN)/N
例: 5,6,7,8,5,6,7,8
X= (5+6+7+8+5+6+7+8)/8 = 6.5
直方图的意义
直方图为次数分布的直方图,沿横轴以各组组界为分界,组距为 底边,以各组次数为高度,每一组距上划一矩形,所绘成之图形。
组距
次
组界
数
组别
计数值之直方图 1. 以数据的数值特征加以分组,以固定宽度画出上、下组界。 2. 以各组的元素个数或出现数为高度,画出各组直方图。
Frequency
6
5
N
Mean Median Mode Sum StDev MinimumMaximum Range
60 0.06255 0.061 0.06 3.753 0.01236 0.035 0.09 0.055
0.064
0.069
Count
0.035
1
0.041
1
0.042
3
0.049
3
0.05
1
0.051
1
最小数须在最小一组内;最大数须在最大一组内,若有数值 小于最小一组下组界或大于最大一组上组界时,应酌情增加 组数。
5. 求各组之组中点。(该组上组界+该组下组界)/2
60
Frequency
20
10
0 0.031 0.039 0.047 0.055 0.063 0.071 0. of C1 N=
60
Midpoint 0.035 0.043 0.051 0.059 0.067 0.075 0.083 0.091
Count 1* 4 **** 10 ********** 19 ************ 14 ************ 6 ****** 3 *** 3 ***
散趋势。
0.071 0.072 0.055 0.058 0.049 0.076 0.054 0.070 0.075 0.052
0.062 0.060 0.086 0.054 0.050 0.067 0.053 0.049 0.057 0.051
0.069 0.035 0.041 0.067 0.058 0.070 0.070 0.087 0.061 0.064
0.052
1
0.053
2
0.054
2
0.055
1
0.056
1
0.057
2
0.058
3
0.059
3
0.06
4
0.061
2
0.062
3
0.064
4
0.066
1
0.067
2
0.069
4
0.07
3
0.071
1
0.072
1
0.075
1
0.076
1
0.078
2
0.082
1
0.086
2
0.087
1
0.09
2
All
随机变数:如将不良品以0表示,良品以1表示(离 散型) ;身高、体重与尺寸等(连续型) 。
机率分配:超几何分配、二项分配、卜瓦松分配 常态分配、魏柏分配、贝他分配
群体(母体)
所有研究数据之全部集合,如全国人口、CF产品总产 出、一盒螺丝钉等。通常以N表示;N可为有限群体或 无限群体。
样本
为自群体中选出一部份的集合,可用以代表群体,提 供群体的有用信息。通常以n表示。
4
3
2
1
0
A
B
C
D
E
F
计量值之直方图 1. 求全距(R)与总数(n)。 2. 决定组数(k)与组距(h)。利用Sturges 经验公式
k = 1 + 3.32 log(n)
and h = R / k
3. 决定第一组之下组界。(最小值-最小测定单位/2) 4. 求各组之上组界。下组界加上组距(h)即为上组界,应注意
If N/n >= 10 then
Treat N as an infinite population
中位数 一组n个数值之数据,依大小排列,则中位数为位于中 间位置之数。
例: 7,8,13,15,20
5,10,11,15,19,23 => (11+15)/2 = 13 众数 一组n个数值之数据,出现最多的数值为众数。
全距
一组n个数值之资料,数值最大者与数值最小者之差距称 为全距(Range)
例: 7,8,13,15,20
全距(Range) = 20-7 = 13
变异数 (随机变数的变方)
一组数据中各个数值与其集中量数(平均数或中位数)之差,
称为变异数。其公式为:
2
N
i
2
/
N
i 1
标准偏差
2
1 N
N
i 1
X2 i
N
Xi
i 1
N
2
变异数的正平方根即为标准偏差。
群体
N
i
2
/
N
i1
样本
s
n
i
2
/n
1
i1
a:将单位还原,与原来单位一致
b:标准偏差以平均数为中心而计算
平均数与标准偏差
平均数: 是代表一群体数值的一个“中心数值”。代表集中趋势。 标准差: 则表示该群体数值与中心值间差异的一个数值。代表离
统计学讲义
+ 统计概论及名词解释 + 直方图(Histogram) + 常态分布(Normal Distribution) + Cp & Cpk与制程能力分析(Process Capability
Study) + 管制图(Control Chart)
统计方法 规划资料的收集,整理与解释资料,并据以导出结论或予 以推广的过程,称为统计方法。
0.066 0.059 0.062 0.060 0.069 0.064 0.078 0.064 0.061 0.060
0.062 0.056 0.060 0.069 0.082 0.058 0.057 0.078 0.090 0.086
0.042 0.042 0.042 0.059 0.059 0.064 0.069 0.053 0.090 0.049
计量值 量测而得或量出来的资料,是为计量值。如厚度,长度硬 度,强度。是连续性的数值。 计数值 点数而得或数出来的资料,是为计数值,如人员数、不良 数。是离散的个别数字。
机率是机遇(chance)或随机(random)出象可能发生 的数量性评估,机率理论是关于随机试验的数学模 式的理论,它讨论机遇现象所遵循的法则。将宇宙 间的事物数值化(随机变数)与模型化(机率分配), 并设法在这些事物中寻找其规律,由规律中回头探 讨事务的特性。
15 15 15 15 18 20 20 25 => 15为众数
平均数 (随机变量的期望值) 所有数值数据相加除以数值资料笔数(X1+X2+X3+X4+…+XN)/N
例: 5,6,7,8,5,6,7,8
X= (5+6+7+8+5+6+7+8)/8 = 6.5
直方图的意义
直方图为次数分布的直方图,沿横轴以各组组界为分界,组距为 底边,以各组次数为高度,每一组距上划一矩形,所绘成之图形。
组距
次
组界
数
组别
计数值之直方图 1. 以数据的数值特征加以分组,以固定宽度画出上、下组界。 2. 以各组的元素个数或出现数为高度,画出各组直方图。
Frequency
6
5
N
Mean Median Mode Sum StDev MinimumMaximum Range
60 0.06255 0.061 0.06 3.753 0.01236 0.035 0.09 0.055
0.064
0.069
Count
0.035
1
0.041
1
0.042
3
0.049
3
0.05
1
0.051
1
最小数须在最小一组内;最大数须在最大一组内,若有数值 小于最小一组下组界或大于最大一组上组界时,应酌情增加 组数。
5. 求各组之组中点。(该组上组界+该组下组界)/2
60
Frequency
20
10
0 0.031 0.039 0.047 0.055 0.063 0.071 0. of C1 N=
60
Midpoint 0.035 0.043 0.051 0.059 0.067 0.075 0.083 0.091
Count 1* 4 **** 10 ********** 19 ************ 14 ************ 6 ****** 3 *** 3 ***
散趋势。
0.071 0.072 0.055 0.058 0.049 0.076 0.054 0.070 0.075 0.052
0.062 0.060 0.086 0.054 0.050 0.067 0.053 0.049 0.057 0.051
0.069 0.035 0.041 0.067 0.058 0.070 0.070 0.087 0.061 0.064
0.052
1
0.053
2
0.054
2
0.055
1
0.056
1
0.057
2
0.058
3
0.059
3
0.06
4
0.061
2
0.062
3
0.064
4
0.066
1
0.067
2
0.069
4
0.07
3
0.071
1
0.072
1
0.075
1
0.076
1
0.078
2
0.082
1
0.086
2
0.087
1
0.09
2
All
随机变数:如将不良品以0表示,良品以1表示(离 散型) ;身高、体重与尺寸等(连续型) 。
机率分配:超几何分配、二项分配、卜瓦松分配 常态分配、魏柏分配、贝他分配
群体(母体)
所有研究数据之全部集合,如全国人口、CF产品总产 出、一盒螺丝钉等。通常以N表示;N可为有限群体或 无限群体。
样本
为自群体中选出一部份的集合,可用以代表群体,提 供群体的有用信息。通常以n表示。
4
3
2
1
0
A
B
C
D
E
F
计量值之直方图 1. 求全距(R)与总数(n)。 2. 决定组数(k)与组距(h)。利用Sturges 经验公式
k = 1 + 3.32 log(n)
and h = R / k
3. 决定第一组之下组界。(最小值-最小测定单位/2) 4. 求各组之上组界。下组界加上组距(h)即为上组界,应注意
If N/n >= 10 then
Treat N as an infinite population
中位数 一组n个数值之数据,依大小排列,则中位数为位于中 间位置之数。
例: 7,8,13,15,20
5,10,11,15,19,23 => (11+15)/2 = 13 众数 一组n个数值之数据,出现最多的数值为众数。
全距
一组n个数值之资料,数值最大者与数值最小者之差距称 为全距(Range)
例: 7,8,13,15,20
全距(Range) = 20-7 = 13
变异数 (随机变数的变方)
一组数据中各个数值与其集中量数(平均数或中位数)之差,
称为变异数。其公式为:
2
N
i
2
/
N
i 1
标准偏差
2
1 N
N
i 1
X2 i
N
Xi
i 1
N
2
变异数的正平方根即为标准偏差。
群体
N
i
2
/
N
i1
样本
s
n
i
2
/n
1
i1
a:将单位还原,与原来单位一致
b:标准偏差以平均数为中心而计算
平均数与标准偏差
平均数: 是代表一群体数值的一个“中心数值”。代表集中趋势。 标准差: 则表示该群体数值与中心值间差异的一个数值。代表离
统计学讲义
+ 统计概论及名词解释 + 直方图(Histogram) + 常态分布(Normal Distribution) + Cp & Cpk与制程能力分析(Process Capability
Study) + 管制图(Control Chart)
统计方法 规划资料的收集,整理与解释资料,并据以导出结论或予 以推广的过程,称为统计方法。
0.066 0.059 0.062 0.060 0.069 0.064 0.078 0.064 0.061 0.060
0.062 0.056 0.060 0.069 0.082 0.058 0.057 0.078 0.090 0.086
0.042 0.042 0.042 0.059 0.059 0.064 0.069 0.053 0.090 0.049
计量值 量测而得或量出来的资料,是为计量值。如厚度,长度硬 度,强度。是连续性的数值。 计数值 点数而得或数出来的资料,是为计数值,如人员数、不良 数。是离散的个别数字。
机率是机遇(chance)或随机(random)出象可能发生 的数量性评估,机率理论是关于随机试验的数学模 式的理论,它讨论机遇现象所遵循的法则。将宇宙 间的事物数值化(随机变数)与模型化(机率分配), 并设法在这些事物中寻找其规律,由规律中回头探 讨事务的特性。