基础统计学

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6sigma课程
基础统计学
邱国男 2011.4
1
六西格玛绿带培训——测量阶段 目
— 统计数据分类 — 正态分布 — 系统散布

2
统计数据分类
计量值和记数值数据的比较
计量型数据 用测量工具 能测得的值 ·实际的测定值 focus 5.5 dot B/R 0.5 mm dot 幅 35 u 温度 33.3度 ·使用 :测定工具 显微镜,尺,温度计 放大镜, 记数型数据 通过观察统计 出来的数值 ·COUNTS统计 Yes-no(是-不是) 数率 96.5% focus不良 3个 不良率 53.2% ·使用 : 检查(Pass/Fail) 良品,不良品
标准偏差
母集团
σ=
样本
s=
∑(X
i
− μ) 2
∑(X
i
− X )2
N
n −1
N = 母集团的数
n = 样本的数
9
正态分布
举例来说, 许多成年男子参加一次聚会,如果观察其所有人的身高会发现: 大部分人的身高是在165cm到 175cm之间; 处在155cm到165cm, 或175cm到185cm之间的人数就比较少; 处在155cm以下或185cm以上的人数就更少. 将这些数值用直方图描述呈现如下情形.
18
正态分布
例) 平均是 20 ,标准偏差 5的正态分布求如下概率. 1) X ≤ 15概率 2) X ≥ 30概率 3) 10 ≤ X ≤ 25概率
5
5
?%
15
20
20%
xi
?
20
xi
19
正态分布
已知分界线,求概率? 例:求X≤15的概率P=?%
20
正态分布
思考 1) X ≥ 30概率 2) 10 ≤ X ≤ 25概率
6
统计数据分类
▶ 极差(Range) : 作为散布的最简单的测定手段, 它是指最大值与最小值的差异。
R = X 最大 − X 最小
7
统计数据分类
▶ 方差(Variance) : 表示数据偏离中央值多少程度的尺度, 母集团的分散表示为σ , 样本的分散表示为 s 2 .
2
方差
母集团
σ2 =
样本
2
∑(X
24
系统的散布 ▶ 散布的根源
散布(Variation)的原因 · 方法(Method) · 设备(Machine) · 资材(Material) · 人员(Man) · 测定(Measurement) · 环境(Environment) Process 散布
Output的变动
散布常常在测定或观测PROCESS(工程)的 Output时可以发现. 希望铭记偶然原因和异常原因就是PROCESS(工程)的Input.
5
统计数据分类
▶ Mode(最频数): 指在数据集合中出现频度最多的数. 例) 187, 499, 500, 500, 502, 503 最频值 = 500
☞ 虽然在求中心倾向时我们多使用平均,但是我们必须清楚了解平均的 短处---那就是平均对偏离的数据表现非常敏感。
例) 503, 499, 500, 502, 500 这5个数据的平均 = 500.8 但当我们增加一个偶然的数据187时; 变为 503, 499, 500, 502, 500, 187的6个数据的平均 = 448.5 即平均对偏离的数据表现得非常敏感的倾向. 但是中央值(median)在上述两种情况下都为 500 故中央值对偏离的数据表现得不是很敏感.
面积 = 0.6826
面积 = 0.9544 u- 3σ u- 2σ u- σ u u+ σ u+ 2σ u+ 3σ
--以平均(μ)为中心到两侧的1σ的个体所占面积为: 68.26% --以平均(μ)为中心到两侧的2σ的个体所占面积为: 95.44% --以平均(μ)为中心到两侧的3σ的个体所占面积为: 99.73%
i
− μ)
N
s2 =
( Xi − X )2 ∑ n −1
N = 母集团的数
n = 样本的数
8
统计数据分类
▶ 标准偏差(Standard Deviation) : 由于分散是将偏离平均值的距离(偏差)的平方所得,因此 具有原数据的二次方单位. 为解决这个问题,求出分散的平方根后使用, 称之为标准偏差. 母集团的标准偏差表示为σ(Sigma), 样本的标准偏差用 s表示.
140
145 150
155 160 165 170 175 180 185 190 195
μ -3σ μ -2σ μ -1σ μ
200
cm
μ -6σ μ -5σ μ -4σ
μ +1σ μ +2σ μ +3σ μ +4σ μ +5σ μ +6σ
11
正态分布
正态分布的曲线
正态分布图可用一条曲线包围, 形状类似一个倒挂的钟. 这条曲线就称之为 正态分布曲线.
68.27%
95.46% 99.73% 4 3 2 1 0 1 2 3 4
15
正态分布
▶ 正太分布具有下面的特征. ⓐ 以平均值为中心呈左右对称类似倒挂钟的形状. ⓑ 平均值不同而分散相同的两个分布形状相同. ⓒ 平均值相同而分散不同的两个分布形状不同.
平均不同而分散相同时
分散不同而平均相同时
ⓓ 正态分布大部分值集中在以μ为中心的位置, 具有越往边缘个数越少的模型.
数据的统计与处理是从对计量型/记数型的理解开始的。 通过计量型数据和记数型数据的分析, 我们可以获得重要的情报!
3
统计数据分类
▶ 平均 : μ(谬)是母集团的平均, X 表示样本的平均.
平均
母集团
样本
∑X μ=
N
i
∑X X =
n
i
N = 母集团的数
n = 样本的数
4
统计数据分类
▶ Median(中央值) Median(中央值)
μ -6 σ μ -5 σ μ -4 σ μ -3 σ μ -2 σ μ -1 σ
μ
μ +1 σ μ +2 σ μ +3 σ μ +4 σ μ +5 σ μ +6 σ
68.26% 95.44% 99.73% 99.9937% 99.999943% 99.9999998%
23
系统的散布
面积 = 0.9973
当母集团,样本的数 为偶数时 将数值从小到大排列 后中间两数的平均
例) 499, 500, 500, 502, 503 187, 499, 500, 501, 502, 503
当母集团,样本的数 为奇数时 将数值从小到大排 列后位于中间的数
中央值 = 500 中央值 = (500+501)/2=500.5
21
正态分布
已知概率,求分界线? 例:求P≤20%时的X≤?
22
系统的散布
▶ 概率的观点 : 从正态分布的母集团中随机(Randomly) 抽取一个个体并测定其 某种特性, 则该个体的测定值大于μ+3σ或小于μ-3σ的可能性 (概率)只有0.27% (0.27% = 100% - 99.73%)
150
155 160 165 170 175 180 185 190
cm
这种模型在各种其它类型的母集团中也出现, 我们将此称之为正态分布. 当母集团出现这种模型时, 我们就称之为正态分布.
10
正态分布
▶ 参加聚会的成年男子的身高为例 : 假设母集团的平均值(μ)为170cm, 标准偏差(σ)为 5cm. 如果从这母集团中随机选择一个人, 他的身高小于155cm(μ-3σ)或大于185cm(μ+3σ)的概率非常小. ( 只占0.27% )
150
155 160 165 170 175 180 185 190
cm
12
正态分布
正态分布的特征
▶ 下图表示一般正态分布曲线与 μ和 σ的之间的关系.
平均 (μ ) 1标准偏差(σ)
-∞
测定值
+∞
13
正态分布
正态分布
标准偏差 平均
xi
标准正态分布
1 0
z
14
正态分布
标准正态分布
平均是 0 ,标准偏差是1的正态分布叫标准正态分布.
25
16
正态分布
下列4个正态分布曲线的分散是 平均是 .
下列4个正态分布曲线的平均是
分散是
.
17Fra Baidu bibliotek
正态分布
LG职员的身高μ=170,σ=10, 180cm以上职员应占整体的%?
顾客要求银行在5分钟内处理业务 A银行业务处理μ=4分,σ=1分, 百分之多少顾客要忍受不方便呢?
想知道 的概率
顾客不 满领域
相关文档
最新文档