统计学基础ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3部分
统计学概念
.
统计概念
目的: 复习基本的统计学概念。
目标: 解释以下基本统计概念。 1. 误差 2. 连续数据和离散数据 3. 平均值、方差、标准差 4. 正态曲线 5. 用Z值将数据标准化 6. 中心极限定理 7. 工序能力
- 使用Z值作为衡量工序能力的指标 - 通过改进关键值Xs来改进Y
举例:
XXXXX XXXXX XXXXX XXXXX XXXXX
这个矩阵代表25个X的总体。画 上圆圈的那些是由总体中的六 个X组成的样本。
.
统计学术语和定义
平均值 - 总体或样本的平均值。
用x或^来表示样本,用来表示总体。
n
xi
平均值的公式
x=
1
n
,
在这里X1是样本的第一个点,
Xn是样本的最后一个点。 .
.
数据的两种类型
解决办法
连续数据
离散数据
问题
• 连续 (可变) 数据 使用一种度量单位,比如英寸或小 时。 • 离散 (属性) 数据是类别信息,比如““ 通过” 或 ““ 未通过”。
.
连续数据 (也称为可变数据)
连续数据以参数的形式,比如尺寸、重量或时间,说明 一个产品或过程的特性。测量标准可以有意义地不断分 割,使精确度提高。
.
观测值变化
当重复进行测量的时候,通常会得到不同的答案, 这就是 误差! 1. 系统误差
预期的和可预测的测量结果之间的差异。 举例: 夏季和圣诞节假日的电灶销售量不同。
2. 随机误差
不可预测的测量结果之间的差异。 举例:具有同一种设计的两台冰箱,由同一个技术人员、在同 样的气温条件下、使用同样的测量仪器,在两个不同的日子对 其能量消耗进行测试…...可能得到两个不同的结果。
.
观测值变化(续)
我们预期观测值会有差异。如果没有差异,我们就会产生怀 疑。
如果所有地区的电灶销售量是一样的,那么我们就 会怀疑是数据库出了问题。.
如果我们测量10台电冰箱,得到同样的能耗测量结 果,我们就会怀疑测量是否正确。
这种变化使我们的工作更具挑战性! 一般来说,我们不能相信来自一个数据点的结果。通常我们 收集多个数据点,而且非常注意如何选取这些样本,以减少 偏差。
偏差的产生是很自然的,意料之中的,是统计 学的基础
.
统计学的作用
统计学用以下方法处理误差:
统计描述 统计推理
试验设计
用图表和几个总结性数字(均值、方 差、标准差)描述一组数据。
确定结果之间的差异何时可能是由于 随机误差引起的,何时不能归因于随 机误差。
(置信区间和假设检验)。
收集并分析数据,以估算过程变化的 影响。
• 均方差是方差的 (正) 平方根。 (它也代表该 组数据的分散程度)。 -总体的标准差用 来表示 -样本的标准差用^s或^表示
.
统计学术语和定义
总体 - 全部对象.
举例 – 1998年5月在Decatur 生产的所有的16立方英尺冰箱
样本 -代表总体的一个子集数据。
举例 - 1998年5月在Decatur生产的一百二十台十六立方英 尺冰箱
i
xi
(xi-4) (xi-4)2
1
2
-2
4
2
6
2
4
3
4
0
0
和
12
0
8
方差 (s2) = 8 / (3 - 1) = 4 标准差 (s) = sqrt(4) = 2
.
课堂练习
计算平均值、方差和标准差
n
x=
xi
1
n
均值
s2
=
n
(
Xi
-X
)2
i =1
s=
n-1
方差
n
( Xi - X )2
i =1
n-1
你能举出我们用来获得 连续数据的三个器具例 子吗?
相对于仅仅知道部件是否合格而言, 连续数据可以提供更多的信息。
.
离散数据 (也称为属性或类别数据)
离散数据是某件事发生或未发生的次数,以发生的 频数来表示。
离散数据也可以是分类数据。如:销售地区、生产 线、班次和工厂。
烟火探测器
离散数据不能更进一步精确地细分。
标准差
课堂举例: 计算样本{1,3,5,4,7 }的方差和标准差
(使用下面的表作为向导。)
首先计算平均值X:
i
xi
1
2
3
4
5
Totals
xi - x
方差 (s2) =
标准差 (s 或 ^) =
.
(xi - x)2
绘制直方图
90位女士的身高
59 61 63 63 64 59
62 66 65 65 64 60 65 62 64 68 70 65 63 64 68 66 65 66 67 64 66 58 65 65 71 63 69 63 66 70 64 67 64 66 62 64 64 64 61 64 63 65 64 68 66 67 69 71 68 66 65 63 64 64 68 67 65 64 65 64 70 65 68 65 66 69 66 66 65 63 68 66 62 67 65 66 67 66 60 67 63 60 64 73
.
统计学术语
• 总体 - 全组数据,全部对象。 - 一个总体中的元素数量用N来表示
• 样本 -总体的一个子集 - 样本的元素数量用n 来表示
• 平均值 - 总体或样本的平均值
- 总体的平均值用 来表示 - 样本的平均值用X 或^ 来表示
• 方差 - 数据与其平均值之间差值的平方的 平均值 。(它代表该组数据的分散程度) - 总体的方差用 表示 - 样本的方差用s2或^表示
.
练习-应用你所学到的东西
请在下面的例子旁,写出它是“连续”还是“离散”
1 销售订单准确度 2 数据输入准确度 3 销售地区 1. 4 使用“合格/不合格”测量仪器得到的孔径 2. 5 孔径 3. 6 应答中心对话时间 4. 7 制冷氟利昂的重量(克) 5. 8 每百万部件中有缺陷部件的数量 6. 9 装配线缺陷(ALD)
.
离散数据
离散数据举例:
有凹痕的部件数量
通过/未通过
申诉决议
产出
生产线不合格品数量
及时交货
连续数据与离散数据进行比较的解释:
• 一般来说,连续数据比离散数据更可取,因为你可以 利用更少的数据获得更多的信息。
• 如果不能得到连续数据,就可以对离散数据进行分析 ,发现结果,作出判断。.
离散数据需要更多的数据点才能进行有效的分析
i =1
n-1
样本的公式
方差 - 与平均值之差的平方的平均值。一般用s2或^2来表
示。
.
举例
计算平均值、方差和标准差
n
Βιβλιοθήκη Baidu
x=
xi
i=1
n
平均值
s2
=
n
(
Xi
-X
)2
i =1
s=
n-1
方差
n
(
Xi
-X
)2
i =1
n-1
标准差
课堂举例: 计算样本{2, 6, 4 }的方差和标准差 首先计算均值: (2 + 6 + 4) / 3 = 12 / 3 = 4
举例:给定一个样本:{1,3,5,4,7 },平均值就是:
x = (1+3+5+4+7) = 20 = 4.0
5
5
样本的平均值等于4。
.
统计学术语和定义
标准差 -衡量数据分散程度的一个指标。一般用表示总
体,用s 或^表示样本。
=
N
( Xi - )2
i=1
N
总体的公式
S= =
n
( Xi - X )2
统计学概念
.
统计概念
目的: 复习基本的统计学概念。
目标: 解释以下基本统计概念。 1. 误差 2. 连续数据和离散数据 3. 平均值、方差、标准差 4. 正态曲线 5. 用Z值将数据标准化 6. 中心极限定理 7. 工序能力
- 使用Z值作为衡量工序能力的指标 - 通过改进关键值Xs来改进Y
举例:
XXXXX XXXXX XXXXX XXXXX XXXXX
这个矩阵代表25个X的总体。画 上圆圈的那些是由总体中的六 个X组成的样本。
.
统计学术语和定义
平均值 - 总体或样本的平均值。
用x或^来表示样本,用来表示总体。
n
xi
平均值的公式
x=
1
n
,
在这里X1是样本的第一个点,
Xn是样本的最后一个点。 .
.
数据的两种类型
解决办法
连续数据
离散数据
问题
• 连续 (可变) 数据 使用一种度量单位,比如英寸或小 时。 • 离散 (属性) 数据是类别信息,比如““ 通过” 或 ““ 未通过”。
.
连续数据 (也称为可变数据)
连续数据以参数的形式,比如尺寸、重量或时间,说明 一个产品或过程的特性。测量标准可以有意义地不断分 割,使精确度提高。
.
观测值变化
当重复进行测量的时候,通常会得到不同的答案, 这就是 误差! 1. 系统误差
预期的和可预测的测量结果之间的差异。 举例: 夏季和圣诞节假日的电灶销售量不同。
2. 随机误差
不可预测的测量结果之间的差异。 举例:具有同一种设计的两台冰箱,由同一个技术人员、在同 样的气温条件下、使用同样的测量仪器,在两个不同的日子对 其能量消耗进行测试…...可能得到两个不同的结果。
.
观测值变化(续)
我们预期观测值会有差异。如果没有差异,我们就会产生怀 疑。
如果所有地区的电灶销售量是一样的,那么我们就 会怀疑是数据库出了问题。.
如果我们测量10台电冰箱,得到同样的能耗测量结 果,我们就会怀疑测量是否正确。
这种变化使我们的工作更具挑战性! 一般来说,我们不能相信来自一个数据点的结果。通常我们 收集多个数据点,而且非常注意如何选取这些样本,以减少 偏差。
偏差的产生是很自然的,意料之中的,是统计 学的基础
.
统计学的作用
统计学用以下方法处理误差:
统计描述 统计推理
试验设计
用图表和几个总结性数字(均值、方 差、标准差)描述一组数据。
确定结果之间的差异何时可能是由于 随机误差引起的,何时不能归因于随 机误差。
(置信区间和假设检验)。
收集并分析数据,以估算过程变化的 影响。
• 均方差是方差的 (正) 平方根。 (它也代表该 组数据的分散程度)。 -总体的标准差用 来表示 -样本的标准差用^s或^表示
.
统计学术语和定义
总体 - 全部对象.
举例 – 1998年5月在Decatur 生产的所有的16立方英尺冰箱
样本 -代表总体的一个子集数据。
举例 - 1998年5月在Decatur生产的一百二十台十六立方英 尺冰箱
i
xi
(xi-4) (xi-4)2
1
2
-2
4
2
6
2
4
3
4
0
0
和
12
0
8
方差 (s2) = 8 / (3 - 1) = 4 标准差 (s) = sqrt(4) = 2
.
课堂练习
计算平均值、方差和标准差
n
x=
xi
1
n
均值
s2
=
n
(
Xi
-X
)2
i =1
s=
n-1
方差
n
( Xi - X )2
i =1
n-1
你能举出我们用来获得 连续数据的三个器具例 子吗?
相对于仅仅知道部件是否合格而言, 连续数据可以提供更多的信息。
.
离散数据 (也称为属性或类别数据)
离散数据是某件事发生或未发生的次数,以发生的 频数来表示。
离散数据也可以是分类数据。如:销售地区、生产 线、班次和工厂。
烟火探测器
离散数据不能更进一步精确地细分。
标准差
课堂举例: 计算样本{1,3,5,4,7 }的方差和标准差
(使用下面的表作为向导。)
首先计算平均值X:
i
xi
1
2
3
4
5
Totals
xi - x
方差 (s2) =
标准差 (s 或 ^) =
.
(xi - x)2
绘制直方图
90位女士的身高
59 61 63 63 64 59
62 66 65 65 64 60 65 62 64 68 70 65 63 64 68 66 65 66 67 64 66 58 65 65 71 63 69 63 66 70 64 67 64 66 62 64 64 64 61 64 63 65 64 68 66 67 69 71 68 66 65 63 64 64 68 67 65 64 65 64 70 65 68 65 66 69 66 66 65 63 68 66 62 67 65 66 67 66 60 67 63 60 64 73
.
统计学术语
• 总体 - 全组数据,全部对象。 - 一个总体中的元素数量用N来表示
• 样本 -总体的一个子集 - 样本的元素数量用n 来表示
• 平均值 - 总体或样本的平均值
- 总体的平均值用 来表示 - 样本的平均值用X 或^ 来表示
• 方差 - 数据与其平均值之间差值的平方的 平均值 。(它代表该组数据的分散程度) - 总体的方差用 表示 - 样本的方差用s2或^表示
.
练习-应用你所学到的东西
请在下面的例子旁,写出它是“连续”还是“离散”
1 销售订单准确度 2 数据输入准确度 3 销售地区 1. 4 使用“合格/不合格”测量仪器得到的孔径 2. 5 孔径 3. 6 应答中心对话时间 4. 7 制冷氟利昂的重量(克) 5. 8 每百万部件中有缺陷部件的数量 6. 9 装配线缺陷(ALD)
.
离散数据
离散数据举例:
有凹痕的部件数量
通过/未通过
申诉决议
产出
生产线不合格品数量
及时交货
连续数据与离散数据进行比较的解释:
• 一般来说,连续数据比离散数据更可取,因为你可以 利用更少的数据获得更多的信息。
• 如果不能得到连续数据,就可以对离散数据进行分析 ,发现结果,作出判断。.
离散数据需要更多的数据点才能进行有效的分析
i =1
n-1
样本的公式
方差 - 与平均值之差的平方的平均值。一般用s2或^2来表
示。
.
举例
计算平均值、方差和标准差
n
Βιβλιοθήκη Baidu
x=
xi
i=1
n
平均值
s2
=
n
(
Xi
-X
)2
i =1
s=
n-1
方差
n
(
Xi
-X
)2
i =1
n-1
标准差
课堂举例: 计算样本{2, 6, 4 }的方差和标准差 首先计算均值: (2 + 6 + 4) / 3 = 12 / 3 = 4
举例:给定一个样本:{1,3,5,4,7 },平均值就是:
x = (1+3+5+4+7) = 20 = 4.0
5
5
样本的平均值等于4。
.
统计学术语和定义
标准差 -衡量数据分散程度的一个指标。一般用表示总
体,用s 或^表示样本。
=
N
( Xi - )2
i=1
N
总体的公式
S= =
n
( Xi - X )2