基本统计概念

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

试验设计
基本统计概念
5
数据的两种类型
解决办法 连续数据 问题 离散数据
• 连续 (可变) 数据 使用一种度量单位,比如英寸或小时。
• 离散 (属性) 数据是类别信息,比如““ 通过” 或““ 未通过”。 举例: 部件号 离散 连续 1 通过 2.031 2 通过 2.034 3 未通过 2.076 4 通过 2.022 5 未通过 2.001
i
1 2 3
xi
2 6 4
(xi-4)
-2 2 0
(xi-4)2
4 4 0
和 12 0 8 方差 (s2) = 8 / (3 - 1) = 4 标准差 (s) = sqrt(4) = 2
基本统计概念
15
课堂练习
计算平均值、方差和标准差 x = 均值
离散数据是某件事发生或未发生的次数,以发生的频数来表示。 离散数据也可以是分类数据。如:销售地区、生产线、班次和工厂。
离散数据不能更进一步精确地细分。
基本统计概念
8
离散数据
离散数据举例:
有凹痕的部件数量 申诉决议 通过/未通过 产出
生产线不合格品数量
及时交货
连续数据与离散数据进行比较的解释:
• • 一般来说,连续数据比离散数据更可取,因为你可以利用更少的数据获 得更多的信息。 如果不能得到连续数据,就可以对离散数据进行分析,发现结果,作出 判断。.
基本统计概念
14
举例
计算平均值、方差和标准差

x =
i=1
n
xi
s2 =
( Xi - X ) i = 1
n -1 方差
n
2
s=
2 i - X ) ( X i = 1
n
n 平均值
n -1
标准差
课堂举例: 计算样本{2, 6, 4 }的方差和标准差 首先计算均值: (2 + 6 + 4) / 3 = 12 / 3 = 4
统计概念
解释以下基本统计概念。 1. 波动(偏差)
2. 连续数据和离散数据
3. 平均值、方差、标准差 4. 正态曲线
5. 用Z值将数据标准化
6. 中心极限定理 7. 过程能力 - 使用Z值作为衡量工序能力的指标 - 通过改进关键值Xs来改进Y 8.稳定性因子
基本统计概念
1
波动
所有的人不会都是同样的高度; 所有的葡萄不可能同一天采摘 问题: 你期望存在波动吗?什么类型的波动?
波动的产生是很自然的,意料之中的,是统计学的基础
基本统计概念
4
统计学的作用
统计学用以下方法处理误差:
统计描述 用图表和几个总结性数字(均值、方差、标准差)描 述一组数据。
统计推理
确定结果之间的差异何时可能是由于随机误差引起 的,何时不能归因于随机误差。 (置信区间和假设检验)。
收集并分析数据,以估算过程变化的 影响。
基本统计概念
10
统计学术语
总体 - 全组数据,全部对象。 - 一个总体中的元素数量用N来表示 样本 -总体的一个子集 - 样本的元素数量用n 来表示 平均值 - 总体或样本的平均值 - 总体的平均值用来表示 - 样本的平均值用X 或^ 来表示 方差 - 数据与其平均值之间差值的平方的平均值 。(它代表该组数据的分散程度) - 总体的方差用 表示 - 样本的方差用s2或^ 表示 均方差是方差的 (正) 平方根。 (它也代表该组数据的分散程度)。 -总体的标准差用 来表示 -样本的标准差用s或 ^来表示
X X X X X
X X X X X
X X X X X
X X X X X
基本统计概念
12
统计学术语和定义
平均值 - 总体或样本的平均值。 用x或^ 来表示样本,用来表示总体。
x =
1
n
n
xi ,
平均值的公式 在这里X1是样本的第一个点, Xn是样本的最后一个点。 .
举例:给定一个样本:{1,3,5,4,7 },平均值就是: x = (1+3+5+4+7) = 20 = 4.0 5 5
ຫໍສະໝຸດ Baidu
离散数据需要更多的数据点才能进行有效的分析
基本统计概念
9
应用你所学到的东西
请在下面的例子旁,写出它是“连续”还是“离散”
1 销售订单准确度
2 数据输入准确度 3 销售地区
4 使用“合格/不合格”测量仪器得到的孔径
5 孔径 6 应答中心对话时间
7 制冷氟利昂的重量(克)
8 每百万部件中有缺陷部件的数量 9 装配线缺陷(ALD)
样本的平均值等于4。
基本统计概念
13
统计学术语和定义
标准差 -衡量数据分散程度的一个指标。一般用表示总体,用s 或 表示样 ^ 本。
2 i - ) ( X i= 1
N

总体的公式
=
N
S=

=
2 i - X ) ( X i = 1
n
样本的公式
n -1
^2来表示。 方差 - 与平均值之差的平方的平均值。一般用s2或
基本统计概念
3
观测值变化(续)
我们预期观测值会有差异。如果没有差异,我们就会产生怀疑。
如果所有地区的手机销售量是一样的,那么我们就会怀疑是数据库出了 问题。. 如果我们测量10台电冰箱,得到同样的能耗测量结果,我们就会怀疑测 量是否正确。
这种变化使我们的工作更具挑战性!
一般来说,我们不能相信来自一个数据点的结果。通常我们收集多个数据点,而 且非常注意如何选取这些样本,以减少偏差。
基本统计概念
6
连续数据(也称为可变数据)
连续数据以参数的形式,比如尺寸、重量或时间,说明一个产品或过程的 特性。测量标准可以有意义地不断分割,使精确度提高。
你能举出我们用来获得连续数据 的三个器具例子吗?
相对于仅仅知道部件是否合格而言, 连续数据可以提供更多的信息。
基本统计概念
7
离散数据(也包括属性或类别数据)
基本统计概念
11

统计学术语和定义
总体 - 全部对象.
举例 – 1998年5月在深圳生产的所有的21英寸彩电
样本 -代表总体的一个子集数据。 举例 - 1998年5月在深圳生产的一百二十台21英寸彩电
这个矩阵代表25个X的总体。画上圆圈的 那些是由总体中的六个X组成的样本。
X X X 举例: X X
基本统计概念
2
观测值变化
当重复进行测量的时候,通常会得到不同的答案, 这就是波动! 1. 系统波动
预期的和可预测的测量结果之间的差异。 举例: 夏季和冬季的空调的销售量不同。
2. 随机波动
不可预测的测量结果之间的差异。
举例:具有同一种设计的两台冰箱,由同一个技术人员、在同样的 气温条件下、使用同样的测量仪器,在两个不同的日子对其能量消 耗进行测试…...可能得到两个不同的结果。
相关文档
最新文档