假设检验培训资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•“历史”的解释方法: •销售VP给A区经理较多的奖金。 •销售VP考虑换 掉C区 经理。
•“Six Sigma”解释的方法:
•销售VP问:“在95%置信度下是否有统 计上的差异?”
•回答说:“是的,A区销售与总平均值 有统 计上的差异。” •VP研 究A区的最佳实践。
• 统计“能够 ”... • 推论两组数据的平均值是否相同 • 推论两组数据的偏差是否相同 • 推论两组数据的缺陷率是否相同
•在风险水平一定的情况下,样本平均值周边的多大范围能将
总体平均值包括在内?
•
置信区间
•置信限
•置信区间....置信限...
•真实的总体平均值和标准方差 可以落在置信上限和下限之间
的任何一点!!!
•置信下限
•置信区间
•置信上限 • 置信限是 • 置信区间内的最大值和最小值 !
•置信度
• 置信度是希望让总体平均值和标准方差落在根据样本计算出的置信区间内的概 率大小!
百度文库
•置信度 = 承担业务风险的意愿
•X 轴 • LSL
•X 轴 • USL
•高风险 •< 75%
•中等风险 •~ 85%
•低风险 •> 95%
•Kmart LFL Watts 举例
•故障几率
•1 Watt 的增加 =
Kmart 发生1亿美元的成 本/照明公司的担保风险
•X 轴估计 •Kmart 需 求
•假设检验路线图
•数据类型
•连续 变量
•逻辑变量
•数据正态
•数据非正态
•比例数
•可计数数据
•正态理论检验
•非参数的检验
•平均值的检验 •.
•标准偏差检验 •位 置的检验
•离数的检验
•常用的假设检验
•连续变量
•平均值的检验
•标准偏差的检验
•一个总体
•两个总体
•三个或 以上总体
•一个总体
•两个总体
•三个或 以上总体
• 6 西格玛和业内通常使用95%的 置信度,这意味着: – 在95%的情况下总体平均值和标准方差落在置信区间内 –在5%的情况下(alpha 风险),总体平均值落在置信区间外。
• 如果我希望提高信心 (99% 的置信度).……或者承担更多风险 (75% 的置信 度).……
• 真实情景下,需要明确愿意承受的风险度…!
•一个样本 的T检验
•样本相关
•样本不相关
•结构图
•无结构图
•标准偏差的 •CHI平方检验
•标准偏差 •比率的F检验
•均方差的同一性
•成对T检验 •二个样本 的T检验
•Tukey的 •平均值的 •快速检验 分析ANOM
•均方差的 分析
ANOVA
•BARTLETT'S •TEST.
•LEVENE'S •TEST.
•p
•1. 总体参数(值)是固定的,但不知道。 •2. 样本统计是用来估计总体值的。
•假设是对总体值进行阐述,而不是对样本统计。
•置信区间
•置信区间
• 使用置信区间我们可以利用样本估算总体的平均值和标准方差
• 置信区间是基于下列要素的取值范围: – 样本平均值 (X) 和样本标准方差(s)
• 置信区间的取值范围会包括: – 总体平均值 ( ) 及总体标准方差( )。
•60.8 •60.9 •61.0 •61.1 •Average Watts
•置信水平
•99% •95% •85% •75%
样本容
259 132
53 23
•假设检验: •依据数据进行决策的核心
•实际问题 •统计问题
•“经验”
•本能 •数据 •知识
•实际答案 •统计答案
• 1. 所有流程均具有 变动性
•或
•可计数数据 分析 •Stat>Control Chart>U
•或
•比例 分析 •Stat>Control Chart>P •(np>5)
•平均值分析:
•ANOM是检验总体平均值的 图形检验
• •H•i•t• •R•a•t•io
•0••.4•0 •0••.3•5
• •平• 均值图•形•分析 •
•Ho
•Ha
•b
•a
•临界限制
•a 和 b 处在不同区域;故我们不可能同时 犯 I 类和 II 类错误
•何时需要假设检验?
•如果想分析输入以确定是否影响输出
•输入A •输入B •输入C
•过程
•输出 •发票
•如果想知道两个不同的过程产生的结果是否相同 •如果在“改进”实施前想确认一下。
•任何时侯如果想根据样本作客观的判断,就用假设检验!!!
假设检验培训资料
2020年4月25日星期六
•目的:
•熟悉连续变量和逻辑变量的假设检验。
•目标: •完成该章你将能够: •1) 写假设检验--原假设和备择假设。 •2) 解释假设检验的结果。
•情况: 在三个不同的销售区域使用相同促销方法,销售量分别是:
•A区: 1000 •B区: 850 •C区: 700
• 2. 从给定流程取得的样 本可能有所不同
• 3. 如何区分基于样本的“几率 性”差异和真正的流程差异?
•真实情况
•Ho
•Ha
•无罪
•有罪
•真实情况
•Ho
•Ha
•Ho •释放 •无罪释 放
•判决
•有罪, 释放
•Ha•监禁 •无罪, •有罪,
监禁
监禁
•Ho •正确判决 •II 类 •错误b
•接受 •Ha •I 类 •正确判决 •错误a
•0••.4•1•1•3•2•6 •0••.3•5•3•7•5
•0••.3•0
•0••.2•9•6•1•7•4
•A
•B
•C
•D
•E
•F
•
•方差分析: ANOVA
• 单因子ANOVA:检验有一个变量时,总体平均值是否相等 • 双因子ANOVA:检验有两 个变量时,总体平均值是否相等
• ANOVA-General Linear Model:检验有两个以上变量时,总体平均值 是否相等
•逻辑变量
•可计数数据
•将数据转变成连续数据(开平 方根) •Stat>ANOVA> •1-Way, 2-Way, or GLM
•比例数(样本数N是常数)
•比例分析 •Stat>ANOVA>Analysis of Means •Binomial (np>5)
•比例 数(样本数N不是常数)
•比例分析 •Stat>Control Chart>P •(np>5)
• 统计“不能” … • 直接说那一个较好 • 告诉我们如何解决问题 • 做出决定 • 确定规范或极限
•为什幺需要假设检验?
•总体:整个集合的全体特征 •样本:具有总体特征的子集
•根据样本确定总体!!!
•总体参数与样本统计
•总 体参 数
•样本统计
•平均
•
•x
值
•标准偏差
•
•s
•比例(百分数)
•P