初步数据分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单尾检验
在上面例中,若我们关心的是总体均值μ是否比 μ0大,我们要确定是接受假设 H 0 : :还是0 接 受另一假设 H1 : ,0 即促销后,销售的收入 是否得到了提高。这样,问题就是要检验下面 的假设:
H0 : 0
H1 : 0
这称为右边检验,同样存在左边检验,统称单
尾检验。
例2 在例1中,是否可以认为促销后,销售的收入
• J.D. Power坚信,当一个公司对用户满 意度给予足够的关注后,销售额、利润 和市场份额的增长就会水到渠成。
第三章 初步数据分析
• 引例 • 3.1 频数分布 • 3.2 集中趋势指标 • 3.3 离散趋势指标 • 3.4 分布形状指标 • 3.5 典型案例及SPSS应用
第三章 初步数据分析
第三章 初步数据分析
• 引例 • 多元统计分析简介 • 3.1 频数分布 • 3.2 集中趋势指标
• 3.3 离散趋势指标
• 3.4 分布形状指标 • 3.5 典型案例及SPSS应用
第三章 初步数据分析
• 引例 • 多元统计分析简介 • 3.1 频数分布 • 3.2 集中趋势指标 • 3.3 离散趋势指标
• 引例
• 3.1 频数分布
• 3.2 集中趋势指标 • 3.3 离散趋势指标 • 3.4 分布形状指标 • 3.5 典型案例及SPSS应用
第三章 初步数据分析
• 引例 • 多元统计分析简介 • 3.1 频数分布
• 3.2 集中趋势指标
• 3.3 离散趋势指标 • 3.4 分布形状指标 • 3.5 典型案例及SPSS应用
x 0 ~ N (0,1) / n
(2)
双尾检验,查表得 z0.025 1.96 。 |μ|的拒绝域为:(1.96,) 将抽样值代入上式得:
x 0 / n
53.2 52.8 0.8 / 16
2 z0.025 1.96
落入拒绝域中,即小概率事件竟
然出现,于是否定假设H0,认为促销 后销售收入发生了变化。
员工工资——Descriptive过程
ቤተ መጻሕፍቲ ባይዱ
假设检验
1、假设检验的基本概念
2、假设检验的基本原理
3、假设检验的基本思想及推理方法
例1 某企业为了提高销售的收入进行了促销,已知销 售收入X(单位:万元)服从正态分布N(52.8, 0.82 ),其中52.8万元是销售收入,现进行了促销后, 抽取n=16的样本,测得收入为:(万元) 51.9 53.4 52.9 54.3 53.8 52.4 53.7 54.0 52.4 52.5 53.5 51.3 54.9 52.8 54.5 52.9
应当注意
上面例1的结论是在显著性水平 0.05 的情况下得出的,
如果 ,0.0则1
z z0.005 2.5, 8
2
代入观察值 2 z0.005 ,则会得出,促销后销售
收入无实质变化的相反结论。可见,原假设取舍与否
与 的取值直接相关,当我们倾向于不要轻易否H0
时 可取小一些,反之,取大一些。
根据实际问题可以进行不同形式的假设, 归纳如下:
右边检验,假设形式为:
H0 : 0 H1 : 0
左边检验,假设形式为: H0 : 0 H1 : 0
两类错误
小概率原理是假设检验的基本依据,然 而,对于小概率事件,无论其概率多 么小,还是可能发生的,所以,利用 小概率原理为基础的假设检验方法进 行检验,可能会做出错误的判断,主 要有以下两种形式
假设 2=0.82不变,问促销后销售收入是否发生了实
质性变化?
我们的问题就是:
已知总体X~N(u 0
,
2 0
),且
2
2 0
0.82
要求检验下面的假设:
H 0 : 0 52.8 H 1 : 0(1)
通常把H0称为原假设或零假设,把H1称为备择 假设或对立假设。
从取样结果看 x 53.2 ,样本均值 x 与总体均
记为 。
我们自然希望犯这两类错误的概率越小越好。 但当样本容量n确定后,犯这两类错误的概 率不可能同时被控制,通常在我们根据历史
经验选取恰当的显著性水平 后,通过扩
大样本容量n的方式来使第二类错误的概率 减小。
4、假设检验的基本步骤
(1)根据实际问题提出基本假设H0和备择假设H1。
值 0 52.8 之间存在差异,这种差异是因为
抽样的随机性导致的不可避免的误差,还是因 为促销而导致的实质性差异?
为了回答这个问题,首先给定一个小概率 ,
称为显著性水平, 通常取较小的值,如 为0.05, 0.01。在本例中,我们选
取 0.05 。
选取统计量,它包含待检验参数,当H0为 真时,它的分布是已知的,本例中,选取
有明显的提高? 0.05 解:依题意假设:
H 0 : 0 52.8 H1 : 0
选择统计量 x 0 ~ N (0,1) n 16
/ n
查表得 z z0.05 1.645 拒绝域为 1.645,
将抽样值代入得 2 1.645
落入拒绝域中,拒绝H0,接受H1,
认为销售的收入促销后有明显的提高。
第三章 初步数据分析
第三章 初步数据分析
• 引例
• 3.1 频数分布 • 3.2 集中趋势指标 • 3.3 离散趋势指标 • 3.4 分布形状指标 • 3.5 典型案例及SPSS应用
JD Power 的满意度调查
• J.D.Power建立于1968年,是一家全球性 的市场咨询公司,主要就顾客满意度, 产品质量和消费者行为等方面进行独立 公正的调研。
(1)原假设H0实际是正确的,但却错误 地拒绝了H0,这样就犯了“弃真”的
错误,通常称为第一类错误。由于仅 当所考虑的小概率事件A发生时才拒 绝H0,所以犯第一类错误的概率就是 条件概率 。
(2)原假设H0实际是不正确的,但是却错 误地接受了H0,这样就犯了“取伪”的错误, 通常称为第二类错误。犯第二类错误的概率
• 3.4 分布形状指标
• 3.5 典型案例及SPSS应用
第三章 初步数据分析
• 引例 • 多元统计分析简介 • 3.1 频数分布 • 3.2 集中趋势指标 • 3.3 离散趋势指标 • 3.4 分布形状指标
• 3.5 典型案例及SPSS应用
大学生的平均每周浏览知名网站行为的 初步数据分析—— Frequencies过程