【最新】R语言假设检验 PPT课件教案讲义(附代码数据)图文
合集下载
假设检验PPT课件
60 62.5 65 67.5 70 72.5 75
b
H0 不真
67.5 70 72.5 75 77.5 80 82.5
两类错误是互相关联的, 当样本容 量固定时,一类错误概率的减少导致另 一类错误概率的增加.
b a
要同时降低两类错误的概率a b,或 者要在 a 不变的条件下降低 b,需要增
加样本容量.
(二)备择假设(alternative hypothesis),与原假设相对立(相反)的假设。 一般为研究者想收集数据予以证实自己观点的假设。 用H1表示。 表示形式:H1:总体参数≠某值 (<) (>)
例:H1: 0
(三)两类假设建立原则 1、H0与H1必须成对出现 2、通常先确定备择假设,再确定原假设 3、假设中的等号“=”总是放在原假设中
•
P>α时,H0成立
多重检验及校正
在同一研究中,有时我们会用到二次或多次显著 性检验,从上表可以看出,如果我们将显著性水平确 定为α=0.05水平,做一次显著性检验后我们只能保证 有95%的研究结果与真值是一致的;如果做两次显著 性检验后,研究结果与真值的符合程度就会降至 95%*95%=90.25,当我们进行5次显著性检验后,就 会降至77.4%,即在5次显著性检验后,由α水平所得 到的显著性检验结果的可靠性只有3/4的可靠性。
用于处理生物学研究中比较不同处理效应 的差异显著性。
数据资料中,两个样本的各个变量从各自 总体中抽取,两个样本之间变量没有任何关 联,即两个抽样样本彼此独立,不论两个样 本容量是否相同。
方法1:两个总体方差都已知(或方差未知大样本)
• 假定条件
– 两个样本是独立的随机样本
– 两个总体都是正态分布 – 若不是正态分布, 可以用正态分布来近似(n130和
第五章假设检验01精品PPT课件
1. 与原假设对立的假设, 也称“备择假设”
2. 表示为 H1 3. 总是有符号 , 或
H1 : <某一数值 或 某一数值
例如, H1 : < 10cm, 或 10cm
提出假设
1. 原假设和对立假设是一个完备事件组,而且相互 对立 在一项假设检验中,原假设和对立假设必有一 个成立,而且只有一个成立
然后利用样本信息来判断假设是否成立
2. 类型
总体分布已知,
参数假设检验
检验关于未知参数
非参数假设检验
的某个假设
总体分布未知时的 假设检验问题
假设检验的过程
(提出假设→抽取样本→作出决策)
总体
提出假设
X的均值
作出决策
???
☺☺ ☺
☺☺ ☺☺
☺☺
抽取随机样本
☺
样本 均值
☺
假设检验的思想
假设检验的基本思想:通过提出假设,利用“小 概率原理”和“概率反证法”,论证假设的真伪 的一种统计分析方法。
解:研究者想收集证据予以支持的假设是“该城市中 家庭拥有汽车的比例超过30%”。建立的原假设和对 立假设为
H0 :p 30% H1 : p 30%
双侧检验与单侧检验
1、对立假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾检 验(two-tailed test)
2、对立假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或单 尾检验(one-tailed test) 对立假设的方向为“<”,称为左侧检验 对立假设的方向为“>”,称为右侧检验
拒绝H0
拒绝H0
/2
1 -
/2
0 临界值
第八章----假设检验课件PPT
第八章 假设检验
假设检验的基本问题 一个总体参数的检验 两个总体参数的检验
1
学习目标
假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验
2
正常人的平均体温是37oC吗?
37.1 36.9 36.9 37.1 36.4
在一次试验中小概率事件一旦发生,我们就有理 由拒绝原假设
8
原假设
(null hypothesis)
1. 又称“0假设”,研究者想收集证据予以反对的假 设,用H0表示
2. 所表达的含义总是指参数没有变化或变量之间没 有关系
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
4. 总是有符号 , 或
原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为
❖被称为显著性水平
❖ 2.第二类错误(取伪错误)
原假设为假时接受原假设 第二类错误的概率为(Beta)
12
两类错误的控制
❖ 一般来说,对于一个给定的样本,如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较 高,则将犯第Ⅰ类错误的概率定得低些较为 合理;反之,如果犯第Ι类错误的代价比犯第 Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错 误的概率定得高些
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
9
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设(期望出现的结论作为备选假设),用H1或Ha表 示
2. 所表达的含义是总体参数发生了变化或变量之间 有某种关系
➢ 我们应该放弃“正常人的平均体温是37oC”这个 共识吗?本章的内容就将提供一套标准统计程序 来检验这样的观点
假设检验的基本问题 一个总体参数的检验 两个总体参数的检验
1
学习目标
假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验
2
正常人的平均体温是37oC吗?
37.1 36.9 36.9 37.1 36.4
在一次试验中小概率事件一旦发生,我们就有理 由拒绝原假设
8
原假设
(null hypothesis)
1. 又称“0假设”,研究者想收集证据予以反对的假 设,用H0表示
2. 所表达的含义总是指参数没有变化或变量之间没 有关系
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
4. 总是有符号 , 或
原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为
❖被称为显著性水平
❖ 2.第二类错误(取伪错误)
原假设为假时接受原假设 第二类错误的概率为(Beta)
12
两类错误的控制
❖ 一般来说,对于一个给定的样本,如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较 高,则将犯第Ⅰ类错误的概率定得低些较为 合理;反之,如果犯第Ι类错误的代价比犯第 Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错 误的概率定得高些
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
9
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设(期望出现的结论作为备选假设),用H1或Ha表 示
2. 所表达的含义是总体参数发生了变化或变量之间 有某种关系
➢ 我们应该放弃“正常人的平均体温是37oC”这个 共识吗?本章的内容就将提供一套标准统计程序 来检验这样的观点
假设检验完整版PPT课件
H0 : 335ml H1 : 335ml
消费者协会接到消费者投诉,指控品牌纸包装 饮料存在容量不足,有欺骗消费者之嫌。包装 上标明的容量为250毫升。消费者协会从市场上 随机抽取50盒该品牌纸包装饮品进行假设检验。 试陈述此假设检验中的原假设和备择假设。
解:消费者协会的意图是倾向于证实饮料厂包装 饮料小于250ml 。建立的原假设和备择假设为
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平
1-
拒绝H0
0 观察到的样本统计量
样本统计量 临界值
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平
1-
拒绝H0
0
样本统计量
临界值
第一节 假设检验概述
1、假设检验的基本思想 2、假设检验的步骤 3、两类错误和假设检验的规则
三、两类错误和假设检验的规则
(单侧检验 )
抽样分布
置信水平
拒绝H0
1-
拒绝域 临界值
0 接受域
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
置信水平
拒绝H0
1-
临界值
0
样本统计量
观察到的样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
置信水平
拒绝H0
1-
临界值
0
观察到的样本统计量
样本统计量
•【例2】一种罐装饮料采用自动生产线生产,每罐的容量 是255ml,标准差为5ml,服从正态分布。换了一批工人后, 质检人员在某天生产的饮料中随机抽取了16罐进行检验,
一个总体的检验
一个总体
消费者协会接到消费者投诉,指控品牌纸包装 饮料存在容量不足,有欺骗消费者之嫌。包装 上标明的容量为250毫升。消费者协会从市场上 随机抽取50盒该品牌纸包装饮品进行假设检验。 试陈述此假设检验中的原假设和备择假设。
解:消费者协会的意图是倾向于证实饮料厂包装 饮料小于250ml 。建立的原假设和备择假设为
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平
1-
拒绝H0
0 观察到的样本统计量
样本统计量 临界值
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平
1-
拒绝H0
0
样本统计量
临界值
第一节 假设检验概述
1、假设检验的基本思想 2、假设检验的步骤 3、两类错误和假设检验的规则
三、两类错误和假设检验的规则
(单侧检验 )
抽样分布
置信水平
拒绝H0
1-
拒绝域 临界值
0 接受域
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
置信水平
拒绝H0
1-
临界值
0
样本统计量
观察到的样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
置信水平
拒绝H0
1-
临界值
0
观察到的样本统计量
样本统计量
•【例2】一种罐装饮料采用自动生产线生产,每罐的容量 是255ml,标准差为5ml,服从正态分布。换了一批工人后, 质检人员在某天生产的饮料中随机抽取了16罐进行检验,
一个总体的检验
一个总体
数据分析方法2(2假设检验)课件PPT
么是小概率的标准。这要看具体应用的需要。但在一般的统计书 和软件中,使用最多的标准是在零假设下(或零假设正确时)抽 样所得的数据拒绝零假设的概率应小于0.05(也可能是0.01,0.005, 0.001等等)。
9
假设检验的过程和逻辑
这种事先规定的概率称为显著性水平(significant level),用字
如果小概率事件发生,是相信零假设,还是相信数据呢?当然 是相信数据。于是就拒绝零假设。但事件概率小并不意味着不 会发生,仅仅发生的概率很小罢了。拒绝正确零假设的错误常 被称为第一类错误(type I err有第一类错误,还有第二类错误;那是备选零假设 正确时反而说零假设正确的错误,称为第二类错误(type II error)。如要“接受零假设”就必须给出第二类错误的概率. 但对于目前面对的问题, 无法计算它.
4
假设检验的过程和逻辑
注意:零假设和备选假设在我们涉及的假设检验中并不对称。 检验统计量的分布是从零假设导出的, 因此, 如果有矛盾, 当然 就不利于零假设了。 不发生矛盾也不说明备选假有问题。
5
假设检验的过程和逻辑
检验统计量在零假设下,这个样本的数据实现值的概率称为
p-值(p-value)。显然得到很小p-值意味着小概率事件发生了。
假设检验
在假设检验中,一般要设立一个原假设;而设立该 假设的动机主要是企图利用人们掌握的反映现实世界的 数据来找出假设和现实的矛盾,从而否定这个假设。
1
假设检验
在多数统计教科书中(除了理论探讨之外),假设检验都是以 否定原假设为目标。如否定不了,那就说明证据不足,无法否定原 假设。但这不能说明原假设正确。
和临界值的大小。
13
假设检验的过程和逻辑
使用临界值而不是p-值来判断拒绝与否是前计算机时代的产 物。当时计算p-值不易,只有采用临界值的概念。但从给定的a
9
假设检验的过程和逻辑
这种事先规定的概率称为显著性水平(significant level),用字
如果小概率事件发生,是相信零假设,还是相信数据呢?当然 是相信数据。于是就拒绝零假设。但事件概率小并不意味着不 会发生,仅仅发生的概率很小罢了。拒绝正确零假设的错误常 被称为第一类错误(type I err有第一类错误,还有第二类错误;那是备选零假设 正确时反而说零假设正确的错误,称为第二类错误(type II error)。如要“接受零假设”就必须给出第二类错误的概率. 但对于目前面对的问题, 无法计算它.
4
假设检验的过程和逻辑
注意:零假设和备选假设在我们涉及的假设检验中并不对称。 检验统计量的分布是从零假设导出的, 因此, 如果有矛盾, 当然 就不利于零假设了。 不发生矛盾也不说明备选假有问题。
5
假设检验的过程和逻辑
检验统计量在零假设下,这个样本的数据实现值的概率称为
p-值(p-value)。显然得到很小p-值意味着小概率事件发生了。
假设检验
在假设检验中,一般要设立一个原假设;而设立该 假设的动机主要是企图利用人们掌握的反映现实世界的 数据来找出假设和现实的矛盾,从而否定这个假设。
1
假设检验
在多数统计教科书中(除了理论探讨之外),假设检验都是以 否定原假设为目标。如否定不了,那就说明证据不足,无法否定原 假设。但这不能说明原假设正确。
和临界值的大小。
13
假设检验的过程和逻辑
使用临界值而不是p-值来判断拒绝与否是前计算机时代的产 物。当时计算p-值不易,只有采用临界值的概念。但从给定的a
第五章 假设检验ppt课件
第三节
t检验(t test)
t检验,亦称student t检验(Student’s t
test),主要用于样本含量较小(例如n<30), 总体标准差σ未知的正态分布资料。 一、样本均数与总体均数的比较 二、配对资料的比较 三、两样本均数的比较 四、大样本均数比较的u检验 五、正态性检验与两方差齐性检验
H0成立 H0不成立
(1-b)即把握度(power of a test):两总 体确有差别,被检出有差别的能力 (1-a)即可信度(confidence level):重复 抽样时,样本区间包含总体参数(m)的百分数 2018年11月7日
通常情况下Ⅱ型错误未知
对于一般的假设检验, a 定为 0.05 (或 0.01 ), b 的大小 取决于H1。通常情况下,比较总体间有 无差异并不知道,即H1不明确, b值的 大小无法确定,也就是说,对于一般的 假设检验,我们并不知道犯Ⅱ型错误的 概率b有多大。
2018年11月7日
第二节 假设检验的基本步骤
总体间差异: 1. 个体差异,抽样误差所致; 2. 总体间固有差异 判断差别属于哪一种情况的统计学检验, 就是假设检验(test of hypothesis)。 t检验是最常用的一种假设检验之一。
小概率思想: P<0.05(或P<0.01)是小概率事件。在 一次试验中基本上不会发生。 P≤α(0.05) 样本差 别有统计学意义;P >α(0.05) 样本差别无统计学意 义
2018年11月7日根据专 Nhomakorabea知识确定单、双侧检验
È û ç ¹ Ó Ð À í Ó É È Ï Î ª Ä Ñ ² ú ¶ ù ³ ö É ú Ì å Ö Ø µ Ä × Ü Ì å ¾ ù Ê ý Ò » ¶ ¨ ´ ó Ó Ú Ò » ° ã ¤¶ Ó ù Ô ò ¿ É Ã Ó µ ¥ ² à ¼ ì Ñ é £ ¨one-sided £ ©£ ¬ ¼ ´ £ º H0 £ º m 3.30 £ ¨Ä Ñ ² ú ¶ ù ³ ö É ú Ì å Ö Ø µ Ä × Ü Ì å ¾ ù Ê ý Ó ë Ò » ° ã Ó ¤¶ ù Ï à µ È £ © H1 £ º m 3.30 £ ¨Ä Ñ ² ú ¶ ù ³ ö É ú Ì å Ö Ø µ Ä × Ü Ì å ¾ ù Ê ý ´ ó Ó Ú Ò » ° ã Ó ¤¶ ù £ © ¥ ² µ à ¼ ì Ñ é £ ¬ ì Ñ ¼ é Ë ® × ¼ :¦ Á =0.05 é ¸ ² ½ ± í 2µ ¥ ² à t½ ç Ö µ t 0.05,34 1.691£ ¬ t 1.77 t 0.05,34 £ ¬ P < 0.05 £ ¬ ´ ¦ ° Á =0.05 Ë ® × ¼ £ ¬ ¾ Ü ¾ ø H0 £ ¬ ½ Ó Ê Ü H1 £ ¬ Á ½ Õ ß µ Ä ² î ± ð Ó Ð Í ³ ¼ Æ Ñ § Ò â Ò å £ ¬ Ñ ² Ä ú ¶ ù Æ ½ ¾ ù ³ ö É ú Ì å Ö Ø ´ ó Ó Ú Ò » ° ã Ó ¤¶ ù ¡ £ Ô É Ò Ï Ë « ² à ¼ ì Ñ é º Í µ ¥ ² à ¼ ì Ñ é µ Ä ½ á Â Û ½ Ø È » ² » Í ¬ ¡ £ Ë ù Ò Ô Ñ ¡ Ô ñ µ ¥ ² à ¼ ì Ñ é » ¶ Ò ¨Ò ª Ó Ð ¹ ý Ó ² µ Ä × ¨Ò µ Ò À ¾ Ý £ ¬ ¶ ø Ç Ò Ô Ú · ¢ ± í Â Û Î Ä Ê ±Ò ª Ì Ø ± ð × ¢ à ÷¡ £ Ò » ° ã Ç é ö ¶ ¿ ¼ Ò » Â É ² É Ó Ã Ë « ² à ¼ ì Ñ é £ ¨two-sided £ ©¡ £
假设检验1ppt课件
20
1.选择检验方法,建立检验假设并确定检验水准 H0:μ=14.1(月),总体上该县儿童前囟门闭
合月龄的平均水平与一般儿童的平均水平相 同 H1 : μ>14.1(月),该县儿童前囟门闭合月龄 的平均水平高于一般儿童的平均水平 检验水准(size of a test)
α=0.05
21
2、选定检验方法,计算统计量:
第七章 假设检验基础(1)
学习要点:
1、掌握假设检验的概念、原理、基本步骤; 2、掌握常见t检验方法及要求条件; 3、熟悉假设检验的逻辑思维方法(p的意义、结 论的写作等)
1
X
~
N(,
) z 2
z x
~
N (0,1)
X ~ N (, 2 ) z x x z~ N ( 0 ,1 ) x
P的含义是指从H0规定的总体随机抽样, 抽得等于及大于(或/和等于及小于)现有样 本获得的检验统计量(如t、u等)值的概率。
16
计算统计量t / z
●
17
若 P ,按所取检验水准 ,拒绝 H0 , 接受 H1 ,下“有差别”的结论。其统计学依 据是,在 H0 成立的条件下,得到现有检验结 果的概率小于 ,因为小概率事件不可能在 一次试验中发生,所以拒绝 H0 。
平均数为14.1
Population
μ0
μ1
SAMPLE
平均数为14.3 标准差为5.08 N=36
6
(二)假设检验的基本原理(基本思想): 1、为什么要进行假设检验?
因为样本均数存在差别的原因有: ①完全由抽样误差造成 ②研究因素造成(本质上的差别)
统计上就是推断样本均数的差别,由①造成的 概率大小。
13
(3) 检验水准,过去称显著性水准,是预
1.选择检验方法,建立检验假设并确定检验水准 H0:μ=14.1(月),总体上该县儿童前囟门闭
合月龄的平均水平与一般儿童的平均水平相 同 H1 : μ>14.1(月),该县儿童前囟门闭合月龄 的平均水平高于一般儿童的平均水平 检验水准(size of a test)
α=0.05
21
2、选定检验方法,计算统计量:
第七章 假设检验基础(1)
学习要点:
1、掌握假设检验的概念、原理、基本步骤; 2、掌握常见t检验方法及要求条件; 3、熟悉假设检验的逻辑思维方法(p的意义、结 论的写作等)
1
X
~
N(,
) z 2
z x
~
N (0,1)
X ~ N (, 2 ) z x x z~ N ( 0 ,1 ) x
P的含义是指从H0规定的总体随机抽样, 抽得等于及大于(或/和等于及小于)现有样 本获得的检验统计量(如t、u等)值的概率。
16
计算统计量t / z
●
17
若 P ,按所取检验水准 ,拒绝 H0 , 接受 H1 ,下“有差别”的结论。其统计学依 据是,在 H0 成立的条件下,得到现有检验结 果的概率小于 ,因为小概率事件不可能在 一次试验中发生,所以拒绝 H0 。
平均数为14.1
Population
μ0
μ1
SAMPLE
平均数为14.3 标准差为5.08 N=36
6
(二)假设检验的基本原理(基本思想): 1、为什么要进行假设检验?
因为样本均数存在差别的原因有: ①完全由抽样误差造成 ②研究因素造成(本质上的差别)
统计上就是推断样本均数的差别,由①造成的 概率大小。
13
(3) 检验水准,过去称显著性水准,是预
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章习题 5.1 依题意,应选择双侧检验,于是可写出原假设和备择假设如下: 原假设:油漆工人的血小板计数与正常成年男子无差异。 备择假设:油漆工人的血小板计数与正常成年男子有差异。 x<-c(220, 188, 162, 230, 145, 160, 238, 188, 247, 113, 126, 245, 164, 231, 256, 183, 190, 158, 224, 175) t.test(x,mu=225) One Sample t-test data: x t = -3.4783, df = 19, p-value = 0.002516 alternative hypothesis: true mean is not equal to 225 95 percent confidence interval: 172.3827 211.9173 sample estimates: mean of x 192.15 由于 p 值小于 0.05,拒绝原假设,认为油漆工人的血小板计数与正常成年男子有差异。 5.2 x<-c(1067,919,1196,785,1126,936,918,1156,920,948) pnorm(1000,mean(x),sd(x)) [1] 0.5087941 由此看出,x 1000的概率为 0.509,因此x 1000 的概率为 0.491. 5.3 A<-c(113,120,138,120,100,118,138,123) B<-c(138,116,125,136,110,132,130,110) t.test(A,B,paired=TRUE) Paired t-test data: Aand B t = -0.6513, df = 7, p-value = 0.5357 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -15.62889 8.87889 sample estimates: mean of the differences -3.375 p 值大于 0.05,接受原假设,两种方法治疗无差异。 5.4
sort(x) [1] -5.6 -1.6 -1.4 -0.7 -0.5 0.4 0.7 1.7 2.0 2.5 2.5 2.8 3.0 3.5 4.0 [16] 4.5 4.6 5.8 6.0 7.1 x1<-table(cut(x,br=c(-6,-3,0,3,6,9))) p<-pnorm(c(-3,0,3,6,9),mean(x),sd(x)) p [1] 0.04894712 0.24990009 0.62002288 0.90075856 0.98828138 p<-c(p[1],p[2]-p[1],p[3]-p[2],p[4]-p[3],1-p[4]);p [1] 0.04894712 0.20095298 0.37012278 0.28073568 0.09924144 chisq.test(x1,p=p) Chi-squared test for given probabilities data: x1 X-squared = 0.5639, df = 4, p-value = 0.967 警告信息: In chisq.test(x1, p = p) : Chi-squared 近似算法有可能不准 p 值为 0.967,接受原假设,x 符合正态分布。 再以 y 为例。 sort(y) [1] -2.0 -1.1 0.2 0.6 0.8 1.2 1.6 1.7 2.0 2.0 2.2 3.1 [15] 3.8 5.0 5.2 6.0 6.5 6.6 y1<-table(cut(y,br=c(-6,-3, 0,3,6,9))) p<-pnorm(c(-3,0,3,6,9),mean(y),sd(y)) p [1] 0.01006540 0.13907444 0.56156046 0.91839260 0.99577767 p<-c(p[1],p[2]-p[1],p[3]-p[2],p[4]-p[3],1-p[4]);p [1] 0.01006540 0.12900904 0.42248601 0.35683214 0.08160740 chisq.test(y1,p=p) Chi-squared test for given probabilities data: y1 X-squared = 0.4531, df = 4, p-value = 0.9779 警告信息: In chisq.test(y1, p = p) : Chi-squared 近似算法有可能不准 p 值为 0.9779,接受原假设,y 符合正态分布。 (2) 方差相同模型 t 检验: t.test(x,y,var.equal=TRUE) Twox<-c(-0.7,-5.6,2,2.8,0.7,3.5,4,5.8,7.1,-0.5,2.5,-1.6,1.7,3,0.4,4.5,4.6,2.5,6,-1.4) y<-c(3.7,6.5,5,5.2,0.8,0.2,0.6,3.4,6.6,-1.1,6,3.8,2,1.6,2,2.2,1.2,3.1,1.7,-2) shapiro.test(x) Shapiro-Wilk normality test data: x W = 0.9699, p-value = 0.7527 shapiro.test(y) Shapiro-Wilk normality test data: y W = 0.971, p-value = 0.7754 无论是对照组,还是实验组,p 值均大于 0.05,于是接受原假设,即这两组数据均来自正态 分布总体。 ks 检验: ks.test(x,"pnorm",mean(x),sd(x)) One-sample Kolmogorov-Smirnov test data: x D = 0.1065, p-value = 0.977 alternative hypothesis: two-sided 警告信息: In ks.test(x, "pnorm", mean(x), sd(x)) : 在有连结的情况下无法正确計算 p 值 ks.test(y,"pnorm",mean(y),sd(y)) One-sample Kolmogorov-Smirnov test data: y D = 0.1197, p-value = 0.9368 alternative hypothesis: two-sided 警告信息: In ks.test(y, "pnorm", mean(y), sd(y)) : 在有连结的情况下无法正确計算 p 值 无论是对照组,还是实验组,p 值均大于 0.05,于是接受原假设,即这两组数据均来自正态 分布总体。 pearson 拟合优度检验,以 x 为例。
sort(x) [1] -5.6 -1.6 -1.4 -0.7 -0.5 0.4 0.7 1.7 2.0 2.5 2.5 2.8 3.0 3.5 4.0 [16] 4.5 4.6 5.8 6.0 7.1 x1<-table(cut(x,br=c(-6,-3,0,3,6,9))) p<-pnorm(c(-3,0,3,6,9),mean(x),sd(x)) p [1] 0.04894712 0.24990009 0.62002288 0.90075856 0.98828138 p<-c(p[1],p[2]-p[1],p[3]-p[2],p[4]-p[3],1-p[4]);p [1] 0.04894712 0.20095298 0.37012278 0.28073568 0.09924144 chisq.test(x1,p=p) Chi-squared test for given probabilities data: x1 X-squared = 0.5639, df = 4, p-value = 0.967 警告信息: In chisq.test(x1, p = p) : Chi-squared 近似算法有可能不准 p 值为 0.967,接受原假设,x 符合正态分布。 再以 y 为例。 sort(y) [1] -2.0 -1.1 0.2 0.6 0.8 1.2 1.6 1.7 2.0 2.0 2.2 3.1 [15] 3.8 5.0 5.2 6.0 6.5 6.6 y1<-table(cut(y,br=c(-6,-3, 0,3,6,9))) p<-pnorm(c(-3,0,3,6,9),mean(y),sd(y)) p [1] 0.01006540 0.13907444 0.56156046 0.91839260 0.99577767 p<-c(p[1],p[2]-p[1],p[3]-p[2],p[4]-p[3],1-p[4]);p [1] 0.01006540 0.12900904 0.42248601 0.35683214 0.08160740 chisq.test(y1,p=p) Chi-squared test for given probabilities data: y1 X-squared = 0.4531, df = 4, p-value = 0.9779 警告信息: In chisq.test(y1, p = p) : Chi-squared 近似算法有可能不准 p 值为 0.9779,接受原假设,y 符合正态分布。 (2) 方差相同模型 t 检验: t.test(x,y,var.equal=TRUE) Twox<-c(-0.7,-5.6,2,2.8,0.7,3.5,4,5.8,7.1,-0.5,2.5,-1.6,1.7,3,0.4,4.5,4.6,2.5,6,-1.4) y<-c(3.7,6.5,5,5.2,0.8,0.2,0.6,3.4,6.6,-1.1,6,3.8,2,1.6,2,2.2,1.2,3.1,1.7,-2) shapiro.test(x) Shapiro-Wilk normality test data: x W = 0.9699, p-value = 0.7527 shapiro.test(y) Shapiro-Wilk normality test data: y W = 0.971, p-value = 0.7754 无论是对照组,还是实验组,p 值均大于 0.05,于是接受原假设,即这两组数据均来自正态 分布总体。 ks 检验: ks.test(x,"pnorm",mean(x),sd(x)) One-sample Kolmogorov-Smirnov test data: x D = 0.1065, p-value = 0.977 alternative hypothesis: two-sided 警告信息: In ks.test(x, "pnorm", mean(x), sd(x)) : 在有连结的情况下无法正确計算 p 值 ks.test(y,"pnorm",mean(y),sd(y)) One-sample Kolmogorov-Smirnov test data: y D = 0.1197, p-value = 0.9368 alternative hypothesis: two-sided 警告信息: In ks.test(y, "pnorm", mean(y), sd(y)) : 在有连结的情况下无法正确計算 p 值 无论是对照组,还是实验组,p 值均大于 0.05,于是接受原假设,即这两组数据均来自正态 分布总体。 pearson 拟合优度检验,以 x 为例。