管理统计学第3章--非参数假设检验

合集下载

非参数假设检验.pptx

非参数假设检验.pptx
取 1。.据9 此,我们可以用参数 的泊1松.9分布来
计算每分钟内通过收费站的汽车为0辆、1辆、2辆、3 辆、4辆或更多的概率。
第12页/共43页
e 各概率乘以观测总数n=100,便得到理论频数 ,具体结果见下表: i ei
计算 2统计量的值:
2 (14.96 10)2 (28.42 26)2 (27.0 35)2
H0 :汽车通过收费站的辆数服从泊松分布; H1 :不服从泊松分布。
观测值分为5组,且有 u0 10,u1 26,u2 35,u4 5
第11页/共43页
回忆泊松分布
P{X x} e x , x 0,1, 2,
x!
其中 为泊松分布的期望值,是未知的,需要用样
本观测值来估计。由于100分钟内观测到190辆汽车, 所以平均每分钟观测到190/100=1.9辆汽车,故
第9页/共43页
计算 2统计量的值:
2 6 (ui ei )2
i1
ei
(27 25)2 (18 25)2 (15 25)2 (24 25)2
25
25
25
25
(36 25)2 (30 25)2 12
25
25
在本例的情况下, 统2 计量的自由度为m-1=6-1=5。
第8页/共43页
解:本例中的观测值以月为组,共分为m=6组,
每 月的销售台数即为观测的频v数i ,观测的总次
数为n=150。现欲检验是否服从(离散的)均匀 分布,即每月的销售量是否为
ei
nPi
150 6
25(台),
Pi
1 6
,i
1,
,6
为此,设
H0 :洗衣机销售量服从均匀分布;
H1 :并不服从均匀分布;

数理统计13 非参数假设检验

数理统计13 非参数假设检验
X1,X2,…,Xn 为来自总体X的样本,则 X n F L n N (0,1) ( n ) Sn
均值的渐近分布为N ( F,
F
2
).
定理3 设(X1,X2,…,Xm) 与(Y1,Y2,…,Yn) 是来
自X~N(1,12)与Y~N(2,22)的两独立样本,
则当n趋于无穷, m趋于无穷时有
得到拒绝域{Dn1 ,n2 Dn , }。 Fn1 ( x)和Gn2 ( x)是两个总体对应的经验分布函数
柯尔莫哥洛夫检验 当连续分布时,效率较
高,不能用于离散情形
-检验能用于离散情形,连续情形精度较差
2
(三)独立性检验 分析
需要检验H0 :两个总体X和Y是否独立 将这两个总体的取值范围分成m个和k个 互不相交的区间A1 , A2 , . . . ,Am 和B1 ,B2 ,... ,Bk 。 设从总体中抽取一个容量为n的样本 (X1,Y1), (X2,Y2), …,(Xn,Yn),
, , 未知但 = = .
2 1 2 2 2 3 2 1 2 2 2 3
试提出三正态总体均值1 2 =3的 假设检验.
2. 某厂使用两种不同的工艺生产同一类型的产 品。现对产品进行分析比较,抽取第一种工艺 生产的样品120件,测得均值为1.25 (kg),标准 差为0.52(kg);抽取第二种工艺生产的样品60 件,测得均值为1.32(kg),标准差为0.45 (kg)。 设产品的质量都服从正态分布,试判断在检验 水平0.05下,能否认为两种生产工艺的方差相 等?如果能认为两种工艺质量的方差相等,再 进一步判断能否认为使用第二种工艺生产的产 品的平均质量较使用第一种生产的为大?
记nij表示样本值中其横坐标落入Ai,纵坐 标落入Bj中的个数(i=1,2,…,m;j=1,2,…k).

《管理统计学》-实验教学大纲

《管理统计学》-实验教学大纲

《管理统计学》课程实验教学大纲一、课程基本信息课程代码:16225004课程名称:管理统计学英文名称: Statistics for Management实验总学时:24适用专业:信管专业课程类别:学科基础课先修课程:线性代数,微积分,概率论与数理统计二、实验教学的总体目的和要求1、对学生的要求:了解统计学、数据分析技术对世界、企业的作用及全球化过程中我国快速发展的伟大成就;让学生掌握课程中的基本原理和理论方法;能将实验过程、求解方法及在实验过程中的收获和发现的问题正确地表达出来,并以实验报告的形式总结出来。

2、对教师的要求:授课教师实验前在课堂上简单讲解实验流程,实验中解答学生的疑问。

3、对实验条件的要求:SPSS,Office软件以及网络开发环境。

实验教学内容实验项目一实验名称:界面介绍和基础操作介绍实验内容:1.了解SPSS软件界面:菜单栏;工具栏;数据窗口;数据视图与变量视图切换.2.SPSS数据结构1)变量名是变量存取的唯一标志。

起名规则:不多于8个字符组成;不区分大小写;允许汉字作为变量名;默认变量名为VARn,如:var00001。

2)变量的类型(type)和显示宽度(width)3)变量名标签(Variable label) :对变量名的一些解释说明,增强分析结果的可视性。

可以省略。

4)变量名标签(Variable label) :对变量名的一些解释说明,增强分析结果的可视性。

可以省略。

5)变量列格式(Column Format):对齐方式(Text Alignment):左对齐(Left):字符型默认,右对齐(Right):数值型默认居中对齐(Center);列宽度:默认值为变量的总长度。

6)缺失值(Missing Values):对缺失值的一般处理包括事先指定和其他处理方法。

3.变量度量(Measurement):scale: 定距数据,一般为数值型数据。

如:收入、人数。

ordinal:有固有顺序的顺序水准的数值型或字符型数据。

假设检验的思想和原理

假设检验的思想和原理

假设检验的思想和原理摘要 统计推断研究的一类基本问题是本章所讨论的统计假设检验问题。

在数理统计中,通常称对有关总体分布所提出的某种推断为统计假设;称根据所获得的样本,采用合理的方法来判断这个假设是否成立为统计假设检验。

统计假设检验的基本任务是根据来自总体的样本所提供的信息,对未知总体分布的某些概率特征(如总体数学期望,总体方差,总体分布,两个总体相互独立等)的统计假设作出合理的判断。

为行文简便,以下将统计检验假设简写成假设检验。

假设检验与参数估计一样,在数理统计的理论研究与实际应用中都占有极其重要的地位。

关键词:原理讨论 参数检验 检验水平一般地,在统计假设检验问题中,其出发点是对总体作一个假设,称之为原假设或零假设(null hypothesis ),记为0H ;而与之对立的假设称为备择假设(alternative hypothesis),记为1H 。

原假设和备择假设称为统计假设。

而用来判断统计假设真伪的规则为检验法。

必须强调指出,原假设0H 通常是不轻易否定的一个被检验的假设,只有在样本提供足够不利于它的证据时才能拒绝它;如果样本提供的信息没有充分的理由否定原假设0H ,则不能拒绝它。

假设检验问题按照总体的状况通常分为参数假设检验与非参数假设检验两类:若总体的分布函数或者总体在离散情形的概率质量函数或在连续情形的概率密度函数的数学表达式为已知,只是分布中的参数有些是未知的,这时统计假设是针对未知参数而提出并需要检验的,这样的问题称为参数假设检验问题。

如备择假设为“50:1≠μH ”,它表示当备择设1H 成立时,μ可能大于50,也可能小于50,通常称这种备择假设为双侧被择假设(two-sided alter- native hypothesis ),与之相应的检验为双侧检验(two-sided test )。

在实际问题中还会出现备择假设为“01:θθ H ”或“01:θθ H ”的情形。

例如,某厂生产的固体燃料推进器的燃烧率服从正态分布),(200σμN ,现采用新方法研究一批推进器,其目的是提高推进器的燃烧率。

非参数统计基本概念

非参数统计基本概念

§ 非参数统计
知识回顾 势函数(检验的势) 无偏检验 经验分布 检验的相对效率
2.4 检验的相对效率
已知好的检验, 势越大越好.
那么用怎样的标准选择检验函数呢?
----可以通过比较势的大小选择较优的检验
然而势不容易计算,则考虑其影响因素:
总体的真值, 显著水平, 样本量 样本量越大,势越大
• 超几何分布:
• p=S/N
=
,这里
数据处理
• 拿到数据时,首先要有一个直观概念。 • 若数据来自一个总体,先通过绘图(直方图、箱线图、 茎叶图、Q-Q图、P-P图 等)了解它的大致分布情况, 如是否对称,是否有很长的尾部,是否有远离数据 主体的点等。 • 若数据来自不同总体,除了上述了解,还需要看各 样本的形状是否类似,通过二维或三维图观察样本 间的联系或相关性。 • P12的图1.1给出了x和y样本的直方图、盒形图及相对 于正态分布的QQ图. • 数据常常需要处理以符合非参数统计推断方法的某 些条件,最常用的是指数变换。
2.2 势函数
即不犯第II类错误的概率,
此时 为检验犯第II类错误的概率
Remark:
势越大越好(如此才是有意义的检验)
低势的检验说明检验在区分零假设和备择假设 方法的价值不大
例2.1:电话交换台单位时间内接到的呼唤次数服从 Poisson分布P( ) ,为单位时间内接到的平均呼唤次 数。考察该交换台在单位时间内的平均呼唤次数是 否超过1。
局部最优势检验LMP
§ 非参数统计
知识回顾 势函数(检验的势) 无偏检验 经验分布 检验的相对效率
2.3 经验分布
Recall 分布函数的两种定义形式
设 X 1 , X 2 ,, X n是取自分布函数为F ( x)的总体中一个简单随机样 本的观测值,若把样本观测值由小到大进行排列,得到 X (1) X ( 2) X ( n),其中 X (1) 是样本观测值 X , X , , X 中最小的 1 2 n 一个, X (i ) 是样本观测值中第 i 个小的,则 n 1 0 当X (1) x F ( x) I ( X n i x) n i 1 k

管理统计学-第4章 假设检验

管理统计学-第4章  假设检验

• 在本例中,
_
x 32 35
3.184
s / n 5.96 / 40
⑤作出统计决策
• 根据样本信息计算出统计量z的具体值,Z 将它与临界值 相比较,就可以作出接受 原假设或拒绝原假设的统计决策。
• 在本例中,由于z=3.184>1.96,落在拒绝 域内,所以拒绝原假设H0。可以得出结论:
在0.05的显著性水平下,抽样结果的平
– p<α,拒绝零假设 – p>α,不应拒绝零假设
举例1
• 某健身俱乐部主管经理估计会员的平均年 龄是35岁,研究人员从2005年入会的新 会员中随机抽取40人,调查得到他们的年 龄数据如下。
33 28 32 26 37 35 27 29 33 30 35 29 39 34 27 37 34 36 31 29 29 26 19 21 36 38 42 39 36 38 27 22 29 34 36 20 39 37 22 39
素有:总体方差已知还是未知,用于进行检验的
样本是大样本还是小样本,等等。
• 在本例中,由于n=40>30是大样本,所以 近似
服从正态分布,以样本标准差代替总体标准差, 所用的统计量是:
_
x
3.184
s/ n
③选取显著性水平,确定接受域和拒绝域
• 显著性水平(Significant Level):事先给定的形 成拒绝域的小概率,用表示。
(3)右单侧检验
两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,
右单侧检验的拒绝域位于统计量分布曲线的右侧。
④计算检验统计量的值
• 在提出原假设H0和备选假设H1,确定了检验统计 量,给定了显著性水平以后,接下来就要根据

【2019-2020年整理】管理统计学第3章--非参数假设检验

【2019-2020年整理】管理统计学第3章--非参数假设检验
Mann-Whitney秩和检验法(序号和检验法) 3.1.4 两个总体分布的非参数检验小结



实际问题中,经常要检验两种不同的 处理方法效果是否相同。 例如,比较在不同钻机、不同操作人 员、不同地质条件下,钻机效率是否相同 等等。
诸如此类问题是对两个总体的分布是 否相同的检验。本章主要介绍两种简单易 行的方法:“符号检验法”和“秩和检验 法”。
1, xi yi Ai 0, xi yi

于是 A=A1+A2+...+An服从二项分布

即,在H0:F(x)=G(y)的假设下,可以把抽样 过程看成一个近似的贝努利实验,服从B(m,p) 分布。
1. 小样本情况下,正负号个数检验法的处理 (方法一)


如果实际的“xi-yi>0 的个数n+”在(k1,k2)中,就接受H0:p=0.5 (即F(x)=G(y)),否则,拒绝H0,认为p≠0.5,即F(x)≠G(y)。
第3章 非参数假设检验(分布检验)

3.1 两个总体分布的非参数假设检验 3.1.1 检验两个总体的分布是否相同的第一种方法: 符号检验法(正负号个数检验法)

3.1.2 检验两个总体的分布是否相同的第二种方法:
Wilcoxon秩和检验法(序号和检验法)

3.1.3 检验两个总体的分布是否相同的第三种方法:
配对
得 实验组 分 对照组
1
2
3
4
5
6
7
8
9 10 11 12
X1 18 20 26 14 25 25 21 12 14 17 20 19 X2 14 20 23 12 29 18 21 10 16 13 17 25

统计学假设检验概念和方法

统计学假设检验概念和方法

临界值
H0值
计算出旳样本统计量
样本统计量
右侧检验旳P 值
抽样分布
置信水平
拒绝域
1 -
P值
H0值
临界值 计算出旳样本统计量
利用 P 值进行检验
(决策准则)
1. 单侧检验
– 若p-值 ,不拒绝 H0 – 若p-值 < , 拒绝 H0
2. 双侧检验
– 若p-值 /2, 不拒绝 H0 – 若p-值 < /2, 拒绝 H0
零假设总是一种与总体参数有关旳问题,所以 总是用希腊字母表达。有关样本统计量如样本 均值或样本均值之差旳零假设是没有意义旳, 因为样本统计量是已知旳,当然能说出它们等 于几或是否相等
提出原假设和备择假设
什么是备择假设?(alternative hypothesis) 1. 与原假设对立旳假设,也称“研究假设” 2. 研究者想搜集证据予以支持旳假设总是有不
(单尾和双尾)

z 检验
Z X 0 n
总体均值旳检验
(检验统计量)
总体 是否已知 ?

z 检验
Z X 0
Sn

样本容量 n

用样本标 准差S替代
检验
t X 0 Sn
总体均值旳检验
(2 已知或2未知大样本)
1. 假定条件
– 总体服从正态分布 – 若不服从正态分布, 可用正态分布来近似
– 右侧检验时,P-值为曲线上方不小于等于
检验统计量部分旳面积
3. 被称为观察到旳(或实测旳)明显性水平
– H0 能被拒绝旳 旳最小值
双侧检验旳P 值
/ 2 拒绝
1/2 P 值
/ 2 拒绝
1/2 P 值

3-3 非参数假设检验方法

3-3  非参数假设检验方法

,m
由前面的分析可以看出,选择皮尔逊统计量
cn2
i 1
m
N i npi 0
npi 0
m
2
2 k N 2 i n 或c n i 1 npi 0
拒绝域为
W { x : cn
2
( N i npi 0 ) c 2 (m 1)} npi 0 i 1
(2)计算概率
pi F0 (ai 1 ) F0 (ai ) P{ai X ai 1 }
并计算 npi ,称为理论频数。 (3)计算样本 x1 ,, xn 落在 (ai , ai 1 ]中的个数 Ni 称为实际频数。
(4)计算检验统计量的值
组数
2
( N i npi ) c npi i 1
i Ni Ai 0 1 A0 1 2 3 17 A3 4 5 6 9 A6 7 9 A7 8 2 A8 9 1 A9 10 2 A10 11 1 A11 12 0 A12 5 16 A1 A2 26 11 A4 A5
其中 N i 是观察到有 i 个 粒子的次数. 从理论上 e i 考虑 X 应服从泊松分布P X i i 0,1, 2, i! e i 问 PX i 是否符合实际?( 0.05) i!
2
例1 把一颗骰子重复抛掷 300 次, 结果如下:
出现的点数 1 2 3 4 5 6 出现的频数 40 70 48 60 52 30
试检验这颗骰子的六个面是否匀称? (取 0.05 )

根据题意需要检验假设
H0: 这颗骰子的六个面是匀称的. 1 (或 H 0 : P{ X i } ( i 1,2,,6)) 6 其中X表示抛掷这骰子一次所出现的点数 (可能值 只有6个),

非参数检验方法 PPT课件

非参数检验方法 PPT课件

对于符合参数统计分析条件者,采用 非参数统计分析,其检验效能较低
秩和检验
秩和检验(rank sum test):一类常用 的非参数统计分析方法;基于数据的秩次与 秩次之和
两独立样本差别的秩和检验 配对设计资料的秩检验 完全随机设计多组差别的秩和检验
两独立样本比较的秩和检验 Wilcoxon rank sum test
n1=8 T1=216 n2=7
21 26 24 27
T2=134
11.7 11.7 12.0 12.3 12.4 13.6
n3=9
14 15 16 16 20 25
T3=123.5
10.5 10.5 10.5 10.9 11.0 11.5
n4=8
6 7 9 10 12
T4=54.5
假设检验步骤
建立假设检验 • H0:四组鼠脾DNA含量的总体分布相同。 • H1:四组鼠脾DNA含量的总体分布位置不全相
第九章
非参数检验方法
参数统计
(parametric statistics)
已知总体分布类型,对 未知参数(μ、π)进 行统计推断
依赖于特定分布类 型,比较的是参数
非参数统计
(nonparametric statistics)
对总体的分布类 型不作任何要求
不受总体参数的影响, 比较分布或分布位置
适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
对于计量数据,如果资料方差相等,且服从 正态分布,就可以用 t 检验比较两样本均数。
如果此假定不成立或不能确定是否成立,就 应采用秩和时间(月)
无淋巴细胞转移
有淋巴细胞转移
时间
秩次
时间
秩次

管理统计学复习题

管理统计学复习题

管理统计学第一章绪论一、填空1、统计学发展经历了( )、( )和( )三个阶段。

2、依据“恩格尔法则”,家庭收入(),则饮食支出占家庭收入的百分比()。

3、统计学方法一般可以分为两类:()和()。

4、描述统计是指()。

5、推断统计是指()。

6、()用于衡量生活水平。

二、名词解释1、管理统计学2、统计学3、随机现象总体4、总体三、简答题1、统计学方法可以解决的主要问题有哪些?2、统计学的发展经历了哪些阶段?说明每个阶段的特点。

第二章数据收集方法一、填空1、数据来源分为()和()两种。

2、依据调查对象的不同,统计调查方式分为()和()。

3、全面调查主要有()和()。

4、非全面调查包括()、()、()、()、()及()等。

5、统计调查方法归纳起来可分为()和()两大类。

6、随机抽样类型包括()、()及()等。

7、非随机抽样类型包括()、()及()等。

8、误差分为()和()两大类。

9、非抽样误差包括()、()、()、()及()等。

二、名词解释1、抽样调查2、单纯随即抽样3、抽样误差三、简答题1、数据计量尺度分为哪几种?不同计量尺度各有什么特点?2、统计变量分类有哪些?统计数据有哪几种?3、抽样调查分为哪两类?各有什么特点?4、简述企业数据收集过程第三章描述数据的图表方法一、填空1、单变量定量数据的图形描述分为()和()两大类。

2、单变量定量数据的图形表示方法有()、()、()及()、()等。

3、多定量数据的的图形表示方法有()、()、()及()等4、比较具有相同分类且问题可比的定性数据的各样本或总体时,应用()。

5、描述同时产生的两个定性变量关系的最常用的两种方式为()和()。

6、()和()通过反映频数分布表的内容,来描述定性数据。

7、累积频数分布图通过反映累积频数分布表的内容来描述()。

二、简答题及绘图1、简述频数分布表的编制过程。

2、什么是茎叶图?有什么特点?习题3-1、3-3第四章描述统计中测度一、填空1、集中趋势的度量有()和()。

管理统计SPASS 非参数假设检验

管理统计SPASS 非参数假设检验

表7-1 参数检验和非参数检验的效率比较
对正态总体的 非参数检验的 效率评价
应用
参数检验பைடு நூலகம்
非参数检验
配对样本数据
t检验或者z检验
符号检验 Wilcoxon检验
Wilcoxon检验 K-W检验 秩相关检验 游程检验
0.63 0.95
0.95 0.95 0.91 没有可比较的基础
两个独立样本 多个独立样本 相关 随机性
• Step03:选择期望值 在【Expected Values(期望值)】选项组中点选【Values 】单选钮,以指定期望概率值。接着在Values的文本框中分 别输入0.8、0.05和0.15这三个数值,并且单击【Add】按钮 加以确定。 • Step04:完成操作 最后,单击【OK(确定)】按钮,操作完成。
t检验或者z检验 方差分析(F检验) 线性相关 无可用的参数检验
7.2
卡方检验
1.使用目的 卡方检验(Chi-Square Test)也称为卡方拟合优度检验, 是K.Pearson给出的一种最常用的非参数检验方法。它用于 检验观测数据是否与某种概率分布的理论数值相符合,进 而推断观测数据是否是来自于该分布的样本的问题。 2.基本原理 H 0 样本X来自的 进行卡方检验时,首先提出零假设: 总体分布服从期望分布或某一理论分布。接着,利用实际 观测值的频数与理论的期望频数之间的差异来构造检验统 2 c 计量 ,它描述了观察值和理论值之间的偏离程度。
二项分布检验基本思想
SPSS二项分布检验,在小样本中采用精确检验方法,对 于大样本则采用近似检验方法。 精确检验方法计算n次试验中成功出现的次数小于等于x 次的概率,即
P{ X x} Cni pi q ni

统计学--第三章总体均数的估计与假设检验

统计学--第三章总体均数的估计与假设检验
第三章
总体均数的估计 与假设检验
课件
1
统计推断的目的:
用样本的信息去推论总体。
医学研究中大多数是无限总体, 即使是有限总体,但也经常受各种条 件的限制,不可能直接获得总体的信 息。
课件本科生卫生学(5)
2
第一节 均数的抽样误差与标准误
• 抽样误差(sampling
error):因各样本 包含的个体不同,所得的各个样本统计量 (如均数)往往不相等,这种由于个体差 异和抽样造成的样本统计量与总体参数的 差异,称为抽样误差。
均数的95%可信区间为3.47~ 3.81(mmol / L) 95%参考值范围为1.29~ 5.99(mmol / L)
S 1.20 X u / 2 S X X 1.96 3.64 1.96 n 200 (3.47, 3.81)
X 1.96S 3.64 1.961.20 (1.29, 5.99) 32 课件本科生卫生学(5)
t分布的应用: 总体均数的区间估计 t检验
课件本科生卫生学(5) 18
第三节 总体均数的置信区间估计 confidence interval
可信区间的概念 总体均数可信区间的计算 均数可信区间与参考值范围的区别
课件本科生卫生学(5)
19
一、可信区间的概念
统计推断:参数估计与假设检验。 参数估计: parametric estimation,用样本统 计量估计总体参数的方法。 点(值)估计:point estimation,直接用样 本统计量作为总体参数的估计值。方法简 单但未考虑抽样误差大小。 区间估计:interval estimation,按预先给定 的概率95%,或(1-),确定的包含未知总 体参数的可能范围。考虑了抽样误差。

管理统计学复习资料

管理统计学复习资料

1、统计学方法可以解决的主要问题有哪些?1)现状的客观描述(如不同状况的百分比、均值)2)均值、方差、百分比等统计值是否有本质区别(随机差异?本质差异?)3)依据样本推断总体的概率分布是什么4)依据数据找出问题的显著因素与关键因素5)寻找变量的相互关系(相关关系)6)寻找变量间的数量规律7)依据规律把变量分为具有某些共同特性的类别8)依据已有规律,判别新数据属于哪个类别等。

2、统计学的发展经历了哪些阶段?说明每个阶段的特点.1)古典统计学时代:政治算术派国势学派2)近代统计学时代:数理统计学派社会统计学派3)现代统计学时代:区间估计理论假设检验理论1、数据计量尺度分为哪几种?不同计量尺度各有什么特点?答:一、定类尺度二、定序尺度三、定距尺度四、定比尺度A定类尺度特点:(1)定类尺度是最粗略、计量层次最低的计量尺度。

(2)定类尺度作为代码的数值不反映各类的优劣、量的大小或顺序,不可以区分大小或进行任何数学运算.(3)对定类尺度的计量结果,可以计算每一类或组中各元素或个体出现的频数.B、定序尺度的特点:(1)定序尺度可以将研究对象分为不同的类别,而且可以反映各类的优劣、量的大小或顺序.(2)定序尺度比定类尺度精确一些,但只是测度了类别之间的顺序,而未测量出类别之间的精确差值.(3)计量结果只能比较大小,不能进行加、减、乘、除.C、定距尺度特点:(1)定距尺度不但可以用数字表示现象各类别的不同和顺序大小的差异,还可以用确切的数值反映现象之间在量方面的差异。

(2)反映现象规模水平的数据必须以定距尺度计量,例如产品产量、人口数、国内生产总值等(3)结果可以进行加减。

D、定比尺度的特点:(1)反映现象的结构、比重、速度、密度等数量关系(2)定比尺度的计量结果可以进行加、减、乘、除等数学运算2、统计变量分类有哪些?统计数据有哪几种?统计变量定类变量、定序变量、数字变量;统计数据有定类数据、定序数据、定距数据和定比数据.定类变量的值就是定类数据;定序变量的值就是定序数据;数字变量的值即为定距数据或定比数据(这两者统称为定量数据)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

单位:次/分钟
6 78 56 58 47 55 54 45
这两组观察数据即为配对样本。
h
8
例:现有18名学生按身体条件大体相近配成 9对,并用随机分组将他们分为甲、乙两组, 由一位教师采用不同的教法执教一年,一年 后测得她们的平衡术成绩(见下表),问两 种不同教法的效果是否有显著差异?
一年后甲、乙两组平衡术成绩表
由表可知,n+=7, n-=3,于是,m=n++n-=10。将n+和 n-中的较小者记为K,K=3。 (3)统计推断
根据m=10,查符号检验表找临界值,K0.05(10)=1, 而K> K0.05(10),不显著。即,接受原假设,认为:
颜色教学无显著效果。
配对
1 2 3 4 5 6 7 8 9 10 11 12
h
2
3.1 两个总体分布的非参数假设检验
h
3
3.1.1 检验两个总体的分布是否相同的第一 种方法:符号检验法(正负号个数检验法)
配对样本
h
4
配对样本的概念及属性
配对样本:按某些重要特征相近的原 则,可将两样本中的每一个体配成对 子,这两组样本称为配对样本。
配对样本的属性:
1)两样本的观察数量应相同;
3.1.4 两个总体分布的非参数检验小结
h
1
实际问题中,经常要检验两种不同的处 理方法效果是否相同。
例如,比较在不同钻机、不同操作人员、 不同地质条件下,钻机效率是否相同等等。
诸如此类问题是对两个总体的分布是否 相同的检验。本章主要介绍两种简单易行 的方法:“符号检验法”和“秩和检验法”。
第3章 非参数假设检验(分布检验)
3.1 两个总体分布的非参数假设检验
3.1.1 检验两个总体的分布是否相同的第一种方法: 符号检验法(正负号个数检验法)
3.1.2 检验两个总体的分布是否相同的第二种方法: Wilcoxon秩和检验法(序号和检验法)
3.1.3 检验两个总体的分布是否相同的第三种方法: Mann-Whitney秩和检验法(序号和检验法)
配对
1 2 3 4 5 6 7 8 9 10 11 12
得 分
实验组
X1
18
20
26
14
25 25
21 12
14
17
20
19
对照组 X2 14 20 23 12 29 18 21 10 16 13 17 25
h
16
解:(1)建立假设。H0 :颜色教学无显著效果; H1 :颜色教学有显著效果
(2)求差数并记符号,差值计算列于下表。
2)两样本观察顺序不能各自独立地 颠倒。
h
5
配对样本可以是同一研究对象分别给 于两种不同处理的效果比较的观察值; 或,同一研究对象处理前后的效果比 较的观察值。
h
6
配对样本示例
例:某种干电池,在一定温度下存放之 后它的电压有可能升高也可能降低。我 们取10个样品做实验。数据如下:
编号 1 2 3 4 5 6 7 8 9 10 存前电压 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 存后电压 1.9 1.8 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0
得 分
实验组
X1
18
20
26
14
25 25
21 12
14
17
20
19
对照组 X2 14 20 23 12 29 18 21 10 16 13 17 25
差数符号 + 0 + + - + 0 + - + + -
h
17
练习∶
某研究测定了噪声刺激前后15只羊的心率,结果 见下表。问噪声对羊的心率有无显著影响? 已知, K0.05(15)=3 , K0.01(15) = 2 。
检 验 的 统 计 量 为 K , K 为 n+ 、 n- 中 的 较 小 者 , 即
K=min{n+,n-}
h
13
(3)统计推断
由m查表得临界值K0.05(m),K0.01(m),作统计推断: 如果K>K0.05(m),即P>0.05,则不能否定HO,
两个试验处理差异Байду номын сангаас显著;
如果K0.01(m)<K≤K0.05(m),即0.01<P≤0.05,则否 定HO,接受H1,两个试验处理差异显著;
yi yi
A=A1+A2+...+An服从二项分布
即,在H0:F(x)=G(y)的假设下,可以把抽样 过程看成一个近似的贝努利实验,服从B(m,p)
分布。
h
10
h
11
1. 小样本情况下,正负号个数检验法的处理 (方法一)
如果实际的“xi-yi>0 的个数n+”在(k1,k2)中,就接受 H0:p=0.5(即F(x)=G(y)),否h 则,拒绝H0,认为p≠0.5,即 12 F(x)≠G(y)。
1. 小样本情况下,正负号个数检验法的处理 (方法二)
(1)建立假设
零假设H0 : F(x)G(y) 备择假设H1 :F(x)G(y)
(2)计算差值d并赋予符号
d=xi-yi
d>0,记为“+”,总个数记为n+
d<0,记为“-”, 总个数记为n-
d=0, 记为“0”, 总个数记为n0
m= n++ n-
配对号 1 2 3 4 5 6 7 8 9 甲 组 8.7 9.3 8.2 9.0 7.6 8.9 8.1 9.5 8.4
乙 组 7.8 8.2 8.4 8.1 7.9 8.0 8.2 8.1 6.8
这两组观察数据即为配对样本。
h
9
令xi>yi的事件为Ai ,其取值为1,0
于是
Ai
10,,xxii
这两组观察数据即为配对样本。
h
7
例:为了探索长跑对学生体质发展的影响, 随机抽取同年龄男生8名,经5个月长跑训 练,观测训练前、后心脏功能是否有所增强, 用晨脉这个指标来反映,训练前、后的晨脉 测试结果如下表,问长跑对晨脉的影响有无 显著意义?
训练前、后晨脉数据表
编号 1 2 3 4 训练前 70 66 56 63 训练后 48 54 52 62
如果K≤K0.01(m),即P≤0.01,则否定HO,接受H1,
两个试验处理差异极显著。
h
14
符号检验统计判断规则
K与临界值的比较
P值
显著性
K> K0.05(m)
K0.01(m)<K≤K0.05(m)
K≤K0.01(m)
P>0.05 0.01<P≤0.05
P≤0.01
不显著 显著
极显著
h
15
例:研究人员将三岁儿童经配对而成的 实验组进行颜色试验教学,对照组不进 行此种教学。后期测验得分如下表。问 颜色教学是否有显著效果?已知K0.05(10)=1。
相关文档
最新文档