两样本数据模型

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

将肿瘤重量从小到大排列为:
• 秩 • 组 0.94 1.15 1.20 1.30 1.56 1.63 1.87 2.20 2.26 1 2 3 4 5 6 7 8 9 X X Y Y X Y Y Y Y
Wx 1 2 5 8
Wy 3 4 6 7 8 9 37
Z W y ( N 1)n / 2 mn( N 1) / 12 ~ N (0,1)
②:有节点
例题:我国沿海和非沿海省市区的人均GDP的中位数是否 一样,这就是检验两个总体的位置参数是否相等的问题?
Leabharlann Baidu
WY=180,WXY=9, 对于H1:WX>WY,P—值为0.000012。
对于H1:WX≠WY,P—值为单边检验的两倍。
• 根据前面的基本原理,检验统计量为 Wy Y的秩和 • Wx X的秩和 • 由于X、Y的混合序列的等级和为:
Wx Wy N ( N 1) / 2
等价的统计量:
做出决策:
大样本近似统计量:
①:无节点
Z Wxy mn / 2 mn( N 1) / 12 ~ N (0,1)
若大部分的y大于x,或大部分的x大于y,将不能证实这个有 序的序列是一个随机的混合,将拒绝零假设;
在x、y的混合排列中,等级1是最小的观察值,等级N是最大 的,若x的等级大部分大于y的等级,那么数据将支持H1:Mx>My, 而x的等级大部分小于y的等级,则数据将支持H1:Mx<My。
Mann-Whitney秩和检验
第三章 两样本位置模型
• 在单样本位置问题中,人们想要检验的是总体的 中心是否等于一个已知的值 • 但在实际问题中,更受注意的往往是比较两个总 体的位置参数; • 比如:两种训练方法中哪一种更出成绩 两种汽油中哪一个污染更少 两种市场营销策略中那种更有效等.
• 例:我国沿海和非沿海省市区的人均(GDP)的1997 年抽样数据.沿海省市区为(X1,X2,…,X12): 15044 12270 5345 7730 22275 8447 8136 6834 9513 4081 5500 • 而非沿海的为(Y1,Y2,…,Y18): • 5163 4220 4259 6468 3881 3715 4032 5122 4130 3763 2093 3715 2732 3313 2901 3748 3731 5167 • 这就是检验两个独立总体的位置参数是否相等的 问题.
中位数为:13.5
H1 : M X M Y
>Mxy <Mxy 总和
X 9 3 12
Y 2 8 10
总和 11 11 22
9 2 10 1 11 0 11 P( A 9) (C12 C10 C12 C10 C12 C10 ) / C22
(220 * 45 66 *10 12) / 705432 0.014987
总体容量:30 样本容量:12
总体中成功的次数:15 样本中成功的次数:11
P( A a ) = P( A 11 ) p( A 12 )
=0.000237+0.00000526=0.000242
• 正态近似统计量
Z

A 0.5 mt / N mnt( N t ) / N
由m=3,n=6查表可得p=0.048<0.05,因而拒绝原假 设,即9只白鼠的药物实验结果表明,在5%的显著性 水平下,该抗癌药物对控制肿瘤有效。
练习
两独立样本SPSS实现
1、Brown-Mood 中位数检验(假设、检验原理、检验统计 量、决策) 例P65/1: 输入数据,如图所示
• 结果:
• 假定代表两个独立总体的随机样本(X1,X2,…, X12)和(Y1,Y2,…,Y18),则问题归结为检验它们 总体的均值(或中位数)的差是否相等,或是否等于 某个已知值.换言之,即检验
在正态假定下,这些问题化为:
t ( x y ) D0 1 1 s n m ~ t (n m 2)
S
2 ( x x ) ( y y ) i i 2 i 1 i 1 n m
mn2
3.1 Brown-Mood 中位数检验
例:沿海地区的人均GDP的中位数为MX,而内 地的为MY,检验两地GDP是否相同?
M xy
显然,在零假设下,中位数如果一样的话,它们共同的中位数, 即这(12十18)=30个数的样本中位数(记为 M xy ),应该对于每一 列数据来说都处于中间位置.也就是说,(X1,X2,…,X12) 和(Y1,Y2,…,Y18)中大于或小于 M xy 的样本点应该大致一样 多,计算他们的混合样本中位数为4690.5。在用两个样本和 M xy 比较之后得到各个样本中大于和小于它的数目
3
A 0.5 12*15 / 30 12*18*15*(30 15) / 30
3
=4.5/1.34=3.36
p p( Z 3.36 ) 0.00039
• 例:有22名职工,其中的12名职工来自企业1,另外
的10名职工来自企业2,他们的工资如下(千元): • 企业1:11 12 13 14 15 16 17 18 19 20 40 60 • 企业2:3 4 5 6 7 8 9 10 30 50
3.2 Wlicoxon(Mann-Whitney)秩和检验
H0 : M x M y H0 : M x M y H0 : M x M y
如果H0为真,那么将m个x、n个y数据,按数值的相对大小 从小到大排序,x、y的值应该期望被很好地混合,这m十n=N 个观察值能够被看作来自于共同总体的一个单一的随机样本;
应用
某种药物对治疗肿瘤是否有效
选择9只白鼠,作为抗癌药物筛选的对象。9只白鼠的基 本条件相同,同时注射致癌物。然后随机选取其中3只 进行抗癌药物处理。肿瘤的重量是检验药物有效性的一 个指标。经过一个固定的时间周期后,将9只白鼠的肿 瘤割除称重,结果如下(单位:kg) 处理组(X) 0.94 1.56 1.15 控制组(Y) 1.20 1.63 2.26 1.87 2.20 1.30
相伴概率为0.414>0.05,说明 两组样本均值不存在显著差异.
2、WMW(假设、检验原理、检验统计量、决策)
例P65/1:
Z统计量为-1.86,相伴概率为 0.06>0.05,说明两组样本均 值不存在显著差异.
3.3
Cohen’s Kappa 系数
相关文档
最新文档