王静龙定性数据分析第四章二维列联表答案.
定型数据分析论文
评分表
题目:探讨大学生是否是党员对智育成绩高能入党的看法
学号:xxxx 姓名:xxxx
评分标准
项目要求分值得分
写作1.题目恰当
2.摘要书写合理、规范10
3.图表,公式规范
4.引用,注释规范
10 5.文章书写结构合理,语言流畅,
结构完整。无错别字
30
内容6.观点合理10
7.分析方法,手段合理恰当。30
8.结论可信10
合计100
定性数据分析期末论文
题目:探讨大学生是否是党员对智育成绩高能入党的看法班级:xxx级数学与应用数学xxx班
姓名: xxx
学号: xxx
探讨大学生是否是党员对智育成绩高能入党的看法
摘要
1、目的
为了更好的建立党员与群众之间的关系,党员与党员之间的关系,从而更科学更具体的发展我们系的党员。我们通过调查2011级四个班的学生们对是否是党员与对智育成绩高能入党的看法。通过这个调查了解同学们的心声,听听她们的意见。
2、方法
通过对2011级四个班的同学进行发问卷的形式进行调查,了解他们对智育成绩高能否入党的看法,并对这个数据进行收集整理分析,其中对数据进行分层与压缩处理,其中压缩包括层压缩,行压缩,列压缩,分别用Excel和spss软件,把数据表示成直观的图表表示和数据处理结果的直观显示。
3、结果
通过对2011级四个班的同学进行问卷调查,并对数据进行分析处理结果如下:
G=5986 H=3682
Kendall T系数T=0.1533 se(T)=0.4417 U=T/se(T)
=0.3471
P=P(N(0,1)
≥0.3471)≈0
Gamma系数r=0.2383 se(r)=0.6992 U=r/ se(r)
王静龙《非参数统计分析》教案
王静龙《非参数统计分析》(1-8
章)教案(总77页)
--本页仅作为文档封面,使用时请直接删除即可--
--内页可以根据需求调整合适字体及大小--
.引言
一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。 例如:分析下面的供应商的产品是否合格?
合格产品的标准长度为(±),随即抽取n=100件零件,数据如下:
表
经计算,平均长度为cm x 4958.8=,非常接近中心位置,样本标准差为
()
1047.011
2
=--=
∑=n
i i n x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。
%
66)
1047.04958.84.8()1047.04958.86.8()
4.8()6.8()6.84.8(≈-Φ--Φ=-Φ--Φ=≤≤σ
μσμX P
这说明产品有接近三分之一不合格,三分之二合格,所以需要更换供应厂 商,而用非参数分析却是另外一个结果。 以下是100个零件长度的分布表:
这说明有90%的零件长度在)2.05.8(±cm 之间,有9%的零件不合格,所以工厂不需要换供应商。
例2 哪一个企业职工的工资高? 表两个企业职工的工资
显然,企业1职工的工资高,倘若假设企业1与企业2的职工工资分别服从正态分布),(),,(22σσb N a N ,则这两个企业职工的工资比较问题就可以转化为一个参数的假设检验问题,原假设为b a H =:0,备择假设为b a H >:0 则 ))11(,(~2σn
统计学课后习题答案第四章动态数列
第四章动态数列
、单项选择题
1 .下列动态数列中属于时点数列的是
A.历年在校学生数动态数列
B.历年毕业生人数动态数列
C.某厂各年工业总产值数列
D.某厂各年劳动生产率数列
2 .构成动态数列的两个基本要素是
A.主词和宾词
B.变量和次数
C.分组和次数
D.现象所属的时间及其指标值
3 .动态数列中各项指标数值可以相加的是
A.相对数动态数列
B.平均数动态数
列
C.时期数列
D.时点数列
4.最基本的动态数列是
A.指数数列
B.相对数动态数
列
C.平均数动态数列
D.绝对数动态数
列
5.动态数列中,指标数值的大小与其时间长短没有直接关系的
A.时期数列
B.时点数列
C.相对数动态数列
D.平均数动态数列
6.动态数列中,指标数值是经过连续不断登记取得的数列是
A.时期数列
B.时点数列
C.相对数动态数列
D.平均数动态数列
7 .下列动态数列中属于时期数列的是
A.企业历年职工人数数列
B.企业历年劳动生产率数列
C.企业历年利税额数列
D.企业历年单位产品成本数列
8 .动态数列中,各项指标数值不可以相加的是
A.相对数动态数列
B.绝对数动态数列
C.时期数列
D.时点数列
9.动态数列中,指标数值大小与其时间长短有关的是
A.相对数动态数列
B.绝对数动态数列
C.时期数列
D.时点数列
10.动态数列中,指标数值是通过一次登记取得的数列是
A.相对数动态数列
B.绝对数动态数列
C.时期数列
D.时点数列
11.编制动态数列的最基本原则是保证数列中各项指标必须具有
A.可加性
B.可比性
C.连续性
D.一致性
12 .基期为某一固定时期水平的增长量是
A.累计增长量
B.逐期增长量
第三,4章参考答案
第三章参考答案
一、选择题
1. C)
2. A)
3. D)
4. B)
5. D)
6. A)
7. D)
8. B)
9. D) 10. C)
11. C) 12. B) 13. A) 14. C) 15. A)
16. A) 17. C) 18. D) 19. A) 20. C)
21. B) 22. A) 23. D) 24. C) 25. D)
26. A) 27. B) 28. B) 29. C) 30. B)
31. D) 32. C) 33. B) 34. A) 35. A)
36. B) 37. D) 38. C) 39. C) 40. B)
41. C) 42. B) 43. C) 44. B) 45.C)
46. A) 47. B) 48. B) 49. D) 50. D)
51. B) 52. C) 53. A) 54. C) 55. D)
56. A) 57. D) 58. C) 59. B) 60. C)
61. A) 62. B) 63. B) 64. C) 65. B)
66. D) 67. C)
二、填空题
1. 11.25
2. 字段变量, 内存变量
3. OXBAS
4. FOXBASE
5. (年龄>60 OR年龄<30) AND 职称=”工程师”
6. .F.
7. .F
8. 18
9. 11 10. 2010 11. 15
12. visual foxpro 数据库管理系统13. = =, $
14. 字符型常量, 数值型常量15. x^2+(x+2)/(y-8)
16. .F. 17. 15,m(2, 5) 18. 0
第4章 二维列联表
ln mij ln i ln j
这就是对数线性模型(第7章)。
不完备列联表
当某些nij=0时,称这些格为空格;有空格的列联 表称为不完备的列联表。
对于一般完备列联表讨论独立性,对不完备列联 表讨论拟独立性。
二维列联表的独立性检验
二维列联表独立性检验实质上是带参数的 分类数据的检验问题。
二维列联表的独立性检验
【例4.1】为了解男性和女性对三种啤酒的偏 好差异分别调查了1353个男性和636个女性, 结果见表:
问男性与女性对啤酒的偏好是否有显著差异。
二维列联表的独立性检验
通过计算检验统计量的值得到:
独立性与齐性
ห้องสมุดไป่ตู้
如果对任意的i和j,都有:pi j pi p j,则称 属性A与B独立。
如果A与B独立,则对任意j都与i无关
p1 j p1
prj p1 j pr p1
prj pr
p j
如果A与B独立,则对任意i都与j无关
pi1 p1
pic pi1 pc p1
果见表:
问:他们的检验结果是否一致?
一致性的度量
在二维列联表的相合性度量中,当除从左上角到 右下角的对角线元素外其余都为0时,两种属性完 全正相合。
定性数据统计分析第3章四格表
• 可以发现修正后的U值比原来的3.1086小,检验的 P-值为0.002428,比原来的0.00094要大。 • 由费歇尔精确检验知(见双侧给定时的检验),修正 后的U统计量更接近真实值0.002467,说明连续性 修正后的近似程度更好。
单侧给定四格表的似然比检验
• 在单侧给定情况下,根据原假设p1=p2以及 似然函数,可以得到独立性检验的似然比 统计量:
• 于是,令p1=p2=p,进行线性变换(见附录5) 有: n /n n /n
U ˆ p
11 1 21 2
p (1 p )(1 / n1 1 / n2 ) n11 n21 n1 n2 n1
~ N (0,1),其中:
n1 n11 n2 n21 n1 n2 ˆ ˆ p1 p2 n n n1 n n2 n n
– 其中,a1,a2和b1,b2分别是属性A和B的分类(取值)
• 当A与B不相关时,有: p11 p1 p1 0 pij pi p j 0
• 可见,四格表中属性A与B无关也就是相互独立。
属性之间独立与不相关
• 在协方差的基础上,不难计算出随机变量X(A)和 Y(B)的方差,并得到它们的相关系数。 • 各自方差分别为: 2
2
Байду номын сангаас 结构0与抽样0
• 四格表中出现0时,有两种情况:
SAS-属性数据分析
死亡人数限为1555,划归两类城市 水硬度设定39,划归硬度高低两类城 市;进一步做列联表分析 /chisq 添加卡方独立性检验选项 tables后指定行变量和列变量,两者 用星号分开。
上海Βιβλιοθήκη Baidu经大学统管院
数据集water-mortal与hardness关联分析
上海财经大学统管院
Sandflies
25 5
3 50
上海财经大学统管院
Kappa统计量(一致性检验)
data x_ray; input radiologist_1 $ radiologist_2 $ count; datalines; no no 25 no yes 3 yes no 5 yes yes 50 ; proc freq data=x_ray; title ‘ computing coefficient kappa for two observers’; tables radiologist_1*radiologist_2 / agree; weight count; 由结果,kappa统计量为0.7881, run; 表示中等的一致性程度。
定性数据分析
• 数据描述
沙蝇低空和高空捕捉数与雌雄关系、槐蚁入侵与槐树品种关系、 机器不同方位活塞环失效数与方位关系、血凝块病人控制前后 是否继续口服某药物研究、印度不同地区口腔疾病分布研究和 支气管炎与空气颗粒含量关系研究。
王静龙定性数据分析 习题五
王静龙定性数据分析习题五
1. 问题描述
在定性数据分析中,王静龙遇到了一个问题,他想要了解
一份调查问卷中的开放性问题的回答情况。具体而言,他想要回答以下几个问题:
1.开放性问题的回答内容的总体情况如何?
2.开放性问题的回答内容中是否存在一些常见的关键
词或主题?
3.开放性问题的回答内容中是否存在一些特定的意见
或情感?
为了解决这个问题,王静龙希望能够进行数据分析,并得
出一些有用的结论。
2. 数据准备
首先,王静龙需要准备调查问卷中开放性问题的回答数据。这些数据可以以文本文件的形式存储,每一行代表一个回答。
例如,以下是一些示例数据:
1. 我觉得工作环境很好,同事们相互合作,给了我很多帮助。
2. 公司的培训计划很好,能够提高员工的技能和知识。
3. 我对公司的管理方式有一些不满意,希望能够改进。
4. 薪资待遇不够优厚,希望能够有所提升。
5. 我觉得公司的发展前景很不错,希望能够有更好的发展空间。
3. 数据分析
3.1 总体情况分析
为了了解开放性问题的回答内容的总体情况,王静龙可以
进行以下分析:
•回答的总数
•回答的平均长度
•回答的最长长度
•回答的最短长度
为了实现这些分析,可以使用Python编程语言中的文本处理库进行操作。下面是一个示例代码,可以帮助完成上述分析:
```python # 导入所需的库 import pandas as pd 读取文本文件
data = pd.read_csv(’responses.txt’, header=None)计算回答的总数
total_responses = len(data)
王静龙非参数统计分析课后计算题参考答案Word版
王静龙《非参数统计分析》课后习题计算题参考答案
习题一
1.One Sample t-test for a Mean Sample Statistics for x
N Mean Std. Dev. Std. Error -------------------------------------------------
26 1.38 8.20 1.61 Hypothesis Test
Null hypothesis: Mean of x = 0 Alternative: Mean of x ^= 0
t Statistic Df Prob > t --------------------------------- 0.861 25 0.3976
95 % Confidence Interval for the Mean
Lower Limit: -1.93 Upper Limit: 4.70
则接受原假设认为一样
习题二
1.描述性统计
习题三
1.1
{}+01=1339
:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957
S n H me H me P S +==<≤
另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数
*
**0*0+1inf :2BINOM.INV(39,0.5,0.05)=14
1sup :113
2S 1313
n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪
定性数据分析第五章课后答案
定性数据分析第五章课后作业
1、为了解男性和女性对两种类型的饮料的偏好有没有差异,分别在年青人和老
年人中作调查。调查数据如下:
试分析这批数据,关于男性和女性对这两种类型的饮料的偏好有没有差异的问题,你有什么看法?为什么?
解:(1)数据压缩分析
首先将上表中不同年龄段的数据合并在一起压缩成二维2×2列联表1.1,合起来看,分析男性和女性对这两种类型的饮料的偏好有没有差异?
表1.1 “性别×偏好饮料”列联表
二维2×2列联表独立检验的似然比检验统计量Λ
2的值为0.7032,p值
-ln
为05
≥
=
=χ
p,不应拒绝原假设,即认为“偏好类型”
(2>
P
4017
.0
)1(
)
.0
7032
.0
与“性别”无关。
(2)数据分层分析
其次,按年龄段分层,得到如下三维2×2×2列联表1.2,分开来看,男性和女性对这两种类型的饮料的偏好有没有差异?
表1.2 三维2×2×2列联表
在上述数据中,分别对两个年龄段(即年青人和老年人)进行饮料偏好的调查,在“年青人”年龄段,男性中偏好饮料A 占58.73%,偏好饮料B 占41.27%;女性中偏好饮料A 占58.73%,偏好饮料B 占41.27%,我们可以得出在这个年龄段,男性和女性对这两种类型的饮料的偏好有一定的差异。同理,在“老年人”年龄段,也有一定的差异。 (3)条件独立性检验
为验证上述得出的结果是否可靠,我们可以做以下的条件独立性检验。 即由题意,可令C 表示年龄段,1C 表示年青人,2C 表示老年人;D 表示性别,1D 表示男性,2D 表示女性;E 表示偏好饮料的类型,1E 表示偏好饮料A ,2E 表示偏好饮料B 。欲检验的原假设为:C 给定后D 和E 条件独立。
第四章 定性数据4.14.2
相互独立的定义 如果对任意的i=1, …,r和j=1, …,c都有 pij=pi+p+j, 则称属性A和属性B独立。
在属性A和属性B相互独立时
p1 j p1
表4.3 男性和女性饮酒者对三种啤酒的偏好的观察频数
这是2×3,单侧1353和636固定。所以男性和女性对这三种 类型啤酒的偏好比例的计算是有意义的。
表4.4男性和女性饮酒者对三种啤酒的偏好的比例 啤酒偏好 淡啤酒 男 女 性 26.0% 性 46.1% 普通啤酒 21.0% 20.9% 黑啤酒 53.0% 33.0% 100% 100% 合计
prj pr
p j
在Ai类的个体中属于Bj类的条件概率
pi (B1, …,Bc)在每个Ai类中具有相同的分布, 这时我们称属性A和属性B有齐性关系。
P( B j Ai )
pij
与i无关
在属性A和属性B有齐性关系时
p1 j p1
prj pr
p1 j prj p1 pr
p j
从而对所有的i=1, …,r和j=1, …,c都有 pij=pi+p+j,
这说明属性A和属性B独立。 由此,齐性和独立性等价。 通常将二维r×c列联表中两个属性无关理解为它们有齐性关系, 则属性无关和属性独立等价。
定性数据分析
二语中的复数使用 (Gass & Selinker, 2008)
(3-10) Many people have ideas about Jeddah and other cities located in Saudi Arabia. (3-11) When he complete nine month . . . (3-12) He can spend 100 years here in America. (3-13) There are about one and half-million inhabitant in Jeddah. (3-14) How many month or years have been in his mind? (3-15) There are many tents—and goats running around. (3-16) There are two mountains. (3-17) How many hour? (3-18) There are more than 200,000 telephone lines. (3-19) Every country had three or four kind of bread.
7
基于(3-1)的规则1
(3-1) There are also two deserts. Rule 1: When a noun is modified by a plural numeral or a quantitative word, the plural marker –s is added to that noun. Pattern Example Pl. num./quan. w. + Ns two deserts Rule 1 applies to: (3-6) (3-10) (3-12) (3-15) (3-18) four days Many people 100 years many tents 200,000 telephone lines
自考数据库系统原理 第四章 关系运算 课后习题答案
自考数据库系统原理第四章关系运算课后习题答案
2009-09-15 10:45
4.1 名词解释
(1)关系模型:用二维表格结构表示实体集,外键表示实体间联系的数据模型称为关系模型。
(2)关系模式:关系模式实际上就是记录类型。它的定义包括:模式名,属性名,值域名以及模式的主键。关系模式不涉及到物理存储方面拿枋觯 鼋鍪嵌允 萏匦缘拿枋觥?
(3)关系实例:元组的集合称为关系和实例,一个关系即一张二维表格。
(4)属性:实体的一个特征。在关系模型中,字段称为属性。
(5)域:在关系中,每一个属性都有一个取值范围,称为属性的值域,简称域。
(6)元组:在关系中,记录称为元组。元组对应表中的一行;表示一个实体。
(7)超键:在关系中能唯一标识元组的属性集称为关系模式的超键。
(8)候选键:不含有多余属性的超键称为候选键。
(9)主键:用户选作元组标识的一个候选键为主键。(单独出现,要先解释“候选键”)
(10)外键:某个关系的主键相应的属性在另一关系中出现,此时该主键在就是另一关系的外键,如有两个关系S和SC,其中S#是关系S的主键,相应的属性S#在关系SC中也出现,此时S#就是关系SC的外键。
(11)实体完整性规则:这条规则要求关系中元组在组成主键的属性上不能有空值。如果出现空值,那么主键值就起不了唯一标识元组的作用。
(12)参照完整性规则:这条规则要求“不引用不存在的实体”。其形式定义如下:如果属性集K是关系模式R1的主键,K也是关系模式R2的外键,那么R2的关系中, K的取值只允许有两种可能,或者为空值,或者等于R1关系中某个主键值。这条规则在使用时有三点应注意: 1)外键和相应的主键可以不同名,只要定义在相同值域上即可。 2)R1和R2也可以是同一个关系模式,表示了属性之间的联系。 3)外键值是否允许空应视具体问题而定。(13)过程性语言:在编程时必须给出获得结果的操作步骤,即“干什么”和“怎么干”。如Pascal和C语言等。
ch3-属性数据分析
Sandflies
上海财经大学统管院
Sandflies
上海财经大学统管院
Acacia Ants
data ants; input species $ invaded $ n;
datalines; A no 2 A yes 13 B no 10 B yes 3 ; run;
刺槐(A 或B),是否被蚁群侵入, 侵入的种群数目
数据归类处理-以water为例
data water; */
/* Chapter 3
set water; /* having created the water
data set as above for chapter 2 */ mortgrp=mortal > 1555; hardgrp=hardness > 39; run;
tables sex*height /chisq riskdiff;
weight n; run;
按雌雄、捕捉高度和捕捉数目录入
riskdiff计算行变量各类比重差-(基 于二项分布)此处计算雌蝇和雄 蝇在低空和高空所占比重是否有 差异的检验。
使用weight语句表示重复数的变量为 n。如果为原始基本情况的数据, 则不需要weight语句。
deviation:输出格子估计的残差 cellchi2:输出格子贡献的卡方值
统计学第四章课后题及答案解析
第四章
一、单项选择题
1.由反映总体单位某一数量特征的标志值汇总得到的指标是()
A.总体单位总量
B.质量指标
C.总体标志总量
D.相对指标
2.各部分所占比重之和等于1或100%的相对数()
A.比例相对数 B.比较相对数 C.结构相对数 D.动态相对数
3.某企业工人劳动生产率计划提高5%,实际提高了10%,则提高劳动生产率的计划完成程度为()
A.104.76%
B.95.45%
C.200%
D.4.76%
4.某企业计划规定产品成本比上年度降低10%实际产品成本比上年降低了14.5%,则产品成本计划完成程度()
A.14.5%
B.95%
C.5%
D.114.5%
5.在一个特定总体内,下列说法正确的是( )
A.只存在一个单位总量,但可以同时存在多个标志总量
B.可以存在多个单位总量,但必须只有一个标志总量
C.只能存在一个单位总量和一个标志总量
D.可以存在多个单位总量和多个标志总量
6.计算平均指标的基本要求是所要计算的平均指标的总体单位应是()
A.大量的
B.同质的
C.有差异的
D.不同总体的
7.几何平均数的计算适用于求()
A.平均速度和平均比率
B.平均增长水平
C.平均发展水平
D.序时平均数
8.一组样本数据为3、3、1、5、13、12、11、9、7这组数据的中位数是()
A.3
B.13
C.7.1
D.7
9.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的统计量是()
A.方差
B.极差
C.标准差
D.变异系数
10.用标准差比较分析两个同类总体平均指标的代表性大小时,其基本的前提条件是( )
王静龙定性数据分析第四章二维列联表答案
GH
0.20054 0
2
n n n n ( z) 488047028.8
i j
U 检验统计量:
z GH = 9.42784 ( z) ( z)
9n3
p P{N (0,1) 9.42784} 0 拒绝H 0,即是有题中的趋势
2
n( j n j - n) - ni ) 2 n (n 1)
=
n( ( j n - n j)ni n - ni ) n 2 (n 1)
2 2
(2) E (nij ni n j / n) E (nij E (nij ))
n( ( j n - n j)ni n - ni ) n 2 (n 1)
n n 1 / 2 TA n n 1 / 2 TB 正相合
(2)相合性的检验
GH
0.4245 0
H0:A(年龄)和B(冠状动脉硬化的程度)相互独立 H1:A和B正相合
第5题
2
n n n n ( z) 1942119
提出的问题 你满意吗 你不满意吗 139 128 82 69 12 20 10 23
• 问:这两种提问方式对被调查者回答问题有没有影响?
第3题
• H0:这两种提问方式对被调查者回答问题无影响的 • H1:这两种提问方式对被调查者回答问题有影响
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• (1)相合性的度量,用Kendall系数检验
G 352 (133 210) 284 210 180376 H 717 (133 293) 284 293 388654
回答
非常满意 比较满意 比较不满意 不满意
提出的问题 你满意吗 你不满意吗 139 128 82 69 12 20 10 23
• 问:这两种提问方式对被调查者回答问题有没有影响?
第3题
• H0:这两种提问方式对被调查者回答问题无影响的 • H1:这两种提问方式对被调查者回答问题有影响
2
第1题
• 三家供应商提供的零件合格和不合格的情 况如下:
供应商 A B C 良好 90 170 135 零件质量 小缺陷 3 18 6 大缺陷 7 7 9
• 取 检验供应商与零件质量的独立性。你的 分析结果能告诉采购部分什么?
第1题
• H0 :供应商与零件质量独立 • H1:供应商与零件质量不独立 2 2 r c (n np r c ˆ ) n ij ij ij 2 n 7.712 ˆ ij np i 1 j 1 i 1 j 1 ni n j / n
i 1 j 1
4
wenku.baidu.com
2
nij 2 ni n j / n
n 8.675
p P ( 2 4 1 2 1 2 8.675) 0.0339 0.05 拒绝H 0,即有影响
0.01接受H 0,即没影响
第4题
• 表4.3的数据是否说明有这种趋势:女性倾向于饮淡啤酒,男性倾向于 饮浓啤酒?试用相合性的度量和检验方法回答这个问题。
第5题
• 278例尸体解剖资料整理如下:
冠状动脉硬化等级(由低到高) + ++ 22 4 24 9 23 13 20 15 89 41
年龄(岁) 20 至 30 30 至 40 40 至 50 50 以上 合计
70 27 16 9 122
+++ 2 3 7 14 26
合计 98 63 59 58 278
父母 31 28
子女 19 7
其他亲戚 12 16
• 女性和男性关于给谁买节日礼物最难的看法上有没有显著的差异? •
第2题
• H0:女性和男性关于给谁买礼物最难的看法上没有显著差 异 • H1:女性和男性关于给谁买礼物最难的看法上有显著差异。
2
i 1 j 1
r
c
nij 2 ni n j / n
3 3 i 3 3 j
9n3
z GH 检验统计量: U = 8.29219 ( z) ( z)
p P{N (0,1) 8.29219} 0 0.05 拒绝H 0
第6题
• 习题三第8题说四格表可用来比较两个总体在中心位置上有没有差异。列 联表也有这样的作业。第8题中26位女职工和24位男职工的年收入分组列 表表示如下(单位:元):
• 年龄越大的人,冠状动脉硬化的程度是否有越重的趋势? • (取水平 =0.05 )
第5题
• (1) 相合性的度量 G 15880 H 4324
ni ni 1 TA 10070 2 i 1
4
TB
j 1
4
n j n j 1 2
12442
ni ni 1 TA 1116558 2 i 1
2
TB
j 1
3
n j n j 1 2
723627
第4题
n n 1 / 2 TA n n 1 / 2 TB 负相合
• (2)相合性的检验 • H0:A(性别)和B(啤酒偏好)相互独立 • H1:A和B负相合
n 13.429
p P ( 2 6 1 2 1 2 13.429) 0.0197 当 =0.05时拒绝H 0,有显著差异 当 =0.01时接受H 0,没有显著差异
第3题
• 调查人们对某项措施的满意程度,可以问他:“你对这项措施满意 吗?”,也可以问他:“你对这项措施不满意吗?”为了解这两种提 问方式对被调查者回答问题有没有影响,向243人问:“你满意吗?”, 另外向240人问:“你不满意吗?”。 • 调查结果如下:
p P{ 2 (4) 2 7.714} 0.103 0.05 接受H 0,供应商于零件质量独立
第2题
• 向100个女性和100个男性做调查,了解他们关于给谁买节日礼物最难 得看法。调查结果如下:
给谁买礼物最难 兄弟姐妹 姻亲 3 10 8 4
性别 女性 男性
配偶 25 37
工资 22500-25000 25000-27500 27500-30000 30000-32500 32500-35000 35000-37500 37500-40000 40000-42500 合计 女职工 1 4 2 10 3 5 1 0 26 男职工 0 1 1 3 5 6 6 2 24
n n 1 / 2 TA n n 1 / 2 TB 正相合
(2)相合性的检验
GH
0.4245 0
H0:A(年龄)和B(冠状动脉硬化的程度)相互独立 H1:A和B正相合
第5题
2
n n n n ( z) 1942119
3
GH
0.20054 0
2
n n n n ( z) 488047028.8
3 i 3 3 j
U 检验统计量:
z GH = 9.42784 ( z) ( z)
9n3
p P{N (0,1) 9.42784} 0 拒绝H 0,即是有题中的趋势