王静龙定性数据分析第四章二维列联表答案.

合集下载

冠心病危险因素分析与研究方法

冠心病危险因素分析与研究方法

冠心病危险因素分析与研究方法作者:杨丹来源:《健康周刊》2018年第13期【摘要】查阅近几年国内外冠心病研究进展进行而分析、总结,结果显示冠心病的危险因素除了与患者本身体质指数BMI(Body Measure Index)和年龄外,还可能有高血压史、高血压家族史、吸烟、高血脂史、动物脂肪摄入和A型性格等因素。

为探讨冠心病发生的危险因素,进行了一项病例对照研究,利用Logit回归模型探讨冠心病的危险因素找出对冠心病有影响的危险因素建立回归模型提出一套判别法则来判别某人是否患上了冠心病,经过实验数据的检验,此办法可行。

根据危险因素预测个体发生冠心病的概率,旨在为冠心病健康教育提供科学的理论依据。

本文采用多项Logit模型,因变量是患冠心病、不患冠心病2种模式。

结果显示:根据logit的计算值f(x) >0,判别出患者有冠心病;当【关键词】冠心病;Logit回归模型;危险因素1 对象与方法1.1研究对象:选择十堰市人民医院.从心内科一、心内科二、心内科三分别收集2018年5月1日至8月1日的住院病例,共搜集53例。

登记比较详细的病例信息,包括姓名、性别、出生年月、住址、病名或症状、是否初(复)诊等.把从各科室收集的门诊病例按次序编号,逐个录入到用Epidata3.0编好的程序中,核查、纠错后转入SPSS进行归类整理和统计分析.心血管疾病的统计根据国际疾病分类标准第10版(ICD-10)[11].同时,调查对象中的病史记录、生活习惯由主管护士提供。

1.2 研究方法:采用后退法最终对模型筛减去掉关联性较小的危险因素,得到如下的Logit回归方程:F(x)=-5.183+0.859 x2+1.69 x6+2.984 x7+2.017 x8,从得出的模型中可以看出,患者的体质指数BMI、高血压史、高血压家族史、和吸烟都是不显著的危险因素,而年龄、高血脂史、动物脂肪摄入和A型性格是显著的危险因素。

体质指数BMI越高有高血压史、高血压家族史并且还吸烟则患冠心病的可能性相对较高。

定性数据分析课后答案

定性数据分析课后答案

第二章课后作业【第 1题】解:由题可知消费者对糖果颜色的偏好情况(即糖果颜色的概率分布),调查者取 500 块糖果作为研究对象,则以消费者对糖果颜色的偏好作为依据,500 块糖果的颜色分布如下表 1.1所示:表 1.1 理论上糖果的各颜色数橙色黄色红色棕色绿色蓝色150100*********由题知r=6 ,n=500,我们假设这些数据与消费者对糖果颜色的偏好分布是相符,所以我们进行以下假设 :原假设: H 0 :类 A i所占的比例为 p i p i 0 (i 1, (6)其中 A i为对应的糖果颜色, p i 0 (i1,...,6)6p i0 1已知,1i则 2 检验的计算过程如下表所示:颜色类别n i np i0( n i np i 0 ) 2 np i 0 A1172150 3.2267A2124100 5.7600A385100 2.2500A44150 1.6200A53650 3.9200A64250 1.2800合计500500218.0567在这里 r 6 。

检验的 p 值等于自由度为 5 的2变量大于等于 18.0567 的概率。

在 Excel 中输入“chidist (18.0567,5) ”,得出对应的p值为 p0.0028762 0.05 ,故拒绝原假设,即这些数据与消费者对糖果颜色的偏好分布不相符。

【第 2题】解:由题可知 ,r=3 , n=200,假设顾客对这三种肉食的喜好程度相同,即顾客选择这三种肉食的概率是相同的。

所以我们可以进行以下假设: 原假设 H 0 : p i1( 1,2,3)i32则 检验的计算过程如下表所示:肉食种类n inp i( n i np i ) 2 np i猪肉 85 66.67 5.03958 牛肉 41 66.67 9.88374 羊肉 74 66.670.80589合计200200215.72921在这里 r 3 。

检验的 p 值等于自由度为 2 的2变量大于等于 15.72921 的概率。

定性数据分析-王静龙-第一章

定性数据分析-王静龙-第一章

G − S (ζ ) = 1 − ∑ pi2
i =1
k
G-S指数越大,说明变量ξ分布越离散 指数越大,说明变量 分布越离散 指数越大 原理:如果对 进行两次独立的抽样 当变量ξ的值分 进行两次独立的抽样, 原理:如果对ξ进行两次独立的抽样,当变量 的值分 布比较集中时,两次抽到同一个值xi的概率 i2就大, 布比较集中时,两次抽到同一个值 的概率p 就大, 的概率 ∑ pi2就大,因而 就大,因而G-S布中心
第P百分位数的求法 百分位数的求法
将数据由小到大排序 计算第P百分位数的所在位置 计算第 百分位数的所在位置 p i=( )( n + 1) 100 确定第P百分位数 确定第 百分位数
是整数, 位的数; 不是整数 不是整数, 若i是整数,位于第 位的数;若i不是整数, 是整数 位于第i位的数 向上取整。 将i向上取整。 向上取整
数值法-离散程度 数值法 离散程度

随机变量ξ的熵 随机变量 的熵
H (ζ ) = − ∑ pi ln pi
i =1
k
熵越大,说明变量ξ分布越离散 熵越大,说明变量 分布越离散 原理: 原理:
均匀分布时,所有 均相等 都为1/k. 均相等, 均匀分布时,所有Pi均相等,都为
1 H (ζ ) = − ln( ) k
第一章 定性数据的 数据的描述性统计方法 定性数据的描述性统计方法
定性数据的概念 单个变量的描述统计方法
定性数据
数据的尺度
定类—名义( ):只能计次 定类 名义(Category Scale):只能计次 名义 ): 定序—有序(Ordinal Scale):计次、排序 ):计次 定序 有序( 有序 ):计次、 定距—计数( ):计次 定距 计数(Interval Scale):计次、排序、 计数 ):计次、排序、 加减 定比—计量( ):计次 定比 计量(Ratio Scale):计次、排序、加 计量 ):计次、排序、 减、乘除

王静龙《非参数统计分析》课后计算题参考答案解析

王静龙《非参数统计分析》课后计算题参考答案解析

王静龙《非参数统计分析》课后习题计算题参考答案习题一1. One Sample t-test for a MeanSample Statistics for xN Mea n Std. Dev. Std. Error26Hypothesis TestNull hypothesis: Mea n of x = 0Alternative: Mea n of x A= 0t Statistic Df Prob > t2595 % Con fide nee In terval for the MeanLower Limit:Upper Limit:则接受原假设认为一样习题二1.描述性统计习题二S+=13 n 39H0: me 6500 H1: me 6500PS 13 二BINOMDIST(13,39,0.5,1)=0.026625957另外:在excel2010中有公式(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a的最小整数* 1 n m* nm inf m :2 i 0 iBINO M」N V(39,0.5,0.05)=14*n1 *d nd=sup d : m 1 132 i 0 iS+13 d 13以上两种都拒绝原假设,即中位数低于6500inf c* :n ** 1 m nm inf m :-2 i 0 iBINOM.INV(40,0.5,1 -0.025)=26 d=n-c=40-26=14 x145800 x266400me x206200=0 2.S +=40 n 70H 0: me 6500 H 1: me 6500 2P S 402*(1-BIN0MDIST(39,70,0.5,1))=0.281978922则接受原假设,即房价中位数是 6500S +=1552 n 1552 527 2079H o : p H 1: pn 比较大,则用正态分布近似*1 nnc inf c :2 i c * i 2n m **1 m n m inf m :2i 0im=BINOM.INV(2079,0.5,0.975)=1084则拒绝原假设,即相信孩子会过得更好的人多P 为认为生活更好的成年人的比例,则1522p 的比估计是:一 =0.746513 20794.S18154 n 157860H 0: F 0.906 65 H 1: P 0.90665p 1 0.906 0.094S ~b(n,p) P S 181541 BIN0MDIST(18153,157860,0.094,1)因为0〈则拒绝原假设P S 15521039.5-1552+0.5「519.75 =5.33E-112另外:S +=1552n 1552527 2079习题四1.符号秩和检验统计量:W+=6+8+10+1+4+12+9+11+2+7=70 p值为2P W+70,当n=12得C o.o25 =65 所以p值小于2P W+65 =0.05即拒绝原假设2.符号秩和检验统计量:W+=2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p值为2P W+234.5,当n=25 得c°.°25=236所以p值小于2P W+236 =0.05即接受原假设符号检验:S+18 n 26H 0: me 0 H1 : me 02P S 18 2*(1-BIN0MDIST(17,25,0.5,1))=0.043285251 则拒绝原假设t检验:t 统计量=0.861 df=25 p=0.3976接受原假设3.(1)W+=5+2+2=9 n 8查表可得:C o.025 33d n(n D c 30.025 0.02522P(W+3) 0.052P(W+9) 0.05则接受原假设Walsh平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105105 105 105 110 110 110 110 110 115 115 120AN=55则对称中心为W N 1 /2 W28 90d n n 1 /4 0.5 U1 /2“j n n 1 2n 1 /24 27.5 0.5 1.96 10 11 21/24 7.77101146c n n 1 /4 0.5 U1 /2 [ n n 1 2n 1 /24 27.5 0.5 1.96 .10 11 21/24 47.22898853因为c不是整数,则L介于讽k)与w(k+i)之间,其中k表示比d大的最小整数即为8AL为70与75之间,即为则H-L的点估计为9095%的区间估计为72.5,105习题五22800 25200 26550 26550 26900 27350 28500 28950 29900 30150 30450 30450 30650 30800 31000 31300 31350 31350 31800 32050 32250 32350 32750 32900 33250 33550 33700 33950 34100 34800 35050 35200 35500 35600 35700 35900 36100 36300 36700 37250 37400 37750 38050 38200 38200 38800 39200 39700 40400 4100050个和在一起的中位数是( 33250+33550) /2=33400p i 1P(i,24,25,50) 0.005060988p值很小,则拒绝原假设即认为女职工的收入比男职工的低。

定性数据分析第五章课后答案

定性数据分析第五章课后答案

定性数据分析第五章课后作业1、为了解男性和女性对两种类型的饮料的偏好有没有差异,分别在年青人和老试分析这批数据,关于男性和女性对这两种类型的饮料的偏好有没有差异的问题,你有什么看法?为什么?解:(1)数据压缩分析首先将上表中不同年龄段的数据合并在一起压缩成二维2X 2列联表1.1 ,合起来看,分析男性和女性对这两种类型的饮料的偏好有没有差异?二维22列联表独立检验的似然比检验统计量2ln的值为0.7032,p值为p P( 2(1) 0.7032) 0.4017 0.05,不应拒绝原假设,即认为“偏好类型”与“性别”无关。

(2)数据分层分析其次,按年龄段分层,得到如下三维2X 2X 2列联表1.2,分开来看,男性和女性对这两种类型的饮料的偏好有没有差异?在上述数据中,分别对两个年龄段(即年青人和老年人)进行饮料偏好的调 查,在“年青人”年龄段,男性中偏好饮料A 占58. 73%偏好饮料B 占41.27%; 女性中偏好饮料A 占58. 73%偏好饮料B 占41.27%,我们可以得出在这个年 龄段,男性和女性对这两种类型的饮料的偏好有一定的差异。

同理,在“老年人”年龄段,也有一定的差异。

(3) 条件独立性检验为验证上述得出的结果是否可靠,我们可以做以下的条件独立性检验。

即由题意,可令C 表示年龄段,0表示年青人,C 2表示老年人;D 表示性别,D ! 表示男性,D 2表示女性;E 表示偏好饮料的类型,E !表示偏好饮料A, E 2表示 偏好饮料B 。

欲检验的原假设为:C 给定后D 和E 条件独立 按年龄段分层后得到的两个四格表,以及它们的似然比检验统计量 2ln 的值如下:条件独立性检验问题的似然比检验统计量是这两个似然比检验统计量的和,2ln 6.248 11.822 18.07由于ret 2,所以条件独立性检验的似然比检验统计量的渐近 2分布的自由度为r(e 1)(t 1) 2,也就是上面这2个四格表的渐近 2分布的自由度的和 由于p 值P( 2(2)18.07) 0.000119165很小,所以认为条件独立性不成立,即在年龄段给定的条件下,男性和女性对两种类型的饮料的偏好是有差异的。

数据分析参考答案

数据分析参考答案

数据分析参考答案数据分析参考答案数据分析是一项重要的技能,它帮助我们从大量的数据中提取有用的信息和洞察力。

在当今信息爆炸的时代,数据分析已经成为了各行各业的必备技能。

无论是企业决策、市场营销还是科学研究,数据分析都扮演着重要的角色。

在本文中,我将提供一些数据分析的参考答案,帮助读者更好地理解和应用数据分析。

首先,数据分析的第一步是数据清洗和整理。

在进行数据分析之前,我们需要确保数据的质量和准确性。

这包括删除重复数据、处理缺失值、解决异常值等。

只有经过清洗和整理的数据才能真正反映出问题的本质和规律。

其次,数据分析需要选择合适的方法和工具。

根据问题的性质和数据的类型,我们可以选择不同的数据分析方法。

常见的数据分析方法包括描述性统计、推断统计、机器学习等。

同时,我们还需要选择适合的数据分析工具,如Excel、Python、R等。

选择合适的方法和工具可以提高数据分析的效率和准确性。

第三,数据可视化是数据分析的重要环节。

通过数据可视化,我们可以将抽象的数据转化为直观的图表和图形,更好地理解数据的分布和趋势。

数据可视化不仅可以提高数据分析的效果,还可以帮助我们向他人传达分析结果。

在进行数据可视化时,我们需要选择适当的图表类型,如柱状图、折线图、散点图等,以及合适的颜色和字体。

第四,数据分析需要进行合理的假设和推断。

在进行数据分析时,我们需要建立合理的假设,并通过数据进行验证。

通过统计方法和推断统计学,我们可以对数据进行推断和预测。

然而,我们需要注意的是,数据分析只能提供相关性而非因果性的结论。

因此,在进行数据分析时,我们需要谨慎解读结果,并避免错误的推断。

最后,数据分析需要不断的学习和实践。

数据分析是一个不断发展和演进的领域,新的方法和工具不断涌现。

为了保持竞争力,我们需要不断学习新的数据分析技术,并将其应用到实际问题中。

同时,我们还需要通过实践不断提高自己的数据分析能力,不断优化分析结果和方法。

综上所述,数据分析是一项重要的技能,它帮助我们从大量的数据中提取有用的信息和洞察力。

SPSS软件在定性数据分析中的技术处理

SPSS软件在定性数据分析中的技术处理

SPSS软件在定性数据分析中的技术处理郭梦霞【摘要】SPSS全称为社会科学统计软件包,SPSS软件在数据管理、统计建模、结果报告等方面具有相当大的优势。

本文主要研究的是在做定性数据分析的时候,如何才能利用SPSS软件恰当的进行数据的组织。

本文主要对多变量的列联表、多选项和单变量等三种形式的定性数据统计分析和输入方式进行的深入的研究。

通过本文的研究,希望各个领域、行业当需要进行定性数据分析的时候,通过本文的阅读能够掌握SPSS软件如何进行定性数据分析,方便自己的使用。

%Called the SPSS social science statistical package,SPSS software in data management,statistical modeling,the results report has a big advantage.This paper mainly studies the when doing the qualitative data analysis,how to use SPSS software appropriate for data organization.This article mainly to multivariate contingency table,more options,and the three types of qualitative data such as univariate statistical analysis and input methods of in-depth study.Through the study of this article,I hope each domain, industry when the need for qualitative data analysis,through reading of this article can grasp qualitative data analysis and SPSS software to facilitate their use.【期刊名称】《电子测试》【年(卷),期】2014(000)008【总页数】3页(P106-108)【关键词】社会科学统计;定性数据;单变量;多变量【作者】郭梦霞【作者单位】陕西职业技术学院管理系,陕西西安,710000【正文语种】中文0 引言SPSS 全称为社会科学统计软件包,英文全称为statistical product and service solutions。

定型数据分析习题答案

定型数据分析习题答案

作业中的一些错误情况1:解题过程不完整,没有明确指出所检验的假设和检验统计量。

2:算错检验统计量的值,或算错检验的p 值。

(P27Ex2)解法一:总体总共分3类,要检验顾客是否对这三种肉食的喜好程度相同,这是一个分布的拟合优度检验问题。

(1)要检验的原假设为 0H :顾客对这三种肉食的喜好程度相同,即要检验0H :顾客对这三种肉食的喜好程度的分布为⎪⎪⎪⎭⎫ ⎝⎛313131羊肉牛肉猪肉,(2)取检验统计量∑=-=310202)(i i i i np np n χ,检验分布为)13(2-χ;(3)题中200=n ,3,2,1,32000==i np i ,则检验统计量的值为(计算过程略) 73.153200)320074(3200)320041(3200)320085(2222≈-+-+-=χ(4)计算P 值为: 05.0000384.0)73.15)2((2<≈≥=χP p 值,故在水平05.0=α下拒绝0H ,即调查数据不符合该均匀分布.解法二(采用似然比检验+p 值形式)(1)要检验的原假设为 0H :顾客对这三种肉食的喜好程度相同,即要检验0H :顾客对这三种肉食的喜好程度的分布为⎪⎪⎪⎭⎫ ⎝⎛313131羊肉牛肉猪肉,(2)选取似然比检验统计量∑∑==-=-=Λ-=ri i i i ri i i i n np n n n p n G 1102ln 2ln 2ln 2,检验分布为)1(2-r χ; (3)题中200=n ,3,2,1,32000==i np i ,则检验统计量的值为(计算过程略)88.16ln2312≈=-=∑= i ii i n np n G (4)计算P 值为: 05.000022.0)88.16)2((2<≈≥=χP p 值,故在水平05.0=α下拒绝0H ,即顾客对这三种肉食的喜好程度的分布不是均匀分布.注:若显著性水平取05.0=α,则临界值为99.5)2()13(295.0205.01≈=--χχ。

定性数据分析论文讲解

定性数据分析论文讲解

2014—2015 学年第一学期《定性数据》期末论文题目不同年级与性别对奖助学金渴望度定性数据分析姓名常XX学号20120623104学院数学与统计学院专业统计专业2014 年12 月18 日不同年级与性别对奖助学金渴望度定性数据分析摘要:定性数据分析是数据分析的一个重要内容,它在实践中有着广泛的应用,如问卷调查、产品检验、医学统计等领域中经常用到列联表的定性数据分析来。

列联表的定性数据分析不2仅可以分析分类特征之间的相互依赖关系,还可以进行2检验、似然比检验、相合性的度量和检验、计算相关系数作相关分析也可以进行一致性与读了性的检验。

本文主要采用2检验、似然比检验、相合性的度量和检验来对不同年级、不同性别的大学生对奖助学金渴望度的独立性、相合性检验,最终得到对奖助学金的渴望度与性别无关、与年级有关。

2关键词列联表2检验似然比检验相合性度量一、问题简述为了解高某校不同年级不同性别的大学生对奖助学的渴望程度,对某校大一年级、大二年级共 80 位同学关于奖助学金的调查,并取其中的年级、性别、渴望度三个指标生成列联表,对列联表做定性数据分析。

二、符号说明22:卡方统计量2ln :似然比统计量U :统计量p :概率:相合性度量统计量三、理论方法理论:列联表一般来说,有二维的r c 列联表,假设将n个个体根据两个属性A和B 进行分类,属性A有r 类:A1, ,A r ,属性B 有c类:B1, ,B c。

n个个体中既属于A i 类又属于B j 类的有n ij 个。

得如下二维的r c列联表:其中,n i j n ij,,i 1, ,r;n j i n ij,j 1, ,c,n n i n j 。

ij如果n 个个体根据三个或三个以上的属性分类,就会有三维或三维以上的列联表,对于高维的列联表一般将其压缩为二维列联表在对数据进行统计分析或对高维列联表进行分层在检验。

方法:对二维表中的数据进行2检验、似然比检验、相合性的度量和检验。

定性属性数据分析复习题

定性属性数据分析复习题

属性数据分析复习题一、 填空(每题4分,共20分)1. 按数据取值分类,人的身高,性别,受教育程度分别属于计量数据,名义数据,有序数据2. 度量定性数据离散程度的量有离异比率, G-S 指数,熵3. 分类数据的检验方法主要有2χ检验和似然比检验4. 二值逻辑斯蒂线性回归模型的一般形式是011ln 1k k p x x pβββ=+++- 5. 二维列联表的对数线性非饱和模型有 3 种二、 案例分析题(每题20分,共60分)1.P40习题二1,给出上分位数20.05(5)11.07χ=0123456:0.3,0.2,0.2,0.1,0.1,0.1H p p p p p p ======220.0518.0567(5)11.07χχ=>=,落入拒绝域,故拒绝原假设,即认为这些数据与消费者对糖果颜色的偏好分布不相符2.P42表3.1独立性检验,给出上分位数20.05(1) 3.84χ= 012:H p p =(即认为肺癌患者中吸烟比例与对照组中吸烟比例相等) 112:H p p ≠未连续性修正的:2222112212210.051212()106(6011332)9.6636(1) 3.8463439214n n n n n n n n n χχ++++-⋅-⋅===>=⋅⋅⋅ 带连续性修正的:2211221221220.051212(||)106(|6011332|53)27.9327(1) 3.8463439214n n n n n n n n n n χχ++++--⋅-⋅-===>=⋅⋅⋅ 均落入拒绝域,故拒绝原假设,即认为肺癌患者中吸烟比例与对照组中吸烟比例不等3.P83表4.3 独立性检验,给出上分位数20.05(2) 5.99χ= 0:ij i j H p p p ++=(即认为男性和女性对啤酒的偏好无显著性差异)220.0590.685(2) 5.99χχ=>=,落入拒绝域,故拒绝原假设,即认为男性和女性对啤酒的偏好有显著性差异三、简答(每题10分) 1.谈谈你对p 值的认识P 值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。

王静龙定性数据分析 习题五

王静龙定性数据分析 习题五

王静龙定性数据分析习题五1. 问题描述在定性数据分析中,王静龙遇到了一个问题,他想要了解一份调查问卷中的开放性问题的回答情况。

具体而言,他想要回答以下几个问题:1.开放性问题的回答内容的总体情况如何?2.开放性问题的回答内容中是否存在一些常见的关键词或主题?3.开放性问题的回答内容中是否存在一些特定的意见或情感?为了解决这个问题,王静龙希望能够进行数据分析,并得出一些有用的结论。

2. 数据准备首先,王静龙需要准备调查问卷中开放性问题的回答数据。

这些数据可以以文本文件的形式存储,每一行代表一个回答。

例如,以下是一些示例数据:1. 我觉得工作环境很好,同事们相互合作,给了我很多帮助。

2. 公司的培训计划很好,能够提高员工的技能和知识。

3. 我对公司的管理方式有一些不满意,希望能够改进。

4. 薪资待遇不够优厚,希望能够有所提升。

5. 我觉得公司的发展前景很不错,希望能够有更好的发展空间。

3. 数据分析3.1 总体情况分析为了了解开放性问题的回答内容的总体情况,王静龙可以进行以下分析:•回答的总数•回答的平均长度•回答的最长长度•回答的最短长度为了实现这些分析,可以使用Python编程语言中的文本处理库进行操作。

下面是一个示例代码,可以帮助完成上述分析:```python # 导入所需的库 import pandas as pd 读取文本文件data = pd.read_csv(’responses.txt’, header=None)计算回答的总数total_responses = len(data)计算回答的平均长度average_length = data[0].apply(len).mean()计算回答的最长长度max_length = data[0].apply(len).max()计算回答的最短长度min_length = data[0].apply(len).min()输出结果print(。

Logit回归模型在医学中的应用

Logit回归模型在医学中的应用

Logit回归模型在医学中的应用作者:张森来源:《科技视界》2013年第05期【摘要】Logit回归模型在生活中有很多应用,利用Logit回归模型探讨冠心病的危险因素,找出对冠心病有影响的危险因素,建立回归模型,提出一套判别法则来判别某人是否患上了冠心病。

经过实验数据的检验,此办法可行。

【关键词】Logit回归模型;定性数据;冠心病0 引言Logit回归又称Logit回归分析[1-2],主要在流行病学中应用较多,比较常用的情形是探索某疾病的危险因素,根据危险因素预测某疾病发生的概率,等等。

例如,想探讨胃癌发生的危险因素,这里的因变量就是是否胃癌,即“是”或“否”为两分类变量,自变量就可以包括很多了,例如年龄、性别、饮食习惯、幽门螺杆菌感染等。

通过Logit回归分析,就可以大致了解到底哪些因素是胃癌的危险因素。

1 逻辑斯蒂线性回归模型设响应变量Y仅有两个状态,它们分别以0和1两个值表示。

p=P(Y=1)是我们的研究对象。

设有k个因素x1,x2,…,xk影响Y的取值,则称:ln(p/(1-p))=β0+β1*x1+……+βk*xk二值Logit回归模型,简称Logit回归模型,其中的k个因素x1,x2,…,xk称为逻辑斯蒂回归模型的协变量β0,β1,…,βk是待估计的未知参数。

2 冠心病危险因素的Logit回归模型2.1 问题介绍经过分析,冠心病的危险因素除了有体质指数BMI(Body Measure Index)和年龄外,还可能有高血压史、高血压家族史、吸烟、高血脂史、动物脂肪摄入和A型性格等。

有所谓的A型性格的人的主要表现有过分的抱负、快节奏、高效率、好争辩、好冲动、固执、急躁、匆匆忙忙、大声说话和竞争意识特强等。

2.2 建立Logit回归方程首先建立得冠心病的概率p和这8个可能的危险因素之间的Logit线性回归模型:3 结果与分析8个危险因素中有的可能与是否患冠心病仅有比较小的关联性,使用逐步回归的方法排除掉关联性比较小的危险因素。

内化诚信理念和追求的两种途径_自律与他律_张栋栋

内化诚信理念和追求的两种途径_自律与他律_张栋栋

*

收稿日期: 2011 - 04 - 06 基金项目: 阜阳师范学院党建与思想政治教育研究项目( 2009DJSZ09 ) 。 作者简介: 张栋栋( 1979 - ) , 男, 安徽阜阳人, 硕士, 讲师, 研究方向: 教育学。
· 72·
“以诚信为荣, 成相互约束机制, 达成 以见利忘义为耻 ” 的共 。 在比较中发现不足, 在他律中增强自律 识, 那么, 如何构建科学的诚信评价体系呢? 针对不同的主 方向, 评价的指标有不同的设计, 当然相应的评价方法也可 以是各种各样, 现仅以设计综合评价模型使用综合评价法说 明之。 不诚信的表现有很多方面, 但对在校大学生来说, 主要 说话、 处事, 因此可选定诚信的评价要素集为 U 表现在学习、 = ( 作业抄袭, 考试作弊, 说话不可靠, 处事不真诚) , 评价的 偶尔, 不存在) 。 由于评价因素对被评 登记论域为 v = ( 经常, 价事物并非同等重要的, 所以各单方面因素的表现对总体表 因此在合成之前要确定模糊权向量, 现的影响也是不同的, a2 , a3 , a4 ) , 令 A = ( a1 , 其中 a i > 0 , 且Σ a i = 1 ,a i 表示第 i 个因素的权量, 它反映对诸因素的一种权衡 。 权数的确定有多种方法, 如专家估测法、 层次分析法等。 充分考虑到对于育人的后效性, 四种要素具有同等地位, 故 0 . 25 , 0 . 25 , 0 . 25 ) 。 对于学生的诚信状态而 可取 A = ( 0 . 25 , 言, 评价要素和评价等级之间的关系, 即从 U 到 v 的模糊关 系, 可用模糊评判矩阵加以描述, 用 R 表示: r11 r12 r13 R = ( r ij ) =
一、 问题的提出 诚实守信, 自古以来就是国人“修身, 齐家, 治国, 平天 的根本, 是个人与社会, 个人与个人之间的相互关系的 下” 基础性道德规范。 党的十六大报告强调“以为人民服务为 核心, 以集体主义为原则, 以诚实守信为重点, 加强社会公 德、 职业道德和家庭美德教育, 特别要加强青少年的思想道 德建设, 引导人们在遵守基本行为准则的基础上, 追求更高 。党的十七大报告再次明确要求 “建设和 的思想道德目标” 培育文明风尚, 以增强诚信意识为重点, 加强社会公 谐文化, 。 高校学生是一 德、 职业道德、 家庭美德及个人道德建设 ” 个越来越庞大越来越有影响的群体, 他们诚信度如何, 不仅 对他( 她) 们本身的人际交往和事业发展有直接的影响, 而 因受社会大环境的 且与整个社会的发展息息相关 。近年来, 影响、 家庭教育对学生诚信品德形成的影响以及教育内 、 外 因的影响等, 使得部分大学生在潜意识中诚信意识变得匮 乏, 曾被视为一方净土的大学校园诚信缺失现象时有所见并 仍有进一步蔓延的趋势 。 最近, 我们再次运用分层抽样方法随机抽取某高校大学 生 100 名, 对其发放问卷进行调查, 问卷内容包括大学生诚 信问题的突出表现, 造成诚信问题的原因等问题 。其结果如 下: 突出表现 学习不诚信 助学贷款不诚信 根本不诚信 交往态度不诚信 网络道德虚拟 合计 经常 7 2 5 6 7 27 一般 10 4 7 13 19 53 偶尔 11 9 10 7 12 49 无 72 85 78 74 62 371 合计 100 100 100 100 100 500

定性数据分析-王静龙-第一章

定性数据分析-王静龙-第一章
则取值的越多,分布越离散,此时熵值也越大。 则取值的越多,分布越离散,此时熵值也越大。
作业
自己运用所给数据, 自己运用所给数据,对定性数据进行描述统 计分析
用表、图和数值法 用表、 对不同的定性数据的分布情况进行比较
数值法-离散程度 数值法 离散程度

随机变量ξ的熵 随机变量 的熵
H (ζ ) = − ∑ pi ln pi
i =1
k
熵越大,说明变量ξ分布越离散 熵越大,说明变量 分布越离散 原理:它给出了∑ pi=1的约束前提下,衡量 原理:它给出了 的约束前提下, 的约束前提下 给定的分布与均匀分布的接近程度。 给定的分布与均匀分布的接近程度。均匀分 布最离散,如果给定分布接近均匀分布, 布最离散,如果给定分布接近均匀分布,则 给定分布越离散,此时熵值也越大。 给定分布越离散,此时熵 条形图(与直方图的区别) 圆形图(饼形图 圆形图(饼形图) 排列图(Pareto图) 排列图( 图
绘制 应用
数值法
代表性数值
分布中心 离散程度
数值法-分布中心 数值法 分布中心
名义数据: 名义数据:众数 有序数据: 有序数据:
众数、中位数(更好) 众数、中位数(更好) 百分位数:衡量数据位置,表示相对高低。 百分位数:衡量数据位置,表示相对高低。第 相对高低 50百分位数就是中位数,P百分位数表示至少 百分位数就是中位数, 百分位数表示 百分位数表示至少 百分位数就是中位数 的数据项数小于或等于该数据, 有P%的数据项数小于或等于该数据,且至少 的数据项数小于或等于该数据 有(1-P)%的数据项数大于或等于这个值 。 ) 的数据项数大于或等于这个值
数值法-分布中心 数值法 分布中心
第P百分位数的求法 百分位数的求法

青岛版八年级上册数学第4章 数据分析含答案审定版

青岛版八年级上册数学第4章 数据分析含答案审定版

青岛版八年级上册数学第4章数据分析含答案一、单选题(共15题,共计45分)1、有一组数据7、11、12、7、7、8、11.下列说法错误的是()A.中位数是7B.平均数是9C.众数是7D.极差是52、李老师为了了解学生暑期在家的阅读情况,随机调查了20名学生某一天的阅读小时数,具体情况统计如下:则关于这20名学生阅读小时数的说法正确的是()A.众数是8B.中位数是3C.平均数是3D.方差是0.343、数据2,4,3,4,5,3,4的众数是( )A.5B.4C.3D.24、关于一组数据:1、5、6 、3、5,下列说法错误的是()A.平均数是 4B.众数是5C.方差是3.2D.中位数是65、一组数据-3,7,1,-5,19,7,15,12的中位数和众数分别是()A.7和7B.1和7C.7和1D.9.5和76、某社区青年志愿者小分队年龄情况如下表所示:则这12名队员年龄的众数、中位数分别是()A.5人,20岁B.5人,19岁C.19岁,19岁D.19岁,20岁7、一组数据1,3,2,0,3,0,2的中位数是()A.0B.1C.2D.38、已知甲、乙两组数据的平均数相等,若甲组数据的方差S2甲=0.055,乙组数据的方差S2乙=0.105,则()A.甲组数据比乙组数据波动大B.乙组数据比甲组数据波动大C.甲组数据与乙组数据的波动一样大D.甲.乙两组数据的数据波动不能比较9、为调查某班学生每天使用零花钱的情况,张华随机调查了20名同学,结果如下表:则这20名同学每天使用的零花钱的中位数是( )A.17.5元B.20元C.22.5元D.25元10、在“童心向党,阳光下成长”合唱比赛中,30个参赛队的决赛成绩如下表:则这30个参赛队决赛成绩的中位数和众数分别是( )A.9.7,9.5B.9.7,9.9C.9.6,9.5D.9.6,9.611、在我市举办的中学生“争做文明盘锦人”演讲比赛中,有15名学生进入决赛,他们决赛的成绩各不相同,小明想知道自己能否进入前8名,不仅要了解自己的成绩,还要了解这15名学生成绩的()A.众数B.方差C.平均数D.中位数12、在开展“爱心捐助某灾区”的活动中,某团支部8名团员捐款的数额(单位:元)分别为3,5,6,5,5,6,5,10,这组数据的中位数是()A.3元B.5元C.6元D.10元13、为了了解某班同学一周的课外阅读量,任选班上15名同学进行调查,统计如表,则这组数据的中位数和众数分别是()A.1,2B.2,2C.4,6D.6,614、牛牛同学10个周综合素质评价成绩统计如下:成绩(分)94 95 97 98 100周数(个) 1 2 2 4 1下列说法错误的是()A.这10个周的综合素质评价成绩的中位数是98B.这10个周的综合素质评价成绩的平均数是97 C.这10个周的综合素质评价成绩的方差是3 D.这10个周的综合素质评价成绩的众数是9815、学校为了丰富学生课余活动开展了一次“校园歌手大奖赛”的歌咏比赛,共有18名同学入围,他们的决赛成绩如下表:成绩9.40 9.50 9.60 9.70 9.80 9.90(分)人数 2 3 5 4 3 1则入围同学决赛成绩的中位数和众数分别是()A.9.70,9.60B.9.60,9.60C.9.60,9.70 D.9.65,9.60二、填空题(共10题,共计30分)16、超市决定招聘广告策划人员一名,某应聘者三项素质测试的成绩如表:测试项目创新能力综合知识语言表达测试成绩(分数)70 80 90将创新能力、综合知识和语言表达三项测试成绩按5:3:2的比例计入总成绩,则该应聘者的总成绩是________分.17、某校901班共有50名同学,如图是该次体育模拟测试成绩的频数分布直方图(满分为30分,成绩均为整数),则测试成绩的中位数所在的组别是________.18、数据1,2,4,5,3的中位数是________.19、已知一组数据1,3,a,6,6的平均数为4,则这组数据的方差为________ .20、一组数据-2,3,2,1,-2的中位数为________.21、若一组数据7,3,5,,2,9的众数为7,则这组数据的中位数是________.22、体育课时,九年级乙班10位男生进行投篮练习,10次投篮投中的次数分别为3,3,6,4,3,7,5,7,4,9则这组数据的中位数是________.23、对甲、乙、丙三名射击手进行20次测试,平均成绩都是8.5环,方差分别是0.4,3.2,1.6,在这三名射击手中成绩比较稳定的是________.24、甲、乙两班举行数学知识竞赛,参赛学生的竞赛得分统计结果如下表:某同学分析上表后得到如下结论:①甲、乙两班学生的平均成绩相同;②乙班优秀的人数少于甲班优秀的人数(竞赛得分分为优秀);③甲班成绩的波动性比乙班小.上述结论中正确的是________.(填写所有正确结论的序号)25、某小区20户家庭的日用电量(单位:千瓦时)统计如下:日用电量(单位:千瓦4 5 6 7 8 10 时)户数 1 3 6 5 4 1这20户家庭日用电量的众数、中位数分别是________ .三、解答题(共6题,共计25分)26、下表是某班学生右眼视力的检查结果视力 4.0 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 5.0人数 1 2 4 5 3 5 1 1 5 9 5 (1)求该班学生右眼视力的平均值;(2)求该班学生右眼视力的众数和中位数.27、某超市出售甲、乙、丙三种糖果,其售价分别为5元/kg,12元/kg,20元/kg,为满足客多样化需求,超市打算把糖果混合成杂拌糖出售,如果按照如图所示的扇形统计图中甲、乙、丙三种糖果的比例混合,这种新混合的杂排糖的售价应该为多少元/kg?28、某公司10名销售员,去年完成的销售额情况如表:销售额(单位:万元) 3 4 5 6 7 8 10销售员人数(单位:人)1 3 2 1 1 1 1(1)求销售额的平均数、众数、中位数;(2)今年公司为了调动员工积极性,提高年销售额,准备采取超额有奖的措施,请根据(1)的结果,通过比较,合理确定今年每个销售员统一的销售额标准是多少万元?29、你对:“您觉得该不该在公共场所禁烟”作民意调查,下面是三名同学设计的调查方案:同学A:我把要调查的问题放到访问量最大的网站上,这样大部分上网的人就可以看到调查的问题,并很快就可以反馈给我.同学B:我给我们小区的居民每一位住户发一份问卷,一两天也可以得到结果了.同学C:我只要在班级上调查一下同学就可以了,马上就可以得到结果.请问:上面三个同学哪个能获得比较准确的民意吗?为什么?30、某文具店九、十月出售了五种计算器,其售价和销售台数如下表:售价(台/10 15 16 20 30(1)该店平均每月销售多少台;(2)在所考察的数据中,其中位数和众数分别是多少;(3)经核算各种计算器的利润率均为20%,请你根据上述有关信息,选定下月应多进哪种计算器?并说明进价是多少?参考答案一、单选题(共15题,共计45分)1、A2、B3、B4、D5、A6、C7、C8、B9、C10、C11、D12、B13、B14、A15、B二、填空题(共10题,共计30分)16、17、18、19、20、21、22、23、24、25、三、解答题(共6题,共计25分)26、27、28、29、30、。

王静龙《非参数统计分析》课后计算题参考的答案解析

王静龙《非参数统计分析》课后计算题参考的答案解析

WORD格式资料王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a MeanSample Statistics for xN Mean Std. Dev. Std. Error-------------------------------------------------26 1.38 8.20 1.61Hypothesis TestNull hypothesis: Mean of x = 0Alternative: Mean of x ^= 0t Statistic Df Prob > t---------------------------------0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计专业整理专业整理习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2WORD 格式资料专业整理****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200n ni c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>≥≈比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则WORD 格式资料专业整理1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.专业整理()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设WORD 格式资料专业整理t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 8585 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105专业整理N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++=++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。

王静龙《非参数统计分析》(1-6章)教案---精品管理资料

王静龙《非参数统计分析》(1-6章)教案---精品管理资料

引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。

例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1。

18.503 8.508 8.498 8。

347 8。

494 8。

500 8。

498 8.500 8.502 8.501 8。

491 8.504 8。

502 8.503 8.501 8。

505 8.492 8。

497 8。

150 8.496 8。

501 8.489 8.506 8.497 8。

505 8。

501 8。

500 8。

499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8。

505 8.510 8。

499 8。

489 8.496 8.500 8。

503 8.497 8。

504 8。

503 8.506 8.497 8。

507 8。

346 8.310 8.489 8。

499 8.492 8。

497 8。

506 8。

502 8.505 8.489 8.503 8.492 8.501 8。

499 8.804 8。

505 8。

504 8.499 8。

506 8。

499 8。

493 8。

494 8。

490 8。

505 8。

511 8。

502 8。

505 8。

503 8.782 8.502 8.509 8。

499 8.498 8.493 8.897 8.504 8。

493 8。

494 7.780 8.509 8.499 8.503 8。

494 8.511 8。

501 8。

497 8。

493 8.501 8.495 8。

461 8.504 8。

691经计算,平均长度为cm x 4958.8=,非常接近中心位置8。

5cm,样本标准差为()1047.0112=--=∑=ni i n x x s cm 。

王静龙定性数据分析第四章二维列联表答案

王静龙定性数据分析第四章二维列联表答案
TA
i 1 3 2
ni ni 1 2
1116558 723627
TB
j 1
n j n j 1 2
第4题
n n 1 / 2 TA n n 1 / 2 TB 负相合
• (2)相合性的检验 • H0:A(性别)和B(啤酒偏好)相互独立 • H1:A和B负相合
工资 22500-25000 25000-27500 27500-30000 30000-32500 32500-35000 35000-37500 37500-40000 40000-42500 合计 女职工 1 4 2 10 3 5 1 0 26 男职工 0 1 1 3 5 6 6 2 24

这是 列联表。基于列联表的检验方法,回答问题:收入和性别有没有关 系?女职工的收入是否比男职工低?
从 n 个单元中抽取 n j 个单元,则 k 由于 k 都是随机的,其分布律如下:
1, 第k个单元第一次入样 0, 否则
k
概率
n
1
0 1- n j /n
n j /n
则有 nij k yk ,则有 E (nij ) E ( k ) yk
k 1
3 3 3 3

GH
0.20054 0
2Hale Waihona Puke n n n n ( z) 488047028.8
i j
U 检验统计量:
z GH = 9.42784 ( z) ( z)
9n3
p P{N (0,1) 9.42784} 0 拒绝H 0,即是有题中的趋势
第3题
• 调查人们对某项措施的满意程度,可以问他:“你对这项措施满意 吗?”,也可以问他:“你对这项措施不满意吗?”为了解这两种提 问方式对被调查者回答问题有没有影响,向243人问:“你满意吗?”, 另外向240人问:“你不满意吗?”。 • 调查结果如下:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ni ni 1 TA 1116558 2 i 1
2
TB
j 1
3
n j n j 1 2
723627
第4题
n n 1 / 2 TA n n 1 / 2 TB 负相合
• (2)相合性的检验 • H0:A(性别)和B(啤酒偏好)相互独立 • H1:A和B负相合
• 年龄越大的人,冠状动脉硬化的程度是否有越重的趋势? • (取水平 =0.05 )
第5题
• (1) 相合性的度量 G 15880 H 4324
ni ni 1 TA 10070 2 i 1
4
TB
j 1
4
n j n j 1 2
12442
n n 1 / 2 TA n n 1 / 2 TB 正相合
(2)相合性的检验

GH
0.4245 0
H0:A(年龄)和B(冠状动脉硬化的程度)相互独立 H1:A和B正相合
第5题
2
n n n n ( z) 1942119
回答
非常满意 比较满意 比较不满意 不满意
提出的问题 你满意吗 你不满意吗 139 128 82 69 12 20 10 23
• 问:这两种提问方式对被调查者回答问题有没有影响?
第3题
• H0:这两种提问方式对被调查者回答问题无影响的 • H1:这两种提问方式对被调查者回答问题有影响
2
3 3 i 3 3 j
9n3
z GH 检验统计量: U = 8.29219 ( z) ( z)
p P{N (0,1) 8.29219} 0 0.05 拒绝H 0
第6题
• 习题三第8题说四格表可用来比较两个总体在中心位置上有没有差异。列 联表也有这样的作业。第8题中26位女职工和24位男职工的年收入分组列 表表示如下(单位:元):
第5题
• 278例尸体解剖资料整理如下:
冠状动脉硬化等级(由低到高) + ++ 22 4 24 9 23 13 20 15 89 41
年龄(岁) 20 至 30 30 至 40 40 至 50 50 以上 合计
70 27 16 9 122
+++ 2 3 7 14 26
合计 98 63 59 58 278
父母 31 28
子女 19 7
其他亲戚 12 16
• 女性和男性关于给谁买节日礼物最难的看法上有没有显著的差异? •
第2题
• H0:女性和男性关于给谁买礼物最难的看法上没有显著差 异 • H1:女性和男性关于给谁买礼物最难的看法上有显著差异。
2
i 1 j 1
r
c
nij 2 ni n j / n
第1题
• 三家供应商提供的零件合格和不合格的情 况如下:
供应商 A B C 良好 90 170 135 零件质量 小缺陷 3 18 6 大缺陷 7 7 9
• 取 检验供应商与零件质量的独立性。你的 分析结果能告诉采购部分什么?
第1题
• H0 :供应商与零件质量独立 • H1:供应商与零件质量不独立 2 2 r c (n np r c ˆ ) n ij ij ij 2 n 7.712 ˆ ij np i 1 j 1 i 1 j 1 ni n j / n
工资 22500-25000 25000-27500 27500-30000 30000-32500 32500-35000 35000-37500 37500-40000 40000-42500 合计 女职工 1 4 2 10 3 5 1 0 26 男职工 0 1 1 3 5 6 6 2 24
i 1 j 1
4
2
nij 2 ni n j / n
n 8.675
p P ( 2 4 1 2 1 2 8.675) 0.0339 0.05 拒绝H 0,即有影响
0.01接受H 0,即没影响
第4题
• 表4.3的数据是否说明有这种趋势:女性倾向于饮淡啤酒,男性倾向于 饮浓啤酒?试用相合性的度量和检验方法回答这个问题。
p P{ 2 (4) 2 7.714} 0.103 0.05 接受H 0,供应商于零件质量独立
第2题
• 向100个女性和100个男性做调查,了解他们关于给谁买节日礼物最难 得看法。调查结果如下:
给谁买礼物最难 兄弟姐妹 姻亲 3 10 8 4
性别 女性 男性
配偶 25 37
n 13.429
p P ( 2 6 1 2 1 2 13.429) 0.0197 当 =0.05时拒绝H 0,有显著差异 当 =0.01时接受H 0,没有显著差异
第3题
• 调查人们对某项措施的满意程度,可以问他:“你对这项措施满意 吗?”,也可以问他:“你对这项措施不满意吗?”为了解这两种提 问方式对被调查者回答问题有没有影响,向243人问:“你满意吗?”, 另外向240人问:“你不满意吗?”。 • 调查结果如下:
3

GH
0.20054 0
2
n n n n ( z) 488047028.8
3 i 3 3 j
U 检验统计量:
z GH = 9.4) 9.42784} 0 拒绝H 0,即是有题中的趋势
啤酒偏好 淡啤酒 男性 女性 合计 352 293 645 普通啤酒 284 133 417 黑啤酒 717 210 927 合计 1353 636 1989
• (1)相合性的度量,用Kendall系数检验
G 352 (133 210) 284 210 180376 H 717 (133 293) 284 293 388654
相关文档
最新文档