多重对应分析方法
多重比较
• 计算的公式:
LSD t dfe sxi x j
s xi x j
2MS e n
安康学院
7
例1:方差分析表(肥料盆栽试验)
变异来源 处理间 t 处理内 e 总变异T SS 301.2 101.0 402.2 df 4 15 19 MS 75.30 6.73 F F0.05 F0.01 4.89
4
4.05 dfe = 16
5.19
41.88
53.66
标准误 = 10.34
安康学院
30
例2: q 法多重比较表
处理 A1饲料 A4饲料 平均数 311.8 279.8 – A3饲料 64.4** 32.4 – A2饲料 49.0* 17.0 – A4饲料 32.0*
A2饲料
A3饲料
262.8
247.4
q法:检验标准较严,特殊试验使用。
• LSR法:有SSR法、q法两种标准可供选择
安康学院
32
书面作业
• 教材:142页,第11题 • 完成 3 种多重比较 • 要求:写在作业本上,未完,还要继续分析。
安康学院
课间休息
2013年5月6日
安康学院
15.4
LSR0.05 = 31.02,37.74,41.88, LSR0.01 = 42.70,49.43,53.66,
( LSD0.05 = 31.00) ( LSD0.01 = 42.70)
安康学院
31
3 种多重比较方法的对比
• LSD法:利用 t 检验原理 • 简单,误差大
• •
•
检验标准较松,初级试验使用 SSR法:检验标准适中,常规试验使用
多重分析(一)
x2x3 x1x3 x4 x1 x1x2 x3 x2
ADJRSQ CP AIC 0.40748 3 46.66 0.37522 3 48.091 0.34653 2 48.405 0.28443 2 50.857 0.27478 3 52.116 0.23063 2 52.814 0.17864 2 54.579
应用以上准则如何选择模型?
求出所有可能的回归模型 (共有2m-1个)对应的准则 值;按上述准则选择最优模 型
SAS获得的几个准则值结果
x2x3x4 x1x2x3x4 x1x3x4 x1x2x4 x1x4 x2x4 x3x4 x1x2x3
ADJRSQ CP AIC 0.54563 4 40.343 0.52823 5 42.157 0.48797 4 43.568 0.44683 4 45.655 0.44137 3 45.07
模型 Y与X1 Y与X4 Y与X4 X1
SS回 SS偏回
SS残
F值
P值
69.4251 38.3652
82.7144 25.0759
5.2441 0.0311
107.7903
114.7615
逐步回归法实例(第三步)
模型
Y与X4 X1
Y与X4 X1 X2 Y与X4 X1 X3
SS回 SS偏回 107.7903
标准化
回归系数b’j
0.07758 0.30931 -0.33948 0.39774
ljj
标准差
S
66.0103 172.3648 350.3106
86.4407 222.5519
多重回归分析方法
多重回归分析方法多重回归分析是一种统计分析方法,用于探究多个自变量与一个因变量之间的关系。
通过回归方程,我们能够预测和解释因变量的变化程度。
本文将介绍多重回归分析的基本原理、应用场景和步骤,并详细讨论模型建立、参数估计和结果解释的相关内容。
一、多重回归分析的基本原理多重回归分析是在简单回归分析的基础上进行拓展,考虑了多个自变量对因变量的影响。
简单回归分析中,我们通过一条直线来建立自变量和因变量之间的关系;而多重回归分析中,我们考虑了多个自变量,通过一个多维的平面或超平面来建立模型。
多重回归分析基于以下假设:1. 自变量与因变量之间存在线性关系;2. 自变量彼此之间不存在多重共线性;3. 残差项满足独立同分布的假设。
二、多重回归分析的应用场景多重回归分析广泛应用于社会科学、经济学以及其他研究领域。
例如,在市场营销研究中,我们可以利用多重回归分析探究不同市场因素对产品销量的影响;在医学研究中,我们可以利用多重回归分析研究不同药物剂量对患者病情的改善程度。
三、多重回归分析的步骤多重回归分析一般包括以下步骤:1. 数据收集:收集相关的自变量和因变量的数据;2. 变量选择:根据研究目的和领域知识,选择适当的自变量进行分析;3. 模型建立:建立多重回归模型,构建回归方程;4. 参数估计:利用最小二乘法或其他方法,估计回归方程中的参数;5. 模型拟合:评估回归模型的拟合效果,如调整决定系数、F检验等;6. 结果解释:解释回归系数的含义和统计显著性,分析自变量对因变量的影响程度。
四、模型建立和参数估计在多重回归分析中,我们需要选择适当的自变量,并建立回归方程。
回归方程的形式为:Y = β0 + β1X1 + β2X2 + … + βnXn + ε,其中Y表示因变量,X1至Xn表示自变量,β0至βn表示回归系数,ε表示误差项。
参数估计可以通过最小二乘法来进行,即寻找一组参数估计值,使得观测值与模型预测值之间的残差平方和最小化。
中国西部两县6~36月龄婴幼儿喂养指数与生长发育的多重对应分析
方 法: 中国西部陕西省和重庆市符 合研 究条 件 的农 业县 中随机抽 取到 两个样 本县 , 2 1 从 于 00年 9~1 1月 对两县 6~ 6 3 月龄 4 2例早产/ 出生体重儿 ( rm tr lwb t egtna tP B 和 4 1 7 低 pe aue o ihw i f , L W) 6 例正常足月儿 ( om lem i. / r hi n nr a t r n
陈宏达 郝 波 康 晓平 , 更力 , , , 赵 周 敏
(. 1 北京大学公共卫 生学院流行病与卫生统计学 系, 北京
[ 摘
10 9 ;. 京大学第 一医院妇 产科 , 0 1 12 北 北京
10 3 ) 0 04
要 ] 目的: 采用多重对应分 析探 讨中 国西部农村婴幼儿 喂养指数 与生 长发 育指标在不 同类 别上 的对 应关系 。
rn, T 的 喂 养 和 生 长 发 育 情 况 进 行 调 查 , S S 9 0统 计 软 件 对 相 关 数 据 进 行 常 规 统 计 方 法 的 分 析 和 多 重 对 atN ) 用 P S1.
应 分析。 结果: 在中国西部两县 , 婴幼儿 喂养指数在 中等水平 的比例最 高, 5 % 一 0 。在 P B 组和 N 为 0 6% LW T组 中, 6~ 9月龄 的婴幼儿喂养指数不合格 率较其 他 月龄要 高 , 中 P B 组为 3 . % , T组 为 2 . % , P B 组和 其 LW 33 N 94 在 L W N T组 中 , 各个年龄组之 间的喂养指数差异 均具 有统计 学意义 ( 0 0 ) P< . 5 。对 于喂养指 数得分 差的 婴幼儿 , L W PB 组 的生长发育 指标 较 N T组落后 , 对于喂养指数得分 中或优 的婴 幼儿 , L W 有 追赶生长 的趋 势 , 生长发育 指标 PB 但 仍较 同等 喂养 条件下的 N T差 。多重对应分 析发 现 P B 与 喂养指数低 、 LW 生长发育水平低 、 母亲文化程度低 以及 其 家庭收入低对应并 有较强关联 ; T与喂养 指数 中等及以上 、 N 生长发育水平 中等 、 母亲教育 程度 中等及 以上 、 家庭 收 入 中等及 以上对应 并有较强关联 。结论 : 中国西部两县的婴幼儿类别 、 喂养 指数 、 婴幼 儿生长发育指 标与婴幼 儿家
多重比较 统计学
多重比较统计学多重比较统计学是一种在统计学领域应用广泛的方法,它可以帮助研究人员对多个群体或变量进行比较和分析。
通过比较不同群体或变量之间的差异和相似性,我们可以更好地理解数据,并得出更准确的结论。
本文将介绍多重比较统计学的基本概念、方法和应用。
我们来了解一下多重比较统计学的基本概念。
多重比较统计学是指在进行多个群体或变量比较时,采用一系列统计方法来控制错误率,并对差异进行推断。
在传统的单个比较中,我们通常使用t检验或方差分析等方法来比较两个群体或变量之间的差异。
然而,在多重比较中,由于同时进行多个比较,存在着累积的错误率问题。
为了解决这个问题,我们需要采取一些措施来控制错误率,例如Bonferroni校正、False Discovery Rate等。
接下来,我们将介绍一些常用的多重比较方法。
首先是Bonferroni 校正,它是一种最简单和最常用的多重比较校正方法。
Bonferroni 校正将显著性水平除以比较的总数,从而得到每个比较的显著性水平。
这样可以有效地控制整体错误率,但也可能导致较高的Type Ⅰ错误率。
另一个常用的方法是False Discovery Rate(FDR),它通过控制被错误拒绝的假设的比例来控制错误率。
FDR方法可以更好地平衡Type Ⅰ错误和Type Ⅱ错误,适用于大规模的多重比较。
在实际应用中,多重比较统计学具有广泛的应用领域。
例如,在医学研究中,我们可以使用多重比较方法来比较不同治疗方法的疗效;在生物学研究中,我们可以使用多重比较方法来比较不同基因的表达水平;在市场研究中,我们可以使用多重比较方法来比较不同产品的销售情况。
通过使用多重比较统计学,我们可以更好地理解数据,并得出准确的结论,为决策提供科学依据。
尽管多重比较统计学在实际应用中具有重要意义,但我们在使用时也需要注意一些问题。
首先,我们需要选择合适的多重比较方法,根据实际情况来控制错误率。
其次,我们需要注意样本的选择和数据的质量,以确保比较的结果具有可靠性和代表性。
多重比较方法及其在实证分析中的应用
多重比较方法及其在实证分析中的应用第一章绪论随着科技的发展,大数据时代的到来,数据分析越来越成为人们重视并热衷的领域。
本文旨在介绍多重比较方法及其在实证分析中的应用,通过对比多重比较和单个比较的优劣,阐述多重比较方法的必要性和实用性。
第二章多重比较方法的基本概念2.1 多重比较方法的概念在统计学中,多重比较方法是指用于比较三个或多个(但少于总体中的所有个体)总体在一个或多个方面上的方法。
多重比较方法可以更全面地了解总体之间的差异,防止在进行多重检验时产生的多重错误。
2.2 多重比较方法的分类多重比较方法可以分为两类:一级比较和二级比较。
一级比较方法适用于确定多个总体是否存在差异,例如T检验、单因素方差分析和多因素方差分析等方法。
二级比较方法适用于确定哪些总体之间存在差异,例如考虑Bonferroni校正、Tukey方法、Scheffé方法和Dunnett方法等方法。
第三章多重比较方法的应用3.1 多重比较在医学研究中的应用例如在药物研究中,多个药物需要比较其效果是否有显着差异,采用多重比较方法可以避免假阳性的结果,同时减少研究时间和成本。
3.2 多重比较在经济学研究中的应用例如在城市房价研究中,需要对各个地区的房价进行比较,采用多重比较方法可以防止在多个区域中错判高价位,同时减少样本选择的问题。
3.3 多重比较在生态学研究中的应用例如在生态系统复杂度的研究中,多个因素需要进行比较,采用多重比较方法可以降低产生假阳性的概率,更好地理解生态系统中各元素之间的关系。
第四章多重比较方法的优劣比较在进行多重比较时,我们需要比较其与单个比较的优劣之处。
多重比较方法可以全面地了解总体之间的差异,避免在进行多重检验时产生的多重错误。
同时多重比较方法能够减少样本的假阳性结果,提高数据的可靠性和真实性。
但是多重比较方法也需要注意慎重选择,同时避免由于样本的选择和样本误差等问题引起的假阳性。
第五章结论通过对多重比较方法的介绍与应用,可以看出多重比较方法在实证分析中有着极大的作用,能够更好地了解总体之间的差异,避免在进行多重检验时产生的多重错误,同时减少研究时间和成本。
76. 如何在数据分析中处理多重比较问题?
76. 如何在数据分析中处理多重比较问题?76、如何在数据分析中处理多重比较问题?在数据分析的领域中,多重比较问题是一个相当常见且重要的挑战。
当我们进行多个组之间的比较或者对同一变量进行多次测试时,多重比较问题就可能悄然出现。
如果处理不当,它可能会导致错误的结论和不准确的分析结果。
首先,让我们来理解一下什么是多重比较问题。
简单来说,就是在一个研究中进行了大量的比较或检验。
想象一下,我们有三个不同的治疗方法,想要知道哪一种更有效。
如果只是简单地两两比较,可能会增加得出错误结论的风险。
因为每次比较都有一定的概率犯错误,比较的次数越多,累积的错误概率就越大。
那么,为什么多重比较问题会带来麻烦呢?一个主要原因是增加了第一类错误(即错误地拒绝了原本正确的零假设)的概率。
假设我们设定的显著水平为 005,这意味着在一次比较中,有 5%的可能性会错误地拒绝零假设。
但如果进行了 10 次独立的比较,那么至少出现一次错误拒绝的概率就大大增加了。
为了解决这个问题,有几种常见的方法。
其中一种是控制家族错误率(Familywise Error Rate,FWER)。
这就像是给所有比较的错误率设定一个总的上限。
Bonferroni 校正就是一种常见的控制 FWER 的方法。
它的基本思想很简单,就是把我们设定的显著水平除以比较的次数。
比如,如果进行了 10 次比较,原本的显著水平是 005,那么经过Bonferroni 校正后,每次比较的显著水平就变成了 005/10 = 0005。
这样做虽然降低了犯第一类错误的概率,但同时也增加了犯第二类错误(即错误地接受了原本错误的零假设)的概率,可能会导致一些真正的差异被忽略。
另一种方法是控制错误发现率(False Discovery Rate,FDR)。
与FWER 不同,FDR 控制的是在所有被拒绝的零假设中错误拒绝的比例。
BenjaminiHochberg 方法就是一种常用的控制 FDR 的策略。
沈浩老师讲对应分析法
沈浩⽼师讲对应分析法沈浩⽼师讲对应分析法数据君推荐技术前沿超过822⼈围观 0条评论对应分析是⼀种多元统计分析技术,主要分析定性数据Category Data⽅法,也是强有⼒的数据图⽰化技术,当然也是强有⼒的市场研究分析技术。
这⾥主要介绍⼤家了解对应分析的基本⽅法,如何帮助探索数据,分析列联表和卡⽅的独⽴性检验,如何解释对应图,当然⼤家也可以看到如何⽤SPSS操作对应分析和对数据格式的要求!对应分析是⼀种数据分析技术,它能够帮助我们研究由定性变量构成的交互汇总表来揭⽰变量间的联系。
交互表的信息以图形的⽅式展⽰。
主要适⽤于有多个类别的定类变量,可以揭⽰同⼀个变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。
适⽤于两个或多个定类变量。
主要应⽤领域:概念发展(Concept Development)新产品开发 (New Product Development)市场细分 (Market Segmentation)竞争分析 (Competitive Analysis)⼴告研究 (Advertisement Research)主要回答以下问题:谁是我的⽤户?还有谁是我的⽤户?谁是我竞争对⼿的⽤户?相对于我的竞争对⼿的产品,我的产品的定位如何?与竞争对⼿有何差异?我还应该开发哪些新产品?对于我的新产品,我应该将⽬标指向哪些消费者?数据的格式要求对应分析数据的典型格式是列联表或交叉频数表。
常表⽰不同背景的消费者对若⼲产品或产品的属性的选择频率。
背景变量或属性变量可以并列使⽤或单独使⽤。
两个变量间——简单对应分析。
多个变量间——多元对应分析。
案例分析:⾃杀数据分析上⾯的交互分析表,主要收集了48961⼈的⾃杀⽅式以及⾃杀者的性别和年龄数据!POISON(毒药)GAS(煤⽓)HANG(上吊)DROWN(溺⽔)GUN(开枪)JUMP(跳楼)(我们就不翻译成中⽂了,读者可以把六个⽅式想象成品牌或别的什么)当然,我们拿到的最初原始数据可能是SPSS数据格式记录表,其中,性别取值1-male 2-female,年龄取值1-5,分别表⽰不同年龄段。
多重应答数据深度分析方法及其SPSS操作
多重应答数据深度分析方法及其SPSS操作data发表于2015-05-25 21:37 来源:统计资源门户多重应答(Multiple Response),又称多选题,是市场调查研究中十分常见的数据形式。
多重应答数据本质上属于分类数据,但由于各选项均是对同一个问题的回答,之间存在一定的相关,将各选项单独进行分析并不恰当。
对多重应答数据最常见的分析是使用SPSS中的“Multiple Response”命令,通过定义变量集的方式,对选项进行简单的频数分析和交叉分析。
笔者认为,该分析方法对调查数据的开发利用往往是不够的,我们还可以使用其他分析方法对数据信息进行深度挖掘。
一、两种数据录入方式比如说在某次民意调查中,我们希望了解公众评价宜居城市时,到底是城市的哪一些特征决定人们对该城市宜居性的评估。
为此,我们在研究中设计了14项标准请被访者从中选出他们在进行宜居评价时最看重的5项标准(关于宜居标准的具体探讨,参见本刊2006年第8期)。
选项包括:这是一道典型的多重应答题。
统计软件中对多重应答的标准纪录方式有两种:(1)多重二分法(Multiple dichotomy method)。
对于多项选择题的每一个选项看作一个变量来定义。
0代表没有被选中,1代表被选中。
这样,多项选择题中有几个选项,就会变成有几个单选变量。
这些单选变量的选项都只有两个,即0或1。
比如在上述例子中,我们就可以设置14个单选变量,来标示某选项是否被选中;(2)多重分类法(Multiple category method)。
多项选择题中有几个选项,就定义几个单选变量。
每个变量的选项都一样,都和多项选择题的选项相同。
每个变量代表被调查者的一次选择,即纪录的是被选中的选项的代码。
如上述例子中,我们可以设置X1~X5共5个变量,每个变量的选项兼为从1到14的14项宜居标准。
很多情况下,当问卷中不限定被访者可选择的选项数量时,被调查者可能不会全部选项都选,因此在数据录入时,一般从这些变量的最前面几个变量开始录入,这样最后面几个变量自然就是缺失值。
统计师如何应对数据分析中的多重比较问题
统计师如何应对数据分析中的多重比较问题数据分析中的多重比较问题是统计学中一个常见且重要的挑战。
在统计分析过程中,多重比较指的是对多个组进行比较并寻找差异的问题,在没有适当控制的情况下,可能会导致错误的结论或误导性的结果。
统计师在处理多重比较问题时,需要采取一系列合适的方法和策略来确保数据分析结果的准确性和可靠性。
1. 设置明确的假设和研究目标在开始数据分析之前,统计师应该明确研究的假设和目标。
多重比较通常是为了比较多个组之间的差异,但统计师需要明确要比较的哪些组以及比较的方向,例如是否为单侧或双侧比较等。
这样有助于缩小分析的范围,提高分析的针对性。
2. 控制类型I错误率类型I错误是在给定显著性水平下,拒绝了正确的零假设。
为了避免在多重比较中产生过多的类型I错误,可以采用一些统计方法来进行校正。
其中,最常见的方法之一是Bonferroni校正,将显著性水平除以比较的组数,以确保整体的类型I错误率在合理范围内。
3. 使用多重比较校正方法除了Bonferroni校正外,还有其他多重比较的校正方法,如Holm 校正、FDR(False Discovery Rate)校正等。
这些方法可以对不同的情况进行灵活的校正,并且更加适用于各种多重比较的场景。
统计师需要选择合适的校正方法,并将其应用到数据分析中,以控制多重比较产生的错误率。
4. 使用方差分析和协方差分析在处理多重比较问题时,统计师可以使用方差分析(ANOVA)或协方差分析(ANCOVA)这样的方法。
这些方法可以对多个组之间的差异进行比较,并且对结果进行调整,以控制多重比较问题。
方差分析和协方差分析是常用的多重比较问题解决方法,统计师需要熟练掌握并运用于实际数据分析中。
5. 结合图形展示结果除了统计分析方法外,统计师还可以通过图形展示来直观地表达多重比较的结果。
例如,可以使用箱线图、折线图等方式来显示各组之间的差异情况,并在图上标注显著性水平或置信区间等信息。
02 多重对应分析方法
第二讲 多重对应分析方法前面的一篇博文介绍了对应分析方法的解读技巧,不少读者看了后非常想知道如何操作多重对应分析。
其实多重对应分析在超过两个以上定类变量时有时候非常有效,当然首先我们要理解并思考,如果只有三个或有限的几个变量完全可以通过数据变换和交互表变量重组可以转换成两个定类变量,这时候就可以用简单对应分析了。
对应分析对数据的格式要求:•对应分析数据的典型格式是列联表或交叉频数表。
•常表示不同背景的消费者对若干产品或产品的属性的选择频率。
•背景变量或属性变量可以并列使用或单独使用。
两个变量间——简单对应分析。
多个变量间——多元对应分析。
现在,我们还是来看看如何操作多重对应分析并如何解读对应图;我们假定有个汽车数据集,包括:来源国(1-美国、2-欧洲、3-日本),尺寸(1-大型、2-中型、3-小型),类型(1-家庭、2-运动、3-工作),拥有(1-自有、2-租赁)性别(1-男、2-女),收入来源(1-1份工资来源、2-2份工资来源),婚姻状况(1-已婚、2-已婚有孩子、3-单身、4-单身有孩子);从数据集看,我们有7个定类变量,如果组合成简单的交叉表是困难的事情,此时采用多重对应分析是恰当的分析方法。
下面我还是采用SPSS18.0,现在叫PASW Statistics 18.0来操作!注意:不同版本在多重对应分析方法有一些不同,但大家基本上可以看出了,高版本只能是更好,但选择会复杂和不同!在进行多重对应分析之前,研究者应该能够记住各个变量大致有多少类别,个别变量如果变量取值太偏或异常值出现,都会影响对应分析的结果和对应图分析!在SPSS分析菜单下选择降维(Data Redaction-数据消减)后选择最优尺度算法,该选项下,根据数据集和数据测量尺度不同有三种不同的高级定类分析算法,主要包括:多重对应分析、分类(非线性)主成分分析、非线性典型相关分析;注意:随着版本的增高,研究人员在统计分析时就要各位主要变量的测量尺度,并且最好在进行数据清理和分析前,明确定义好测量尺度;当然也要做好Lable工作!接下来,我们就可以选择变量和条件了!大家可以把要分析的变量都放到分析变量内,补充变量的含义是如果有哪个变量你并不想作为对应分析的变量,而只是作为附属变量表现在对应图上可以加入!这一点其实在简单对应分析也有这种定义。
多重对应分析在中医大样本分类变量相关性分析中的应用
收稿日期:2009210203 作者简介:段艳霞(19732),女,湖南炎陵人,上海中医药大学讲师,医学硕士。
研究方向:医学统计学和循证医学。
文章编号:100424337(2010)0120065202 中图分类号:R19511 文献标识码:A・统计分析・多重对应分析在中医大样本分类变量相关性分析中的应用段艳霞 王忆勤 付晶晶 许朝霞(上海中医药大学 上海201203)摘 要: 目的:介绍应用多重对应分析方法实现对大样本分类变量之间的相关性分析,旨在对大样本疾病信息采集资料的临床和基础科研工作者提供可借鉴的统计学分析方法。
方法:应用SPSS11.5统计分析软件中Data Reduction 菜单的Optimal Scaling 过程对大样本分类变量进行多重对应分析,以研究它们之间的联系。
结果:慢性胃炎的4种病理组织诊断与8种中医证型有一定的相关性,这对慢性胃炎的临床诊断及治疗具有指导意义,为慢性胃炎中医证候规范化研究提供一定的思路。
结论:对于中医研究中常见的无序多分类或二分类变量,要同时研究它们之间的联系,用多重对应分析在结果的直观性和可解释性方面优于对数线性模型。
SPSS11.5统计分析软件易于实现多个变量间的多重对应分析。
关键词: 多重对应分析; 相关性分析; 大样本; 分类变量 长期以来,中医的辨证分型纷繁多样,难以统一,同时病理组织检查是许多疾病诊断及治疗的重要依据。
如何理清中医证型和病理诊断之间关系是许多临床和基础科研工作者遇到的难题。
本研究介绍应用多重对应分析方法实现对中医大样本证型与病理诊断的相关性分析,以期为疾病的临床诊断和治疗提供参考依据和帮助,为中医证候的规范化研究提供一定的思路,为大样本疾病信息资料的临床和基础科研工作者提供可借鉴的统计学分析方法。
1 资料及方法111 资料来源本研究资料来源于上海市重点学科(第三期)中医诊断学建设项目(编号:S30302)。
为2001年3月~2008年3月上海中医药大学附属龙华医院、曙光医院、岳阳医院及上海市第八人民医院消化科门诊且经内窥镜及病理组织学检查确诊为慢性胃炎的患者1068例。
驾驶分心行为驾驶人的多重对应分析
第20卷第2期2020年4月交 通 工 程Vol.20No.2Apr.2020DOI:10.13986/ki.jote.2020.02.002驾驶分心行为驾驶人的多重对应分析弯美娜,李 洋,何 庆(北京警察学院,北京 102202)摘 要:对536名驾驶人的人口统计学特征(包括年龄㊁性别㊁受教育程度㊁职业和家庭月收入)以及基本的驾驶情况(驾龄㊁车型㊁周均驾驶里程㊁驾驶能力)进行调查.使用多重对应分析的方法对其中报告在驾驶行为中存在驾驶分心的363名驾驶人的年龄㊁性别㊁职业㊁驾龄㊁周均驾驶里程和驾驶能力等特征进行了分析.结果显示,男性㊁非固定职业㊁驾龄在3~5a 在同一方向出现聚集;18~35岁与驾龄在3a 以内㊁周均驾驶里程为中途(50~400km)与固定职业也存在一定的关联性.同时,不同性别㊁不同驾驶能力认知的驾驶人分布出现差异,相对而言,女性驾驶人可能更多地受到驾驶能力认知的影响.关键词:驾驶分心;多重对应分析;人口统计学变量中图分类号:U 491文献标志码:A文章编号:2096⁃3432(2020)02⁃06⁃06Multiple Correspondence Analysis of Driving Distracted DriversWAN Meina,LI Yang,HE Qing(Beijing Police College,Beijing 102202,China)Abstract :Demographic characteristics (age,gender,education,occupation,and monthly household income)and basic driving conditions (driving age,vehicle type,average driving mileage per week,driving ability)of 536drivers were investigated.The Multiple correspondence analysis was used to analyze the characteristics of age,gender,occupation,driving age,average driving mileage and driving ability of 363drivers who reported driving distraction.The results showed that the three characteristics of male,non⁃fixed occupation,and driving age ranged from 3-5years appeared in the same direction.There is also a certain correlation between 18-35years of age and driving age within 3years and an average driving mileage of 50-400km per week with fixed occupation.At the same time,there aredifferences in the distribution of drivers with different genders and different driving ability cognition.Relatively speaking,female drivers may be more affected by their own driving ability cognition.Key words :driving distraction;multiple correspondence analysis;demographic variables收稿日期:2019⁃11⁃20.基金项目:北京警察学院重点课题 分心驾驶对行车安全影响及对策研究”项目编号2018KZD08.作者简介:弯美娜(1985 ),女,硕士研究生,讲师,研究方向为交通心理学,E⁃mail:meina.wan@.0 引言驾驶人的驾驶分心是引发交通事故的重要原因之一.据美国国家公路安全管理局(NHTSA)统计,美国2006 2010年由于分心导致事故比例达到17%,2011 2013年事故比例达到16%.其中驾驶分心导致死亡事故占到总死亡事故的10%[1].2014年,全国简易交通事故656.3万起,其中因 驾驶分心”导致的309.9万起,占47.22%;一般以上交通事故中,因 驾驶分心”导致的共有74746起,占 第2期弯美娜,等:驾驶分心行为驾驶人的多重对应分析37.98%,造成21570人死亡,76984人受伤,直接财产损失4.58亿元.2019年以来,交警部门共查处 驾驶分心”违法行为40.3万起,与去年同期相比上升11.1%[2].国际标准化组织将驾驶分心初步定义为:注意力集中在驾驶无关的活动中,一般对驾驶行为有害[3].美国高速公路安全管理局(NHTSA)将驾驶分心分为以下3种类型:视觉分心:需要驾驶员离开路面注视来获取信息;操作分心:需要驾驶员单手离开方向盘并操作设备;认知分心:需要驾驶员从驾驶任务中转移精神注意力.目前驾驶分心的研究较多地集中在分心的认知机制探讨和分心行为分析等研究中.其中,认知机制的探讨一般通过视觉分心或认知分心任务㊁在驾驶模拟环境下㊁通过实验的方式考查分心任务对驾驶操作行为的影响.如罗毅等[4]通过驾驶模拟试验,考查驾驶分心对车辆变道行为的影响,结果显示,驾驶分心对变道过程中车辆的纵向速度㊁横向速度㊁横向加速度㊁方向盘转角㊁方向盘转速和油门开度等6项驾驶绩效参数有显著影响.李鹏辉等[5]通过驾驶模拟器对分心任务与交通冲突反应时之间的关系进行了分析,结果显示,认知分心会延长驾驶人应对侧向冲突的反应时,视觉分心同时延长驾驶人应对侧向及纵向冲突的反应时间;视觉分心对驾驶人反应时间的延长显著性高于认知分心.同时,伴随着移动电话的迅速普及,驾驶时使用电话的行为也变得越发普遍.越来越多的研究者在驾驶分心特性中开始关注如手动操作电子通讯设备㊁使用非手持电子设备通话㊁使用手持电话通话等的影响[6].如党珊[7]对驾驶中操作手机打车软件诱发的驾驶分心行为进行的驾驶模拟实验结果显示,正常驾驶与4类驾驶分心情况下驾驶行为表现出显著差异,非常规场景中,分心操作对危险刺激的反应时增长显著,驾驶分心操作时的事故率出现显著上升.彭丹丹等[8]使用眼动仪用模拟驾驶试验的方式对手机导航方式对驾驶行为的影响进行分析后指出,不同手机导航方式都会造成驾驶分心,但分心程度不同;手持手机导航使驾驶人对前方和左侧区域的关注下降最为显著.此外,通过自然观察和自我报告的方式对驾驶分心行为进行的研究也较为常见.如李晨[9]采用自然驾驶观察法对货运车辆驾驶人的视频录像和视频监控观察后指出,货车驾驶人在行驶过程中发生频率最高的分心任务分别为发信息㊁打电话㊁看或触摸手机屏幕㊁喝水和拿东西,同时,看或者触摸手机屏幕的行为具有相当大的个体差异性.郭羽熙等[10]通过问卷调查的方式分析了驾驶人在驾驶时使用手机的特点与风险感知水平之间的关系,研究结果显示,驾驶人使用手机频率和风险认知水平存在负相关,风险感知水平较高,使用手机的频率越低,同时更愿意接受驾驶时限制手机功能以提高驾驶安全性.在此基础上,对驾驶分心的监测系统以及人-机交互界面设计等领域的研究也是传统分心行为研究的热门领域[11⁃12].从上述研究中可看到,驾驶分心的研究目前主要集中在对驾驶分心行为的行为观察和认知机制探索等方面,包括对视觉分心㊁认知分心的神经生理机制分析㊁风险认知水平分析等认知过程的分析,以及由此衍生的驾驶分心行为检测系统和人机交互界面设计等领域中,而对于驾驶分心行为的驾驶人的社会特征和驾驶行为特征分析则较为少见.从交通管理工作实践角度出发,对于驾驶分心行为的驾驶人社会特征和行为特征进行分析,对于交通安全工作也具有不可忽视的作用.因此,本研究从驾驶人的人口统计学特征和驾驶行为特征出发,对驾驶分心行为进行了分析,并进一步总结分心驾驶的人群的常见特征,以期为交通管理工作提供可能的管理思路.1 研究方法1.1 研究工具本研究使用网上调查的形式,通过自我报告的问卷,对驾驶人日常出行驾驶行为中的社会经济状况㊁驾驶分心情况(驾驶行为中出现频率最高的分心行为㊁日常驾驶活动中使用手机的频率)和事故情况(过去3a发生的事故数量)进行了调查.最终有536名驾驶人接受了调查,其中男性338人,女性198人.1.2 统计方法本研究中涉及的分类变量包括驾驶分心情况㊁基本的人口统计学变量(年龄㊁性别㊁受教育程度㊁职业和家庭月收入)以及基本的驾驶情况(驾龄㊁驾驶人性质㊁车型㊁周均驾驶里程).使用传统的列联表分析不仅列联表层次复杂,且行与列之间的交叉信息也不易理解,针对这种情况,采用研究者们普遍推荐的多重对应分析的方式进行呈现.使用SPSS22.0统计软件进行数据整理和分析,以P<0.05为差异有统计学意义.7交 通 工 程2020年2 研究结果2.1 驾驶分心行为描述统计研究者列举了驾驶行为中常见的可能引起驾驶分心的行为,要求被试选择在驾驶行为中出现频率最高的两项行为,结果如表1所示.表1 常见的驾驶分心行为频率表分心行为响应频次占总选择人数百分比/%观察值百分比/%聊天36235.667.5玩手机878.516.2看视频605.911.2听广播36936.268.8吃东西807.914.9化妆121.22.2其他分心行为484.79.0总计1018100.0189.9 从表1中可看到,在驾驶分心行为中,驾驶人最常出现的行为频次最高的5项行为依次为听广播㊁聊天㊁玩手机㊁吃东西和看视频.进一步询问被试在驾驶行为中使用手机的频率,结果如图1所示.图1 驾驶行为中使用手机的频率分布图从图1中可看到,超过68%的驾驶人承认在驾驶行为中出现过使用手机的情况,其中14%的驾驶人频繁地在驾驶行为中使用手机.2.2 驾驶分心行为的多重对应分析研究者对自我报告中承认在驾驶行为中使用手机的驾驶人(n =363)样本进一步进行多重对应分析.2.2.1 基本情况描述363名驾驶人的年龄㊁受教育程度㊁家庭经济状况等人口统计学变量如表2所示.表2 人口统计学变量分布表项目类别频数百分比/%性别男25369.7女11030.318~35岁22862.8年龄36~59岁13136.160岁以上41.1高中及以下4913.5受教育程度大学26673.3研究生及以上4813.2职业非固定14740.5固定21659.5家庭月低(5000以下)7921.8收入/元中(5000~30000)24366.9高(30000以上)4111.3 从表2中可看到,男性驾驶人占比接近70%,大多数被调查者年龄在35岁以下,大多数受过高等教育,职业以固定职业为主,家庭月收入处于中等水平.363名驾驶人的驾龄㊁日常驾驶车型和周均驾驶里程等驾驶基本情况如表3所示.表3 被调查者人口统计学变量分布表项目类别频数百分比/%3a 以内13537.2驾龄3~5a7921.85~10a 6116.810a 以上8824.2驾驶车辆小型客车143.9类型大中型客车31987.9货车或其他专用作业车308.3周均驾驶短途(50以下)15041.3里程/km 中途(51~400)19252.9长途(400以上)215.8驾驶能力低17949.3(自评)高18450.7 从表3中可看到,大多数驾驶人的驾龄在5a 以下,驾驶车辆以小型客车为主,周均驾驶里程以中短8 第2期弯美娜,等:驾驶分心行为驾驶人的多重对应分析途为主.2.2.2 适应性检验适用性检验结果显示,不同人口特征的驾驶人在不同的驾驶特征上的表现如表4所示. 从表4中可看到,不同性别的驾驶人在职业㊁周均驾驶里程上的分布无差异;不同职业的驾驶人在驾驶能力分布上无差异;其余研究变量的分布上均表现出显著差异.表4 不同人口特征的驾驶人变量的两两适应性检测(χ2/P值)项目性别年龄职业驾龄周均驾驶里程年龄6.00/0.05职业0.35/0.55419.00/0.000驾龄8.65/0.034179.51/0.00015.04/0.004周均驾驶里程5.76/0.05614.84/0.0058.69/0.01338.09/0.000驾驶能力4.00/0.04520.73/0.0002.58/0.10834.55/0.00022.81/0.000 2.2.3 模型情况概要考虑到人口统计学变量中,受教育程度和家庭收入情况与年龄和职业之间存在较大的相关,因此,研究者最终选择对性别㊁年龄㊁职业㊁驾龄㊁车型㊁周均驾驶里程和驾驶能力7个变量间进行多重对应分析[13].在对这7个变量进行特征分析后,其在2个维度上的调整惯量贡献率如表5所示.表5 调整惯量贡献率表维度特征根调整惯量调整惯量贡献率/%累积调整惯量贡献率/%12.0970.34934.94734.947 21.3200.22022.00256.949 从表5中可看到,维度1可解释总体变异的34.95%,维度2可解释总体变异的22.00%;也就是说,两维坐标图可介绍原有数据的56.95%的信息.根据上述2个特征根得到2个辨识度量,并得到性别等维度在这2个辨识度量上的载荷,如表6所示.表6 辨识度量载荷表辨识度量12性别0.0030.373年龄0.6530.086职业0.1350.134驾龄0.7340.358周均驾驶里程0.2840.259驾驶能力0.2880.111 从表6中可看到,年龄㊁驾龄和驾驶能力主要分布在辨识度量1上,性别主要分布在辨识度2上,职业和周均驾驶里程在2个辨识度量上分布比较平均.它们之间的关系,如图2所示.图2 变量在两个辨识维度上的分布图3.2.4 多重对应分析的联合分布图为了更清晰地呈现这些变量之间的关系,研究将多重对应分析的结果以类别联合图的形式绘制出来,结果如图3所示.图3 驾驶分心人群的多重对应分析的类别联合图 从图3中可看到,男性㊁非固定职业㊁驾龄在3~5a在同一方向出现聚集,表明这些变量之间存在相关;同样,18~35岁与驾龄与在3a以内㊁周均驾驶里程为中途(50~400km)与固定职业㊁60岁以9交 通 工 程2020年上与周均驾驶里程为长途之间也存在一定的关联性.男性和女性在原点的不同方向,驾驶能力自评高㊁低的驾驶人的位置较远,说明不同性别㊁不同驾驶能力认知的驾驶人分布有所不同.研究者进一步对不同性别㊁不同驾驶自评能力的驾驶分心人群特征进行了多重对应对应分析,其类别联合图的结果如图4㊁图5所示.图4 男性驾驶分心人群的多重对应分析的类别联合图图5 女性驾驶分心人群的多重对应分析的类别联合图从图4中可看到,在男性的驾驶分心人群中,非固定职业㊁驾龄在3a 以内㊁周均驾驶里程在50km 以内,同时驾驶能力自评较低等特征出现了聚集;同时,固定职业㊁驾龄在5~10a,周均驾驶里程在50~400km 与高的驾驶能力自评等特征可能存在相关.图5中的信息显示,在女性的驾驶分心人群中,10a以上驾龄与较高的驾驶能力自评出现聚集;女性驾驶人非固定职业㊁驾龄3a 以内㊁周均驾驶里程较短等特征也表现出相关.从图6㊁7中我们发现,男性驾驶人18~35岁以及3~5a 驾龄均表现出较强的相关,但是在驾驶能力自评较低的群体中,女性与较长的里程出现相关;而在驾驶能力自评较高的群体中,相对而言,女性与中等程度的驾驶里程关系较为密切.图6 低驾驶能力驾驶分心人群的多重对应分析的类别联合图图7 高驾驶能力驾驶分心人群的多重对应分析的类别联合图3 讨论3.1 驾驶分心的群体特征:年龄和职业特征的影响综上所述,在不同条件多重对应分析中出现了一些稳定的特征聚集:如驾龄在3a 以内这一特征几乎总是与短途驾驶里程(周均驾驶里程在50km1 第2期弯美娜,等:驾驶分心行为驾驶人的多重对应分析以内)以及非固定职业这些特征联系在一起.这些特征共同构成了这样一幅驾驶人群体的描象:新手驾驶人.一般而言,国际惯例将取得驾驶执照在1a 以内的驾驶人称之为新手驾驶人.但是由于我国的国情,一部分驾驶人在取得驾驶执照后的一段时间内,并没有很多的上路实践机会,从周均驾驶里程在50km以内也能反映出这一点.同时,也意味着这一群体并非具有稳定上下班通勤需要的驾驶人群体.这3个特征放在一起,研究者猜测这一群体中相当大的人群可能是属于青年驾驶人群体.由于在本次研究中,我们使用在驾驶活动中对手机的使用频率作为驾驶分心的指标,因此,这一群体在驾驶分心上表现突出也就不难理解了.一方面,智能手机的使用频率本身就呈现出了极强的年龄效应,青年群体中对于智能手机的依赖本身就显著地高于其他年龄阶段;另一方面,在新手驾驶人阶段,对驾驶环境㊁驾驶操作等方面内容的不熟悉,也进一步加剧了对智能手机(如手机导航软件等)的依赖,从而使得驾驶分心在这一群体中更加常见.另一方面,在驾驶里程为中途(50~400km)与固定职业㊁5~10a驾龄等特征之间的密切相关,也似乎提示,在年龄更高的群体中,驾驶分心的群体似乎与朝九晚五的 上班族”存在一定的重合,周均50~400km的驾驶里程似乎也与上下班的通勤距离较为接近.同时,在部分类别联合图中出现的, 60岁以上的驾驶人群体与周均400km以上的驾驶里程之间的聚集,似乎也在提示研究者,对于不同年龄阶段的驾驶人而言,驾驶中对手机的使用这一驾驶分心行为可能存在的不同指向和功能,这一内容需要后续研究根据使用手机的内容和形式进行进一步挖掘.3.2 驾驶分心行为可能受到性别刻板印象的影响除了年龄和职业的影响之外,多重对应分析的结果还显示,驾驶分心行为在很大程度上表现出了性别和驾驶能力的差异.具体而言,驾驶自评能力几乎没有在男性驾驶人群体表现出差异性的相关,而女性驾驶人则表现出一定的驾驶能力自评结果与驾驶里程至今的负相关的倾向.也就是说,驾驶能力自评较低的群体中,女性与较长的里程出现相关;而在驾驶能力自评较高的群体中,女性则与中等程度的驾驶里程关系较为密切.研究者认为,出现这一现象的原因,可能与女性驾驶人所遭受的在驾驶行为中的刻板印象相关.由于这种刻板印象的存在,女性驾驶人可能对自身的驾驶技能评价相对较低,这种较低的评级可能进一步抑制了女性驾驶人在驾驶活动中的分心行为.因此,对自己驾驶能力评级较高的女性驾驶人与周均驾驶里程为中途表现出聚集,而对自己驾驶能力评价较低的女性驾驶人则与周均驾驶里程为长途表现出相关.周均驾驶里程在一定程度上可看做是驾驶人对驾驶技能的练习活动,从这个意义上讲,女性驾驶人伴随着对驾驶技能的熟练,从而导致对自我驾驶能力评价的提高,并进一步可能出现驾驶分心行为.参考文献:[1]National Highway Traffic Safety Administration.Overview of the National Highway Traffic Safety Administration’s Driver Distraction Program[J].Report No.DOT HS, 2010,811:299.[2]http:∥/news/shizheng/2015/ 1203/50661.html[3]Pettitt M,Burnett G E,Stevens A.Defining driver distraction[C]∥12th World Congress on Intelligent Transport Systems,2005.[4]罗毅,高岩,尤志栋.基于换道行为的驾驶分心识别方法[J].中国安全科学学报,2018,28(10):25⁃30. [5]李鹏辉,胡孟夏,张文会,等.分心对驾驶人交通冲突反应时间的影响[J].中国公路学报,2018,31(4): 36⁃42.[6]National Highway Traffic Safety Administration.MMUCC guideline:model minimum uniform crash criteria[EB⁃OL].[2011⁃12⁃19].http:∥www⁃/ Pubs/810957.pdf.http:∥/sites/ default/files/2008MMUCCGuideline.pdf,2008.[7]党珊.基于手机打车软件使用的驾驶分心行为研究[D].成都:西南交通大学,2017.[8]彭丹丹,田伟,石京.手机导航方式对驾驶行为的影响研究[J].中国安全科学学报,2017,27(9):39⁃44. [9]李晨.基于驾驶模拟试验的货车驾驶人驾驶分心识别研究[D].北京:北京交通大学,2019. [10]郭羽熙,吴昊,付锐,等.驾驶人智能手机使用行为与风险感知分析[J].长安大学学报(自然科学版),2018,38(5):123⁃130.[11]赵博,马钧.驾驶员分心监测方法探究[J].农业装备与车辆工程,2016,54(3):59⁃61+71. [12]王加.基于驾驶员操纵及车辆运动轨迹信息的驾驶分心辨识方法[C].中国汽车工程学会.面向未来的汽车与交通 2013中国汽车工程学会年会论文集精选.中国汽车工程学会:中国汽车工程学会,2013:195. [13]叶勒丹㊃马汉,孙勇,等.乌鲁木齐市体检人群高血压类型与其危险因素的多重对应分析[J].中国全科医学,2019,22(16):1966⁃1972.11。
多重比较统计方法
多个均值之间的多重比较在完成方差分微得知某因素对观测结果的影响显著时,仅表明该因素的各水平下的均数之间的差别总体上是显著的,并不知道任何2个均数之间的差别是否显著(此时,即使在多数场合下,可认为均数的最大值与最小值之间的差别显著,但却不知p值的大小)。
当实际工作者希望进一步知道更为详细的情况时,就需要在多个均数之间进行多重比较。
然而,根据所控制误差的类型和大小不同,便产生了许许多多的多重比较法。
设某因素有10个水平,若采用通常的t检验进行多重比较,共需比较的次数为∶C210=45次,即使每次比较时都把α控制在0.05水平上(即令CER=0.05),但此时EER=1-(1-0.05)45=0.90,这表明作完45次多重比较后,所犯Ⅰ型错误的总概率可达到0.90,事实上,选用t检验进行多重比较,仅仅控制了CER,却大大地增大了EER!1.两两比较(1)仅控制CER(比较误差率)的方法①T法(即成组比较的t检验法,但误差的均方不是由所比较的2组数据、而是由全部数据算得的)注意∶用此法所作比较的次数越多,其EER(试验误差率)就越大。
②LSD法:也叫最小显著差数法,只用于2组例数相等的场合LSD的值被称为Fisher的最小显著差.注意∶用此法所作比较的次数越多,其EER(试验误差率)就越大。
③DUNCAN法(2)控制MEER(最大试验误差率)的方法①BON法(即Bonferroni t检验法)它令CER=ε=α/C,这里C为比较的总次数,当因素有K个水平时,则C=K(K-1)/2,下同。
②SIDAK法(根据Sidak的不等式进行校正的t检验法)③SCHEFFE法它是由Scheffe于1953和1959年提出的另一种控制MEER的法,Scheffe检验的结果与先作的方差分析的结果是相容的,即若ANOVA的结果是显著,用此法至少能发现一次比较的结果是显著的,反之,若ANOVA的结果为不显著,用此法也找不出任何2个均数之间有显著差别来(然而,大部分多重比较法则可能会发现有显著差别的对比组)。
多选题数据的SPSS多重对应分析操作方法
多选题数据的SPSS多重对应分析操作方法出处:江苏通灵翠钻有限公司发布日期:2008年04月17日10:18 多选题又称多重应答(Multiple Response),即针对同一个问题被访者可能回答出多个有效的答案,它是市场调查研究中十分常见的数据形式。
对多选题数据的分析除了使用SPSS中的“Multiple Response”命令进行频数分析和交叉分析之外,还可以使用“Data Reduction”命令中的“Optimal Scaling”(最优尺度分析)进行多重对应分析,用以挖掘该数据与其他若干个变量之间的相互关系。
一、多选题数据在SPSS中的录入方式 SPSS软件中对于多选题答案的标准纪录方式有两种:(1)多重二分法(Multiple dichotomy method)即把本道多选题的每个候选答案均看作一个变量Variable来定义,0代表没有被选中,1代表被选中。
(2)多重分类法(Multiple category method)即根据被访者可能提供的答案数量来设置相应个数的变量Variable(假设被访者最多只能选择n个不同答案,则在SPSS中设置n个变量用以录入本道多选题数据)。
实际操作中我们基本都会采用第二种数据录入方式,因为大多数被访者只会选择相对少数几个候选答案作为自己所提交的答案,如果我们采用第一种录入方式就显得繁琐,输入数据时也容易出错,尤其是当样本量增大时,不利于提高工作效率。
二、案例介绍 某次市场调研项目中向被访者收集以下数据,A1题为多选题,把上述数据以第二种方式录入进SPSS软件中,其中设置a101、a102、a103三个变量用来录入多选题A1,并定义好相应的变量值标签(Values)如图1。
三、多选题两种数据录入格式的转换 由于只有第一种数据录入方式才是符合统计分析原则的数据排列格式,能够直接进行后续的统计推断,而第二种录入方式只是一种简化纪录方式,需要转化为前者。
常用多重比较方法
日期
总人数 护士站二次分诊人数 准确率 / %
2007 202 220
1 322
63
2007 202 225
1 197
55
2007 202 227
1 501
101
2007 202 228
1 414
88
平均
5 434
307
95. 23 95. 40 93. 27 93. 77 94. 35
4 讨论
资源的有限性和生命救助的迫切性 ,要求医院提
·29·
压力 。分诊排队数据库系统实时提供医生服务和病员 排队的动态信息 ,并可利用网络传送到远程计算机进 行实时监控 。根据提供的实时动态信息 ,科学设置岗 位 ,提高服务效率 ,提高服务质量 ,提高管理水平 ,树立 良好形象 ,有利于提高医院的经济效益和社会效益 。
挂号自动分诊排队实现了医院病人就诊过程中的 流程重组 ,减少了中间排队等候的环节 ,大大改善了医 院门诊就诊的秩序 。该系统实施以来 ,取得了良好的 效果 ,达到了预期的目的 。
Sdi =
M S误差 2
1 + 1 ,常用于多个试验组 n1 n0
与一个对照组间的比较 ,根据算得的 t值 , 误差自由度 ν误差 、试
验组数 k - 1以及检验水准 α查 Dunnett2t界值表 ,作出推断 。 1. 6 Duncan法 (新复极差法 )
q′= ( XA - XB ) /
M S误差 2
q = ( XA - XB ) /
M S误差 2
1 + 1 ,它实质上是根据预先 nA nB
制定的准则将各组均数分为多个子集 , 利用 Studentized Range
分布来进行假设检验 ,并根据所要检验的均数的个数调整总的 Ⅰ类错误概率不超过 α。
儿童营养状况与生活行为的多重对应分析
摘要 : 目的 探 讨 儿 童 营养 状 况 与 生 活 习 惯之 间 的 关 系 , 旨在 为 学龄 儿 童 的 保健 措 施 提 供 科 学 依 据 , 促 进 儿 童 健 康 成 长 。方 法 采 用 分 层 整 群 随 机 抽 样 的 方 法 对 禹 州 市 城 乡 5所 小 学 1 —6年 级 的 1 8 5 4名 学 生 进 行 研 究, 运 用 自制 生 活 行 为 问卷 进 行 调 查 , 测 量身 高、 体 重, 采 用 w H0 推 荐 的 身 高标 准 体 重 法 评 价 营 养 状 况 , 进 行 多重 对 应 分 析 。结 果 营 养 不 良 、 正 常、 超体质 量 、 肥胖 率分别是 5 . 2 6 , 8 3 . 4 4 , 8 . 3 1 和 2 . 9 9 % 。 营 养 不 良与 主 食 量 较 少有 关 ( P< 0 . 0 1 ) ; 营养 正 常 与 主食 量 正 常 或 量 少 、 零食 量适 当、 不偏食 、 睡眠 时间 8 ~1 0 h / d 和运动 时间 1 ~2 h / d有 关 ( P< O . 0 1 ) ; 超 体 质 量 与偏 食 ( 肉、 蛋、 奶、 甜 食) 、 运动时间小于 1 h / d 、 睡 眠 时 间 大 于 1 0 h / d有 关 ( P< O . 0 1 ) ; 肥胖 与 主 、 零 食 量较 多有 关 ( P< 0 . 0 1 ) 。 结 论 营 养 状 况 与 生 活 行 为 密 切 相 关 。调 整 膳食结构 , 适 度 运 动锻 炼 , 按 时睡 眠是 改善 儿 童 营 养 状 况 、 促 进 儿 童健 康 成 长 的 可行 办 法 。 关键词 : 营养 ; 饮食行为 ; 运动 ; 睡 眠; 多重 对 应 分 析 中图分类号 : R7 2 3 文献标识码 : A Mu l t i p l e C o r r e s p o n d e n c e An a l y s i s o f Nu t r i t i o n a l S t a t u s a n d Li v i n g B e h a v i o r i n Ch i l d r e n
多重比较
多重比较四、多重比较F 值显著或极显著,否定了无效假设H O ,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。
因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。
统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons )。
多重比较的方法甚多,常用的有最小显著差数法(LSD 法)和最小显著极差法(LSR 法),现分别介绍如下。
(一)最小显著差数法 (LSD 法,least significant difference ) 此法的基本作法是:在F 检验显著的前提下,先计算出显著水平为α的最小显著差数αLSD ,然后将任意两个处理平均数的差数的绝对值..j i x x -与其比较。
若..j i x x ->LSD a 时,则.i x 与.j x 在α水平上差异显著;反之,则在α水平上差异不显著。
最小显著差数由(6-17)式计算。
..)(j i e x x df a a S t LSD -=(6-17)式中:)(e df t α为在F 检验中误差自由度下,显著水平为α的临界t 值,..j i x x S -为均数差异标准误,由(6-18)式算得。
nMS S e x x j i /2..=-(6-18)其中e MS 为F 检验中的误差均方,n 为各处理的重复数。
当显著水平α=0.05和0.01时,从t 值表中查出)(05.0e df t 和)(01.0e df t ,代入(6-17)式得:....)(01.001.0)(05.005.0j i e j i e x x df x x df S t LSD S t LSD --==(6-19)利用LSD 法进行多重比较时,可按如下步骤进行: (1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;(2)计算最小显著差数05.0LSD 和01.0LSD ; (3)将平均数多重比较表中两两平均数的差数与05.0LSD 、01.0LSD 比较,作出统计推断。
多重对应分析及其在职业人群健康损害研究中的应用
多重对应分析及其在职业人群健康损害研究中的应用目的:运用多重对应方法研究职业人群健康损害,讨论多重对应方法的重要意义。
方法:选取2013年2月到2015年2月期间的217例的工人,将这217例工人的工种和工龄以及健康状况整理成资料,资料必须要用表格的形式表现出来,即三维例联表,然后我们运用多重对应分析法,对这217例工人的工种和身体健康情况以及年龄作出分析,分析这三者之间到底存在什么样的关系。
结果:行政这个工种的职员,工作年龄一般为5到15年之间,他们有稍微的“轻度失调”表现;电解这个工种的人员,工作年龄一般在16到25岁之间,他们的“潜临床”和“前临床”所表现的现象基本相同;其它工种的职工人员,工作年龄一般在26到35之间,这个工种的职工没有对应的特征。
结论:对选取的这217名工人进行观察,我们就会发现这个工厂的工人的职业亚健康和工作年限以及工种之间有关系,即三者之间是对应关系,彼此之间互相关联。
多重对应法能够说明各个指标之间的情况,反映他们之间的相互对应的关系,我们可以运这种方法来探索多分类资料之间的关联,另外还可以做好未来预防措施。
标签:多重对应分析法;关联性;职业人群;亚健康对应分析(CA)不仅是一种多元统计分析方法,还是一种多维图示技术,我们可以把它简称为R-Q类型的FA,对应分析这种方法是对因子分析的进一步发展。
这种分析法借助定型计量的资料,制作成一种交叉汇总表,然后运这个来体现同一变量和不同变量之间的关系,因此,我们将这种分析法可以称为关联分析法,或者说也可以称为相应分析法。
在简单的CA之中,它的行和列的分类标量非常少,并且只有一个。
如果我们研究的分类变量是在两个以上,那么我们就应该考虑运用多重对应分析法(MCA),CA和MCA所表达的结果更加的简单直观,当前,这两种分析方法运用普遍,一般被运用在医药卫生和经济以及地质等领域。
关于职业人群健康损害的相关研究文献是非常少的。
随着社会竞争压力的增大,职业人群的亚健康问题已经受到社会越来越多的关注,这是当今社会上一个热点话题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多重对应分析方法
多重对应分析在超过两个以上定类变量时有时候非常有效,当然首先我们要理解并思考,如果只有三个或有限的几个变量完全可以通过数据变换和交互表变量重组可以转换成两个定类变量,这时候就可以用简单对应分析了。
对应分析对数据的格式要求:
∙对应分析数据的典型格式是列联表或交叉频数表。
∙常表示不同背景的消费者对若干产品或产品的属性的选择频率。
∙背景变量或属性变量可以并列使用或单独使用。
∙两个变量间——简单对应分析。
∙多个变量间——多元对应分析。
现在,我们还是来看看如何操作多重对应分析并如何解读对应图;
我们假定有个汽车数据集,包括:
来源国(1-美国、2-欧洲、3-日本)
尺寸(1-大型、2-中型、3-小型)
类型(1-家庭、2-运动、3-工作)
拥有(1-自有、2-租赁)
性别(1-男、2-女)
收入来源(1-1份工资来源、2-2份工资来源)
婚姻状况(1-已婚、2-已婚有孩子、3-单身、4-单身有孩子);
从数据集看,我们有7个定类变量,如果组合成简单的交叉表是困难的事情,此时采用多重对应分析是恰当的分析方法。
下面我还是采用SPSS18.0,现在叫PASW Statistics 18.0来操作!注意:不同版本在多重对应分析方法有一些不同,但大家基本上可以看出了,高版本只能是更好,但选择会复杂和不同!
在进行多重对应分析之前,研究者应该能够记住各个变量大致有多少类别,个别变量如果变量取值太偏或异常值出现,都会影响对应分析的结果和对应图分析!
在SPSS分析菜单下选择降维(Data Redaction-数据消减)后选择最优尺度算法,该选项下,根据数据集和数据测量尺度不同有三种不同的高级定类分析算法,主
要包括:多重对应分析、分类(非线性)主成分分析、非线性典型相关分析;
注意:随着版本的增高,研究人员在统计分析时就要各位主要变量的测量尺度,并且最好在进行数据清理和分析前,明确定义好测量尺度;当然也要做好Lable 工作!
接下来,我们就可以选择变量和条件了!
大家可以把要分析的变量都放到分析变量内,补充变量的含义是如果有哪个变量你并不想作为对应分析的变量,而只是作为附属变量表现在对应图上可以加入!这一点其实在简单对应分析也有这种定义。
(我们将在专门的简单对应分析方法中再讲!)
然后我们要选择“变量”选项,大家可以选择类别图:每一个变量的分类图,重点是选择联合类别图,我们把7个变量全部放入,执行!(其它选项大家可以测试)
下面我们看结果:
从图中我们可以看出:美国车都比较大,家庭型,主要购买者是已婚带孩子的;日本和欧洲车主要是小型、运动的和已婚没有孩子的人购买;特别注意:单身和单身带孩子的往往是租赁汽车,收入单一来源,但这个地区没有车满足这个市场,或许是市场空白;
具体的解读大家可以根据自己的研究设计和假设去寻找答案!主要统计指标可以看:
上图主要给我们了对应图维度的解释比率,最下面的图大家会看吗?
提示:夹角是锐角意味着相关,所以:定类变量的相关性是不是可以解释啦!总结:(同样适合简单对应分析)
对应分析的优点:
∙定性变量划分的类别越多,这种方法的优势越明显。
∙揭示行变量类别间与列变量类别间的联系。
∙将类别联系直观地表现在二维图形中(对应图)。
∙可以将名义变量或次序变量转变为间距变量。
对应分析的缺点:
∙不能用于相关关系的假设检验。
∙维度要由研究者决定。
∙有时候对应图解释比较困难。
∙对极端值比较敏感。
本文由项目数据分析师广东授权管理中心转载,更多详细内容请参考。