参数统计与非参数统计、
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本统计方法一般分为两个大的分支—参数统计和非参数统计。非参数统计方法主要有:一是卡方拟合度检验(大众媒介研究者经常比较某一现象所观察到的发生频次和其期望值或假设的发生频次,卡方(X的平方)是一个表示期望值和观察值之间关系的值)。其局限性在于变量必须是定类或者定序测量的。二是交叉表分析,可以同时检验两个或者更多的变量。参数统计常用于定距或定比数据。一是t检验,二是方差分析;三是相关性统计分析。
T分布在抽样分布和样本分布之间架起了一座桥梁,是借助于颐和总显著性检验来实现的,成为“t检验”。t检验又称“均值检验”,用以计算样本均值是否不同于总体均值、零或另一样本均值。可分为三种类型:一是检验样本均值是否不同于其总体均值。二是检验一个样本均值是否与另一个样本均值不同(独立样本t检验)。三是重复测量的t检验—当相比较的两组样本以某种相联系的方式重复(相同的被试在不同时间段的结果检验)。
方差分析(ANOV A)——当实验涉及机组的比较时适用的统计方法。它是均值检验的一种自然延伸,更强调样本组内与组间的变化而不是样本组均值。ANOV A将发生在因变量上的变化分为由自变量作用的方差(称为被假设方差)和不被解释的方差(称为误差或剩余方差)。“被解释”方差成为“主效应”。ANOV A应用F分布而非t分布。多因子方差分析——任何有两个或更多个自变量的ANOV A可以是多因子ANOV A,测量其“交互效应”。
相关检验——不同于t检验的均值检验,相关是一种“关联性”测量。相关测量一个变量值的改变与另一个变量值改变的关联程度。相关的显著性是指,系统性变化是否又非偶然因素引起的;换言之,相关系数是否显著大于零。最常见的相关检验是皮尔逊积矩相关系数。
例3:在某次的新闻节目收视情况调查中,总体为某市12岁以上的居民。有效样本男性为240人,平均每天收视时间31.5分钟,标准差12分钟;样本中女性180人,平均每天收视时间26.3分钟,标准差19分钟,请问总体中男女居民的新闻节目收视时间有无差异?原假设H0:总体中没有差异:H0:u1=u2;H1:u1>u2, u1 案例8:人际印象效果测量。概念的操作化:1目标:将概念转化为变量2概念:对事物的抽象定义3变量:概念所对应的具有操作定义的量4过程:操作定义的步骤—步骤1:将变量分解为多个维度(dimension),步骤2:每个维度选择一组指标(indicator)来衡量。人际印象效果可以划分为哪些维度:维度1:印象的鲜明度;维度2:印象的全面度;维度3:印象的好感度;维度4:印象的失真度。 变量的测量工具—量表(scale)、问卷(questionnaire)(量表能将变量的层次提升到定比和定距层面,而问卷只能局限于定类和定序层面)常见成熟量表:人格量表、智力量表、职业倾向量表。量表的分类:自陈式量表:被试对自身情况作出判断并填写;评定式量表:被试对目标他人作出判断并填写;里克特量表(Likert Scale);语义差异量表(Semantic Differential Scale)。量表的选择:保证效度信度(成熟量表)一定程度上保证效度信度(改编量表)基本无法保证效度信度(自编量表) 案例9:NEO五因素人格量表Neuroticism(情绪性)Extraversion(外向性)Openness(开明性)Agreeableness(宜人性)Conscientiousness(严谨性)NEO各维度的测量指标 情绪性(N):焦虑度、抑郁度、自信度;外向性(E):乐群度、热情度、交际反应性;开明性(O):想象力、行动力、观念开放度;宜人性(A):温和度、信任度、利他性;严谨性(C):条理性、审慎度、自律性 严格的量表编制流程:清楚地决定你要测量什么;选择量表的形式(里克特、语义差异等);建立一个题项库;征求专家评价及建议;考虑是否加入某些特殊测试题项;小样本试测;评估题项的适合度并筛选题项;优化量表长度 质性资料收集方法一:访谈(一)访谈计划的制订 1访谈的分类:结构式访谈(structural interview)无结构式访谈(non-structural interview)2、在制订访谈计划的过程中,通常研究者需要明确这样几个问题:为什么通过访谈来收集资料?怎样进行访谈?访谈的对象是谁?什么时间以及在何处进行访谈?3、为什么通过访谈来收集资料?把握内心:企图对个人动机、态度、价值观念、思想等无法直接观察的问题进行把握。挖掘细节:对整个研究对象的故事细节缺乏了解。集中焦点:需要搜寻和集中一些问题的焦点以便为量化研究做准备。 4、怎样进行访谈?三轮访谈序列(the series of three interviews)第一轮:再现生活经历:探寻被访者获得的生活经历及其背景;第二轮:挖掘经历细节:让被访者在其所处背景中还原(重构)经历的细节;第三轮:反思经历意义:鼓励和引导被访者反思其经历对其自身的意义。 5、访谈的对象是谁?“找熟人”的问题:问题1:熟人之间可能存在利害相关性,以致损害研究者与被访者之间的平等关系,从而使得被访者在谈论话题的时候产生种种顾忌,导致研究者获取的信息可靠性受到影响。问题2:熟人之间(尤其是朋友之间)有可能认为自己能够很好地理解对方的想法,以致于削弱对经历的挖掘和意义的反思。 6、目的性抽样(purposive sampling):典型案例抽样(typical case sampling)极端/异常案例抽样(extreme/deviant sampling)关键案例抽样(critical case sampling)最大变异性抽样(maximum variation sampling) 7、被访者筛选过程中可能出现的问题:不愿意参与访谈的人—通常还是不宜勉强选为被访者,因为这样的人即便被说服后参与了访谈,可能在访谈中仍然处于一种对抗和抵触的状态,造成对整个研究的不利影响。别有企图而特别想要参与访谈的人—研究者也必须谨慎。特别想要对研究者进行表达的被访者很可能不能给予研究者自然状态下的信息。 8、被访者的数量:两个判断标准:对象涵盖面:已选取的被访者是否足以涵盖研究所需要考察的人群中不同特征的人。信息饱和度:通过访谈,研究者是否已经听到了大量重复信息,或者说已几乎不再可能获取 9、什么时间以及在何处进行访谈?访谈时间:有学者提出了90分钟的访谈长度。建议根据具体情况而定。访谈间隔:3天——1周。既有利于被访者获得一定的时间来反思前一次访谈,又不至于造成两次访谈之间时间间隔过久而使得被访者的前后两次访谈的关系变得淡化。访谈地点:被访者居所或办公室、约定的公共场合(如水吧、茶馆、咖啡厅等)以及研究者居所或办公室。(尽量尊重被访者意见)(二)访谈的准备工作(三)访谈关系的建立与维持(四)访谈技巧(五)访谈记录 关联性检验(measures of association)是统计学最重要的方法之一。关联性取决于测量的水平与检验的类型。例如,定类数据测量需要一种关联性测量,而定序数据则需要另外一种,关联性检验的种类包括独立性检验(即检验一个变量是否依赖另一个变量)和相关性检验(即检验一个变量是否随另一个变量的变化而增减)。T检验——是定序变量的关联性测量方法。当一个自变量为定类或定序而另一个变量为定距时,用T检验。卡方检验是一种检验变量变异性的测量。适用于进行变量间的独立性检验。如果把一个变量对另一个变量的可能的影响归结为仅仅由偶然因素引起,那么这两个变量可视为独立变量,即一个变量的变化不依赖于另一个变量。 相关性是一种关联性测量,是一种动态测量;描述两个变量联系的紧密程度,当一个变量变化时,另一个变量也随之而变化。如果变化的轨迹相近,则两者高度相关。另一方面,独立性是一种静态测量,它是检验交互表中观察值的分布是否超出了可以归结为偶然发生的范围,与变量间的动态关系无关,卡方作独立性检验, T检验适用于两组间比较,多组比较适用于方差分析,ANOV A更强调样本组内与组间的变化而不是样本均值。ANOV A将发生在因变量上的变化分为由自变量作用的方差(称为被解释方差——主效应)和不被解释的方差(称为误差或剩余方差)。 T检验、ANOV A和相关检验是主要的参数统计假设检验。 任何有两个或者更多个自变量的ANOV A可以是“多因子”ANOV A。一个自变量单独对因变量的影响不同于第二个或后面自变量的影响,A因子、B因子、C因子对因变量的共同作用成为交互效应。交互效应可以看成是两个变量共同的贡献,但两变量如果分开,则观察不到这种贡献。假如因变量的差异对一个变量和另一个变量来说是相同的,那么所分析的交互效应会趋于零。 相关检验—T检验是均值检验,相关则是一种“关联性”检验。相关测量一个变量值的改变与另一个变量值改变的关联程度。相关的显著性是指,系统性变化是否由非偶然因素引起;换言之,相关系数是否显著大于零。最常见的相关检验是皮尔逊积矩相关系数。当分析这有某一连续变量和另一定序变量时,适合的相关系数是斯皮尔曼级序相关系数。 非参数检验中最常见的是卡方检验。卡方的一项使用是“拟合优度”检验,测量观察时间相对于期望事件的频数。如果观察结果与期望的结果相适合,则不拒绝零假设。 内容分析法的步骤:1、选择主题2决定样本或普查3、定义要计算的概念或单位4、建构类别5、制作编码表6、训练编码员7、收集资料8、测量编码员之间的信度9、分析数据10、报告结果. 研究过程:选择研究课题@确定课题价值@回溯研究文献@陈述理论假设@数据分析与阐释@呈报结果@ 何时使用众数、中位数和均值?如果数据属性是分类的,而且数值只属于一种类型,例如头发颜色、政治背景、邻里位置和宗教,就是用众数。在这种情况下各个分类之间是互斥的。如果数据中包含极值而且你不想扭曲平均数就是用中位数,例如收入。最后,如果数据不包括极值也不是分类数据就是用均值,例如考试得分或游50码需要的时间。 在多因素实验研究中,主效应就是在考察一个变量是否会对因变量的变化发生影响的时候,不考虑其他研究变量的变化,或者说将其他变量的变化效应平均掉。换句话说,就是其他研究变量都不变化的情况下,单独考察一个自变量对因变量的变化效应。 交互效应,则是反映两个或两个以上自变量相互依赖、相互制约,共同对因变量的变化发生影响。换句话说,如果一个自变量对因变量的影响效应会因另一个自变量的水平不同而有所不同,则我们说这两个变量之间具有交互效应。 在分析多个自变量的效应时,要注意主效应与交互效应之间的关联性。我在《应用实验心理学》的第二章末尾,专门就这一问题进行了讨论。现录于此,仅供参考:在析因实验(多因素实验)中,数据收集、数据分析的主要目标是考察自变量的主效应和交互效应是否显著。一个自变量的主效应显著,意味着该自变量的各个水平在其它自变量的所有水平上的平均数存在差异;否则,就不存在显著性差异。比如,在自变量A和自变量B构成的2×2析因设计中,如果A的主效应显著,那就意味着A1在B1和B2水平下的平均数与A2在B1和B2水平下的平均数存在显著性差异。变量间的交互效应则是指一个因子的效应依赖于另一个因子的不同水平。在析因设计中,方差分析直接给出自变量的主效应和交互效应是否显著的结果,多数研究者也依次判定自变量的作用是否明显、这些自变量的作用是否相互依赖。事实上,自变量的主效应与交互效应的评估并非这么简单,它们存在关联性,需要具体情况具体分析。我们就以两个自变量的主效应和交互效应来分析。当交互效应不显著的时候,两个自变量相互独立,我们可以直接从其主效应是否显著来评估自变量对因变量的作用大小;当两个自变量间的交互效应显著时,就不能简单地从主效应是否显著直接得出结论了。我们现在以交互效应显著为前提,来区分自变量A的主效应是否显著的三种情况:第一,交互效应显著,A的主效应也显著,而且主效应方向与简单效应方向一致,如图2-5中的b图就属于这类情况。这种情况下,在自变量B的两个水平上,自变量A从A1到A2的变化引起的因变量的变化趋势一致,只是变化幅度不一致。这里的交互效应掩盖了自变量A在自变量B不同水平上的效应量的差异。很明显,在B1上平上,A的效应量大于其在B2水平上的效应量。第二,交互效应显著,A的主效应也显著,这时A的效应方向可能会被交互效应歪曲。比如图2-5中的a图、d图都属于这类情况。在a图中,A的变化在B1的水平上引起了因变量的显著变化,但在B2水平上却未引起因变量的变化,这就是说A的变化不是在任何情况下都会引起因变量的变化的,它依赖于自变量B的水平;在d图中,虽然A的变化在B的两个水平上都引起了因变量的明显变化,但是变化的方向正好相反,从其主效应看,A的水平提高可以促进因变量分数的提高,但实际情况是,当A在B1水平上提高时,反而会导致因变量分数的下降。所以在这种情况下,显著的交互效应掩盖或歪曲了自变量A的作用机制:它在B的不同水平上效应量是不同的。第三,交互效应显著,A的主效应却不显著,实际上是交互效应掩盖了A的效应,如图2-5中的c、e、f图都属于这种情况。我们从这些图示中可以明显看到A的效应,但方差分析结果却会显示A的主效应不显著,这是因为A在B的两个水平上的效应方向相反,计算A的主效应时A1和A2的差异量被掩盖在了平均过程中。 那么,如何依据自变量主效应和其与其它自变量的交互效应来进行结果分析呢?这一点很简单:当方差分析结果显示A的主效应及A与其它自变量的交互效应都不显著时,则说明A的效应真的不明显;当方差分析的结果显示A的主效应不显著但A与其它自变量的交互效应显著时,则说明A其实是对因变量有明显作用的,即A 的效应其实是存在的,只不过其效应的大小和方向依赖于其它自变量的不同水平。 上述分析提醒我们,在说明方差分析结果时你要特别注意,如果因子间的交互效应达到了显著性水平,那么自变量的效应有可能会被歪曲或掩盖,也就是说,不能简单地依据其主效应是否显著来判断它是否对因变量有影响,而是要进行简单效应检验,分别考察其在其它自变量不同水平上的变化情况。否则,可能会得到错误结论。应该记住,一个因子的主效应是对其在另外一个因子所有不同水平下观测分数的平均而得到的,而这种平均的结果可能很难准确地反映每种具体实验处理的效应。总之,交互效应可能会掩盖或歪曲两个因子中任何一个因子的主效应。因此,只要是交互效应达到了统计学上的显著性水平,你在就主效应问题作出结论前都要仔细考察具体的数据变化。”