SPSS统计应用实务
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS统计应用实务
----问卷分析与应用统计
• 研究者只要按照本书中的操作程序, 就能编制预试问卷、完成预试问卷的 项目分析、效度构造与信度检验,并 进行正式问卷的统计分析。
概述 & 量化研究与统计分析
请注意……
I. 变量如果要进行四则运算或统计分析, 其变量的类型一定要设为Numeric类型, 否则无法进行描述性统计分析,参数统 计或非参数检验。
• 27%规则 • 一般情况下,取上下25%~33%均可。 • 样本少时,可以取50%
因素分析
• 建构效度:指测验能测量理论的概念或特 的 质的程度。
• 因素分析的目的即在找出量表潜在的结构,减 少题项的数目,使之变为一组较少而彼此相关 较大的变量,这是一种探索性因素分析。
• 若量表不采用构造效度检验方法,研究者 也可考虑采用其他效度分析法,如内容效 度、专家效度、效标关联效度等。
问卷信效度分析步骤
• • • • • • • 编拟预试问卷 预试 整理问卷与编号 项目分析 因素分析 信度分析 再测信度
编制问卷时应注意……
• 若问卷题项内容过于敏感,应在问卷中穿 插多道“测谎题”。 • 态度量表通常采用里克特式量表法,量表 填答方式以四点量表法至六点量表法采用 最多
关于采用几点量表法的建议
• 信度是效度的必要非充分条件,信度低效 度一定低,但信度高未必表示效度也高。
低
高
信度
效度
题号代号编码时应注意:
1. 题号代号不能重复,变量名称对字母大小 写不做区分,计算机统计分析时视为相同。 2. 同一量表的题号最好有相同的识别码,eg: A1至A20为量表一,B1至B25为量表二。 3. 名义或类别变量的变量代码最好与其意义 内涵有关以三至五个英文字简写代表最好。 如学生性别为SSEX、年龄为AGE 4. 变量代码不要用中文字,如要加注部分变 量的中文说明,在SPSS中修改。
整群抽样步骤
• • • • • • 确认与界定总体 决定研究所需样本大小 确认与定义合理的组群 列出总体所包括的所有组群 估计每个组群中平均总体成员的个体数 以抽取的样本总数初一组群平均个体数,以决定 要选取的组群数目 • 随机抽样方式,选取所需的组群数 • 每个被选取的组群中的所有成员即成为研究样本
• 1、称名数据,组成的这些数据仅是类别符号而已,没有在量方面 的实质性意义,一般不能对这类数据进行加减乘除运算,但通常可对 每一类别计算次数或个数等。例如,用6位数字组成全国各地的邮政 编码。 • • 2、顺序数据,顺序变量数据之间虽有次序与等级关系,但这种数 据之间不具有相等的单位,也不具有绝对的数量大小和零点。因此, 只能进行顺序递推运算。例如,比赛中排名次。 • • 3、等距数据,例如测气温的量值,星期一为20℃,星期二为22℃, 星期三为24℃。则我们可以知道星期三气温高于星期二,星期二气温 又高于星期一;而且我们还可以从实质性的角度说明相邻两天气温之 差是相等的。对这类数据一般不能用乘、除法运算来反映两个数据之 间的倍数关系。有相等单位,无绝对零点。 • • 4、等比数据,例如一个学生在20岁时身高180CM,而他3岁时身 高是90CM,我们可以说,20岁时的身高是他3岁时身高的两倍。这 类数据可以进行加减乘除运算,允许人们用乘除法处理数据,以便对 不同个体的测量结果进行比较,并作比率性描述。有相等单位和绝对 零点。
• 多数情况下,五点量表是最可靠的,超过 五点,一般人难有足够的辨别力。 • 三点量表限制了温和意见与强烈意见的表 达 • 由于人口变量的异质性关系,对于没有足 够辨别力的人而言,七点导致信度的丧失, 对于有足够辨别力的人五点又使他们有受 限感,所以可通过预试发现问题所在。
对于预试问卷题项数的参考:
三、变量性质与适用时机
• 通常因变量为连续变量时,可进行参数统 计,如方差分析、回归分析等 • 当研究的样本数很少或研究分析的变量为 离散变量,则最好采用非参数统计法。
四、量表编制原则
• 在量化的推论统计检验分析中,分为参数统计检 验和非参数统计法。要使用参数检验须符合: • 正态性:受试样本所来自的总体,在因变量上的 概率分布是正态分布。 • 独立性:每个观察值必须是独立的。 • 方差同构性:各组受试样本在因变量得分的方差 假定是相同的。 • 可加性:从总体所抽出的各随机样本相互独立, 总平方和可分解成几个可相加的部分。
因果比较研究与许多实验研究,各组人数至少要有30位。
以下情况要采用较大样本数
• 编制的测量工具的“信度”(可靠性)较 低时 • 研究进行中有较多变量无法控制时 • 总体的同构性很低 • 统计分析时,受试者需再细分为较小的各 群组来分析比较时 • 实验设计时,预期会有较多受试者中途退 出时
二、变量属性是否正确界定?
显著性水平 α为犯第一类错误(Type I error)的概率; β为犯第二类错误(Type II error)的概率.
抽样的基本准则:样本具有代表性
• 选取的样本大小是否足够 • 样本选取时抽样的方法是否适当 • 从样本处所获得的数据是否精确
常用抽样方法
• 随机抽样:根据概率理论,以随机原则方 式从总体中抽取一定比例的受试者。非随 机抽样法常用者为“目的抽样”与“便利 抽样”。 • 分层随机抽样:受试者总体间差异很大, 或某些样本点很少,为顾及小群体的样本 点也能被抽取…… • 整群抽样法:若样本所属的总体很大或涵 括的地理位置很广则……
区分度
• 指测验项目对被试心理品质水平差异的区 分能力或鉴别能力。 • 项目的区分度是测验是否有效的“指示 器”。
鉴别力分析的一般方法:鉴别力指数、
项目-总分相关、项目间相关。
• 鉴别指数(index of discrimination,D)的 计算 • D = P H - PL • 取值范围:-1~ +1 • D为鉴别指数, PH为高分组在某个项目上 的通过率, PL为低分组在该项目上的通过 率。
量的研究主要在于数据的搜集、计算机统计 应用分析。其研究历程包括: 1.选择与定义问题 2. 执行研究的程序 【完整的实施程序包括样本或受试者的选 择,测量工具的改进,数据的搜集。】 3.数据分析 【首要的是正确的统计方法的选用与数据 结果的客观解释】 4.结果分析与结论
• 在统计学中,不能对H1的真实性直接检验, 需要建立与之对立的假设,即虚无假设, 又叫无差假设、零假设、原假设,记为H0 • 在进行任何一项研究时,都需要根据已有 的理论和经验事先对研究结果做出一种预 想的希望证实的假设,叫科学假设,统计 术语表示叫研究假设,记做H1,又称备择假 设、对立假设。
• 若编制一个正式的测验或量表,作为其他 心理测量之用,则预试题项数最好是将来 所需正式题项总数的3-4倍。 • 在某些特定内容范围中,有些量表题项的 设计不容易,或先前相关研究显示,这些 构思不需要过多的题项即可获得良好的内 在一致性,预试量表的题项数约为正式量 表题项数的1.5倍即可。
预试
• 预试对象的性质应与将来正式问卷要抽取 的对象性质相同。 • 预试对象人数以问卷中包括组多题项的 “分量表”的3-5倍人数为原则 • 量表题项数与预试人数比例约为1:5最为合 适。
一、抽样的样本需要多少?
初学者进行与前人相类似的研究时,可参考别人样本数。 若地区性研究平均样本人数在500—1000 全国性研究平均样本人数约在1500—2500 描述性研究是,样本数最少占总体的10%,若总体较小, 则最小的样本数最好为总体的20%。
相关性研究的目的在于探究变量间有无关系存在,受试者 至少须在30人以上。
• 简单描述性分析 • 复选题处理与分析 • 评分制题目的分析
谢谢 ∩_∩
量化研究与统计分析
• • • • 量化研究的基本概念 量表分析步骤 量表的编码 复选题及其他方调查法
访问调查 问卷调查
主要量的 研究设计 方法
相关研究法
真正实验设计
实验法
准实验设计
• 相关法旨在描述两个变量之间的相关以及 相关程度的高低。 • 目的在于证明两个变量之间是否存在相关 并说明这种相关的性质。 • 所有的相关研究法都无非是收集感兴趣的 观察资料,然后计算相关系数。
样本大小应根据研究种类决定:
• 描述性研究:样本人数至少应有总体人数 的10%,若总体较小则…20%。 • 相关研究:样本人数至少有30人 • 实验研究与事后反馈研究:每组人数至少 的 30人
整理问卷与编号
• 最好使用Excel进行数据录入,第一列一定 要为变量名称,第二列为第一位受试者填 答数据.
定性分析
内容效度、题 目编写的恰当 性和有效性等
项目分析
定量分析
题目难度 和区分度 的测量
难度
大体而言,难度为0.50时最理想,此时项 目具有最大的鉴别力。但在实际操作中, 让所有项目难度都到达0.50困难很大,而且 也不必要,一般只需使项目的平均难度接 近0.50,而各个项目的难度在0.50± 0.20 之间变化。 测验难度影响测验分数的离散程度。测验 过难或过易,分数全距缩小,信度降低。 P=0.50时最佳
实验研究时应把握的原则
1. 要有适当的统计检验功效,使μ和μ0间差异
有实质意义存在。
2. 使用最小资源、人数
3. 提供适当的保护,以防止第一类型错误 4. 无关干扰变量的影响要最小
两种类型的错误
实际情况 决定
拒绝H0 接受H0 H0为真 H0不真
第一类错误
正确
正确
第二类错误
犯两类错误的概率: P{拒绝H0|H0为真}=α, P{接受H0|H0不真}=β.
信度分析
• 克朗巴哈系数(Cronbach‘s α)是指量表所有 可能的项目划分方法的得到的折半信度系数的平 均值,是最常用的信度测量方法。 • 其中K为样本数,σ2x为总样本的方差,σ2Yi为目 前观测样本的方差。
再测信度
• 再测信度又称稳定系数,反应量表的稳定 与一致性程度,一般间隔时间越长稳定系 数越低。较常用者为间隔两周或一个月。 • 要以正式量表对同一组受试者前后测验两 次,并将两次得分求其积差相关系数。
----问卷分析与应用统计
• 研究者只要按照本书中的操作程序, 就能编制预试问卷、完成预试问卷的 项目分析、效度构造与信度检验,并 进行正式问卷的统计分析。
概述 & 量化研究与统计分析
请注意……
I. 变量如果要进行四则运算或统计分析, 其变量的类型一定要设为Numeric类型, 否则无法进行描述性统计分析,参数统 计或非参数检验。
• 27%规则 • 一般情况下,取上下25%~33%均可。 • 样本少时,可以取50%
因素分析
• 建构效度:指测验能测量理论的概念或特 的 质的程度。
• 因素分析的目的即在找出量表潜在的结构,减 少题项的数目,使之变为一组较少而彼此相关 较大的变量,这是一种探索性因素分析。
• 若量表不采用构造效度检验方法,研究者 也可考虑采用其他效度分析法,如内容效 度、专家效度、效标关联效度等。
问卷信效度分析步骤
• • • • • • • 编拟预试问卷 预试 整理问卷与编号 项目分析 因素分析 信度分析 再测信度
编制问卷时应注意……
• 若问卷题项内容过于敏感,应在问卷中穿 插多道“测谎题”。 • 态度量表通常采用里克特式量表法,量表 填答方式以四点量表法至六点量表法采用 最多
关于采用几点量表法的建议
• 信度是效度的必要非充分条件,信度低效 度一定低,但信度高未必表示效度也高。
低
高
信度
效度
题号代号编码时应注意:
1. 题号代号不能重复,变量名称对字母大小 写不做区分,计算机统计分析时视为相同。 2. 同一量表的题号最好有相同的识别码,eg: A1至A20为量表一,B1至B25为量表二。 3. 名义或类别变量的变量代码最好与其意义 内涵有关以三至五个英文字简写代表最好。 如学生性别为SSEX、年龄为AGE 4. 变量代码不要用中文字,如要加注部分变 量的中文说明,在SPSS中修改。
整群抽样步骤
• • • • • • 确认与界定总体 决定研究所需样本大小 确认与定义合理的组群 列出总体所包括的所有组群 估计每个组群中平均总体成员的个体数 以抽取的样本总数初一组群平均个体数,以决定 要选取的组群数目 • 随机抽样方式,选取所需的组群数 • 每个被选取的组群中的所有成员即成为研究样本
• 1、称名数据,组成的这些数据仅是类别符号而已,没有在量方面 的实质性意义,一般不能对这类数据进行加减乘除运算,但通常可对 每一类别计算次数或个数等。例如,用6位数字组成全国各地的邮政 编码。 • • 2、顺序数据,顺序变量数据之间虽有次序与等级关系,但这种数 据之间不具有相等的单位,也不具有绝对的数量大小和零点。因此, 只能进行顺序递推运算。例如,比赛中排名次。 • • 3、等距数据,例如测气温的量值,星期一为20℃,星期二为22℃, 星期三为24℃。则我们可以知道星期三气温高于星期二,星期二气温 又高于星期一;而且我们还可以从实质性的角度说明相邻两天气温之 差是相等的。对这类数据一般不能用乘、除法运算来反映两个数据之 间的倍数关系。有相等单位,无绝对零点。 • • 4、等比数据,例如一个学生在20岁时身高180CM,而他3岁时身 高是90CM,我们可以说,20岁时的身高是他3岁时身高的两倍。这 类数据可以进行加减乘除运算,允许人们用乘除法处理数据,以便对 不同个体的测量结果进行比较,并作比率性描述。有相等单位和绝对 零点。
• 多数情况下,五点量表是最可靠的,超过 五点,一般人难有足够的辨别力。 • 三点量表限制了温和意见与强烈意见的表 达 • 由于人口变量的异质性关系,对于没有足 够辨别力的人而言,七点导致信度的丧失, 对于有足够辨别力的人五点又使他们有受 限感,所以可通过预试发现问题所在。
对于预试问卷题项数的参考:
三、变量性质与适用时机
• 通常因变量为连续变量时,可进行参数统 计,如方差分析、回归分析等 • 当研究的样本数很少或研究分析的变量为 离散变量,则最好采用非参数统计法。
四、量表编制原则
• 在量化的推论统计检验分析中,分为参数统计检 验和非参数统计法。要使用参数检验须符合: • 正态性:受试样本所来自的总体,在因变量上的 概率分布是正态分布。 • 独立性:每个观察值必须是独立的。 • 方差同构性:各组受试样本在因变量得分的方差 假定是相同的。 • 可加性:从总体所抽出的各随机样本相互独立, 总平方和可分解成几个可相加的部分。
因果比较研究与许多实验研究,各组人数至少要有30位。
以下情况要采用较大样本数
• 编制的测量工具的“信度”(可靠性)较 低时 • 研究进行中有较多变量无法控制时 • 总体的同构性很低 • 统计分析时,受试者需再细分为较小的各 群组来分析比较时 • 实验设计时,预期会有较多受试者中途退 出时
二、变量属性是否正确界定?
显著性水平 α为犯第一类错误(Type I error)的概率; β为犯第二类错误(Type II error)的概率.
抽样的基本准则:样本具有代表性
• 选取的样本大小是否足够 • 样本选取时抽样的方法是否适当 • 从样本处所获得的数据是否精确
常用抽样方法
• 随机抽样:根据概率理论,以随机原则方 式从总体中抽取一定比例的受试者。非随 机抽样法常用者为“目的抽样”与“便利 抽样”。 • 分层随机抽样:受试者总体间差异很大, 或某些样本点很少,为顾及小群体的样本 点也能被抽取…… • 整群抽样法:若样本所属的总体很大或涵 括的地理位置很广则……
区分度
• 指测验项目对被试心理品质水平差异的区 分能力或鉴别能力。 • 项目的区分度是测验是否有效的“指示 器”。
鉴别力分析的一般方法:鉴别力指数、
项目-总分相关、项目间相关。
• 鉴别指数(index of discrimination,D)的 计算 • D = P H - PL • 取值范围:-1~ +1 • D为鉴别指数, PH为高分组在某个项目上 的通过率, PL为低分组在该项目上的通过 率。
量的研究主要在于数据的搜集、计算机统计 应用分析。其研究历程包括: 1.选择与定义问题 2. 执行研究的程序 【完整的实施程序包括样本或受试者的选 择,测量工具的改进,数据的搜集。】 3.数据分析 【首要的是正确的统计方法的选用与数据 结果的客观解释】 4.结果分析与结论
• 在统计学中,不能对H1的真实性直接检验, 需要建立与之对立的假设,即虚无假设, 又叫无差假设、零假设、原假设,记为H0 • 在进行任何一项研究时,都需要根据已有 的理论和经验事先对研究结果做出一种预 想的希望证实的假设,叫科学假设,统计 术语表示叫研究假设,记做H1,又称备择假 设、对立假设。
• 若编制一个正式的测验或量表,作为其他 心理测量之用,则预试题项数最好是将来 所需正式题项总数的3-4倍。 • 在某些特定内容范围中,有些量表题项的 设计不容易,或先前相关研究显示,这些 构思不需要过多的题项即可获得良好的内 在一致性,预试量表的题项数约为正式量 表题项数的1.5倍即可。
预试
• 预试对象的性质应与将来正式问卷要抽取 的对象性质相同。 • 预试对象人数以问卷中包括组多题项的 “分量表”的3-5倍人数为原则 • 量表题项数与预试人数比例约为1:5最为合 适。
一、抽样的样本需要多少?
初学者进行与前人相类似的研究时,可参考别人样本数。 若地区性研究平均样本人数在500—1000 全国性研究平均样本人数约在1500—2500 描述性研究是,样本数最少占总体的10%,若总体较小, 则最小的样本数最好为总体的20%。
相关性研究的目的在于探究变量间有无关系存在,受试者 至少须在30人以上。
• 简单描述性分析 • 复选题处理与分析 • 评分制题目的分析
谢谢 ∩_∩
量化研究与统计分析
• • • • 量化研究的基本概念 量表分析步骤 量表的编码 复选题及其他方调查法
访问调查 问卷调查
主要量的 研究设计 方法
相关研究法
真正实验设计
实验法
准实验设计
• 相关法旨在描述两个变量之间的相关以及 相关程度的高低。 • 目的在于证明两个变量之间是否存在相关 并说明这种相关的性质。 • 所有的相关研究法都无非是收集感兴趣的 观察资料,然后计算相关系数。
样本大小应根据研究种类决定:
• 描述性研究:样本人数至少应有总体人数 的10%,若总体较小则…20%。 • 相关研究:样本人数至少有30人 • 实验研究与事后反馈研究:每组人数至少 的 30人
整理问卷与编号
• 最好使用Excel进行数据录入,第一列一定 要为变量名称,第二列为第一位受试者填 答数据.
定性分析
内容效度、题 目编写的恰当 性和有效性等
项目分析
定量分析
题目难度 和区分度 的测量
难度
大体而言,难度为0.50时最理想,此时项 目具有最大的鉴别力。但在实际操作中, 让所有项目难度都到达0.50困难很大,而且 也不必要,一般只需使项目的平均难度接 近0.50,而各个项目的难度在0.50± 0.20 之间变化。 测验难度影响测验分数的离散程度。测验 过难或过易,分数全距缩小,信度降低。 P=0.50时最佳
实验研究时应把握的原则
1. 要有适当的统计检验功效,使μ和μ0间差异
有实质意义存在。
2. 使用最小资源、人数
3. 提供适当的保护,以防止第一类型错误 4. 无关干扰变量的影响要最小
两种类型的错误
实际情况 决定
拒绝H0 接受H0 H0为真 H0不真
第一类错误
正确
正确
第二类错误
犯两类错误的概率: P{拒绝H0|H0为真}=α, P{接受H0|H0不真}=β.
信度分析
• 克朗巴哈系数(Cronbach‘s α)是指量表所有 可能的项目划分方法的得到的折半信度系数的平 均值,是最常用的信度测量方法。 • 其中K为样本数,σ2x为总样本的方差,σ2Yi为目 前观测样本的方差。
再测信度
• 再测信度又称稳定系数,反应量表的稳定 与一致性程度,一般间隔时间越长稳定系 数越低。较常用者为间隔两周或一个月。 • 要以正式量表对同一组受试者前后测验两 次,并将两次得分求其积差相关系数。