实例操作复习
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 例6.7 选取某种植物3个品种(Plant),在 每一株内选取两片叶子(Leaf)(嵌套在植 株因素下的第二个因素),用取样器从每 一片叶子上选取同样面积的两个样本(两 次重复),称取湿重,结果见表6-20,数据 库见6.7.sav。对以上结果进行方差分析。
重复测量方差分析
• 重复测量资料是由在不同时间点上对同一对象
• 5.3 独立样本T检验 • 例 5.3 :现希望评价两位老师的教学质量, 试比较其分别任教的甲、乙两班(设甲、 乙两班原 成绩相近,不存在差别)考试后 的成绩是否存在差异?见例5-3.sav。
• 5.4 配对样本T检验
• 例5.4:某地区随机抽取12名贫血儿童的家 庭,实行健康教育干预三个月,干预前后 儿童的血红蛋白(%)测量结果见例54.sav,试问干预前后该地区贫血儿童血红 蛋白(%)平均水平有无变化?
• 平均差:数组中每一个数与均值之差的绝 对值的均值。
• 方差:统计中的方差(样本方差)是各个 数据分别与其平均数之差的平方的和的平 均数。 • 标准差:标准差是方差的算术平方根。
• 标准误:标准误用来衡量抽样误差。标准 误越小,表明样本统计量与总体参数的值 越接近,样本对总体越有代表性,用样本 统计量推断总体参数的可靠度越大。因此, 标准误是统计推断可靠性的指标。
• 例2.14:为了解某班男生的平均成绩情况, 将他们的平均成绩分为4个档次 ,80分以上 的为“优秀=1”、70-80分的为“良好=2”、 60-70分的为“中等=3”,60分以下的为“差 =4”。数据见“2-14重新编码数据.sav”。 • 要求同时使用该数据“重新编码相同变量”
和“重新编码不同变量”
• 2、定量数据的集中趋势 算术平均数:是指在一组数据中所有数据之和再 除以这组数据的个数。 加权平均数:即将各数值乘以相应的权数,然后 加总求和得到总体值,再除以总的单位数。例: 学生总成绩的计算,平时20%,期中30%,期末 50%。 • 加权平均值 =( 80*20% + 90*30% + 95*50% )/(20%+30%+50%)=90.5 • 算术平均值(80 + 90 + 95)/3 = 88.3
全部k个因素按主次排列,依次称为1级,2级 … k级因素,再
将总离差平和及自由度进行分解,其基本思想与一般方差分 析相同。所不同的是分解法有明显的区别,它侧重于主要因
素,并且,第i级因素的显著与否,是分别用第i级与第i+1级
因素的均方为分子和分母来构造F统计量,并以F测验为其理 论根据的。
嵌套设计方差分析
缩压的降压效果,研究者将受试对象随机分为 两组,分别接受A、B降压药治疗2个月后,测 量患者收缩压,资料见表6-16。数据库见66.sav。本例治疗前的血压专业上应该对治疗后
的血压存在影响,因此采用协方差分析较为合
适。
嵌套设计方差分析
• 嵌套设计被称为巢式设计(nested design)有些教科书上称 这类资料为组内又分亚组的分类资料。根据因素数的不同, 套设计可分为二因素(二级)、三因素(三级)等设计。 将
实例操作
• 例4.1:现测量某人群性别、民族、
身高和体重数据,数据格式如图4-5 所示。请运用“代码本”进行文件
及变量属性特征进行描述。
• 依然以例4.1为例,现对4-1.sav数据进行 OLAP立方分析。性别、年龄、身高、体重 • 依旧以例4.1为例,对不同性别个案的“身 高”和“体重”进行汇总。
实例操作复习
数据的分布特征
• 数据的集中趋势 • 1、定性数据的集中趋势 众数(Mode) : 是一组数据中出现次数 最多的数值。 中位数(又称中值,Median):当变量值 的项数N为奇数时,处于中间位置的变量值 即为中位数;当N为偶数时,中位数则为处 于中间位置的2个变量值的平均数。
数据的分布特征
ຫໍສະໝຸດ Baidu
数据排序实例解析
• 例2.8 将职员的工资按职工号和职称,见 “2-8 排序数据.sav”。 要求:职工号按升序、职称要降序。
分类汇总实例讲解
• 例2.9:以性别作为分组变量,对职员的工 资和年龄的均值进行汇总。见数据“2-9汇 总数据.sav”15-4.sav。
数据加权实例解析
• 例2.10 将人数进行加权,例见“2-10加权 数据.sav”
SPSS报告模块含5种功能
• (1)代码本:用于反映数据库中变量属性特征信息 • (2)OLAP立方:按照一个或者多个分组变量所分的 组,计算目标变量(需为定量变量)的总值、均值以 及其他基本统计量; • (3)个案汇总:主要用于按照指定的分组变量统计分 析不同水平的交叉汇编,对变量进行记录列表,并计 算相应的统计量; • (4)按行汇总; • (5)按列汇总:用于生成复杂报表,它们均可对输出 的表格进行精确的定义,以满足用户的不同需求。
数据的分布特征
• 2、定量数据的集中趋势 截尾平均数:截尾均值是指在一个数列中, 去掉两端的极端值后所计算的算术平均数, 也称为切尾均值。 几何平均数(geometric mean):是指n个观 察值连乘积的n次方根。主要用于平均发展速 度的计算。且只适用于比率数据。
数据的离中趋势
• 全矩,也称极差。是一组数据中最大值与 最小值之差。 • 四分位差:四分位差反映了中间50%数据的 离散程度,其数值越小,说明中间的数据 越集中;其数值越大,说明中间的数据越 分散。
要求:1、让1=男,2=女
2、让1=A,2=A 3=AB,4=O
数据合并实例解析
• 例2.5 将“2-4 未标题4 数据保存”与“2-5 未标题”数据进行合并。 • 例2.6 将“2-4 未标题4 数据保存”与“2-6 Untitled 2” 数据进行合并。
数据拆分实例解析
例2.7:将职员的按性别、年龄进行拆分, 见 “2-7 拆分数据.sav”数据。
方差分析
• 单因素设计方差分析 • 例6.1 比较三个不同电池生产企业生产电池 的寿命,见例6-1.sav。此例企业为因素,不 同厂家为水平,本例为单因素3水平设计。
• 随机区组设计方差分析
• 例6.2 某研究机构研究了3种动物饲料对4种 品系小鼠体重增加的影响,数据见表6-5, 数据库文件见6-2.sav。
重复数据查找实例讲解
• 例2.11:查找2-11重复数据.sav中的重复数 据。
个案选择实例讲解
• 例2.12:选择工资大于1800元人员进行分析; 见例2-12.sav。
计算变量实例讲解
• 例2.13:计算某班男生,每位同学的平均成 绩,见2-13计算新变量.sav。
变量值重新编码实例讲解
频率统计分析实例讲解
• 例3.1:从某单位职工体检资料中获得101名 正常成年女子的血清总胆固醇 (mmol/L) 的测量结果;见“胆固醇.sav ” 。
描述统计分析实例讲解
• 例3.2:分析不同性别演员获得奥斯卡的年 龄差异性;见“演员.sav ” .
探索统计分析实例讲解
• 例3.3:分析中国南北城市的温度差异;见 “南北差异温度.sav ” .
据如表6-11,试对数据进行分析,数据库请
见6-4.sav。
拉丁方设计方差分析
• 例6-5 为了比较5种防护服对脉搏数的影响,
选用5个受试者,在5个不同的日期进行试
验。用拉丁方设计,在行、列与字母上分
别安排3个因素(日期、受试者、防护服),
得如表6-13结果。
协方差分析
• 例6.6 为研究A、B两种降压药对高血压病人收
例1,请构建表1-2的SPSS数据库
• 表1-2某授课小组人员信息
姓名 name 李国梅 程丽 杨玲 王磊 性别 身高 体重 年龄 血型 sex height weight age bloodtype 168 48 20 A 女 女 女 男 167 160 178 54 58 60 19 19 21 B AB O
T检验
• 5.1 均值(Means)过程 例5.1:比较不同性别同学的成绩平均值,见 例5-1.sav。 • 5.2 单样本T检验 • 例 5.2 :某药物在某种溶剂中溶解后的标准浓 度为 20.00mg/L 。现采用某种方法,测量该药 物溶解液11次,测量后得到的结果见例5-2.sav。
• 问:用该方法测量所得结果是否与标准浓度值 有所不同?见例5-2.sav
的同一观察指标进行多次测量所得,重复测量 设计是在科研工作中常见的设计方法,常用来 分析在不同时间点上该指标的差异。重复测量 设计最主要的优点就是提高了处理组间的精确
度,因为它可以通过对同一个体数据的分析估
计出实验误差的大小。
• 例6.8 某研究者欲了解一套新的锻炼方法的减 肥效果,该研究者在某小学随机抽取了12名 肥胖学生,随机分成两组!第一组每天下午按 新的锻炼方法锻炼!第二组不参与新的锻炼, 方法锻炼并于实验开始的第1、2、3个月分 别测量学生体重减重情况,测量值如表6-22 所示,构建数据库见6-8.sav。
• 析因设计方差分析
• 例6.3 A、B两种药物联合应用对红细胞增加 数的影响,数据见表6-8。数据库见6-3.sav。
交叉设计方差分析
• 例6.4 为比较血液透析过程中,低分子肝素
钙(A)与速避凝(B)对凝血酶原时间(TT)
的影响,选择20例接受血液透析的病人为
研究对象,采取二阶段交叉设计,试验数
重复测量方差分析
• 重复测量资料是由在不同时间点上对同一对象
• 5.3 独立样本T检验 • 例 5.3 :现希望评价两位老师的教学质量, 试比较其分别任教的甲、乙两班(设甲、 乙两班原 成绩相近,不存在差别)考试后 的成绩是否存在差异?见例5-3.sav。
• 5.4 配对样本T检验
• 例5.4:某地区随机抽取12名贫血儿童的家 庭,实行健康教育干预三个月,干预前后 儿童的血红蛋白(%)测量结果见例54.sav,试问干预前后该地区贫血儿童血红 蛋白(%)平均水平有无变化?
• 平均差:数组中每一个数与均值之差的绝 对值的均值。
• 方差:统计中的方差(样本方差)是各个 数据分别与其平均数之差的平方的和的平 均数。 • 标准差:标准差是方差的算术平方根。
• 标准误:标准误用来衡量抽样误差。标准 误越小,表明样本统计量与总体参数的值 越接近,样本对总体越有代表性,用样本 统计量推断总体参数的可靠度越大。因此, 标准误是统计推断可靠性的指标。
• 例2.14:为了解某班男生的平均成绩情况, 将他们的平均成绩分为4个档次 ,80分以上 的为“优秀=1”、70-80分的为“良好=2”、 60-70分的为“中等=3”,60分以下的为“差 =4”。数据见“2-14重新编码数据.sav”。 • 要求同时使用该数据“重新编码相同变量”
和“重新编码不同变量”
• 2、定量数据的集中趋势 算术平均数:是指在一组数据中所有数据之和再 除以这组数据的个数。 加权平均数:即将各数值乘以相应的权数,然后 加总求和得到总体值,再除以总的单位数。例: 学生总成绩的计算,平时20%,期中30%,期末 50%。 • 加权平均值 =( 80*20% + 90*30% + 95*50% )/(20%+30%+50%)=90.5 • 算术平均值(80 + 90 + 95)/3 = 88.3
全部k个因素按主次排列,依次称为1级,2级 … k级因素,再
将总离差平和及自由度进行分解,其基本思想与一般方差分 析相同。所不同的是分解法有明显的区别,它侧重于主要因
素,并且,第i级因素的显著与否,是分别用第i级与第i+1级
因素的均方为分子和分母来构造F统计量,并以F测验为其理 论根据的。
嵌套设计方差分析
缩压的降压效果,研究者将受试对象随机分为 两组,分别接受A、B降压药治疗2个月后,测 量患者收缩压,资料见表6-16。数据库见66.sav。本例治疗前的血压专业上应该对治疗后
的血压存在影响,因此采用协方差分析较为合
适。
嵌套设计方差分析
• 嵌套设计被称为巢式设计(nested design)有些教科书上称 这类资料为组内又分亚组的分类资料。根据因素数的不同, 套设计可分为二因素(二级)、三因素(三级)等设计。 将
实例操作
• 例4.1:现测量某人群性别、民族、
身高和体重数据,数据格式如图4-5 所示。请运用“代码本”进行文件
及变量属性特征进行描述。
• 依然以例4.1为例,现对4-1.sav数据进行 OLAP立方分析。性别、年龄、身高、体重 • 依旧以例4.1为例,对不同性别个案的“身 高”和“体重”进行汇总。
实例操作复习
数据的分布特征
• 数据的集中趋势 • 1、定性数据的集中趋势 众数(Mode) : 是一组数据中出现次数 最多的数值。 中位数(又称中值,Median):当变量值 的项数N为奇数时,处于中间位置的变量值 即为中位数;当N为偶数时,中位数则为处 于中间位置的2个变量值的平均数。
数据的分布特征
ຫໍສະໝຸດ Baidu
数据排序实例解析
• 例2.8 将职员的工资按职工号和职称,见 “2-8 排序数据.sav”。 要求:职工号按升序、职称要降序。
分类汇总实例讲解
• 例2.9:以性别作为分组变量,对职员的工 资和年龄的均值进行汇总。见数据“2-9汇 总数据.sav”15-4.sav。
数据加权实例解析
• 例2.10 将人数进行加权,例见“2-10加权 数据.sav”
SPSS报告模块含5种功能
• (1)代码本:用于反映数据库中变量属性特征信息 • (2)OLAP立方:按照一个或者多个分组变量所分的 组,计算目标变量(需为定量变量)的总值、均值以 及其他基本统计量; • (3)个案汇总:主要用于按照指定的分组变量统计分 析不同水平的交叉汇编,对变量进行记录列表,并计 算相应的统计量; • (4)按行汇总; • (5)按列汇总:用于生成复杂报表,它们均可对输出 的表格进行精确的定义,以满足用户的不同需求。
数据的分布特征
• 2、定量数据的集中趋势 截尾平均数:截尾均值是指在一个数列中, 去掉两端的极端值后所计算的算术平均数, 也称为切尾均值。 几何平均数(geometric mean):是指n个观 察值连乘积的n次方根。主要用于平均发展速 度的计算。且只适用于比率数据。
数据的离中趋势
• 全矩,也称极差。是一组数据中最大值与 最小值之差。 • 四分位差:四分位差反映了中间50%数据的 离散程度,其数值越小,说明中间的数据 越集中;其数值越大,说明中间的数据越 分散。
要求:1、让1=男,2=女
2、让1=A,2=A 3=AB,4=O
数据合并实例解析
• 例2.5 将“2-4 未标题4 数据保存”与“2-5 未标题”数据进行合并。 • 例2.6 将“2-4 未标题4 数据保存”与“2-6 Untitled 2” 数据进行合并。
数据拆分实例解析
例2.7:将职员的按性别、年龄进行拆分, 见 “2-7 拆分数据.sav”数据。
方差分析
• 单因素设计方差分析 • 例6.1 比较三个不同电池生产企业生产电池 的寿命,见例6-1.sav。此例企业为因素,不 同厂家为水平,本例为单因素3水平设计。
• 随机区组设计方差分析
• 例6.2 某研究机构研究了3种动物饲料对4种 品系小鼠体重增加的影响,数据见表6-5, 数据库文件见6-2.sav。
重复数据查找实例讲解
• 例2.11:查找2-11重复数据.sav中的重复数 据。
个案选择实例讲解
• 例2.12:选择工资大于1800元人员进行分析; 见例2-12.sav。
计算变量实例讲解
• 例2.13:计算某班男生,每位同学的平均成 绩,见2-13计算新变量.sav。
变量值重新编码实例讲解
频率统计分析实例讲解
• 例3.1:从某单位职工体检资料中获得101名 正常成年女子的血清总胆固醇 (mmol/L) 的测量结果;见“胆固醇.sav ” 。
描述统计分析实例讲解
• 例3.2:分析不同性别演员获得奥斯卡的年 龄差异性;见“演员.sav ” .
探索统计分析实例讲解
• 例3.3:分析中国南北城市的温度差异;见 “南北差异温度.sav ” .
据如表6-11,试对数据进行分析,数据库请
见6-4.sav。
拉丁方设计方差分析
• 例6-5 为了比较5种防护服对脉搏数的影响,
选用5个受试者,在5个不同的日期进行试
验。用拉丁方设计,在行、列与字母上分
别安排3个因素(日期、受试者、防护服),
得如表6-13结果。
协方差分析
• 例6.6 为研究A、B两种降压药对高血压病人收
例1,请构建表1-2的SPSS数据库
• 表1-2某授课小组人员信息
姓名 name 李国梅 程丽 杨玲 王磊 性别 身高 体重 年龄 血型 sex height weight age bloodtype 168 48 20 A 女 女 女 男 167 160 178 54 58 60 19 19 21 B AB O
T检验
• 5.1 均值(Means)过程 例5.1:比较不同性别同学的成绩平均值,见 例5-1.sav。 • 5.2 单样本T检验 • 例 5.2 :某药物在某种溶剂中溶解后的标准浓 度为 20.00mg/L 。现采用某种方法,测量该药 物溶解液11次,测量后得到的结果见例5-2.sav。
• 问:用该方法测量所得结果是否与标准浓度值 有所不同?见例5-2.sav
的同一观察指标进行多次测量所得,重复测量 设计是在科研工作中常见的设计方法,常用来 分析在不同时间点上该指标的差异。重复测量 设计最主要的优点就是提高了处理组间的精确
度,因为它可以通过对同一个体数据的分析估
计出实验误差的大小。
• 例6.8 某研究者欲了解一套新的锻炼方法的减 肥效果,该研究者在某小学随机抽取了12名 肥胖学生,随机分成两组!第一组每天下午按 新的锻炼方法锻炼!第二组不参与新的锻炼, 方法锻炼并于实验开始的第1、2、3个月分 别测量学生体重减重情况,测量值如表6-22 所示,构建数据库见6-8.sav。
• 析因设计方差分析
• 例6.3 A、B两种药物联合应用对红细胞增加 数的影响,数据见表6-8。数据库见6-3.sav。
交叉设计方差分析
• 例6.4 为比较血液透析过程中,低分子肝素
钙(A)与速避凝(B)对凝血酶原时间(TT)
的影响,选择20例接受血液透析的病人为
研究对象,采取二阶段交叉设计,试验数