试验三SPSS基本统计分析
SPSS17.0在生物统计学中的应用实验指导-实验三、参数估计 实验四、t检验(可打印修改) (
SPSS在生物统计学中的应用——实验指导手册实验三:参数估计一、实验目的与要求1.理解参数估计的概念2.熟悉区间估计的概念与操作方法二、实验原理1. 参数估计的定义●参数估计(parameter estimation)是根据从总体中抽取的样本估计总体分布中的未知参数的方法。
它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。
●点估计(point estimation):又称定值估计,就是用实际样本指标数值作为总体参数的估计值。
当总体的性质不清楚时,我们须利用某一量数(样本统计量)作为估计数,以帮助了解总体的性质,如:样本平均数乃是总体平均数μ的估计数,当我们只用一个特定的值,亦即数线上的一个点,作为估计值以估计总体参数时,就叫做点估计。
✧点估计的数学方法很多,常见的有“矩估计法”、“最大似然估计法”、“最小二乘估计法”、“顺序统计量法”等。
✧点估计的精确程度用置信区间表示。
●区间估计(interval estimation)是从点估计值和抽样标准误出发,按给定的概率值建立包含待估计参数的区间。
其中这个给定的概率值称为置信度或置信水平(confidence level),这个建立起来的包含待估计函数的区间称为置信区间,指总体参数值落在样本统计值某一区内的概率●置信区间(confidence interval)是指在某一置信水平下,样本统计值与总体参数值间误差范围。
置信区间越大,置信水平越高。
划定置信区间的两个数值分别称为置信下限(lower confidence limit,lcl)和置信上限(upper confidence limit,ucl)2. 参数估计的基本原理统计分析的目的就是由样本推断总体,参数估计即是实现这一目的的方法之一。
3. 参数估计的方法参数估计的结果,常用点估计值(样本均值)+置信区间(置信下限、置信上限)来表示。
三、实验内容与步骤1. 单个总体均值的区间估计打开数据文件“描述性统计(100名女大学生的血清蛋白含量).sav”选择菜单【分析】—>【描述统计】—>【探索】”,打开图3.1探索(Explore)对话框。
第4章-SPSS基本统计分析
2016/12/25
21
基本描述统计量
描述离散程度的统计量
离散程度:指一组数据远离“中心值”的程度。 即考查所有数据相对于“中心值”分布的疏密程度。 如果数据都紧密地集中在“中心值”的周围,数 据的离散程度较小,则说明“中心值”对数据的 代表性就好; 如果数据比较松散地分布在“中心值”的周围, 数据的离散程度较大,则 “中心值”说明数据特 征是不具有代表性的。
案例
利用“大学生职业生涯规划数据”进行 以下分析:
1. 计算专业和职业认知得分的基本描述统计
量,并比较男女生的得分差异; 2. 分析是否存在专业和职业认知得分的异常 值。
应用举例
基本描述统计
以“居民储蓄调查数据”为例,对一次存(取)款金 额。有两个分析目标: 目标一:计算存(取)款金额的基本描述统计量,并对 城镇储户和农村储户进行比较 (数据拆分)
SK 0
左(负)偏态
x
M M
152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 e 169o170 171 172 173 174 175
基本描述统计量
描述陡峭程度的统计量
– 峰度(kurtosis): 描述某变量取值分布形态陡缓程
龄
合 计
频数分析表
频数分析的任务: 编制频数分布表
用宽度相同的条形的高度或长短来表示频数分布变化的图 如果有缺省值,那 – 各组的名称 形。使用于定序和定类变量的分析 么有效百分比能更 – 频数(Frequency) 加准确地反映取值 用圆形及圆内扇形的面积来表示频数百分比变化的图形。 – 百分比(Percent) 分布状况
SPSS统计分析--第3章--基本统计分析
3.2.1 频数统计的主要功能
• “频率”过程可以产生频数分布表,以对数据按组进行归 类整理。还可以生成各种描述性统计指标,以及条形图、 饼图、直方图等常用的统计图。通过选择SPSS中的“分析 ”︱“描述统计”︱“频率”命令,可以对各变量的数据 分布特征有一个概括的整体的认识。
.
3.2.2 频数统计的操作过程
.
3.2.3 实例分析:大学新生的心理健康状况(1)
【例3.1】某大学为了了解学生的心理健康状况,要对初 入学的大一新生进行心理测评,并建立心理档案。现要对 某班学生的生活事件量表进行分析。请用SPSS做出此测试 结果的频数分布情况。
解:本例中,主要通过“频率”过程对本班生活事件量表 的总分进行描述,并得出全班学生此量表总分各分数的频 数情况及其百分比和累积百分比,可以从中了解到学生整 体得分的高低水平,也可以由此注意到需要给予较多关注 的个体或群体。下面将介绍具体的操作过程。
• 均值标准误差:描述样本均值与总体均值之间的平均差异程度 的统计量。
• 全距:也称极差,是数据的最大值与最小值之间的绝对离差。 • 方差:也是表示变量取值离散程度的统计量,是各变量值与算
数平均数离差平方的算术平均数。
.
• 标准差:表示变量取值距离均值的平均离散程度的统计量。标 准差值越大,说明变量值之间的差异越大,距均值这个“中心 值”的离散趋势越大。
• 均值:即算术平均数,是反映某变量所有取值的集中趋势或平 均水平的指标。如某企业职工的平均月收入可用均值。
• 中位数:即一组数据按升序排序后,处于中间位置上的数据值 。如评价社会的老龄化程度时,可用中位数。
• 众数:即一组数据中出现次数最多的数据值。如生产鞋的厂商 在制定各种型号鞋的生产计划时应该运用众数。
第四章 SPSS的基本统计分析知识讲解
多选项分析
多选项分析的基本思路
– 定义多选项变量集 – 多选项频数分析 – 多选项交叉分组下的频数分析
多选项分析
定义多选项变量集
目的:将已分解的变量定义为一个集合,便于进行多选 项分析
– 菜单选项:analyze->multiple response->define sets – 从原变量中选取被分解的变量(数值型)到variables in
进一步计算
– cells选项:选择在频数分析表中输出各种百分比.
row:行百分比(Row pct); column:列百分比(Col pct); total:总百分比(Tot pct);
分析列联表中变量间的关系
目的:
通过列联表分析,检验行列变量之间是否独立。
方法:
– 卡方检验:对品质数据的相关性进行度量
频数分析
基本操作步骤
(1)菜单选项:analyze->descriptive statistics->frequencies (2)选择几个待分析的变量到variables框. (3)chart选项,选择所需要的图形
计算描述统计量
目的
– 精确把握变量的总体分布状况,了解数据的集中趋 势、离散趋势、对称程度、陡峭程度。
– 菜单选项:analyze->multiple response->crosstabs
频数分析
目的
粗略把握变量值的分布状况。
例:研究被调查者的特征(如:性别、年龄、收入) 研究被调查者对某个问题的总体看法(如:教学方式、选修课程) 研究被调查者某方面的状态(如:购买家电的类型、居民月支出状况)
采用的方法
– 计算频分布表:包括计算 频数、累计频数、百分比、累 计百分比
SPSS统计分析实验指导
>1000
图 1-4 变量值标签定义对话框
2 数据的输入
(1)直接从数据编辑窗口的输入数据:先将变量定义好后,变量名就会在每列的上面显示,可以看到 其格式如 Excel,其实输入及编辑方法也和 Excel 相当。请同学们自己练习。数据输入及编辑窗口如图 1-5 所示(见 Excel 表 1-2),是将表 1-2 所示数据建立成 SPSS 文件。
(二)信息的输入和输出 1 统计变量的定义
(1)变量:SPSS 中的变量与数学中的变量定义相同,即其值可变的量称为变量。SPSS 中变量的属性 主要有四个:变量名、变量类型、变量标签、变量长度。定义变量时至少要有变量名和变量类型。变量定义 窗口如图 1-2 所示。
图 1-2 变量定义窗口
(2)变量类型:SPSS 中有三种基本类型:Numeric(数值型),String(字符型),Date(日期型)。数 值型变量按不同要求可分为五种,再加上自定义型,所以可以定义的类型变量有八种。系统默认的变量类型 为标准数值型,长度为 8,小数占两位。变量类型对话框如 1-3 所示,每种变量的具体定义请参阅相关参考 资料。
2) 变量值标签(Value Labels) 变量值标签是对变量的取值所附加的进一步说明。对分类变量往往要定义其取值的标签。如对收入以 500 的间距进行分类,如表 1-1 定义变量的值标签:
表 1-1 变量值标签的定义实例
变量名
变量值
变量值标签
1
<=500
C
2
501-1000
3
定义变量值标签的对话框如图 1-4 所示
图 1-1 SPSS 11.5 for Windows 主环境
3 SPSS for Windows 功能介绍
SPSS课件第三章 基本统计分析功能
吸烟史 病例
吸烟 647 不吸烟 2 合计 649
男性 对照 622 27 649
合计 1269
29 1298
病例 41 19 60
女性 对照 28 32 60
合计 69 51 120
辽宁医学院
SPSS统计软件应用
温有锋
一、Report(数据汇总报告菜单)
OLAP Cubes即时汇总过程 Cases Summary数据汇总 Report Summaries in Rows行汇 总报告
Report Summaries in Columns 列汇总报告
辽宁医学院
SPSS统计软件应用
温有锋
1、Frequencies(频数分布分析 )
频数分布分析主要通过频数分布表、条形图 和直方图,以及集中趋势和离散趋势的各种 统计量,描述数据的分布特征;
利用频数分布表可以方便地对数据按组进行 归类整理,形成各变量的不同水平(分组) 的频数分布表和图形,以便对各变量的数据 的特征和观测量分布状况有一个概括的认识。
Quartiles(四分位数) Cut point for(将数据平分 为所设定的相等等分。2~ 100之间) Percentile(s)(用户自定义 百分位数)
辽宁医学院
SPSS统计软件应用
温有锋
Statistics
Central Tendency (中心趋势)
Mean(均值) Median(中位数) Mode(众数) Sum(总和)
reportolapcubes即时汇总过程casessummary数据汇总reportsummariesrows行汇总报告reportsummariescolumns列汇总报告descrptivestatistics描述性统计分析frequencies频数分析descrptive描述统计量分析explore探索分析crosstabs多维频数分布ratio比率统计分析frequencies利用频数分布表可以方便地对数据按组进行归类整理形成各变量的不同水平分组的频数分布表和图形以便对各变量的数据的特征和观测量分布状况有一个概括的认识
SPSS数据的基本统计分析
SPSS数据的基本统计分析SPSS(统计软件包用于社会科学)是一种广泛使用的统计分析软件,它提供了一系列功能强大的工具,可以对数据进行基本的统计分析。
在本文中,将介绍SPSS数据的基本统计分析方法,包括数据导入、数据描述统计、数据绘图和假设检验。
数据导入SPSS可以导入多种数据格式,如Excel、CSV、TXT等。
在导入数据时,需要设置数据类型和变量属性,并进行数据清洗。
数据清洗包括处理缺失值、异常值和离群值等。
数据描述统计一旦数据导入SPSS,可以使用描述统计方法来了解数据的基本情况,包括数据的中心趋势、离散趋势和分布情况。
中心趋势:中心趋势是指一组数据的集中程度。
常见的中心趋势度量包括均值、中位数和众数。
SPSS可以计算这些统计量,并提供了描述统计分析的结果。
离散趋势:离散趋势是指一组数据的分散程度。
常见的离散趋势度量包括方差、标准差和极差。
SPSS可以计算这些统计量。
分布情况:了解数据的分布情况可以帮助研究人员判断数据是否满足正态分布或其他分布假设。
SPSS可以绘制直方图、箱线图和正态概率图等来展示数据的分布情况。
数据绘图数据绘图是一种可视化数据的方法,可以更直观地了解数据之间的关系和趋势。
SPSS提供了多种数据绘图方法,包括柱状图、折线图、散点图和饼图等。
可以通过简单的菜单选择来创建相应的图表,并设置图表的格式和风格。
假设检验假设检验是统计分析中非常重要的一步,可以帮助研究人员验证研究假设是否成立。
SPSS提供了各种假设检验方法,如t检验、方差分析、卡方检验和相关分析等。
t检验:用于比较两个样本均值是否存在差异。
SPSS可以进行独立样本t检验和配对样本t检验。
方差分析:用于比较多个样本均值是否存在差异。
SPSS可以进行单因素方差分析和多因素方差分析。
卡方检验:用于比较观察频数与期望频数之间是否存在差异。
SPSS 可以进行卡方检验和列联表分析。
相关分析:用于分析两个变量之间的相关性。
SPSS可以计算皮尔逊相关系数和斯皮尔曼等级相关系数。
学习使用SPSS进行数据分析和统计
学习使用SPSS进行数据分析和统计在今天的数字化时代,数据统计和分析已经成为各个领域不可或缺的技能和技术。
学习使用SPSS进行数据分析和统计,可以帮助我们更加深入地了解数据,同时也可以为我们解决问题和做出决策提供帮助。
一、SPSS的基本概念和用途SPSS全称是“Statistical Product and Service Solutions”,是一种统计分析软件。
它可以用来对数据进行分析、建模和预测,支持多种数据类型,包括文本、数字、日期等。
同时,SPSS也提供了各种图表和报表来展示数据分析结果,方便我们更好地理解和使用数据。
二、SPSS的基本功能和操作1. 数据输入和清洗:在使用SPSS进行数据分析之前,我们需要将数据输入到SPSS中并进行数据清洗。
数据输入可以通过手动输入、复制粘贴、导入文件等方式实现,数据清洗则可以通过数据筛选、去重、去除缺失值等方式实现。
2. 数据分析和统计:SPSS提供了丰富的统计分析方法,包括描述性统计、方差分析、回归分析、聚类分析等。
我们可以根据不同的数据类型和研究需求选择不同的统计方法。
3. 图表展示和报表输出:SPSS提供了多种图表和报表样式,可以很方便地将统计结果展示出来。
我们可以使用SPSS自带的报表或自定义报表来实现。
三、学习SPSS的途径和方法1. 在线课程和教程:通过网络搜索“SPSS入门教程”或“SPSS在线课程”,可以找到很多教程和课程资源来学习SPSS的基本操作和分析方法。
例如,在Coursera和edX等平台上,有很多SPSS课程可供选择。
2. 书籍和教材:学习SPSS最基础的方法是通过购买SPSS的官方教材并进行学习。
SPSS出版了一些很好的教材,例如《SPSS统计分析方法》和《SPSS数据分析入门与进阶》等。
同时,也有其他基础统计学分析的书籍可以参考。
3. 工作中的实践:SPSS的使用需要结合实际问题进行操作,因此在工作中实践是很重要的学习途径。
SPSS基本统计分析
SPSS基本统计分析SPSS(Statistical Package for the Social Sciences)是一种常用的统计分析软件,广泛应用于社会科学研究、市场调研、医学研究等领域。
SPSS提供了各种统计分析方法和工具,既可以进行描述性统计分析,也可以进行推断性统计分析。
在SPSS中进行基本统计分析需要以下步骤:1. 导入数据:首先需要将数据导入SPSS软件中,可以选择从Excel等格式导入数据,也可以直接在SPSS中输入数据。
2.描述性统计:描述性统计是对数据的基本特征进行总结和分析,包括均值、中位数、最大值、最小值等。
可以使用频数统计、描述性统计和十分位数查看数据的分布情况。
3.数据清理:对数据进行清洗,去除异常值、缺失值等。
可以使用“变量查看”功能查看数据是否有问题。
4. 正态性检验:正态性检验用于检验数据是否服从正态分布。
可以使用直方图、正态Q-Q图、Kolmogorov-Smirnov检验等方法进行判断。
5.相关性分析:相关性分析用于评估两个或多个变量之间的关系强度和方向。
可以使用皮尔逊相关系数、斯皮尔曼相关系数等进行分析。
6.单样本t检验:单样本t检验用于比较样本的均值和理论上预期的均值是否有显著差异。
可以使用单样本t检验来评估样本均值与已知值之间的差异。
7.独立样本t检验:独立样本t检验用于比较两组独立样本均值是否有显著差异。
可以根据比较对象的特征选择相应的统计方法。
8.配对样本t检验:配对样本t检验用于比较两个相关样本的均值是否有显著差异。
可以根据样本之间的关系选择相应的统计方法。
9.卡方检验:卡方检验是一种非参数检验方法,用于检验两个或多个变量之间的关联性。
可以通过逐步构建模型来检验多个变量之间的关联性。
10.方差分析:方差分析用于比较多个样本均值是否存在差异。
可以通过比较组间方差和组内方差来评估样本均值是否有显著差异。
在进行统计分析之前,需要了解数据的类型和分析目标,选择合适的统计方法。
SPSS基本统计分析资料
SPSS基本统计分析资料SPSS(Statistical Package for the Social Sciences)是一种统计分析软件,广泛应用于社会科学领域的数据分析。
SPSS具有计算统计指标、绘制图表、进行假设检验、建立回归模型等功能,能够帮助研究者对数据进行全面、客观的分析和解释。
本文将介绍SPSS的基本统计分析功能以及如何使用SPSS进行数据分析。
1.数据导入与清洗在使用SPSS进行数据分析之前,首先需要将原始数据导入到SPSS软件中。
SPSS支持多种数据格式的导入,包括Excel、CSV、文本文件等。
导入数据后,可以通过数据清洗功能对数据进行预处理,如删除重复数据、填补缺失值、调整变量类型等。
2.描述统计分析描述统计分析是对数据进行基本概括和描述的方法。
SPSS提供了丰富的描述统计分析方法,如计算均值、中位数、标准差、最大值、最小值等统计指标;绘制频率分布表、直方图、饼图等图表;计算变量之间的相关系数,了解变量之间的关系等。
3.t检验与方差分析t检验和方差分析是常用的假设检验方法,用于比较两个或多个群体之间的平均差异。
SPSS提供了t检验和方差分析的功能,能够进行单样本t检验、独立样本t检验、配对样本t检验、单因素方差分析、多因素方差分析等。
4.线性回归分析线性回归分析是一种用于建立因变量与自变量之间线性关系的统计方法。
SPSS可以进行简单线性回归分析和多元线性回归分析,并提供了回归系数、显著性检验、R方等评估指标,帮助研究者分析和解释变量之间的关系。
5.相关分析相关分析用于评估两个连续变量之间的相关性。
SPSS提供了皮尔逊相关系数、斯皮尔曼相关系数、判定系数等相关性指标的计算,并可绘制散点图、回归直线图等图表,直观地展示变量之间的关系。
在使用SPSS进行数据分析时,需要注意以下几点:1.确定研究问题和目的,选择合适的统计方法和分析指标。
2.保证数据的质量和准确性,如检查数据的完整性、一致性以及异常值的存在。
SPSS统计分析方法及应用(第三版)
浏览结构:
.
.
SPSS数据的录入 SPSS数据的编辑
• SPSS数据的定位 • 插入和删除一条个案 • 插入和删除一个变量 • 数据的移动、复制和删除
.
SPSS支持的数据格式
• .SPSS格式文件 • .Excel格式文件 • .dBase格式文件 • .文本格式文件
.
直接读入其他格式的数据文件 使用文本向导读入文本文件 使用数据库向导读入数据
.
SPSS函数:根据函数功能和处理的变量类 型,SPSS函数大致可以分成八大类,分别是:算 术函数、统计函数、与分布相关的函数、查 找函数、字符函数、缺失值函数、日期函数 和其他函数
变量计算的基本操作 变量计算的应用举例
.
数据选取就是根据分析的需要,从已收集到 的大批量数据(总体)中按照一定的规则抽取 部分数据(样本)参与分析的过程,通常也称为 样本抽样
饼图,即用圆形及圆内扇形的面积表示频数百分比 变化的图形,利于研究事物内在结构组成等问题。 饼图中圆内的扇形面积可以表示频数,也可以表示 百分比。
直方图,即用矩形的面积表示频数分布变化的图形, 适用于定距型变量的分析。可以在直方图上附加 正态分布曲线,便于与正态分布的比较。
.
计算分位数:是变量在不同百分位点上的取 值。分位点在0~100之间。一般使用较多的 是四分位点,即将所有数据按升序排序后平 均等分成四份,各分位点依次是25%、50%、 75%。于是,四分位数便分别是25%、50%、 75%分位点对应的变量值。此外,还有八分位 数、十六分位数等。
.
频数数据的组织方式
• 如果待分析的数据不是原始的调查问卷数据,而 是经过分组汇总后的汇总数据,那么这些数据就 应以频数数据的组织方式组织
SPSS实验分析报告(三)
SPSS实验分析报告三一、同只小鼠不同饲料关于钙留存量实验分析报告(一)、提出假设原假设H0=“不同饲料喂养下的同只小鼠体内的钙留存量无显著差异”备选假设H1 =“不同饲料喂养下的同只小鼠体内的钙留存量差异显著”(二)、两独立样本t检验结果及分析表 1-1 不同种类饲料喂食同只小鼠的钙留存量的基本描述统计量群统计资料饲料种类N 平均数标准偏差均值的标准误差钙留存量饲料一9 32.5778 3.81077 1.27026饲料二9 34.2667 5.59933 1.86644表 1-2 不同种类饲料喂食同只小鼠的钙留存量的两独立样本t检验结果独立样本检定方差方程的Levene检验均值方程的t检验F 显著性T df显著性(双侧)均值差值标准误差值差分的95%的置信区间下限上限钙留存量假设方差相等1.410 .252 -.748 16 .465 -1.688892.25769 -6.474983.09720 假设方差不相等-.748 14.102 .467 -1.68889 2.25769 -6.52787 3.15009结果分析:由表1-1可以看出,饲料一喂养的钙留存量与饲料二喂养的钙留存量的样本平均值有一定的差距。
通过检验应判断这种差异是有抽样误差造成的还是系统性的。
对于表1-2,做两步分析。
第一步,两总体方差是否相等的F实验。
在该实验中,检验的F统计量的观测值为1.410,对应的P-值为0.252。
此时的显著性水平α为0.05,由于概率P-值大于0.05,可以认为两个总体的方差无显著差异。
第二步,两总体均值的检验。
在第一步中,由于两总体方差有显著差异,因此应该看第一列(假设方差相等)t检验的结果。
其中,t统计量的观测值为-0.748,对应的双侧概率P-值为0.465。
此时的显著性水平α为0.05,p/2大于0.05,不能拒绝原假设,即没有充分的证据和理由认为不同饲料喂养条件下的钙留存量有显著差异;同时,由于0落在两总体均值差的95%的置信区间内,也从另一个角度证明了对于同只小鼠,不同种类饲料的喂养条件对于钙留存量无显著影响,也即原假设成立。
SPSS统计分析简明教程
SPSS统计分析简明教程SPSS(统计分析软件)是一种专业的统计分析工具,广泛应用于社会科学、市场调研、医学研究和商业分析等领域。
下面是一个简明教程,介绍SPSS的基本功能和常用统计分析方法。
一、数据导入与处理1. 数据导入:打开SPSS软件,选择“文件”-“打开”-“数据”,导入数据文件,可以是Excel表格、文本文件或其他格式的数据文件。
2.数据查看与修改:选择“数据查看器”可以查看导入的数据。
可以对数据进行修改、添加新变量或删除不需要的变量。
二、描述统计分析描述统计是指对数据集进行总体特征的概括和汇总。
常用的描述统计方法包括频数分析、描述性统计和交叉表分析。
以下是常用方法的简要介绍:1.频数分析:选择“分析”-“描述性统计”-“频数”,选择需要统计的变量,即可生成变量的频数、百分比、累计频数等统计结果。
2.描述性统计:选择“分析”-“描述性统计”-“描述性统计”,选择需要统计的变量,即可生成均值、标准差、最大最小值等统计结果。
3.交叉表分析:选择“分析”-“交叉表”-“交叉表”,选择需要交叉分析的变量,即可生成不同变量之间的交叉分析结果。
三、推论统计分析推论统计是指通过样本数据进行参数估计和假设检验,以推断总体的统计特征。
常用的推论统计方法包括t检验、方差分析、相关分析和回归分析等。
以下是常用方法的简要介绍:1.t检验:选择“分析”-“比较手段”-“独立样本t检验”或“相关样本t检验”,选择需要比较的变量和相关变量,即可进行t检验并生成结果。
2.方差分析:选择“分析”-“方差分析”-“单因素方差分析”或“多因素方差分析”,选择需要分析的变量和因素,即可进行方差分析并生成结果。
3.相关分析:选择“分析”-“相关”-“双变量”,选择需要进行相关分析的变量,即可生成变量之间的相关系数及相关显著性检验结果。
4.回归分析:选择“分析”-“回归”-“线性”,选择需要进行回归分析的自变量和因变量,即可生成回归方程、回归系数、显著性检验结果等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验三SPSS基本统计分析
一.实验目的和要求
1.掌握频数分析;
2.掌握计算基本描述统计量;
3.掌握交叉分组下的频数分析和各种相关性检验;
4.掌握多选项分析;
5.掌握比率分析。
二.实验的基本方法和内容
1. 频数分析
操作步骤:参阅教材第63、64、65页。
2. 基本描述统计量
操作步骤:参阅教材第68、69、70、71页。
3. 交叉分组下的频数分析
操作步骤:参阅教材第73、74、75、76、77、78、79、80、81、82、83、84、85页。
4. 多选项分析
操作步骤:参阅教材第85、86、87、88、89、90页。
5. 比率分析
操作步骤:参阅教材第91、92页。
6. 实验内容:
(一)验证性实验
(1)教材第65页“商品房购买意向的调查数据分析”
(2)教材第71“商品房购买意向的调查数据分析”
(3)教材第79“商品房购买意向的调查数据分析”
(4)教材第90“商品房购买意向的调查数据分析”
(5)教材第92“保险业务的保费收入占全部业务保费收入的比例情况”
(二)实践性实验
(1)对“文科成绩”的数据文件作如下统计整理:
1.利用频数分析功能,分别对“文科成绩7”中“及格次数”变量和“文科成绩9”中的“value
range ”变量,要求绘制频数分布表和频数分布图,其中频数分布表中的内容按变量值的升序输出,频数分布图前者采用饼状图,后者采用带有分布曲线的直方图,二者均输出百分比数据。
最后将输出结果保存为“文科成绩7-1”和“文科成绩9-1”。
2. 对“文科成绩5.1”的spss 文件,利用描述统计功能,统计第一、第二及第三次考试成 绩的最大值,最小值,区间范围,平均值,标准差,方差,峰度,偏度等统计量的数值, 要求三个变量的输出内容按均值升值的顺序排列。
最后将输出结果保存为“文科成绩5.1-1”。
并配文字对数据做出以适当的分析。
3. 如何在同一个输出结果中同时输出不同学院的“第三次考试成绩”的各种基本 描述统计量,并对不同学院的学生考试成绩情况进行深入比较。
(2)调查100名健康大学生的血清总蛋白含量(g%)如下表:
1.利用描述统计功能从集中趋势、分散程度、偏斜程度、有无异常值等方面分析血清蛋白含量这个变量的分布状况。
2.原始数据进行算术处理:已知最小值为6.430,最大值为8.430,全距为2.000,故可要求分成5组,试作分组后的频数分析,并给出带有正态曲线的直方图。
7.43
7.88 6.88 7.80 7.04 8.05 6.97 7.12 7.35 8.05 7.95 7.56 7.50 7.88 7.20 7.20 7.20 7.43 7.12 7.20 7.50 7.35 7.88 7.43 7.58 6.50 7.43 7.12 6.97 6.80 7.35 7.50 7.20 6.43 7.58 8.03 6.97 7.43 7.35 7.35 7.58 7.58 6.88 7.65 7.04 7.12 8.12 7.50 7.04 6.80 7.04 7.20 7.65 7.43 7.65 7.76 6.73 7.20 7.50 7.43 7.35 7.95 7.35 7.47 6.50 7.65 8.16 7.54 7.27 7.27 6.72 7.65 7.27 7.04 7.72 6.88 6.73 6.73 6.73 7.27 7.58 7.35 7.50 7.27 7.35 7.35 7.27 8.16 7.03 7.43 7.35
7.95 7.04 7.65 7.27 7.72 8.43 7.50 7.65 7.04
(3)对某城市家庭的社会经济调查中,美国某调查公司想确定家庭的家庭拥有量与汽车拥有量是否独立。
该公司对10000户家庭组成的简单随机样本进行调查,获得如下资料。
现问:
1汽车用有量与量与电话拥有量是否独立?(01.0=α)
2请根据列联表特征,选择卡方统计量以外的检验方法分析行列变量之间的关联强度和关联方向。
电话汽车0 1 2 合计
2000
1 4600
2 5 00
合计 3 10000
(4)公司要了解职工对现行奖励制度是否满意,共调查了210个职工,有关资料按男女整理如下,试回答以下问题:
性别满意满意不满意合计
男职工30 70 100
女职工45 65 110
合计75 135 210
α=)
1男女职工对现行奖励制度的满意程度是否有差别?(0.05
2请根据列联表特征,选择卡方统计量以外的检验方法分析行列变量之间的关联强度。
(5)针对以下的列联表,选择合适的关联量数,对两个变量间的关联关系作全面的分析,如关联强度、关联方向、关联形态,对称关系。
a)
b)
c)
d)
e)
f)
(6)请利用“职工基本情况数据.sav”,首先观察其中的变量类型,利用其中的定类或定序变量,或将连续型变量离散化后,做变量间的关联性分析,要求a分析至少3组(如性别和职称)以上的变量,b即要有描述性统计又要有推断性统计,c需要根据变量的测量尺度和变量间的对称关系,对变量间的关联关系分析全面,d最后可以得到数据中关于变量间关系的总结。
(7)针对“文科成绩”,利用比率分析功能,对各学院学生在三次考试中学生成绩变化的相对程度作统计分析,并配以简单的文字说明分析的结果。