第六课:描述性统计分析DescriptiveStatistics菜单详解
第3章 SPSS描述性统计分析
Step01 打开主窗口
选择菜单栏中的【Analyze(分析)】→ 【Descriptive Statistics(描述性统计)】 →【Explore(探索)】命令,弹出【Explor e(探索)】对话框,该对话框是探索性分析的 主操作窗口。
Step02 选择分析变量
在【Explore(探索)】对话框左侧的【候选变 量】清单中,选取一个或多个待分析变量, 将它们移入右侧的【Dependent List(因 变量列表)】列表框中,表示要进行探索性 分析的变量。
3.2.2 描述统计分析的SPSS操作详解
Descriptives 过程是连续资料统计描述应用 最多的一个过程,它可对变量进行描述性统 计分析计算,并列出一系列相应的统计指标。 这和其他过程相比并无不同。但该过程还有 个特殊功能,就是可将原始数据转换成标准 化值,并以变量的形式保存。
Step01:打开主窗口
Step04 选择标签值
从候选变量列表框中选择一个变量作为标识变 量,并将其移入【Label Cases by(标注 个案)】列表框中。选择标识变量的作用在 于,若系统在数据探索时发现异常值,便可 利用标识变量加以标记,便于用户找这些异 常值。如果不选择它,系统默认以id变量作 为标识变量。
Step05 选择输出类型
Step04:选择输出图形类型
Step05:完成操作
(1)基本统计结果输出
频数分析基本统计结果
N Percentiles
Valid Missing 25 50 75
38 0 18.00 20.00 23.00
表3-2 频数分析表
(2)频数分析表输出
频数分析表
Valid
14 15 16 17 18 19 20 21 22 23 24 26 27 Tota l
描述性统计分析
一、什么是描述统计分析(Descriptive Analysis)概念:使用几个关键数据来描述整体的情况描述性数据分析属于比较初级的数据分析,常见的分析方法包括对比分析法、平均分析法、交叉分析法等。
描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形。
Excel里的分析工具库里的数据分析可以实现描述性统计分析的功能。
描述性统计分析即是对数据源最初的认知,包括数据的集中趋势、分散程度以及频数分布等,了解了这些后才能去做进一步的分析。
二、常用指标均值、中位数、众数体现了数据的集中趋势。
极差、方差、标准差体现了数据的离散程度。
偏度、峰度体现了数据的分布形状。
1、均值。
均值容易受极值的影响,当数据集中出现极值时,所得到的的均值结果将会出现较大的偏差。
2、中位数:数据按照从小到大的顺序排列时,最中间的数据即为中位数。
当数据个数为奇数时,中位数即最中间的数,如果有N个数,则中间数的位置为(N+1)/2;当数据个数为偶数时,中位数为中间两个数的平均值,中间位置的算法是(N+1)/2。
中位数不受极值影响,因此对极值缺乏敏感性。
3、众数:数据中出现次数最多的数字,即频数最大的数值。
众数可能不止一个,众数不能能用于数值型数据,还可用于非数值型数据,不受极值影响。
4、极差:=最大值-最小值,是描述数据分散程度的量,极差描述了数据的范围,但无法描述其分布状态。
且对异常值敏感,异常值的出现使得数据集的极差有很强的误导性。
5、四分位数:数据从小到大排列并分成四等份,处于三个分割点位置的数值,即为四分位数,四分位数分为上四分位数(数据从小到大排列排在第75%的数字,即最大的四分位数)、下四分位数(数据从小到大排列排在第25%位置的数字,即最小的四分位数)、中间的四分位数即为中位数。
四分位数可以很容易地识别异常值。
箱线图就是根据四分位数做的图。
spss授课_discriptive
偏度
>0 正偏态(右偏态) 集中于小的一侧 =0 正态分布 <0 负偏态(左偏态) 集中于大的一侧
注:如果偏度的绝对值值大于1 ,那么肯定不是正态分布。
峰度
>0 尖峭峰 =0 正态分布 <0 平阔峰
21
Public health school, Southeast University
22
Public health school, Southeast University
潜伏期
50 40
30
Frequency
20 Std. Dev = 8.81 Mean = 14.8 0
15 21 27 33 39 45 3. 9. .0 .0 .0 .0 .0 .0 0 0
10
N = 146.00
51 .0
潜伏期
Cases weighted by AF
25
Hale Waihona Puke Public health school, Southeast University
– Into same variable – Into different variable
• Rank cases • Automatic recode • Replace missing Values
3
Public health school, Southeast University
变量变换(variable transform)
描述性统计 (Descriptive Statistics)
基本统计学原理
统计描述的概念 常用的描述性统计指标
SPSS操作
对话框介绍
• • • • Frequencies过程 Descriptive过程 Crosstabs过程 Explore过程
实验五描述性统计分析
第二篇 数据分析基础实验五 描述性统计分析实验目的:了解相关系数和偏相关系数的计算方法。
实验工具:SPSS 描述性统计分析菜单项。
知识准备:一、统计整理统计整理是根据统计研究的目的,对统计调查所获得的大量原始资料(初级资料),进行科学的分类和汇总,使之条理化、系统化,得出能够反映现象总体特征的综合资料的工作过程。
统计整理的结果为统计表与统计图。
统计表主要表现为频数表,而统计图的表现形式多样,前面已经介绍了各种统计图的制作方法,此处不在专门进行介绍。
二、集中趋势的测量集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。
集中趋势主要依赖各种平均指标进行反映。
1、算术平均数算术平均数又称为均值,其定义为:设1X ,2X ,…,n X 是取自某总体的一个样本,它的算术平均数∑==ni i X n X 11算术平均数有四个重要性质:①各变量值与平均数离差之和等于零;②各个变量值与平均数离差平方和为最小值;③常数的算术平均数是其本身;④对于任何两个变量x 和y ,它们的代数和的算术平均数就等于两个变量的算术平均数的代数和。
2、调和平均数调和平均数是根据标志值的倒数计算的,它是标志值倒数的算术平均数的倒数。
调和平均数的计算公式为:使用调和平均数要注意三个问题:①变量X 的取值不能为零,因为零不能作为分母,此时调和平均数无法计算;②调和平均数与算术平均数一样,易受极端值的影响③调和平均数只适用于特殊的数据情况,所以要注意区分它的适用条件。
在SPSS 中,调和平均数可以在Report 子菜单的4个报表过程中计算输出。
3、几何平均数几何平均数是n 个变量值乘积的n 次方根。
凡是现象的连乘积等于现象的总比率或总速度都可用几何平均数来计算它们的平均比率和平均速度。
其计算公式为:n n n x x x x x G ∏=⋅⋅⋅⋅= (321)式中:标志值个数。
连乘符号;各个标志值;数;几何平均------------∏n x G在SPSS 中,几何平均数可以在Report 子菜单的4个报表过程中计算输出。
SPSS基本操作步骤详解
SPSS基本操作步骤详解本文采用SPSS21.0版本,其它版本操作步骤大体相同一、基本步骤(一)检查数据在进行项目分析或统计分析之前,要检核输入的数据文件有无错误,即检核missing。
例,“XX量表”采用Likert scale五点量表式填答,每个题项的数据只有五个水平:1,2,3,4,5。
1.执行次数分布表的程序Analyze(分析)→Descriptive statistics(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Frequencies(频率)→Statistics(统计量)→Minimum (最小值)、Maximum(最大值)→Continue(继续)→OK(确定)2.执行描述统计量的程序Analyze(分析)→(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Descriptives(描述)→Options(选项)→Minimum(最小值)、Maximum(最大值)【此处一般为默认状态即可】→Continue(继续)→OK(确定)(二)反项计分若是分析的预试量表中没有反向题,则此操作步骤可以省略;量表或问卷题中如果有反向题,则在进行题项加总之前将反向题反向计分,否则测量分数所表示的意义刚好相反。
例,“XX量表”采用Likert scale五点量表式填答,反向题重向编码计分:1→5,2→4,3→3【可不写】,4→2,5→1。
Transform(转换)→Recode into same Variables(重新编码为相同变量)→将要反向的题目键入至Variables(变量)框中【例,a1,a3,a5】→Old and new values(旧值和新值)→在左边Old value—value中键入1,在右边New value—value中键入5,Add (添加)→……依次进行此步骤……在左边Old value—value中键入5,在右边New value —value中键入1,Add(添加)→Continue(继续)→OK(确定)【注意不同量表计分方式不同,因而反向编码计分也不同,常见的有四点量表、五点量表和六点量表等】(三)题项加总量表题项加总的目的在于便于进行观察值得高低分组。
5.2 描述(Descriptives)统计
5.2 描述(Descriptives)统计5.2.1 描述统计的过程Descriptives 是对变量的统计描述,它既适用于定类变量和定序变量,也适用于定距以上变量。
Descriptives 的功能是将描述统计的各个统计两作为分析结果输出。
Descriptives 的实现如下:1.打开描述统计对话框执行下述操作:Analyze→Descriptive Statistics→Descriptives 打开Descriptives 对话框,如图5-6 所示。
Save standardized values as variables 是将原始数据的标准分存为新变量的选项。
选择该项以后,系统将以原始数据的标准分为变量内容生成一个新变量。
图5-6 Descriptives 对话框2.选择进行描述统计的变量从左侧的源变量窗口中选择将要进行描述统计的变量,使之进入到Variable(s)窗口中。
3.选择描述统计的内容单击0ptions 按钮,打开对话框如图5-7 所示。
图5-7 Options 选项该对话框中的大部分内容均在frequencies 中见过。
只有下方的Display order 选项栏是新的。
Display order 是确定输出统计结果排列顺序的选项栏。
当用户选择了多个变量进行描述时,在输出文件中如何排列这些统计结果,有该栏中的选项来确定。
(1)Variable list 是将输出的统计结果按变量顺序列表,这是系统默认的选项。
(2)Alphabetic 是将输出的统计结果按字母顺序列表。
(3) Ascending means 是将输出的统计结果按照平均值的升序顺序列表。
(4) Descending means 是将输出的统计结果按照平均值的降序顺序列表。
在这个对话框中,系统默认状态是输出平均值、标准差、最大值和最小值。
如用户需要其它的参数可以自己选择。
上述选项都确定以后,单击Continue 按钮返回Descriptives 对话框。
第六课:描述性统计分析DescriptiveStatistics菜单详解
第六章:描述性统计分析--Descriptive Statistics菜单详解(医学统计之星:张文彤)上次更新日期:6.1 Frequencies过程6.1.1 界面说明6.1.2 分析实例6.1.3 结果解释6.2 Descriptives过程6.2.1 界面说明6.2.2 结果解释6.3 Explore过程6.3.1 界面说明6.3.2 结果解释6.4 Crosstabs过程6.4.1 界面说明6.4.2 分析实例6.4.3 结果解释描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。
SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:Frequencies过程的特色是产生频数表;Descriptives过程则进行一般性的统计描述;Explore过程用于对数据概况不清时的探索性分析;Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。
本章讲述的四个过程在9.0及以前版本中被放置在Summarize菜单中。
§6.1 Frequencies过程频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。
它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图,圆图等统计图。
和国内常用的频数表不同,几乎所有统计软件给出的均是详细频数表,即并不按某种要求确定组段数和组距,而是按照数值精确列表。
如果想用Frequencies过程得到我们所熟悉的频数表,请先用第二章学过的Recode过程产生一个新变量来代表所需的各组段。
6.1.1 界面说明Frequencies对话框的界面如下所示:该界面在SPSS中实在太普通了,无须多言,重点介绍一下各部分的功能如下:【Display frequency tables复选框】确定是否在结果中输出频数表。
Descriptive_statistics
for one variable
描述性统计
统计方法的类型
Descriptive Statistics 通过数值和图的方式,清 楚明了地对样本数据进行 总结描述
Inferential Statistics
对数据来自的总体分布进行 推断
描述什么?
数据的“位置”或者“中心” (“measures of location”)
但是对极值点敏感
许多统计方法是基于平均值的
样本分位数
常见1/4, 3/4分位数 对极值点不敏感
Index of central tendency
Source: /psych/stat/5/skewnone.gif
例:开车最快速度调查数据
Sex N Mean Median TrMean StDev SE Mean female 126 91.23 90.00 90.83 11.32 1.01 male 100 96.79 110.00 105.62 17.39 1.74
This is the famous “Bell curve” where many cases fall near the middle of the distribution and few fall very high or very low I.Q.
Statistical properties of the normal distribution
标准偏差(SD)
A summary statistic of how much scores vary from the mean Square root of the Variance
SPSS统计分析—描述性统计分析
• 各地区城乡居民消费水平比较
已知有2005年各省城乡居民消费水平, 试按地区对各省城乡消费 水平之比进行分析, 并比较不同地区之间城乡消费水平是否有较 大差异。
• 执行【Analyze】/【Descriptive Statistics】/【Ratio】命令, 弹出如 下图所示对话框
• 结果解读
SPSS统计分析—描述性统计 分析
描述性统计量
集中趋势
分布情况
均值
Mean
标准差 Std.deviatiom 偏度
Skewness
中位数 Median
Variance
峰度
Kurtosis
众数
Mode
极小值
Minimum
和
Sum
极大值
Maximum
Range
均值的标准 误差
S.E.mean
• 【Descriptive Statistics】子菜单
• ⑤ Ratio: 计算两个变量相对比的统计量特征。
• ⑥ P-P Plots: 绘制P-P图,检验数据服从的分布情况。
• ⑦ Q-Q Plots: 绘制Q-encies
• 频数分析简介 • 频数分析表是描述性统计中最常用的方法之一,它主要包括以下几
• 结果解读
• 1、列联表 • 2.卡方检验结果
3.条图
相对比描述——Ratio
• 在实际问题中,研究者有时除了希望了解变量自身的统计特征,还希望 得到两个变量相对比之间的统计描述。
• 法一: 通过对两个变量作除法形成一个新变量,然后分析新变量的统计 特征来得到。
• 法二: 直接通过【Ratio】过程来分析两个变量之间的相对比关系,并 且可以得到多于第一种方法的信息。
统计分析与Spss应用第五章(描述性统计分析)
选入需要描述的 变量,可选入多个
确定是否将原始数 据的标准正态变换 结果存为新变量。
变量列表顺序 字母顺序 均数升序 均数降序。
Descriptive Statistics N 血清总胆固醇 Valid N (listwise) Minimum Maximum 101 2.70 7.22 101 Mean Std. Deviation 4.6995 .86162
5.1.1 对话框界面及 各部分选项说明 【Display frequency tables复选框】确定是 否在结果中输出频数 表。 【Statistics钮】单击 后弹出Statistics对话 框,用于定义需要计 算的其他描述统计量。
集中趋势指标
百分位数指标
计算百分数时选此项
离散趋势指标 分布指标
1
.002
.000
Hale Waihona Puke .006.002b
.000
.005
639 61.974 d 65.957 55.621 9.398
e
40 40
.014 .006
.016b .009b .011b .003
b
.008 .003 .004 .000
.025 .016 .018 .006 .001
b
1
.002
.000
.002
descriptive statistics菜单主要内容
(1)频数分布表分析(Frequencies):其特色就是产生 频数表,对分类数据和定量资料都适用。 (2)统计描述分析(Descriptive)进行一般性描述,适 用于服从正态分布的定量资料。 (3) Explore 过程:用于对数据分布状况不清楚时的 探索性分析,它会杂七杂八给出一大堆可能用到的 统计指标和统计图,让研究者参考。 (4)Crosstabs 过程则完成计数资料和等级资料的统计 描述和一般的统计检验我们常用的X2 检验也在其中 完成 (5)Ratio过程;用于对两个连续性变量计算相对比指 标,它可以计算出一系列非常专业的相对比描述指 标。
SPSS基本功能
Spss概念及其基础 Spss基础:
1.1 SPSS的启动 1.2 数据的输入和保存
Spss基本统计分析功能
Spss概念及其基础 1.1 SPSS的启动
Spss基本统计分析功能
• 双击“SPSS19.0”即可启动SPSS。
• 启动后在屏幕上显示Spss文件对话框 。
• 选中相应命令,即可进入有关操作,(运行教程,输入数• Spss概念及其基础•
Spss基本统计分析功能
用SPSS来做成组设计两样本均数比较的t检验,选择 Analyze==>Compare Means==>Independent-Samples T test,系统弹 出两样本t检验对话框如下:
Spss概念及其基础
•
Spss基本统计分析功能
将变量X选入test框内,变量group选入grouping框内,这时 下面的Define Groups按钮变黑,表示该按钮可用,单击,系统弹 出比较组定义对话框:
Spss概念及其基础
1.2.2 输入数据
Spss基本统计分析功能
在Data View中输入相应的数据,一个单元格输入一
个数据,Group中输入1代表A公司,2代表B公司。
保存数据
选择菜单File==>Save,如果该数据从来没有被保存 过,弹出Save as对话框。
Spss概念及其基础
Spss基本统计分析功能
Spss概念及其基础
Spss基本统计分析功能
1.3描述分布形态的统计量
偏度:描述取值分布形态对称性的统计量,
值越大,表示分布的偏斜程度越高。
峰度:描述变量取值分布形态扁平程度的统
计量,大于0时表示数据呈扁平分布。小于0 表明数据呈尖峰分布。
描述性统计
Transportation Data Analysis(1) Overview: Descriptive Statistics
同济大学交通运输工程学院 王雪松(副教授、博士生导师)
2013年
交通运输工程学院
1. Data & Traffic Data(1)
• Types of Data
the set to be examined:
������ =
������ ������=1
������������
������
where N is the number of observations in the entire population
• Mode
• the value that occurs most frequently in a set of observations
and provide a better understanding of the data.
• What is descriptive statistics?
• methods and techniques for summarizing and interpreting data in a clear way
quartiles
• [应用]85%位车速
• 15%~85%位车速变化较平稳,在道路管理上通常 将85%位车速作为最高车速限制指标
6. Measures of Central Tendency(1)
• Median
• 50th percentile
• Mean(arithmetic mean)
• [Sample Mean-������]The mean of a sample of measurements x1,
SPSS术语中英文对照
【常用软件】SPSS术语中英文对照SPSS的统计分析过程均包含在Analysis菜单中。
我们只学以下两大分析过程:DescriptiveStatistics(描述性统计)和MultipleResponse(多选项分析)。
? DescriptiveStatistics(描述性统计)包含的分析功能:1.?Frequencies过程:主要用于统计指定变量各变量值的频次(Frequency)、百分比(Percent)。
2.?Descriptives过程:主要用于计算指定变量的均值(Mean)、标准差(Std.Deviation)。
3.?Crosstabs过程:主要用于两个或两个以上变量的交叉分类。
?MultipleResponse(多选项分析)的分析功能:1.DefineSet过程:该过程定义一个由多选项组成的多响应变量。
2.Frequencies过程:该过程对定义的多响应变量提供一个频数表。
3.Crosstabs过程:该过程提供所定义的多响应变量与其他变量的交叉分类表。
Absolutedeviation,绝对离差Absolutenumber,绝对数Absoluteresiduals,绝对残差Accelerationarray,加速度立体阵Accelerationinanarbitrarydirection,任意方向上的加速度Accelerationnormal,法向加速度Accelerationspacedimension,加速度空间的维数Accelerationtangential,切向加速度Accelerationvector,加速度向量Acceptablehypothesis,可接受假设Accumulation,累积Accuracy,准确度Actualfrequency,实际频数Adaptiveestimator,自适应估计量Addition,相加Additiontheorem,加法定理Additivity,可加性Adjustedrate,调整率Adjustedvalue,校正值Admissibleerror,容许误差Aggregation,聚集性Alternativehypothesis,备择假设Amonggroups,组间Amounts,总量Analysisofcorrelation,相关分析Analysisofcovariance,协方差分析Analysisofregression,回归分析Analysisoftimeseries,时间序列分析Analysisofvariance,方差分析Angulartransformation,角转换ANOVA(analysisofvariance),方差分析ANOVAModels,方差分析模型Arcing,弧/弧旋Arcsinetransformation,反正弦变换Areaunderthecurve,曲线面积AREG,评估从一个时间点到下一个时间点回归相关时的误差ARIMA,季节和非季节性单变量模型的极大似然估计Arithmeticgridpaper,算术格纸Arithmeticmean,算术平均数Arrheniusrelation,艾恩尼斯关系Assessingfit,拟合的评估Associativelaws,结合律Asymmetricdistribution,非对称分布Asymptoticbias,渐近偏倚Asymptoticefficiency,渐近效率Asymptoticvariance,渐近方差Attributablerisk,归因危险度Attributedata,属性资料Attribution,属性Autocorrelation,自相关Autocorrelationofresiduals,残差的自相关Average,平均数Averageconfidenceintervallength,平均置信区间长度Averagegrowthrate,平均增长率Barchart,条形图Bargraph,条形图Baseperiod,基期Bayes‘theorem,Bayes定理Bell-shapedcurve,钟形曲线Bernoullidistribution,伯努力分布Best-trimestimator,最好切尾估计量Bias,偏性Binarylogisticregression,二元逻辑斯蒂回归Binomialdistribution,二项分布Bisquare,双平方BivariateCorrelate,二变量相关Bivariatenormaldistribution,双变量正态分布Bivariatenormalpopulation,双变量正态总体Biweightinterval,双权区间BiweightM-estimator,双权M估计量Block,区组/配伍组BMDP(Biomedicalcomputerprograms),BMDP统计软件包Boxplots,箱线图/箱尾图Breakdownbound,崩溃界/崩溃点Canonicalcorrelation,典型相关Caption,纵标目Case-controlstudy,病例对照研究Categoricalvariable,分类变量Catenary,悬链线Cauchydistribution,柯西分布Cause-and-effectrelationship,因果关系Cell,单元Censoring,终检Centerofsymmetry,对称中心Centeringandscaling,中心化和定标Centraltendency,集中趋势Centralvalue,中心值CHAID-χ2AutomaticInteractionDetector,卡方自动交互检测Chance,机遇Chanceerror,随机误差Chancevariable,随机变量Characteristicequation,特征方程Characteristicroot,特征根Characteristicvector,特征向量Chebshevcriterionoffit,拟合的切比雪夫准则Chernofffaces,切尔诺夫脸谱图Chi-squaretest,卡方检验/χ2检验Choleskeydecomposition,乔洛斯基分解Circlechart,圆图Classinterval,组距Classmid-value,组中值Classupperlimit,组上限Classifiedvariable,分类变量Clusteranalysis,聚类分析Clustersampling,整群抽样Code,代码Codeddata,编码数据Coding,编码Coefficientofcontingency,列联系数Coefficientofdetermination,决定系数Coefficientofmultiplecorrelation,多重相关系数Coefficientofpartialcorrelation,偏相关系数Coefficientofproduction-momentcorrelation,积差相关系数Coefficientofrankcorrelation,等级相关系数Coefficientofregression,回归系数Coefficientofskewness,偏度系数Coefficientofvariation,变异系数Cohortstudy,队列研究Column,列Columneffect,列效应Columnfactor,列因素Combinationpool,合并Combinativetable,组合表Commonfactor,共性因子Commonregressioncoefficient,公共回归系数Commonvalue,共同值Commonvariance,公共方差Commonvariation,公共变异Communalityvariance,共性方差Comparability,可比性Comparisonofbathes,批比较Comparisonvalue,比较值Compartmentmodel,分部模型Compassion,伸缩Complementofanevent,补事件Completeassociation,完全正相关Completedissociation,完全不相关Completestatistics,完备统计量Completelyrandomizeddesign,完全随机化设计Compositeevent,联合事件Compositeevents,复合事件Concavity,凹性Conditionalexpectation,条件期望Conditionallikelihood,条件似然Conditionalprobability,条件概率Conditionallylinear,依条件线性Confidenceinterval,置信区间Confidencelimit,置信限Confidencelowerlimit,置信下限Confidenceupperlimit,置信上限ConfirmatoryFactorAnalysis,验证性因子分析Confirmatoryresearch,证实性实验研究Confoundingfactor,混杂因素Conjoint,联合分析Consistency,相合性Consistencycheck,一致性检验Consistentasymptoticallynormalestimate,相合渐近正态估计Consistentestimate,相合估计Constrainednonlinearregression,受约束非线性回归Constraint,约束Contaminateddistribution,污染分布ContaminatedGausssian,污染高斯分布Contaminatednormaldistribution,污染正态分布Contamination,污染Contaminationmodel,污染模型Contingencytable,列联表Contour,边界线Contributionrate,贡献率Control,对照Controlledexperiments,对照实验Conventionaldepth,常规深度Convolution,卷积Correctedfactor,校正因子Correctedmean,校正均值Correctioncoefficient,校正系数Correctness,正确性Correlationcoefficient,相关系数Correlationindex,相关指数Correspondence,对应Counting,计数Counts,计数/频数Covariance,协方差Covariant,共变CoxRegression,Cox回归Criteriaforfitting,拟合准则Criteriaofleastsquares,最小二乘准则Criticalratio,临界比Criticalregion,拒绝域Criticalvalue,临界值Cross-overdesign,交叉设计Cross-sectionanalysis,横断面分析Cross-sectionsurvey,横断面调查Crosstabs,交叉表Cross-tabulationtable,复合表Cuberoot,立方根Cumulativedistributionfunction,分布函数Cumulativeprobability,累计概率Curvature,曲率/弯曲Curvature,曲率Curvefit,曲线拟和Curvefitting,曲线拟合Curvilinearregression,曲线回归Curvilinearrelation,曲线关系Cut-and-trymethod,尝试法Cycle,周期Cyclist,周期性Dtest,D检验Dataacquisition,资料收集Databank,数据库Datacapacity,数据容量Datadeficiencies,数据缺乏Datahandling,数据处理Datamanipulation,数据处理Dataprocessing,数据处理Datareduction,数据缩减Dataset,数据集Datasources,数据来源Datatransformation,数据变换Datavalidity,数据有效性Data-in,数据输入Data-out,数据输出Deadtime,停滞期Degreeoffreedom,自由度Degreeofprecision,精密度Degreeofreliability,可靠性程度Degression,递减Densityfunction,密度函数Densityofdatapoints,数据点的密度Dependentvariable,应变量/依变量/因变量Dependentvariable,因变量Depth,深度Derivativematrix,导数矩阵Derivative-freemethods,无导数方法Design,设计Determinacy,确定性Determinant,行列式Determinant,决定因素Deviation,离差Deviationfromaverage,离均差Diagnosticplot,诊断图Dichotomousvariable,二分变量Differentialequation,微分方程Directstandardization,直接标准化法Discretevariable,离散型变量DISCRIMINANT,判断Discriminantanalysis,判别分析Discriminantcoefficient,判别系数Discriminantfunction,判别值Dispersion,散布/分散度Disproportional,不成比例的Disproportionatesub-classnumbers,不成比例次级组含量Distributionfree,分布无关性/免分布Distributionshape,分布形状Distribution-freemethod,任意分布法Distributivelaws,分配律Disturbance,随机扰动项Doseresponsecurve,剂量反应曲线Doubleblindmethod,双盲法Doubleblindtrial,双盲试验Doubleexponentialdistribution,双指数分布Doublelogarithmic,双对数Downwardrank,降秩Dual-spaceplot,对偶空间图DUD,无导数方法Duncan‘snewmultiplerangemethod,新复极差法/Duncan新法Effect,实验效应Eigenvalue,特征值Eigenvector,特征向量Ellipse,椭圆Empiricaldistribution,经验分布Empiricalprobability,经验概率单位Enumerationdata,计数资料Equalsun-classnumber,相等次级组含量Equallylikely,等可能Equivariance,同变性Error,误差/错误Errorofestimate,估计误差ErrortypeI,第一类错误ErrortypeII,第二类错误Estimand,被估量Estimatederrormeansquares,估计误差均方Estimatederrorsumofsquares,估计误差平方和Euclideandistance,欧式距离Event,事件Event,事件Exceptionaldatapoint,异常数据点Expectationplane,期望平面Expectationsurface,期望曲面Expectedvalues,期望值Experiment,实验Experimentalsampling,试验抽样Experimentalunit,试验单位Explanatoryvariable,说明变量Exploratorydataanalysis,探索性数据分析ExploreSummarize,探索-摘要Exponentialcurve,指数曲线Exponentialgrowth,指数式增长EXSMOOTH,指数平滑方法Extendedfit,扩充拟合Extraparameter,附加参数Extrapolation,外推法Extremeobservation,末端观测值Extremes,极端值/极值Fdistribution,F分布Ftest,F检验Factor,因素/因子Factoranalysis,因子分析FactorAnalysis,因子分析Factorscore,因子得分Factorial,阶乘Factorialdesign,析因试验设计Falsenegative,假阴性Falsenegativeerror,假阴性错误Familyofdistributions,分布族Familyofestimators,估计量族Fanning,扇面Fatalityrate,病死率Fieldinvestigation,现场调查Fieldsurvey,现场调查Finitepopulation,有限总体Finite-sample,有限样本Firstderivative,一阶导数Firstprincipalcomponent,第一主成分Firstquartile,第一四分位数Fisherinformation,费雪信息量Fittedvalue,拟合值Fittingacurve,曲线拟合Fixedbase,定基Fluctuation,随机起伏Forecast,预测Fourfoldtable,四格表Fourth,四分点Fractionblow,左侧比率Fractionalerror,相对误差Frequency,频率Frequencypolygon,频数多边图Frontierpoint,界限点Functionrelationship,泛函关系Gammadistribution,伽玛分布Gaussincrement,高斯增量Gaussiandistribution,高斯分布/正态分布Gauss-Newtonincrement,高斯-牛顿增量Generalcensus,全面普查GENLOG(Generalizedlinermodels),广义线性模型Geometricmean,几何平均数Gini‘smeandifference,基尼均差GLM(Generallinermodels),一般线性模型Goodnessoffit,拟和优度/配合度Gradientofdeterminant,行列式的梯度Graeco-Latinsquare,希腊拉丁方Grandmean,总均值Grosserrors,重大错误Gross-errorsensitivity,大错敏感度Groupaverages,分组平均Groupeddata,分组资料Guessedmean,假定平均数Half-life,半衰期HampelM-estimators,汉佩尔M估计量Happenstance,偶然事件Harmonicmean,调和均数Hazardfunction,风险均数Hazardrate,风险率Heading,标目Heavy-taileddistribution,重尾分布Hessianarray,海森立体阵Heterogeneity,不同质Heterogeneityofvariance,方差不齐Hierarchicalclassification,组内分组Hierarchicalclusteringmethod,系统聚类法High-leveragepoint,高杠杆率点HILOGLINEAR,多维列联表的层次对数线性模型Hinge,折叶点Histogram,直方图Historicalcohortstudy,历史性队列研究Holes,空洞HOMALS,多重响应分析Homogeneityofvariance,方差齐性Homogeneitytest,齐性检验HuberM-estimators,休伯M估计量Hyperbola,双曲线Hypothesistesting,假设检验Hypotheticaluniverse,假设总体Impossibleevent,不可能事件Independence,独立性Independentvariable,自变量Index,指标/指数Indirectstandardization,间接标准化法Individual,个体Inferenceband,推断带Infinitepopulation,无限总体Infinitelygreat,无穷大Infinitelysmall,无穷小Influencecurve,影响曲线Informationcapacity,信息容量Initialcondition,初始条件Initialestimate,初始估计值Initiallevel,最初水平Interaction,交互作用Interactionterms,交互作用项Intercept,截距Interpolation,内插法Interquartilerange,四分位距Intervalestimation,区间估计Intervalsofequalprobability,等概率区间Intrinsiccurvature,固有曲率Invariance,不变性Inversematrix,逆矩阵Inverseprobability,逆概率Inversesinetransformation,反正弦变换Iteration,迭代Jacobiandeterminant,雅可比行列式Jointdistributionfunction,分布函数Jointprobability,联合概率Jointprobabilitydistribution,联合概率分布Kmeansmethod,逐步聚类法Kaplan-Meier,评估事件的时间长度Kaplan-Merierchart,Kaplan-Merier图Kendall‘srankcorrelation,Kendall等级相关Kinetic,动力学Kolmogorov-Smirnovetest,柯尔莫哥洛夫-斯米尔诺夫检验KruskalandWallistest,Kruskal及Wallis检验/多样本的秩和检验/H检验Kurtosis,峰度Lackoffit,失拟Ladderofpowers,幂阶梯Lag,滞后Largesample,大样本Largesampletest,大样本检验Latinsquare,拉丁方Latinsquaredesign,拉丁方设计Leakage,泄漏Leastfavorableconfiguration,最不利构形Leastfavorabledistribution,最不利分布Leastsignificantdifference,最小显着差法Leastsquaremethod,最小二乘法Least-absolute-residualsestimates,最小绝对残差估计Least-absolute-residualsfit,最小绝对残差拟合Least-absolute-residualsline,最小绝对残差线Legend,图例L-estimator,L估计量L-estimatoroflocation,位置L估计量L-estimatorofscale,尺度L估计量Level,水平Lifeexpectance,预期期望寿命Lifetable,寿命表Lifetablemethod,生命表法Light-taileddistribution,轻尾分布Likelihoodfunction,似然函数Likelihoodratio,似然比linegraph,线图Linearcorrelation,直线相关Linearequation,线性方程Linearprogramming,线性规划Linearregression,直线回归LinearRegression,线性回归Lineartrend,线性趋势Loading,载荷Locationandscaleequivariance,位置尺度同变性Locationequivariance,位置同变性Locationinvariance,位置不变性Locationscalefamily,位置尺度族Logranktest,时序检验Logarithmiccurve,对数曲线Logarithmicnormaldistribution,对数正态分布Logarithmicscale,对数尺度Logarithmictransformation,对数变换Logiccheck,逻辑检查Logisticdistribution,逻辑斯特分布Logittransformation,Logit转换LOGLINEAR,多维列联表通用模型Lognormaldistribution,对数正态分布Lostfunction,损失函数Lowcorrelation,低度相关Lowerlimit,下限Lowest-attainedvariance,最小可达方差LSD,最小显着差法的简称Lurkingvariable,潜在变量Maineffect,主效应Majorheading,主辞标目Marginaldensityfunction,边缘密度函数Marginalprobability,边缘概率Marginalprobabilitydistribution,边缘概率分布Matcheddata,配对资料Matcheddistribution,匹配过分布Matchingofdistribution,分布的匹配Matchingoftransformation,变换的匹配Mathematicalexpectation,数学期望Mathematicalmodel,数学模型MaximumL-estimator,极大极小L估计量Maximumlikelihoodmethod,最大似然法Mean,均数Meansquaresbetweengroups,组间均方Meansquareswithingroup,组内均方Means(Comparemeans),均值-均值比较Median,中位数Medianeffectivedose,半数效量Medianlethaldose,半数致死量Medianpolish,中位数平滑Mediantest,中位数检验Minimalsufficientstatistic,最小充分统计量Minimumdistanceestimation,最小距离估计Minimumeffectivedose,最小有效量Minimumlethaldose,最小致死量Minimumvarianceestimator,最小方差估计量MINITAB,统计软件包Minorheading,宾词标目Missingdata,缺失值Modelspecification,模型的确定ModelingStatistics,模型统计Modelsforoutliers,离群值模型Modifyingthemodel,模型的修正Modulusofcontinuity,连续性模Morbidity,发病率Mostfavorableconfiguration,最有利构形MultidimensionalScaling(ASCAL),多维尺度/多维标度MultinomialLogisticRegression,多项逻辑斯蒂回归Multiplecomparison,多重比较Multiplecorrelation,复相关Multiplecovariance,多元协方差Multiplelinearregression,多元线性回归Multipleresponse,多重选项Multiplesolutions,多解Multiplicationtheorem,乘法定理Multiresponse,多元响应Multi-stagesampling,多阶段抽样MultivariateTdistribution,多元T分布Mutualexclusive,互不相容Mutualindependence,互相独立Naturalboundary,自然边界Naturaldead,自然死亡Naturalzero,自然零Negativecorrelation,负相关Negativelinearcorrelation,负线性相关Negativelyskewed,负偏Newman-Keulsmethod,q检验NKmethod,q检验Nostatisticalsignificance,无统计意义Nominalvariable,名义变量Nonconstancyofvariability,变异的非定常性Nonlinearregression,非线性相关Nonparametricstatistics,非参数统计Nonparametrictest,非参数检验Nonparametrictests,非参数检验Normaldeviate,正态离差Normaldistribution,正态分布Normalequation,正规方程组Normalranges,正常范围Normalvalue,正常值Nuisanceparameter,多余参数/讨厌参数Nullhypothesis,无效假设Numericalvariable,数值变量Objectivefunction,目标函数Observationunit,观察单位Observedvalue,观察值Onesidedtest,单侧检验One-wayanalysisofvariance,单因素方差分析OnewayANOVA,单因素方差分析Opensequentialtrial,开放型序贯设计Optrim,优切尾Optrimefficiency,优切尾效率Orderstatistics,顺序统计量Orderedcategories,有序分类Ordinallogisticregression,序数逻辑斯蒂回归Ordinalvariable,有序变量Orthogonalbasis,正交基Orthogonaldesign,正交试验设计Orthogonalityconditions,正交条件ORTHOPLAN,正交设计Outliercutoffs,离群值截断点Outliers,极端值OVERALS,多组变量的非线性正规相关Overshoot,迭代过度Paireddesign,配对设计Pairedsample,配对样本Pairwiseslopes,成对斜率Parabola,抛物线Paralleltests,平行试验Parameter,参数Parametricstatistics,参数统计Parametrictest,参数检验Partialcorrelation,偏相关Partialregression,偏回归Partialsorting,偏排序Partialsresiduals,偏残差Pattern,模式Pearsoncurves,皮尔逊曲线Peeling,退层Percentbargraph,百分条形图Percentage,百分比Percentile,百分位数Percentilecurves,百分位曲线Periodicity,周期性Permutation,排列P-estimator,P估计量Piegraph,饼图Pitmanestimator,皮特曼估计量Pivot,枢轴量Planar,平坦Planarassumption,平面的假设PLANCARDS,生成试验的计划卡Pointestimation,点估计Poissondistribution,泊松分布Polishing,平滑Polledstandarddeviation,合并标准差Polledvariance,合并方差Polygon,多边图Polynomial,多项式Polynomialcurve,多项式曲线Population,总体Populationattributablerisk,人群归因危险度Positivecorrelation,正相关Positivelyskewed,正偏Posteriordistribution,后验分布Powerofatest,检验效能Precision,精密度Predictedvalue,预测值Preliminaryanalysis,预备性分析Principalcomponentanalysis,主成分分析Priordistribution,先验分布Priorprobability,先验概率Probabilisticmodel,概率模型probability,概率Probabilitydensity,概率密度Productmoment,乘积矩/协方差Profiletrace,截面迹图Proportion,比/构成比Proportionallocationinstratifiedrandomsampling,按比例分层随机抽样Proportionate,成比例Proportionatesub-classnumbers,成比例次级组含量Prospectivestudy,前瞻性调查Proximities,亲近性PseudoFtest,近似F检验Pseudomodel,近似模型Pseudosigma,伪标准差Purposivesampling,有目的抽样QRdecomposition,QR分解Quadraticapproximation,二次近似Qualitativeclassification,属性分类Qualitativemethod,定性方法Quantile-quantileplot,分位数-分位数图/Q-Q图Quantitativeanalysis,定量分析Quartile,四分位数QuickCluster,快速聚类Radixsort,基数排序Randomallocation,随机化分组Randomblocksdesign,随机区组设计Randomevent,随机事件Randomization,随机化Range,极差/全距Rankcorrelation,等级相关Ranksumtest,秩和检验Ranktest,秩检验Rankeddata,等级资料Rate,比率Ratio,比例Rawdata,原始资料Rawresidual,原始残差Rayleigh‘stest,雷氏检验Rayleigh‘sZ,雷氏Z值Reciprocal,倒数Reciprocaltransformation,倒数变换Recording,记录Redescendingestimators,回降估计量Reducingdimensions,降维Re-expression,重新表达Referenceset,标准组Regionofacceptance,接受域Regressioncoefficient,回归系数Regressionsumofsquare,回归平方和Rejectionpoint,拒绝点Relativedispersion,相对离散度Relativenumber,相对数Reliability,可靠性Reparametrization,重新设置参数Replication,重复ReportSummaries,报告摘要Residualsumofsquare,剩余平方和Resistance,耐抗性Resistantline,耐抗线Resistanttechnique,耐抗技术R-estimatoroflocation,位置R估计量R-estimatorofscale,尺度R估计量Retrospectivestudy,回顾性调查Ridgetrace,岭迹Riditanalysis,Ridit分析Rotation,旋转Rounding,舍入Row,行Roweffects,行效应Rowfactor,行因素RXCtable,RXC表Sample,样本Sampleregressioncoefficient,样本回归系数Samplesize,样本量Samplestandarddeviation,样本标准差Samplingerror,抽样误差SAS(Statisticalanalysissystem),SAS统计软件包Scale,尺度/量表Scatterdiagram,散点图Schematicplot,示意图/简图Scoretest,计分检验Screening,筛检SEASON,季节分析Secondderivative,二阶导数Secondprincipalcomponent,第二主成分SEM(Structuralequationmodeling),结构化方程模型Semi-logarithmicgraph,半对数图Semi-logarithmicpaper,半对数格纸Sensitivitycurve,敏感度曲线Sequentialanalysis,贯序分析Sequentialdataset,顺序数据集Sequentialdesign,贯序设计Sequentialmethod,贯序法Sequentialtest,贯序检验法Serialtests,系列试验Short-cutmethod,简捷法Sigmoidcurve,S形曲线Signfunction,正负号函数Signtest,符号检验Signedrank,符号秩Significancetest,显着性检验Significantfigure,有效数字Simpleclustersampling,简单整群抽样Simplecorrelation,简单相关Simplerandomsampling,简单随机抽样Simpleregression,简单回归simpletable,简单表Sineestimator,正弦估计量Single-valuedestimate,单值估计Singularmatrix,奇异矩阵Skeweddistribution,偏斜分布Skewness,偏度Slashdistribution,斜线分布Slope,斜率Smirnovtest,斯米尔诺夫检验Sourceofvariation,变异来源Spearmanrankcorrelation,斯皮尔曼等级相关Specificfactor,特殊因子Specificfactorvariance,特殊因子方差Spectra,频谱Sphericaldistribution,球型正态分布Spread,展布SPSS(Statisticalpackageforthesocialscience),SPSS统计软件包Spuriouscorrelation,假性相关Squareroottransformation,平方根变换Stabilizingvariance,稳定方差Standarddeviation,标准差Standarderror,标准误Standarderrorofdifference,差别的标准误Standarderrorofestimate,标准估计误差Standarderrorofrate,率的标准误Standardnormaldistribution,标准正态分布Standardization,标准化Startingvalue,起始值Statistic,统计量Statisticalcontrol,统计控制Statisticalgraph,统计图Statisticalinference,统计推断Statisticaltable,统计表Steepestdescent,最速下降法Stemandleafdisplay,茎叶图Stepfactor,步长因子Stepwiseregression,逐步回归Storage,存Strata,层(复数)Stratifiedsampling,分层抽样Stratifiedsampling,分层抽样Strength,强度Stringency,严密性Structuralrelationship,结构关系Studentizedresidual,学生化残差/t化残差Sub-classnumbers,次级组含量Subdividing,分割Sufficientstatistic,充分统计量Sumofproducts,积和Sumofsquares,离差平方和Sumofsquaresaboutregression,回归平方和Sumofsquaresbetweengroups,组间平方和Sumofsquaresofpartialregression,偏回归平方和Sureevent,必然事件Survey,调查Survival,生存分析Survivalrate,生存率Suspendedrootgram,悬吊根图Symmetry,对称Systematicerror,系统误差Systematicsampling,系统抽样Tags,标签Tailarea,尾部面积Taillength,尾长Tailweight,尾重Tangentline,切线Targetdistribution,目标分布Taylorseries,泰勒级数Tendencyofdispersion,离散趋势Testingofhypotheses,假设检验Theoreticalfrequency,理论频数Timeseries,时间序列Toleranceinterval,容忍区间Tolerancelowerlimit,容忍下限Toleranceupperlimit,容忍上限Torsion,扰率Totalsumofsquare,总平方和Totalvariation,总变异Transformation,转换Treatment,处理Trend,趋势Trendofpercentage,百分比趋势Trial,试验Trialanderrormethod,试错法Tuningconstant,细调常数Twosidedtest,双向检验Two-stageleastsquares,二阶最小平方Two-stagesampling,二阶段抽样Two-tailedtest,双侧检验Two-wayanalysisofvariance,双因素方差分析Two-waytable,双向表TypeIerror,一类错误/α错误TypeIIerror,二类错误/β错误UMVU,方差一致最小无偏估计简称Unbiasedestimate,无偏估计Unconstrainednonlinearregression,无约束非线性回归Unequalsubclassnumber,不等次级组含量Ungroupeddata,不分组资料Uniformcoordinate,均匀坐标Uniformdistribution,均匀分布Uniformlyminimumvarianceunbiasedestimate,方差一致最小无偏估计Unit,单元Unorderedcategories,无序分类Upperlimit,上限Upwardrank,升秩Vagueconcept,模糊概念Validity,有效性VARCOMP(Variancecomponentestimation),方差元素估计Variability,变异性Variable,变量Variance,方差Variation,变异Varimaxorthogonalrotation,方差最大正交旋转Volumeofdistribution,容积Wtest,W检验Weibulldistribution,威布尔分布Weight,权数WeightedChi-squaretest,加权卡方检验/Cochran检验Weightedlinearregressionmethod,加权直线回归Weightedmean,加权平均数Weightedmeansquare,加权平均方差Weightedsumofsquare,加权平方和Weightingcoefficient,权重系数Weightingmethod,加权法W-estimation,W估计量W-estimationoflocation,位置W估计量Width,宽度Wilcoxonpairedtest,威斯康星配对法/配对符号秩和检验Wildpoint,野点/狂点Wildvalue,野值/狂值Winsorizedmean,缩尾均值Withdraw,失访Youden‘sindex,尤登指数Ztest,Z检验Zerocorrelation,零相关Z-transformation,Z变换。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章:描述性统计分析--Descriptive Statistics菜单详解(医学统计之星:张文彤)上次更新日期:6.1 Frequencies过程6.1.1 界面说明6.1.2 分析实例6.1.3 结果解释6.2 Descriptives过程6.2.1 界面说明6.2.2 结果解释6.3 Explore过程6.3.1 界面说明6.3.2 结果解释6.4 Crosstabs过程6.4.1 界面说明6.4.2 分析实例6.4.3 结果解释描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。
SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:Frequencies过程的特色是产生频数表;Descriptives过程则进行一般性的统计描述;Explore过程用于对数据概况不清时的探索性分析;Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。
本章讲述的四个过程在9.0及以前版本中被放置在Summarize菜单中。
§6.1 Frequencies过程频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。
它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图,圆图等统计图。
和国内常用的频数表不同,几乎所有统计软件给出的均是详细频数表,即并不按某种要求确定组段数和组距,而是按照数值精确列表。
如果想用Frequencies过程得到我们所熟悉的频数表,请先用第二章学过的Recode过程产生一个新变量来代表所需的各组段。
6.1.1 界面说明Frequencies对话框的界面如下所示:该界面在SPSS中实在太普通了,无须多言,重点介绍一下各部分的功能如下:【Display frequency tables复选框】确定是否在结果中输出频数表。
【Statistics钮】单击后弹出Statistics对话框如下,用于定义需要计算的其他描述统计量。
现将各部分解释如下:o Percentile Values复选框组定义需要输出的百分位数,可计算四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut pointsfor equal groups)、或直接指定某个百分位数(Percentiles),如直接指定输出P2.5和P97.5。
o Central tendency复选框组用于定义描述集中趋势的一组指标:均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。
o Dispersion复选框组用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)。
o Distribution复选框组用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis)。
o Values are group midpoints复选框当你输出的数据是分组频数数据,并且具体数值是组中值时,选中该复选框以通知SPSS,免得它犯错误。
众数(Mode)指所有数值中出现频率最高的一个值,在国内用的非常少。
【Charts钮】弹出Charts对话框,用于设定所做的统计图。
o Chart type单选钮组定义统计图类型,有四种选择:无、条图(Bar chart)、圆图(Pie chart)、直方图Histogram),其中直方图还可以选择是否加上正态曲线(With normal curve)。
o Chart Values单选钮组定义是按照频数还是按百分比做图(即影响纵坐标刻度)。
【Format钮】弹出Format对话框,用于定义输出频数表的格式,不过用处不大,一般不管。
o Order by单选钮组定义频数表的排列次序,有四个选项:Ascending values为根据数值大小按升序从小到大作频数分布;Descending values 为根据数值大小按降序从大到小作频数分布;Ascending counts为根据频数多少按升序从少到多作频数分布;Descending counts为根据频数多少按降序从多到少作频数分布。
o Multiple Variables单选钮组如果选择了两个以上变量做频数表,则Compare variables可以将他们的结果在同一个频数表过程输出结果中显示,便于互相比较,Organize output by variables则将结果在不同的频数表过程输出结果中显示。
o Suppress Tables more than...复选框当频数表的分组数大于下面设定数值时禁止它在结果中输出,这样可以避免产生巨型表格。
6.1.2 分析实例例6.1 某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数CV、中位数M、p2.5和p97.5(卫统第三版p233 1.1题)。
4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.12 4.56 4.37 5.396.30 5.217.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05解:为节省篇幅,这里只给出精确频数表的做法,假设数据已经输好,变量名为X,具体解法如下:1.Analyze==>Descriptive Statistics==>Frequencies2.Variables框:选入X3.单击Statistics钮:4.选中Mean、Std.deviation、Median复选框5.单击Percentiles:输入2.5:单击Add:输入97.5:单击Add:6.单击Continue钮7.单击Charts钮:8.选中Bar charts9.单击Continue钮10.单击OK得出结果后手工计算出CV。
上面做出的直方图分组太多,需要进一步编辑。
6.1.3 结果解释上题除直方图外的的输出结果如下:Frequencies最上方为表格名称,左上方为分析变量名,可见样本量N为101例,缺失值0例,均数Mean=4.69,中位数Median=4.61,标准差STD=0.8616,P2.5=3.04,P97.5=6.45。
系统对变量x作频数分布表(此处只列出了开头部分),Vaild右侧为原始值,Frequency为频数,Percent为各组频数占总例数的百分比(包括缺失记录在内),Valid percent为各组频数占总例数的有效百分比,Cum Percent为各组频数占总例数的累积百分比。
§6.2 Descriptives过程Descriptives过程是连续资料统计描述应用最多的一个过程,他可对变量进行描述性统计分析,计算并列出一系列相应的统计指标。
这和其他过程相比并无不同。
但该过程还有个特殊功能就是可将原始数据转换成标准正态评分值并以变量的形式存入数据库供以后分析。
6.2.1 界面说明【Save standardized values as variables复选框】确定是否将原始数据的标准正态评分存为新变量。
【Options钮】弹出Options对话框,大部分内容均在前面Frequences过程的Statistics对话框中见过,只有最下方的Display Order单选钮组是新的,可以选择为变量列表顺序、字母顺序、均数升序或均数降序。
6.2.2 结果解释下面是一个典型的Descriptives过程结果统计表:一望可知,这里的大部分内容都在上一节见过,因此就不再多解释了。
讲了两个过程,也许大家已经发现了:结果中的统计专业单词多数在对话框中就已经出现,因此我们以后会详细解释对话框的内容,结果中相同的单词不再重复解释。
§6.3 Explore过程Explore过程可对变量进行更为深入详尽的描述性统计分析,主要用于对资料的性质、分布特点等完全不清楚时,故又称之为探索性分析。
它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,如枝叶图、箱图等,显得更加详细、全面,有助于用户制定继续分析的方案。
6.3.1 界面说明【Display单选钮组】用于选择输出结果中是否包含统计描述、统计图或两者均包括。
【Dependent List框】用于选入需要分析的变量。
【Factor List框】如果想让所分析的变量按某种因素取值分组分析,则在这里选入分组变量。
【Label cases by框】选择一个变量,他的取值将作为每条记录的标签。
最典型的情况是使用记录ID 号的变量。
【Statistics钮】弹出Statistics对话框,用于选择所需要的描述统计量。
有如下选项:o Descriptives复选框:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误及指定的均数可信区间。
o M-estimators复选框:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数。
o Outliers复选框:输出五个最大值与五个最小值。
o Percentiles复选框:输出第5%、10%、25%、50%、75%、90%、95%位数。
【Plot钮】弹出Plot对话框,用于选择所需要的统计图。
有如下选项:o Boxplots单选框组:确定箱式图的绘制方式,可以是按组别分组绘制(Factor levels together),也可以不分组一起绘制(Depentendstogether),或者不绘制(None)。