描述性统计分析--Descriptive-Statistics

合集下载

描述性统计分析

描述性统计分析

统计分析本次问卷调查主要是广大的游客为主要的对象,采用的是网上发放问卷的形式,主要借助的是问卷星网站这个平台。

此次问卷总计发放了420份,回收问卷388份,回收率达到92.38%,回收问卷有效率为92.38%,在问卷星的设计中提交前提是完成问卷,因此回收问卷都为有效问卷。

本部分将根据对有效问卷的统计,对所得数据进行相关的数据分析。

描述性统计分析描述性统计(DescriPtivestatistics)是对统计结构和总体情况所进行的描述,本部分将对游客基本信息进行描述性统计分析。

游客基本信息描述性统计分析游客的基本信息主要包括,第一部分关于游客的人口统计学信息,包括游客的性别、年龄、受教育程度、职业、收入等;第二部分是关于游客在姨奶奶中的旅游次数的一个简单的统计。

表____反映了这一系列的基本信息。

从性别上看,男女比例基本持平,其中女性游客稍占多数51.5%,男性游客占48.5%,女性游客的平均人数比男性游客稍微多一些;从年龄上看,主要集中在18~25岁这个年龄段上,占到了游客总数的91.2%,这说明了青少年时目前旅游人群的主要构成部分,这一方面和现当代的生活水平,价值观、消费观有密切的联系。

从学历上看,游客的学历主要集中在高中、本科及以上这三块,分别占到这次调查样本数的11.9%、78.9%、6.2%。

充分证明对待旅游的看法和学历的高低是一个正相关的关系。

从职业上看,学生占到了最多的一个比例64.9%,比其他的职业人群高出很多,公司职员在其中也占到了13.4%,在这一点上有力的证明了在影响旅游愿景的因素中,时间是一个相当大的权重,个体其实在经济实力这一权重来看是比较具有优势的一个群体,但是在这次调查中仅占了 2.6%,从这一方面也可以得出时间是一个较大权重的结论;从收入状况上看,主要集中在1400~3000和3000~5000这两个段的人群,分别达到67%和19.6%,这印证了旅游公共服务的不断健全和旅游的逐步平民化。

描述性统计分析

描述性统计分析

一、什么是描述统计分析(Descriptive Analysis)概念:使用几个关键数据来描述整体的情况描述性数据分析属于比较初级的数据分析,常见的分析方法包括对比分析法、平均分析法、交叉分析法等。

描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形。

Excel里的分析工具库里的数据分析可以实现描述性统计分析的功能。

描述性统计分析即是对数据源最初的认知,包括数据的集中趋势、分散程度以及频数分布等,了解了这些后才能去做进一步的分析。

二、常用指标均值、中位数、众数体现了数据的集中趋势。

极差、方差、标准差体现了数据的离散程度。

偏度、峰度体现了数据的分布形状。

1、均值。

均值容易受极值的影响,当数据集中出现极值时,所得到的的均值结果将会出现较大的偏差。

2、中位数:数据按照从小到大的顺序排列时,最中间的数据即为中位数。

当数据个数为奇数时,中位数即最中间的数,如果有N个数,则中间数的位置为(N+1)/2;当数据个数为偶数时,中位数为中间两个数的平均值,中间位置的算法是(N+1)/2。

中位数不受极值影响,因此对极值缺乏敏感性。

3、众数:数据中出现次数最多的数字,即频数最大的数值。

众数可能不止一个,众数不能能用于数值型数据,还可用于非数值型数据,不受极值影响。

4、极差:=最大值-最小值,是描述数据分散程度的量,极差描述了数据的范围,但无法描述其分布状态。

且对异常值敏感,异常值的出现使得数据集的极差有很强的误导性。

5、四分位数:数据从小到大排列并分成四等份,处于三个分割点位置的数值,即为四分位数,四分位数分为上四分位数(数据从小到大排列排在第75%的数字,即最大的四分位数)、下四分位数(数据从小到大排列排在第25%位置的数字,即最小的四分位数)、中间的四分位数即为中位数。

四分位数可以很容易地识别异常值。

箱线图就是根据四分位数做的图。

实验五描述性统计分析

实验五描述性统计分析

第二篇 数据分析基础实验五 描述性统计分析实验目的:了解相关系数和偏相关系数的计算方法。

实验工具:SPSS 描述性统计分析菜单项。

知识准备:一、统计整理统计整理是根据统计研究的目的,对统计调查所获得的大量原始资料(初级资料),进行科学的分类和汇总,使之条理化、系统化,得出能够反映现象总体特征的综合资料的工作过程。

统计整理的结果为统计表与统计图。

统计表主要表现为频数表,而统计图的表现形式多样,前面已经介绍了各种统计图的制作方法,此处不在专门进行介绍。

二、集中趋势的测量集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。

集中趋势主要依赖各种平均指标进行反映。

1、算术平均数算术平均数又称为均值,其定义为:设1X ,2X ,…,n X 是取自某总体的一个样本,它的算术平均数∑==ni i X n X 11算术平均数有四个重要性质:①各变量值与平均数离差之和等于零;②各个变量值与平均数离差平方和为最小值;③常数的算术平均数是其本身;④对于任何两个变量x 和y ,它们的代数和的算术平均数就等于两个变量的算术平均数的代数和。

2、调和平均数调和平均数是根据标志值的倒数计算的,它是标志值倒数的算术平均数的倒数。

调和平均数的计算公式为:使用调和平均数要注意三个问题:①变量X 的取值不能为零,因为零不能作为分母,此时调和平均数无法计算;②调和平均数与算术平均数一样,易受极端值的影响③调和平均数只适用于特殊的数据情况,所以要注意区分它的适用条件。

在SPSS 中,调和平均数可以在Report 子菜单的4个报表过程中计算输出。

3、几何平均数几何平均数是n 个变量值乘积的n 次方根。

凡是现象的连乘积等于现象的总比率或总速度都可用几何平均数来计算它们的平均比率和平均速度。

其计算公式为:n n n x x x x x G ∏=⋅⋅⋅⋅= (321)式中:标志值个数。

连乘符号;各个标志值;数;几何平均------------∏n x G在SPSS 中,几何平均数可以在Report 子菜单的4个报表过程中计算输出。

SPSS实现经典统计学分析与变异系数偏度峰度等常用统计学指标计算

SPSS实现经典统计学分析与变异系数偏度峰度等常用统计学指标计算

SPSS实现经典统计学分析与变异系数偏度峰度等常用统计学指标计算SPSS是一个广泛使用的统计软件,可以进行各种经典统计学分析和计算常用统计学指标。

1.经典统计学分析经典统计学分析是指通过描述性统计和推断统计方法对数据进行分析。

SPSS提供了各种分析方法,包括描述性统计、相关性分析、T检验、方差分析、回归分析等。

-描述性统计:描述性统计是对数据进行总体和样本的基本描述。

可以计算平均值、中位数、众数、标准差、方差、最大值、最小值等。

在SPSS中,可以通过选择Analyze菜单下的Descriptive Statistics来进行描述性统计分析。

-相关性分析:相关性分析用于检测两个或多个变量之间是否存在关联关系。

可以通过计算皮尔逊相关系数来衡量变量之间的线性关系。

在SPSS中,可以通过选择Analyze菜单下的Correlate来进行相关性分析。

-T检验:-方差分析:方差分析用于比较三个或多个样本均值是否存在显著差异。

可以进行单因素方差分析和多因素方差分析。

在SPSS中,可以通过选择Analyze菜单下的General Linear Model来进行方差分析。

-回归分析:回归分析用于建立一种变量和其他若干个变量之间的函数关系。

可以进行一元线性回归、多元线性回归和逻辑回归等。

在SPSS中,可以通过选择Analyze菜单下的Regression来进行回归分析。

变异系数、偏度和峰度是常用的描述性统计学指标。

-变异系数:变异系数是用来衡量样本观测值的变异程度大小的指标。

它是标准差与均值之比,通常以百分比表示。

在SPSS中,可以通过计算标准差和平均值来得到变异系数。

-偏度:偏度是用来衡量一个数据分布是否对称的指标。

正偏表示分布右尾较长,负偏表示分布左尾较长,零偏表示分布基本对称。

在SPSS中,可以通过计算偏度来得到偏度指标。

-峰度:峰度是用来衡量一个数据分布的离散程度的指标。

正峰表示分布具有较高的峰,负峰表示分布具有较低的峰,零峰表示分布具有与正态分布相同的峰度。

描述性统计分析--Descriptive Statistics菜单详解

描述性统计分析--Descriptive Statistics菜单详解

第六章:描述性统计分析--Descriptive Statistics菜单详解描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。

SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:Frequencies过程的特色是产生频数表;Descriptives过程则进行一般性的统计描述;Explore过程用于对数据概况不清时的探索性分析;Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。

本章讲述的四个过程在9.0及以前版本中被放置在Summarize菜单中。

§6.1 Frequencies过程频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。

它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图,圆图等统计图。

和国内常用的频数表不同,几乎所有统计软件给出的均是详细频数表,即并不按某种要求确定组段数和组距,而是按照数值精确列表。

如果想用Frequencies过程得到我们所熟悉的频数表,请先用第二章学过的Recode过程产生一个新变量来代表所需的各组段。

6.1.1 界面说明Frequencies对话框的界面如下所示:该界面在SPSS中实在太普通了,无须多言,重点介绍一下各部分的功能如下:【Display frequency tables复选框】确定是否在结果中输出频数表。

【Statistics钮】单击后弹出Statistics对话框如下,用于定义需要计算的其他描述统计量。

现将各部分解释如下:o Percentile Values复选框组定义需要输出的百分位数,可计算四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut pointsfor equal groups)、或直接指定某个百分位数(Percentiles),如直接指定输出P2.5和P97.5。

Descriptive_statistics

Descriptive_statistics
Descriptive statistics
for one variable
描述性统计
统计方法的类型

Descriptive Statistics 通过数值和图的方式,清 楚明了地对样本数据进行 总结描述

Inferential Statistics
对数据来自的总体分布进行 推断
描述什么?

数据的“位置”或者“中心” (“measures of location”)
但是对极值点敏感
许多统计方法是基于平均值的

样本分位数
常见1/4, 3/4分位数 对极值点不敏感

Index of central tendency
Source: /psych/stat/5/skewnone.gif
例:开车最快速度调查数据
Sex N Mean Median TrMean StDev SE Mean female 126 91.23 90.00 90.83 11.32 1.01 male 100 96.79 110.00 105.62 17.39 1.74

This is the famous “Bell curve” where many cases fall near the middle of the distribution and few fall very high or very low I.Q.
Statistical properties of the normal distribution

标准偏差(SD)
A summary statistic of how much scores vary from the mean Square root of the Variance

SPSS统计分析—描述性统计分析

SPSS统计分析—描述性统计分析

• 各地区城乡居民消费水平比较
已知有2005年各省城乡居民消费水平, 试按地区对各省城乡消费 水平之比进行分析, 并比较不同地区之间城乡消费水平是否有较 大差异。
• 执行【Analyze】/【Descriptive Statistics】/【Ratio】命令, 弹出如 下图所示对话框
• 结果解读
SPSS统计分析—描述性统计 分析
描述性统计量
集中趋势
分布情况
均值
Mean
标准差 Std.deviatiom 偏度
Skewness
中位数 Median
Variance
峰度
Kurtosis
众数
Mode
极小值
Minimum

Sum
极大值
Maximum
Range
均值的标准 误差
S.E.mean
• 【Descriptive Statistics】子菜单
• ⑤ Ratio: 计算两个变量相对比的统计量特征。
• ⑥ P-P Plots: 绘制P-P图,检验数据服从的分布情况。
• ⑦ Q-Q Plots: 绘制Q-encies
• 频数分析简介 • 频数分析表是描述性统计中最常用的方法之一,它主要包括以下几
• 结果解读
• 1、列联表 • 2.卡方检验结果
3.条图
相对比描述——Ratio
• 在实际问题中,研究者有时除了希望了解变量自身的统计特征,还希望 得到两个变量相对比之间的统计描述。
• 法一: 通过对两个变量作除法形成一个新变量,然后分析新变量的统计 特征来得到。
• 法二: 直接通过【Ratio】过程来分析两个变量之间的相对比关系,并 且可以得到多于第一种方法的信息。

SPSS词汇大全(中英文对照)

SPSS词汇大全(中英文对照)

SPSS词汇(中英文对照)Absolute deviation,绝对离差Absolute number,绝对数Absolute residuals, 绝对残差Acceleration array,加速度立体阵Acceleration in an arbitrary direction,任意方向上的加速度Acceleration normal,法向加速度Acceleration space dimension,加速度空间的维数Acceleration tangential, 切向加速度Acceleration vector, 加速度向量Acceptable hypothesis, 可接受假设Accumulation, 累积Accuracy,准确度Actual frequency, 实际频数Adaptive estimator,自适应估计量Addition, 相加Addition theorem, 加法定理Additivity,可加性Adjusted rate, 调整率Adjusted value, 校正值Admissible error,容许误差Aggregation,聚集性Alternative hypothesis,备择假设Among groups, 组间Amounts,总量Analysis of correlation,相关分析Analysis of covariance, 协方差分析Analysis of regression,回归分析Analysis of time series,时间序列分析Analysis of variance,方差分析Angular transformation,角转换ANOVA (analysis of variance),方差分析ANOVA Models,方差分析模型Arcing, 弧/弧旋Arcsine transformation,反正弦变换Area under the curve, 曲线面积AREG ,评估从一个时间点到下一个时间点回归相关时的误差ARIMA,季节和非季节性单变量模型的极大似然估计Arithmetic grid paper, 算术格纸Arithmetic mean, 算术平均数Arrhenius relation, 艾恩尼斯关系Assessing fit,拟合的评估Associative laws, 结合律Asymmetric distribution,非对称分布Asymptotic bias,渐近偏倚Asymptotic efficiency, 渐近效率Asymptotic variance,渐近方差Attributable risk, 归因危险度Attribute data,属性资料Attribution,属性Autocorrelation,自相关Autocorrelation of residuals,残差的自相关Average,平均数Average confidence interval length,平均置信区间长度Average growth rate,平均增长率Bar chart,条形图Bar graph, 条形图Base period,基期Bayes' theorem ,Bayes定理Bell—shaped curve, 钟形曲线Bernoulli distribution,伯努力分布Best—trim estimator, 最好切尾估计量Bias,偏性Binary logistic regression,二元逻辑斯蒂回归Binomial distribution,二项分布Bisquare, 双平方Bivariate Correlate,二变量相关Bivariate normal distribution,双变量正态分布Bivariate normal population,双变量正态总体Biweight interval, 双权区间Biweight M-estimator,双权M估计量Block,区组/配伍组BMDP(Biomedical computer programs), BMDP统计软件包Boxplots, 箱线图/箱尾图Breakdown bound,崩溃界/崩溃点Canonical correlation,典型相关Caption, 纵标目Case—control study, 病例对照研究Categorical variable, 分类变量Catenary,悬链线Cauchy distribution,柯西分布Cause—and-effect relationship,因果关系Cell, 单元Censoring,终检Center of symmetry,对称中心Centering and scaling,中心化和定标Central tendency,集中趋势Central value,中心值CHAID -χ2 Automatic Interaction Detector, 卡方自动交互检测Chance, 机遇Chance error,随机误差Chance variable, 随机变量Characteristic equation, 特征方程Characteristic root,特征根Characteristic vector, 特征向量Chebshev criterion of fit, 拟合的切比雪夫准则Chernoff faces,切尔诺夫脸谱图Chi—square test, 卡方检验/χ2检验Choleskey decomposition, 乔洛斯基分解Circle chart, 圆图Class interval, 组距Class mid-value, 组中值Class upper limit,组上限Classified variable, 分类变量Cluster analysis, 聚类分析Cluster sampling,整群抽样Code,代码Coded data, 编码数据Coding, 编码Coefficient of contingency,列联系数Coefficient of determination,决定系数Coefficient of multiple correlation, 多重相关系数Coefficient of partial correlation,偏相关系数Coefficient of production—moment correlation,积差相关系数Coefficient of rank correlation,等级相关系数Coefficient of regression,回归系数Coefficient of skewness, 偏度系数Coefficient of variation,变异系数Cohort study,队列研究Column,列Column effect,列效应Column factor, 列因素Combination pool, 合并Combinative table,组合表Common factor,共性因子Common regression coefficient, 公共回归系数Common value, 共同值Common variance,公共方差Common variation,公共变异Communality variance,共性方差Comparability,可比性Comparison of bathes,批比较Comparison value,比较值Compartment model,分部模型Compassion,伸缩Complement of an event,补事件Complete association, 完全正相关Complete dissociation,完全不相关Complete statistics,完备统计量Completely randomized design, 完全随机化设计Composite event,联合事件Composite events, 复合事件Concavity, 凹性Conditional expectation,条件期望Conditional likelihood,条件似然Conditional probability,条件概率Conditionally linear,依条件线性Confidence interval,置信区间Confidence limit,置信限Confidence lower limit, 置信下限Confidence upper limit,置信上限Confirmatory Factor Analysis , 验证性因子分析Confirmatory research,证实性实验研究Confounding factor, 混杂因素Conjoint,联合分析Consistency, 相合性Consistency check,一致性检验Consistent asymptotically normal estimate, 相合渐近正态估计Consistent estimate,相合估计Constrained nonlinear regression,受约束非线性回归Constraint,约束Contaminated distribution, 污染分布Contaminated Gausssian,污染高斯分布Contaminated normal distribution, 污染正态分布Contamination, 污染Contamination model, 污染模型Contingency table, 列联表Contour,边界线Contribution rate,贡献率Control,对照Controlled experiments,对照实验Conventional depth,常规深度Convolution, 卷积Corrected factor,校正因子Corrected mean,校正均值Correction coefficient, 校正系数Correctness,正确性Correlation coefficient, 相关系数Correlation index,相关指数Correspondence, 对应Counting,计数Counts,计数/频数Covariance,协方差Covariant,共变Cox Regression,Cox回归Criteria for fitting,拟合准则Criteria of least squares,最小二乘准则Critical ratio,临界比Critical region, 拒绝域Critical value,临界值Cross—over design,交叉设计Cross—section analysis,横断面分析Cross—section survey,横断面调查Crosstabs , 交叉表Cross—tabulation table, 复合表Cube root,立方根Cumulative distribution function,分布函数Cumulative probability,累计概率Curvature,曲率/弯曲Curvature,曲率Curve fit ,曲线拟和Curve fitting, 曲线拟合Curvilinear regression, 曲线回归Curvilinear relation,曲线关系Cut-and-try method,尝试法Cycle, 周期Cyclist,周期性D test, D检验Data acquisition,资料收集Data bank,数据库Data capacity,数据容量Data deficiencies,数据缺乏Data handling,数据处理Data manipulation, 数据处理Data processing,数据处理Data reduction,数据缩减Data set, 数据集Data sources, 数据来源Data transformation,数据变换Data validity,数据有效性Data—in, 数据输入Data-out, 数据输出Dead time,停滞期Degree of freedom,自由度Degree of precision, 精密度Degree of reliability, 可靠性程度Degression,递减Density function, 密度函数Density of data points,数据点的密度Dependent variable,应变量/依变量/因变量Dependent variable,因变量Depth, 深度Derivative matrix, 导数矩阵Derivative—free methods,无导数方法Design, 设计Determinacy, 确定性Determinant,行列式Determinant, 决定因素Deviation,离差Deviation from average,离均差Diagnostic plot,诊断图Dichotomous variable, 二分变量Differential equation, 微分方程Direct standardization,直接标准化法Discrete variable,离散型变量DISCRIMINANT,判断Discriminant analysis, 判别分析Discriminant coefficient,判别系数Discriminant function, 判别值Dispersion,散布/分散度Disproportional,不成比例的Disproportionate sub—class numbers,不成比例次级组含量Distribution free,分布无关性/免分布Distribution shape,分布形状Distribution—free method,任意分布法Distributive laws, 分配律Disturbance,随机扰动项Dose response curve, 剂量反应曲线Double blind method,双盲法Double blind trial, 双盲试验Double exponential distribution,双指数分布Double logarithmic,双对数Downward rank, 降秩Dual—space plot,对偶空间图DUD,无导数方法Duncan’s new multiple range method,新复极差法/Duncan新法Effect, 实验效应Eigenvalue, 特征值Eigenvector,特征向量Ellipse,椭圆Empirical distribution,经验分布Empirical probability,经验概率单位Enumeration data,计数资料Equal sun-class number,相等次级组含量Equally likely, 等可能Equivariance, 同变性Error,误差/错误Error of estimate, 估计误差Error type I,第一类错误Error type II,第二类错误Estimand, 被估量Estimated error mean squares,估计误差均方Estimated error sum of squares,估计误差平方和Euclidean distance,欧式距离Event, 事件Event, 事件Exceptional data point,异常数据点Expectation plane, 期望平面Expectation surface, 期望曲面Expected values, 期望值Experiment, 实验Experimental sampling,试验抽样Experimental unit,试验单位Explanatory variable,说明变量Exploratory data analysis,探索性数据分析Explore Summarize, 探索-摘要Exponential curve, 指数曲线Exponential growth,指数式增长EXSMOOTH,指数平滑方法Extended fit,扩充拟合Extra parameter,附加参数Extrapolation,外推法Extreme observation, 末端观测值Extremes,极端值/极值F distribution,F分布F test, F检验Factor,因素/因子Factor analysis, 因子分析Factor Analysis, 因子分析Factor score, 因子得分Factorial,阶乘Factorial design,析因试验设计False negative, 假阴性False negative error,假阴性错误Family of distributions, 分布族Family of estimators,估计量族Fanning, 扇面Fatality rate,病死率Field investigation,现场调查Field survey,现场调查Finite population, 有限总体Finite-sample, 有限样本First derivative, 一阶导数First principal component, 第一主成分First quartile,第一四分位数Fisher information,费雪信息量Fitted value,拟合值Fitting a curve, 曲线拟合Fixed base,定基Fluctuation, 随机起伏Forecast,预测Four fold table, 四格表Fourth,四分点Fraction blow,左侧比率Fractional error,相对误差Frequency,频率Frequency polygon,频数多边图Frontier point, 界限点Function relationship,泛函关系Gamma distribution,伽玛分布Gauss increment,高斯增量Gaussian distribution, 高斯分布/正态分布Gauss-Newton increment, 高斯-牛顿增量General census, 全面普查GENLOG (Generalized liner models),广义线性模型Geometric mean,几何平均数G ini’s mean difference,基尼均差GLM (General liner models),一般线性模型Goodness of fit,拟和优度/配合度Gradient of determinant,行列式的梯度Graeco—Latin square, 希腊拉丁方Grand mean,总均值Gross errors, 重大错误Gross—error sensitivity, 大错敏感度Group averages, 分组平均Grouped data,分组资料Guessed mean,假定平均数Half—life,半衰期Hampel M—estimators,汉佩尔M估计量Happenstance,偶然事件Harmonic mean,调和均数Hazard function,风险均数Hazard rate, 风险率Heading, 标目Heavy-tailed distribution,重尾分布Hessian array,海森立体阵Heterogeneity, 不同质Heterogeneity of variance,方差不齐Hierarchical classification,组内分组Hierarchical clustering method,系统聚类法High—leverage point,高杠杆率点HILOGLINEAR,多维列联表的层次对数线性模型Hinge,折叶点Histogram,直方图Historical cohort study, 历史性队列研究Holes, 空洞HOMALS, 多重响应分析Homogeneity of variance,方差齐性Homogeneity test, 齐性检验Huber M-estimators,休伯M估计量Hyperbola, 双曲线Hypothesis testing,假设检验Hypothetical universe,假设总体Impossible event,不可能事件Independence,独立性Independent variable,自变量Index, 指标/指数Indirect standardization, 间接标准化法Individual,个体Inference band, 推断带Infinite population,无限总体Infinitely great,无穷大Infinitely small, 无穷小Influence curve, 影响曲线Information capacity,信息容量Initial condition, 初始条件Initial estimate, 初始估计值Initial level,最初水平Interaction,交互作用Interaction terms, 交互作用项Intercept, 截距Interpolation,内插法Interquartile range,四分位距Interval estimation, 区间估计Intervals of equal probability,等概率区间Intrinsic curvature, 固有曲率Invariance,不变性Inverse matrix, 逆矩阵Inverse probability,逆概率Inverse sine transformation,反正弦变换Iteration, 迭代Jacobian determinant,雅可比行列式Joint distribution function, 分布函数Joint probability, 联合概率Joint probability distribution, 联合概率分布K means method,逐步聚类法Kaplan—Meier, 评估事件的时间长度Kaplan—Merier chart,Kaplan—Merier图Kendall's rank correlation, Kendall等级相关Kinetic, 动力学Kolmogorov—Smirnove test,柯尔莫哥洛夫-斯米尔诺夫检验Kruskal and Wallis test,Kruskal及Wallis检验/多样本的秩和检验/H检验Kurtosis,峰度Lack of fit,失拟Ladder of powers,幂阶梯Lag,滞后Large sample,大样本Large sample test, 大样本检验Latin square,拉丁方Latin square design,拉丁方设计Leakage, 泄漏Least favorable configuration, 最不利构形Least favorable distribution,最不利分布Least significant difference,最小显著差法Least square method,最小二乘法Least—absolute—residuals estimates,最小绝对残差估计Least-absolute—residuals fit, 最小绝对残差拟合Least—absolute-residuals line,最小绝对残差线Legend, 图例L-estimator,L估计量L—estimator of location, 位置L估计量L-estimator of scale, 尺度L估计量Level,水平Life expectance,预期期望寿命Life table, 寿命表Life table method, 生命表法Light—tailed distribution,轻尾分布Likelihood function,似然函数Likelihood ratio,似然比line graph,线图Linear correlation,直线相关Linear equation,线性方程Linear programming,线性规划Linear regression,直线回归Linear Regression,线性回归Linear trend, 线性趋势Loading, 载荷Location and scale equivariance,位置尺度同变性Location equivariance,位置同变性Location invariance, 位置不变性Location scale family,位置尺度族Log rank test,时序检验Logarithmic curve,对数曲线Logarithmic normal distribution,对数正态分布Logarithmic scale,对数尺度Logarithmic transformation, 对数变换Logic check,逻辑检查Logistic distribution,逻辑斯特分布Logit transformation,Logit转换LOGLINEAR,多维列联表通用模型Lognormal distribution,对数正态分布Lost function,损失函数Low correlation,低度相关Lower limit,下限Lowest—attained variance, 最小可达方差LSD, 最小显著差法的简称Lurking variable,潜在变量Main effect, 主效应Major heading,主辞标目Marginal density function, 边缘密度函数Marginal probability, 边缘概率Marginal probability distribution,边缘概率分布Matched data,配对资料Matched distribution,匹配过分布Matching of distribution, 分布的匹配Matching of transformation,变换的匹配Mathematical expectation, 数学期望Mathematical model, 数学模型Maximum L-estimator,极大极小L 估计量Maximum likelihood method,最大似然法Mean, 均数Mean squares between groups, 组间均方Mean squares within group,组内均方Means (Compare means),均值—均值比较Median,中位数Median effective dose, 半数效量Median lethal dose,半数致死量Median polish,中位数平滑Median test,中位数检验Minimal sufficient statistic,最小充分统计量Minimum distance estimation,最小距离估计Minimum effective dose, 最小有效量Minimum lethal dose,最小致死量Minimum variance estimator,最小方差估计量MINITAB,统计软件包Minor heading, 宾词标目Missing data, 缺失值Model specification,模型的确定Modeling Statistics , 模型统计Models for outliers,离群值模型Modifying the model, 模型的修正Modulus of continuity, 连续性模Morbidity,发病率Most favorable configuration, 最有利构形Multidimensional Scaling (ASCAL), 多维尺度/多维标度Multinomial Logistic Regression ,多项逻辑斯蒂回归Multiple comparison,多重比较Multiple correlation ,复相关Multiple covariance, 多元协方差Multiple linear regression,多元线性回归Multiple response , 多重选项Multiple solutions,多解Multiplication theorem,乘法定理Multiresponse, 多元响应Multi-stage sampling,多阶段抽样Multivariate T distribution,多元T分布Mutual exclusive, 互不相容Mutual independence,互相独立Natural boundary,自然边界Natural dead,自然死亡Natural zero, 自然零Negative correlation,负相关Negative linear correlation, 负线性相关Negatively skewed,负偏Newman—Keuls method,q检验NK method, q检验No statistical significance,无统计意义Nominal variable, 名义变量Nonconstancy of variability, 变异的非定常性Nonlinear regression,非线性相关Nonparametric statistics,非参数统计Nonparametric test,非参数检验Nonparametric tests, 非参数检验Normal deviate,正态离差Normal distribution,正态分布Normal equation,正规方程组Normal ranges, 正常范围Normal value, 正常值Nuisance parameter,多余参数/讨厌参数Null hypothesis, 无效假设Numerical variable, 数值变量Objective function,目标函数Observation unit,观察单位Observed value,观察值One sided test, 单侧检验One-way analysis of variance, 单因素方差分析Oneway ANOVA , 单因素方差分析Open sequential trial,开放型序贯设计Optrim,优切尾Optrim efficiency, 优切尾效率Order statistics,顺序统计量Ordered categories,有序分类Ordinal logistic regression ,序数逻辑斯蒂回归Ordinal variable,有序变量Orthogonal basis,正交基Orthogonal design,正交试验设计Orthogonality conditions, 正交条件ORTHOPLAN,正交设计Outlier cutoffs,离群值截断点Outliers, 极端值OVERALS ,多组变量的非线性正规相关Overshoot, 迭代过度Paired design,配对设计Paired sample, 配对样本Pairwise slopes, 成对斜率Parabola, 抛物线Parallel tests, 平行试验Parameter, 参数Parametric statistics, 参数统计Parametric test,参数检验Partial correlation, 偏相关Partial regression,偏回归Partial sorting, 偏排序Partials residuals,偏残差Pattern,模式Pearson curves, 皮尔逊曲线Peeling,退层Percent bar graph,百分条形图Percentage,百分比Percentile, 百分位数Percentile curves,百分位曲线Periodicity, 周期性Permutation,排列P—estimator,P估计量Pie graph,饼图Pitman estimator,皮特曼估计量Pivot,枢轴量Planar,平坦Planar assumption,平面的假设PLANCARDS,生成试验的计划卡Point estimation, 点估计Poisson distribution,泊松分布Polishing, 平滑Polled standard deviation,合并标准差Polled variance,合并方差Polygon, 多边图Polynomial,多项式Polynomial curve,多项式曲线Population,总体Population attributable risk,人群归因危险度Positive correlation,正相关Positively skewed, 正偏Posterior distribution, 后验分布Power of a test,检验效能Precision,精密度Predicted value,预测值Preliminary analysis, 预备性分析Principal component analysis,主成分分析Prior distribution,先验分布Prior probability, 先验概率Probabilistic model, 概率模型probability,概率Probability density,概率密度Product moment, 乘积矩/协方差Profile trace,截面迹图Proportion, 比/构成比Proportion allocation in stratified random sampling, 按比例分层随机抽样Proportionate,成比例Proportionate sub—class numbers, 成比例次级组含量Prospective study,前瞻性调查Proximities, 亲近性Pseudo F test,近似F检验Pseudo model,近似模型Pseudosigma, 伪标准差Purposive sampling,有目的抽样QR decomposition, QR分解Quadratic approximation,二次近似Qualitative classification,属性分类Qualitative method,定性方法Quantile-quantile plot,分位数—分位数图/Q—Q图Quantitative analysis,定量分析Quartile,四分位数Quick Cluster, 快速聚类Radix sort,基数排序Random allocation,随机化分组Random blocks design, 随机区组设计Random event,随机事件Randomization, 随机化Range, 极差/全距Rank correlation,等级相关Rank sum test, 秩和检验Rank test, 秩检验Ranked data,等级资料Rate, 比率Ratio, 比例Raw data, 原始资料Raw residual, 原始残差Rayleigh’s test, 雷氏检验Rayleigh’s Z,雷氏Z值Reciprocal,倒数Reciprocal transformation, 倒数变换Recording, 记录Redescending estimators, 回降估计量Reducing dimensions,降维Re-expression, 重新表达Reference set, 标准组Region of acceptance,接受域Regression coefficient, 回归系数Regression sum of square,回归平方和Rejection point, 拒绝点Relative dispersion, 相对离散度Relative number,相对数Reliability,可靠性Reparametrization, 重新设置参数Replication,重复Report Summaries,报告摘要Residual sum of square, 剩余平方和Resistance, 耐抗性Resistant line, 耐抗线Resistant technique, 耐抗技术R—estimator of location,位置R估计量R-estimator of scale, 尺度R估计量Retrospective study, 回顾性调查Ridge trace, 岭迹Ridit analysis,Ridit分析Rotation, 旋转Rounding,舍入Row,行Row effects,行效应Row factor,行因素RXC table,RXC表Sample, 样本Sample regression coefficient,样本回归系数Sample size, 样本量Sample standard deviation,样本标准差Sampling error,抽样误差SAS(Statistical analysis system ),SAS统计软件包Scale, 尺度/量表Scatter diagram,散点图Schematic plot,示意图/简图Score test,计分检验Screening, 筛检SEASON,季节分析Second derivative,二阶导数Second principal component, 第二主成分SEM (Structural equation modeling), 结构化方程模型Semi-logarithmic graph, 半对数图Semi—logarithmic paper, 半对数格纸Sensitivity curve,敏感度曲线Sequential analysis, 贯序分析Sequential data set,顺序数据集Sequential design,贯序设计Sequential method, 贯序法Sequential test, 贯序检验法Serial tests, 系列试验Short—cut method,简捷法Sigmoid curve,S形曲线Sign function,正负号函数Sign test, 符号检验Signed rank,符号秩Significance test, 显著性检验Significant figure,有效数字Simple cluster sampling,简单整群抽样Simple correlation,简单相关Simple random sampling,简单随机抽样Simple regression,简单回归simple table,简单表Sine estimator,正弦估计量Single—valued estimate,单值估计Singular matrix,奇异矩阵Skewed distribution, 偏斜分布Skewness,偏度Slash distribution,斜线分布Slope,斜率Smirnov test,斯米尔诺夫检验Source of variation, 变异来源Spearman rank correlation,斯皮尔曼等级相关Specific factor, 特殊因子Specific factor variance,特殊因子方差Spectra , 频谱Spherical distribution,球型正态分布Spread,展布SPSS(Statistical package for the social science),SPSS统计软件包Spurious correlation,假性相关Square root transformation,平方根变换Stabilizing variance,稳定方差Standard deviation,标准差Standard error, 标准误Standard error of difference,差别的标准误Standard error of estimate, 标准估计误差Standard error of rate,率的标准误Standard normal distribution, 标准正态分布Standardization,标准化Starting value, 起始值Statistic,统计量Statistical control,统计控制Statistical graph, 统计图Statistical inference,统计推断Statistical table,统计表Steepest descent,最速下降法Stem and leaf display, 茎叶图Step factor, 步长因子Stepwise regression,逐步回归Storage, 存Strata,层(复数)Stratified sampling,分层抽样Stratified sampling,分层抽样Strength,强度Stringency, 严密性Structural relationship,结构关系Studentized residual, 学生化残差/t化残差Sub—class numbers,次级组含量Subdividing,分割Sufficient statistic,充分统计量Sum of products,积和Sum of squares, 离差平方和Sum of squares about regression, 回归平方和Sum of squares between groups,组间平方和Sum of squares of partial regression, 偏回归平方和Sure event,必然事件Survey, 调查Survival,生存分析Survival rate, 生存率Suspended root gram,悬吊根图Symmetry,对称Systematic error,系统误差Systematic sampling,系统抽样Tags,标签Tail area,尾部面积Tail length,尾长Tail weight, 尾重Tangent line,切线Target distribution,目标分布Taylor series, 泰勒级数Tendency of dispersion, 离散趋势Testing of hypotheses,假设检验Theoretical frequency, 理论频数Time series,时间序列Tolerance interval, 容忍区间Tolerance lower limit, 容忍下限Tolerance upper limit,容忍上限Torsion,扰率Total sum of square, 总平方和Total variation,总变异Transformation,转换Treatment,处理Trend,趋势Trend of percentage, 百分比趋势Trial, 试验Trial and error method, 试错法Tuning constant, 细调常数Two sided test,双向检验Two—stage least squares,二阶最小平方Two-stage sampling, 二阶段抽样Two—tailed test,双侧检验Two—way analysis of variance,双因素方差分析Two-way table, 双向表Type I error, 一类错误/α错误Type II error, 二类错误/β错误UMVU,方差一致最小无偏估计简称Unbiased estimate,无偏估计Unconstrained nonlinear regression ,无约束非线性回归Unequal subclass number,不等次级组含量Ungrouped data,不分组资料Uniform coordinate,均匀坐标Uniform distribution,均匀分布Uniformly minimum variance unbiased estimate,方差一致最小无偏估计Unit, 单元Unordered categories, 无序分类Upper limit, 上限Upward rank,升秩Vague concept,模糊概念Validity, 有效性VARCOMP (Variance component estimation),方差元素估计Variability, 变异性Variable, 变量Variance,方差Variation,变异Varimax orthogonal rotation,方差最大正交旋转Volume of distribution, 容积W test,W检验Weibull distribution,威布尔分布Weight, 权数Weighted Chi-square test,加权卡方检验/Cochran检验Weighted linear regression method, 加权直线回归Weighted mean, 加权平均数Weighted mean square,加权平均方差Weighted sum of square,加权平方和Weighting coefficient,权重系数Weighting method,加权法W-estimation, W估计量W-estimation of location, 位置W估计量Width, 宽度Wilcoxon paired test,威斯康星配对法/配对符号秩和检验Wild point,野点/狂点Wild value, 野值/狂值Winsorized mean,缩尾均值Withdraw,失访Youden's index,尤登指数Z test, Z检验Zero correlation,零相关Z—transformation,Z变换。

统计分析与Spss应用第五章(描述性统计分析)

统计分析与Spss应用第五章(描述性统计分析)

选入需要描述的 变量,可选入多个
确定是否将原始数 据的标准正态变换 结果存为新变量。
变量列表顺序 字母顺序 均数升序 均数降序。
Descriptive Statistics N 血清总胆固醇 Valid N (listwise) Minimum Maximum 101 2.70 7.22 101 Mean Std. Deviation 4.6995 .86162



5.1.1 对话框界面及 各部分选项说明 【Display frequency tables复选框】确定是 否在结果中输出频数 表。 【Statistics钮】单击 后弹出Statistics对话 框,用于定义需要计 算的其他描述统计量。
集中趋势指标
百分位数指标
计算百分数时选此项
离散趋势指标 分布指标
1
.002
.000
Hale Waihona Puke .006.002b
.000
.005
639 61.974 d 65.957 55.621 9.398
e
40 40
.014 .006
.016b .009b .011b .003
b
.008 .003 .004 .000
.025 .016 .018 .006 .001
b
1
.002
.000
.002
descriptive statistics菜单主要内容




(1)频数分布表分析(Frequencies):其特色就是产生 频数表,对分类数据和定量资料都适用。 (2)统计描述分析(Descriptive)进行一般性描述,适 用于服从正态分布的定量资料。 (3) Explore 过程:用于对数据分布状况不清楚时的 探索性分析,它会杂七杂八给出一大堆可能用到的 统计指标和统计图,让研究者参考。 (4)Crosstabs 过程则完成计数资料和等级资料的统计 描述和一般的统计检验我们常用的X2 检验也在其中 完成 (5)Ratio过程;用于对两个连续性变量计算相对比指 标,它可以计算出一系列非常专业的相对比描述指 标。

心理统计笔记—名词解释

心理统计笔记—名词解释

第一章:描述性统计统计:描述性统计descriptive statistics推断性统计inferential statistics#描述性统计主要是对一组给定的测量数据进行总结的方法,而推断性统计是把对给定数据的测量结果推广到更大的潜在数据集的方法。

变量variable和常量constant变量:连续变量continuous variable & 离散变量discrete variable一个具有有限水平但相邻水平之间不再可能赋值的变量被称为离散变量。

一个可以无穷小精确度来测量的变量(至少在理论上,可是求两个任意小的测量水平之间的中间值)被称为连续变量。

自变量indepentent variable & 因变量dependent variable称名/类别量尺(nominal/categorical scale):数字是强制定义的,不可计算。

顺序/等级量尺(ordinal scale):不是简单分类,而是有一定顺序。

然而,这些排名数字并不能看作真正的数值,因为等级之间不是等距的。

研究者在对这类的数据进行数学运算时,已经假设它们是等距数据了。

等距和等比量尺(interval and ratio scales):不但具有等距特征,而且还兼具等比特征的量尺被称之为等比量尺。

尽管所有等比量尺都有等距特征,但有些量尺只有等距特征而不具备等比特征。

这些量尺被称为等距量尺。

等距量尺是没有真正零点的。

E.g. 摄氏和华氏温度,IQ值等。

#不能混淆变量和用来测量变量的量尺。

同一个变量可以用多种量尺来测量,例如:测量温度可以用顺序量尺(第一热,第二热),也可以用等距量尺(摄氏/华氏度),还可以用等比量尺(开尔文,有绝对零度)。

尽管在终极意义上,所有量尺都是离散的,但是具有很多水平的量尺通常被认为是连续的,而水平相对少的量尺则当作离散处理。

而用于测量离散变量的量尺总是离散的。

参数统计(parameter statistics)和非参数统计:基于分布及其参数的统计方法叫参数统计。

小胖说统计之临床试验中的描述性统计分析

小胖说统计之临床试验中的描述性统计分析

小胖说统计之临床试验中的描述性统计分析The purpose of the field of statistics is to characterize a population based on the information contained in a sample taken from that population。

上述论述中,包含的三个要素是population、samples和characterization。

那么具体怎么characterization呢?无非有两种,一种就是我们所谓的descriptive statistics(描述性统计分析),一种是inferential statistics(推断性统计分析)。

具体到我们的临床试验中,描述性统计分析占到了我们最后统计分析报告的绝大部分,这是因为除了你事先有检验假设的一些终点的分析会用到推断性统计分析外,你几乎所有的人口学和基线变量的总结、疗效数据的总结、安全性数据的总结都要用到描述性统计分析。

而具体的描述性统计分析,又根据不同的数据类型有不同的描述方式,对于连续性变量来说,我们最常用到的是均数、标准差、中位数、最小值和最大值;对于分类型变量来说,主要用到的是频数表的方式即频数及百分比;对于time to event数据来说,我们则最主要基于Kaplan-Meier来进行统计描述。

此外,除了用表格的形式对临床试验数据进行描述性总结之外,我们还会用到一些figures来进行统计描述,最常见的如Line Plot,Bar Chart,Box Plot,K-M curve等。

我们在统计分析计划或研究方案中的统计分析部分,特别是在统计分析的一般原则中一般会对描述性统计分析常有以下类似的描述:对于连续型变量,将列出未缺失的受试者个数、均数、标准差、中位数、最小值和最大值。

对于分类变量,将以频数表的形式(频数和百分数)列出。

而有些比较详细的统计分析计划会对各描述性统计分析统计量的小数位数加以规定,从而使table更加标准化,当然小数位数的规定也不是绝对统一的标准,以下的例子的描述供大家参考:对于连续型变量,将列出未缺失的受试者个数、均数、标准差、中位数、最小值和最大值。

SPSS术语中英文对照

SPSS术语中英文对照

【常用软件】SPSS术语中英文对照SPSS的统计分析过程均包含在Analysis菜单中。

我们只学以下两大分析过程:Descriptive Statistics(描述性统计)和Multiple Response(多选项分析). Descriptive Statistics(描述性统计)包含的分析功能:1.Frequencies 过程:主要用于统计指定变量各变量值的频次(Frequency)、百分比(Percent)。

2.Descriptives过程:主要用于计算指定变量的均值(Mean)、标准差(Std.Deviation)。

3.Crosstabs 过程:主要用于两个或两个以上变量的交叉分类。

Multiple Response(多选项分析)的分析功能:1.Define Set过程:该过程定义一个由多选项组成的多响应变量。

2.Frequencies过程:该过程对定义的多响应变量提供一个频数表。

3.Crosstabs过程:该过程提供所定义的多响应变量与其他变量的交叉分类表。

Absolute deviation,绝对离差Absolute number, 绝对数Absolute residuals, 绝对残差Acceleration array, 加速度立体阵Acceleration in an arbitrary direction, 任意方向上的加速度Acceleration normal, 法向加速度Acceleration space dimension,加速度空间的维数Acceleration tangential, 切向加速度Acceleration vector,加速度向量Acceptable hypothesis,可接受假设Accumulation,累积Accuracy,准确度Actual frequency,实际频数Adaptive estimator, 自适应估计量Addition,相加Addition theorem,加法定理Additivity,可加性Adjusted rate,调整率Adjusted value, 校正值Admissible error,容许误差Aggregation, 聚集性Alternative hypothesis, 备择假设Among groups, 组间Amounts, 总量Analysis of correlation, 相关分析Analysis of covariance, 协方差分析Analysis of regression, 回归分析Analysis of time series, 时间序列分析Analysis of variance, 方差分析Angular transformation,角转换ANOVA (analysis of variance),方差分析ANOVA Models, 方差分析模型Arcing, 弧/弧旋Arcsine transformation, 反正弦变换Area under the curve, 曲线面积AREG ,评估从一个时间点到下一个时间点回归相关时的误差ARIMA, 季节和非季节性单变量模型的极大似然估计Arithmetic grid paper, 算术格纸Arithmetic mean,算术平均数Arrhenius relation,艾恩尼斯关系Assessing fit,拟合的评估Associative laws,结合律Asymmetric distribution, 非对称分布Asymptotic bias,渐近偏倚Asymptotic efficiency,渐近效率Asymptotic variance, 渐近方差Attributable risk,归因危险度Attribute data, 属性资料Attribution, 属性Autocorrelation,自相关Autocorrelation of residuals,残差的自相关Average, 平均数Average confidence interval length, 平均置信区间长度Average growth rate,平均增长率Bar chart, 条形图Bar graph,条形图Base period,基期Bayes‘ theorem , Bayes定理Bell—shaped curve, 钟形曲线Bernoulli distribution,伯努力分布Best—trim estimator,最好切尾估计量Bias,偏性Binary logistic regression,二元逻辑斯蒂回归Binomial distribution, 二项分布Bisquare,双平方Bivariate Correlate,二变量相关Bivariate normal distribution,双变量正态分布Bivariate normal population, 双变量正态总体Biweight interval, 双权区间Biweight M—estimator,双权M估计量Block, 区组/配伍组BMDP(Biomedical computer programs),BMDP统计软件包Boxplots,箱线图/箱尾图Breakdown bound,崩溃界/崩溃点Canonical correlation, 典型相关Caption, 纵标目Case-control study, 病例对照研究Categorical variable, 分类变量Catenary, 悬链线Cauchy distribution,柯西分布Cause-and-effect relationship, 因果关系Cell, 单元Censoring,终检Center of symmetry, 对称中心Centering and scaling, 中心化和定标Central tendency,集中趋势Central value,中心值CHAID —χ2 Automatic Interaction Detector,卡方自动交互检测Chance,机遇Chance error,随机误差Chance variable, 随机变量Characteristic equation, 特征方程Characteristic root, 特征根Characteristic vector, 特征向量Chebshev criterion of fit,拟合的切比雪夫准则Chernoff faces, 切尔诺夫脸谱图Chi—square test, 卡方检验/χ2检验Choleskey decomposition,乔洛斯基分解Circle chart, 圆图Class interval,组距Class mid—value,组中值Class upper limit,组上限Classified variable, 分类变量Cluster analysis,聚类分析Cluster sampling, 整群抽样Code,代码Coded data,编码数据Coding, 编码Coefficient of contingency,列联系数Coefficient of determination, 决定系数Coefficient of multiple correlation, 多重相关系数Coefficient of partial correlation,偏相关系数Coefficient of production-moment correlation, 积差相关系数Coefficient of rank correlation, 等级相关系数Coefficient of regression, 回归系数Coefficient of skewness, 偏度系数Coefficient of variation,变异系数Cohort study,队列研究Column,列Column effect, 列效应Column factor,列因素Combination pool, 合并Combinative table,组合表Common factor, 共性因子Common regression coefficient,公共回归系数Common value, 共同值Common variance, 公共方差Common variation, 公共变异Communality variance,共性方差Comparability, 可比性Comparison of bathes, 批比较Comparison value, 比较值Compartment model,分部模型Compassion,伸缩Complement of an event, 补事件Complete association, 完全正相关Complete dissociation,完全不相关Complete statistics, 完备统计量Completely randomized design,完全随机化设计Composite event, 联合事件Composite events, 复合事件Concavity, 凹性Conditional expectation, 条件期望Conditional likelihood,条件似然Conditional probability, 条件概率Conditionally linear,依条件线性Confidence interval, 置信区间Confidence limit,置信限Confidence lower limit,置信下限Confidence upper limit, 置信上限Confirmatory Factor Analysis , 验证性因子分析Confirmatory research, 证实性实验研究Confounding factor, 混杂因素Conjoint, 联合分析Consistency, 相合性Consistency check, 一致性检验Consistent asymptotically normal estimate, 相合渐近正态估计Consistent estimate, 相合估计Constrained nonlinear regression, 受约束非线性回归Constraint, 约束Contaminated distribution, 污染分布Contaminated Gausssian,污染高斯分布Contaminated normal distribution, 污染正态分布Contamination,污染Contamination model, 污染模型Contingency table,列联表Contour,边界线Contribution rate, 贡献率Control, 对照Controlled experiments, 对照实验Conventional depth, 常规深度Convolution, 卷积Corrected factor,校正因子Corrected mean, 校正均值Correction coefficient, 校正系数Correctness,正确性Correlation coefficient, 相关系数Correlation index,相关指数Correspondence, 对应Counting,计数Counts, 计数/频数Covariance,协方差Covariant,共变Cox Regression, Cox回归Criteria for fitting, 拟合准则Criteria of least squares,最小二乘准则Critical ratio, 临界比Critical region, 拒绝域Critical value,临界值Cross—over design,交叉设计Cross—section analysis,横断面分析Cross—section survey, 横断面调查Crosstabs , 交叉表Cross—tabulation table, 复合表Cube root,立方根Cumulative distribution function,分布函数Cumulative probability, 累计概率Curvature, 曲率/弯曲Curvature,曲率Curve fit ,曲线拟和Curve fitting,曲线拟合Curvilinear regression, 曲线回归Curvilinear relation, 曲线关系Cut—and-try method, 尝试法Cycle, 周期Cyclist,周期性D test, D检验Data acquisition,资料收集Data bank, 数据库Data capacity,数据容量Data deficiencies, 数据缺乏Data handling, 数据处理Data manipulation,数据处理Data processing, 数据处理Data reduction,数据缩减Data set, 数据集Data sources,数据来源Data transformation, 数据变换Data validity, 数据有效性Data—in, 数据输入Data-out, 数据输出Dead time,停滞期Degree of freedom, 自由度Degree of precision, 精密度Degree of reliability, 可靠性程度Degression,递减Density function,密度函数Density of data points, 数据点的密度Dependent variable, 应变量/依变量/因变量Dependent variable, 因变量Depth, 深度Derivative matrix, 导数矩阵Derivative—free methods, 无导数方法Design, 设计Determinacy, 确定性Determinant,行列式Determinant, 决定因素Deviation,离差Deviation from average, 离均差Diagnostic plot,诊断图Dichotomous variable, 二分变量Differential equation, 微分方程Direct standardization,直接标准化法Discrete variable, 离散型变量DISCRIMINANT, 判断Discriminant analysis, 判别分析Discriminant coefficient, 判别系数Discriminant function, 判别值Dispersion, 散布/分散度Disproportional, 不成比例的Disproportionate sub-class numbers,不成比例次级组含量Distribution free, 分布无关性/免分布Distribution shape, 分布形状Distribution-free method, 任意分布法Distributive laws, 分配律Disturbance, 随机扰动项Dose response curve, 剂量反应曲线Double blind method,双盲法Double blind trial, 双盲试验Double exponential distribution,双指数分布Double logarithmic, 双对数Downward rank,降秩Dual—space plot,对偶空间图DUD, 无导数方法Duncan‘s new multiple range method,新复极差法/Duncan新法Effect, 实验效应Eigenvalue,特征值Eigenvector, 特征向量Ellipse, 椭圆Empirical distribution,经验分布Empirical probability,经验概率单位Enumeration data,计数资料Equal sun—class number,相等次级组含量Equally likely,等可能Equivariance,同变性Error,误差/错误Error of estimate, 估计误差Error type I,第一类错误Error type II,第二类错误Estimand, 被估量Estimated error mean squares, 估计误差均方Estimated error sum of squares, 估计误差平方和Euclidean distance, 欧式距离Event,事件Event,事件Exceptional data point, 异常数据点Expectation plane,期望平面Expectation surface,期望曲面Expected values, 期望值Experiment,实验Experimental sampling, 试验抽样Experimental unit,试验单位Explanatory variable, 说明变量Exploratory data analysis,探索性数据分析Explore Summarize, 探索—摘要Exponential curve,指数曲线Exponential growth, 指数式增长EXSMOOTH, 指数平滑方法Extended fit,扩充拟合Extra parameter,附加参数Extrapolation, 外推法Extreme observation, 末端观测值Extremes,极端值/极值F distribution,F分布F test,F检验Factor,因素/因子Factor analysis, 因子分析Factor Analysis, 因子分析Factor score,因子得分Factorial,阶乘Factorial design,析因试验设计False negative, 假阴性False negative error,假阴性错误Family of distributions,分布族Family of estimators,估计量族Fanning, 扇面Fatality rate, 病死率Field investigation, 现场调查Field survey,现场调查Finite population,有限总体Finite-sample, 有限样本First derivative, 一阶导数First principal component, 第一主成分First quartile, 第一四分位数Fisher information,费雪信息量Fitted value,拟合值Fitting a curve, 曲线拟合Fixed base, 定基Fluctuation,随机起伏Forecast,预测Four fold table, 四格表Fourth,四分点Fraction blow, 左侧比率Fractional error,相对误差Frequency,频率Frequency polygon,频数多边图Frontier point, 界限点Function relationship, 泛函关系Gamma distribution, 伽玛分布Gauss increment, 高斯增量Gaussian distribution, 高斯分布/正态分布Gauss-Newton increment,高斯—牛顿增量General census,全面普查GENLOG (Generalized liner models),广义线性模型Geometric mean, 几何平均数Gini‘s mean difference, 基尼均差GLM (General liner models),一般线性模型Goodness of fit, 拟和优度/配合度Gradient of determinant, 行列式的梯度Graeco—Latin square, 希腊拉丁方Grand mean, 总均值Gross errors,重大错误Gross—error sensitivity,大错敏感度Group averages, 分组平均Grouped data,分组资料Guessed mean,假定平均数Half-life, 半衰期Hampel M—estimators,汉佩尔M估计量Happenstance,偶然事件Harmonic mean, 调和均数Hazard function,风险均数Hazard rate,风险率Heading, 标目Heavy—tailed distribution, 重尾分布Hessian array,海森立体阵Heterogeneity, 不同质Heterogeneity of variance,方差不齐Hierarchical classification, 组内分组Hierarchical clustering method,系统聚类法High—leverage point,高杠杆率点HILOGLINEAR, 多维列联表的层次对数线性模型Hinge, 折叶点Histogram, 直方图Historical cohort study,历史性队列研究Holes,空洞HOMALS, 多重响应分析Homogeneity of variance,方差齐性Homogeneity test,齐性检验Huber M—estimators,休伯M估计量Hyperbola,双曲线Hypothesis testing,假设检验Hypothetical universe,假设总体Impossible event, 不可能事件Independence,独立性Independent variable,自变量Index, 指标/指数Indirect standardization, 间接标准化法Individual,个体Inference band,推断带Infinite population,无限总体Infinitely great,无穷大Infinitely small, 无穷小Influence curve,影响曲线Information capacity,信息容量Initial condition, 初始条件Initial estimate, 初始估计值Initial level,最初水平Interaction,交互作用Interaction terms,交互作用项Intercept,截距Interpolation, 内插法Interquartile range, 四分位距Interval estimation,区间估计Intervals of equal probability, 等概率区间Intrinsic curvature, 固有曲率Invariance,不变性Inverse matrix,逆矩阵Inverse probability,逆概率Inverse sine transformation, 反正弦变换Iteration,迭代Jacobian determinant,雅可比行列式Joint distribution function,分布函数Joint probability, 联合概率Joint probability distribution, 联合概率分布K means method,逐步聚类法Kaplan—Meier,评估事件的时间长度Kaplan—Merier chart, Kaplan-Merier图Kendall‘s rank correlation, Kendall等级相关Kinetic, 动力学Kolmogorov-Smirnove test, 柯尔莫哥洛夫—斯米尔诺夫检验Kruskal and Wallis test,Kruskal及Wallis检验/多样本的秩和检验/H检验Kurtosis, 峰度Lack of fit,失拟Ladder of powers, 幂阶梯Lag,滞后Large sample,大样本Large sample test,大样本检验Latin square,拉丁方Latin square design, 拉丁方设计Leakage, 泄漏Least favorable configuration, 最不利构形Least favorable distribution, 最不利分布Least significant difference,最小显著差法Least square method, 最小二乘法Least—absolute—residuals estimates,最小绝对残差估计Least—absolute-residuals fit, 最小绝对残差拟合Least-absolute-residuals line, 最小绝对残差线Legend,图例L—estimator,L估计量L-estimator of location,位置L估计量L-estimator of scale, 尺度L估计量Level, 水平Life expectance,预期期望寿命Life table, 寿命表Life table method, 生命表法Light-tailed distribution, 轻尾分布Likelihood function, 似然函数Likelihood ratio, 似然比line graph, 线图Linear correlation, 直线相关Linear equation,线性方程Linear programming, 线性规划Linear regression,直线回归Linear Regression,线性回归Linear trend,线性趋势Loading,载荷Location and scale equivariance, 位置尺度同变性Location equivariance, 位置同变性Location invariance,位置不变性Location scale family, 位置尺度族Log rank test,时序检验Logarithmic curve, 对数曲线Logarithmic normal distribution, 对数正态分布Logarithmic scale,对数尺度Logarithmic transformation,对数变换Logic check, 逻辑检查Logistic distribution,逻辑斯特分布Logit transformation, Logit转换LOGLINEAR, 多维列联表通用模型Lognormal distribution, 对数正态分布Lost function, 损失函数Low correlation, 低度相关Lower limit, 下限Lowest—attained variance, 最小可达方差LSD, 最小显著差法的简称Lurking variable,潜在变量Main effect, 主效应Major heading, 主辞标目Marginal density function, 边缘密度函数Marginal probability,边缘概率Marginal probability distribution, 边缘概率分布Matched data, 配对资料Matched distribution, 匹配过分布Matching of distribution, 分布的匹配Matching of transformation,变换的匹配Mathematical expectation,数学期望Mathematical model,数学模型Maximum L-estimator, 极大极小L 估计量Maximum likelihood method,最大似然法Mean,均数Mean squares between groups,组间均方Mean squares within group, 组内均方Means (Compare means),均值—均值比较Median, 中位数Median effective dose,半数效量Median lethal dose,半数致死量Median polish,中位数平滑Median test, 中位数检验Minimal sufficient statistic, 最小充分统计量Minimum distance estimation,最小距离估计Minimum effective dose,最小有效量Minimum lethal dose, 最小致死量Minimum variance estimator, 最小方差估计量MINITAB,统计软件包Minor heading, 宾词标目Missing data, 缺失值Model specification,模型的确定Modeling Statistics , 模型统计Models for outliers,离群值模型Modifying the model,模型的修正Modulus of continuity,连续性模Morbidity,发病率Most favorable configuration,最有利构形Multidimensional Scaling (ASCAL),多维尺度/多维标度Multinomial Logistic Regression , 多项逻辑斯蒂回归Multiple comparison, 多重比较Multiple correlation , 复相关Multiple covariance, 多元协方差Multiple linear regression,多元线性回归Multiple response , 多重选项Multiple solutions,多解Multiplication theorem, 乘法定理Multiresponse, 多元响应Multi—stage sampling, 多阶段抽样Multivariate T distribution, 多元T分布Mutual exclusive, 互不相容Mutual independence,互相独立Natural boundary, 自然边界Natural dead,自然死亡Natural zero, 自然零Negative correlation, 负相关Negative linear correlation,负线性相关Negatively skewed, 负偏Newman-Keuls method, q检验NK method,q检验No statistical significance, 无统计意义Nominal variable,名义变量Nonconstancy of variability, 变异的非定常性Nonlinear regression, 非线性相关Nonparametric statistics,非参数统计Nonparametric test,非参数检验Nonparametric tests, 非参数检验Normal deviate,正态离差Normal distribution,正态分布Normal equation, 正规方程组Normal ranges,正常范围Normal value,正常值Nuisance parameter,多余参数/讨厌参数Null hypothesis, 无效假设Numerical variable,数值变量Objective function, 目标函数Observation unit, 观察单位Observed value, 观察值One sided test,单侧检验One-way analysis of variance,单因素方差分析Oneway ANOVA ,单因素方差分析Open sequential trial,开放型序贯设计Optrim,优切尾Optrim efficiency, 优切尾效率Order statistics,顺序统计量Ordered categories,有序分类Ordinal logistic regression ,序数逻辑斯蒂回归Ordinal variable,有序变量Orthogonal basis, 正交基Orthogonal design,正交试验设计Orthogonality conditions,正交条件ORTHOPLAN, 正交设计Outlier cutoffs,离群值截断点Outliers, 极端值OVERALS ,多组变量的非线性正规相关Overshoot, 迭代过度Paired design, 配对设计Paired sample, 配对样本Pairwise slopes,成对斜率Parabola, 抛物线Parallel tests,平行试验Parameter, 参数Parametric statistics, 参数统计Parametric test,参数检验Partial correlation,偏相关Partial regression, 偏回归Partial sorting,偏排序Partials residuals, 偏残差Pattern, 模式Pearson curves, 皮尔逊曲线Peeling, 退层Percent bar graph,百分条形图Percentage,百分比Percentile,百分位数Percentile curves, 百分位曲线Periodicity, 周期性Permutation, 排列P-estimator,P估计量Pie graph,饼图Pitman estimator, 皮特曼估计量Pivot, 枢轴量Planar,平坦Planar assumption, 平面的假设PLANCARDS, 生成试验的计划卡Point estimation,点估计Poisson distribution, 泊松分布Polishing, 平滑Polled standard deviation, 合并标准差Polled variance, 合并方差Polygon, 多边图Polynomial,多项式Polynomial curve,多项式曲线Population, 总体Population attributable risk, 人群归因危险度Positive correlation,正相关Positively skewed,正偏Posterior distribution, 后验分布Power of a test, 检验效能Precision, 精密度Predicted value, 预测值Preliminary analysis, 预备性分析Principal component analysis,主成分分析Prior distribution,先验分布Prior probability,先验概率Probabilistic model,概率模型probability, 概率Probability density,概率密度Product moment,乘积矩/协方差Profile trace, 截面迹图Proportion,比/构成比Proportion allocation in stratified random sampling, 按比例分层随机抽样Proportionate,成比例Proportionate sub-class numbers,成比例次级组含量Prospective study,前瞻性调查Proximities, 亲近性Pseudo F test,近似F检验Pseudo model,近似模型Pseudosigma, 伪标准差Purposive sampling, 有目的抽样QR decomposition,QR分解Quadratic approximation, 二次近似Qualitative classification, 属性分类Qualitative method, 定性方法Quantile-quantile plot,分位数-分位数图/Q—Q图Quantitative analysis, 定量分析Quartile,四分位数Quick Cluster, 快速聚类Radix sort,基数排序Random allocation,随机化分组Random blocks design,随机区组设计Random event, 随机事件Randomization,随机化Range, 极差/全距Rank correlation,等级相关Rank sum test, 秩和检验Rank test, 秩检验Ranked data, 等级资料Rate, 比率Ratio, 比例Raw data, 原始资料Raw residual, 原始残差Rayleigh‘s test, 雷氏检验Rayleigh‘s Z,雷氏Z值Reciprocal,倒数Reciprocal transformation, 倒数变换Recording, 记录Redescending estimators, 回降估计量Reducing dimensions,降维Re—expression,重新表达Reference set, 标准组Region of acceptance, 接受域Regression coefficient, 回归系数Regression sum of square,回归平方和Rejection point, 拒绝点Relative dispersion,相对离散度Relative number,相对数Reliability,可靠性Reparametrization,重新设置参数Replication,重复Report Summaries,报告摘要Residual sum of square, 剩余平方和Resistance,耐抗性Resistant line, 耐抗线Resistant technique, 耐抗技术R-estimator of location, 位置R估计量R—estimator of scale, 尺度R估计量Retrospective study, 回顾性调查Ridge trace, 岭迹Ridit analysis,Ridit分析Rotation, 旋转Rounding,舍入Row, 行Row effects,行效应Row factor, 行因素RXC table,RXC表Sample, 样本Sample regression coefficient, 样本回归系数Sample size,样本量Sample standard deviation,样本标准差Sampling error,抽样误差SAS(Statistical analysis system ), SAS统计软件包Scale, 尺度/量表Scatter diagram, 散点图Schematic plot,示意图/简图Score test, 计分检验Screening, 筛检SEASON, 季节分析Second derivative,二阶导数Second principal component, 第二主成分SEM (Structural equation modeling), 结构化方程模型Semi-logarithmic graph, 半对数图Semi-logarithmic paper,半对数格纸Sensitivity curve, 敏感度曲线Sequential analysis, 贯序分析Sequential data set,顺序数据集Sequential design,贯序设计Sequential method,贯序法Sequential test, 贯序检验法Serial tests,系列试验Short—cut method, 简捷法Sigmoid curve,S形曲线Sign function, 正负号函数Sign test, 符号检验Signed rank, 符号秩Significance test, 显著性检验Significant figure, 有效数字Simple cluster sampling, 简单整群抽样Simple correlation,简单相关Simple random sampling, 简单随机抽样Simple regression, 简单回归simple table,简单表Sine estimator, 正弦估计量Single-valued estimate,单值估计Singular matrix,奇异矩阵Skewed distribution,偏斜分布Skewness,偏度Slash distribution,斜线分布Slope, 斜率Smirnov test, 斯米尔诺夫检验Source of variation, 变异来源Spearman rank correlation,斯皮尔曼等级相关Specific factor,特殊因子Specific factor variance, 特殊因子方差Spectra , 频谱Spherical distribution, 球型正态分布Spread, 展布SPSS(Statistical package for the social science),SPSS统计软件包Spurious correlation,假性相关Square root transformation, 平方根变换Stabilizing variance, 稳定方差Standard deviation, 标准差Standard error,标准误Standard error of difference,差别的标准误Standard error of estimate,标准估计误差Standard error of rate, 率的标准误Standard normal distribution, 标准正态分布Standardization,标准化Starting value, 起始值Statistic,统计量Statistical control, 统计控制Statistical graph,统计图Statistical inference, 统计推断Statistical table,统计表Steepest descent, 最速下降法Stem and leaf display,茎叶图Step factor,步长因子Stepwise regression,逐步回归Storage,存Strata,层(复数)Stratified sampling, 分层抽样Stratified sampling,分层抽样Strength,强度Stringency,严密性Structural relationship, 结构关系Studentized residual, 学生化残差/t化残差Sub—class numbers,次级组含量Subdividing, 分割Sufficient statistic, 充分统计量Sum of products,积和Sum of squares,离差平方和Sum of squares about regression,回归平方和Sum of squares between groups,组间平方和Sum of squares of partial regression,偏回归平方和Sure event, 必然事件Survey,调查Survival,生存分析Survival rate,生存率Suspended root gram, 悬吊根图Symmetry, 对称Systematic error, 系统误差Systematic sampling,系统抽样Tags,标签Tail area,尾部面积Tail length,尾长Tail weight, 尾重Tangent line, 切线Target distribution,目标分布Taylor series, 泰勒级数Tendency of dispersion,离散趋势Testing of hypotheses,假设检验Theoretical frequency, 理论频数Time series,时间序列Tolerance interval, 容忍区间Tolerance lower limit, 容忍下限Tolerance upper limit,容忍上限Torsion, 扰率Total sum of square,总平方和Total variation,总变异Transformation,转换Treatment,处理Trend, 趋势Trend of percentage, 百分比趋势Trial, 试验Trial and error method, 试错法Tuning constant,细调常数Two sided test, 双向检验Two-stage least squares, 二阶最小平方Two-stage sampling, 二阶段抽样Two-tailed test, 双侧检验Two-way analysis of variance, 双因素方差分析Two-way table,双向表Type I error,一类错误/α错误Type II error,二类错误/β错误UMVU, 方差一致最小无偏估计简称Unbiased estimate, 无偏估计Unconstrained nonlinear regression , 无约束非线性回归Unequal subclass number, 不等次级组含量Ungrouped data,不分组资料Uniform coordinate,均匀坐标Uniform distribution, 均匀分布Uniformly minimum variance unbiased estimate,方差一致最小无偏估计Unit,单元Unordered categories,无序分类Upper limit, 上限Upward rank,升秩Vague concept, 模糊概念Validity, 有效性VARCOMP (Variance component estimation),方差元素估计Variability, 变异性Variable, 变量Variance,方差Variation, 变异Varimax orthogonal rotation, 方差最大正交旋转Volume of distribution, 容积W test, W检验Weibull distribution, 威布尔分布Weight, 权数Weighted Chi—square test, 加权卡方检验/Cochran检验Weighted linear regression method,加权直线回归Weighted mean,加权平均数Weighted mean square, 加权平均方差Weighted sum of square, 加权平方和Weighting coefficient,权重系数Weighting method, 加权法W—estimation, W估计量W-estimation of location,位置W估计量Width,宽度Wilcoxon paired test, 威斯康星配对法/配对符号秩和检验Wild point,野点/狂点Wild value, 野值/狂值Winsorized mean, 缩尾均值Withdraw, 失访Youden‘s index, 尤登指数Z test,Z检验Zero correlation,零相关Z—transformation,Z变换。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

描述性统计分析--Descriptive-Statistics菜单详解第六章:描述性统计分析--Descriptive Statistics菜单详解描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。

SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:Frequencies过程的特色是产生频数表;Descriptives过程则进行一般性的统计描述;Explore过程用于对数据概况不清时的探索性分析;Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。

本章讲述的四个过程在9.0及以前版本中被放置在Summarize菜单中。

§6.1 Frequencies过程频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。

它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图,圆图等统计图。

和国内常用的频数表不同,几乎所有统计软件给出的均是详细频数表,即并不按某种要求确定组段数和组距,而是按照数值精确列表。

如果想用Frequencies过程得到我们所熟悉的频数表,请先用第二章学过的Recode过程产生一个新变量来代表所需的各组段。

6.1.1 界面说明Frequencies对话框的界面如下所示:该界面在SPSS中实在太普通了,无须多言,重点介绍一下各部分的功能如下:【Display frequency tables复选框】确定是否在结果中输出频数表。

【Statistics钮】单击后弹出Statistics对话框如下,用于定义需要计算的其他描述统计量。

现将各部分解释如下:o Percentile Values复选框组定义需要输出的百分位数,可计算四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut pointsfor equal groups)、或直接指定某个百分位数(Percentiles),如直接指定输出P2.5和P97.5。

o Central tendency复选框组用于定义描述集中趋势的一组指标:均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。

o Dispersion复选框组用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)。

o Distribution复选框组用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis)。

o Values are group midpoints复选框当你输出的数据是分组频数数据,并且具体数值是组中值时,选中该复选框以通知SPSS,免得它犯错误。

众数(Mode)指所有数值中出现频率最高的一个值,在国内用的非常少。

【Charts钮】弹出Charts对话框,用于设定所做的统计图。

o Chart type单选钮组定义统计图类型,有四种选择:无、条图(Bar chart)、圆图(Pie chart)、直方图Histogram),其中直方图还可以选择是否加上正态曲线(With normal curve)。

o Chart Values单选钮组定义是按照频数还是按百分比做图(即影响纵坐标刻度)。

【Format钮】弹出Format对话框,用于定义输出频数表的格式,不过用处不大,一般不管。

o Order by单选钮组定义频数表的排列次序,有四个选项:Ascending values为根据数值大小按升序从小到大作频数分布;Descending values 为根据数值大小按降序从大到小作频数分布;Ascending counts为根据频数多少按升序从少到多作频数分布;Descending counts为根据频数多少按降序从多到少作频数分布。

o Multiple Variables单选钮组如果选择了两个以上变量做频数表,则Compare variables可以将他们的结果在同一个频数表过程输出结果中显示,便于互相比较,Organize output by variables则将结果在不同的频数表过程输出结果中显示。

o Suppress Tables more than...复选框当频数表的分组数大于下面设定数值时禁止它在结果中输出,这样可以避免产生巨型表格。

6.1.2 分析实例例6.1 某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数CV、中位数M、p2.5和p97.5(卫统第三版p233 1.1题)。

4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.12 4.56 4.37 5.396.305.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.743.504.69 4.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.854.09 3.35 4.08 4.795.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.776.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05解:为节省篇幅,这里只给出精确频数表的做法,假设数据已经输好,变量名为X,具体解法如下:1.Analyze==>Descriptive Statistics==>Frequencies2.Variables框:选入X3.单击Statistics钮:4.选中Mean、Std.deviation、Median复选框5.单击Percentiles:输入2.5:单击Add:输入97.5:单击Add:6.单击Continue钮7.单击Charts钮:8.选中Bar charts9.单击Continue钮10.单击OK得出结果后手工计算出CV。

上面做出的直方图分组太多,需要进一步编辑。

6.1.3 结果解释上题除直方图外的的输出结果如下:Frequencies最上方为表格名称,左上方为分析变量名,可见样本量N为101例,缺失值0例,均数Mean=4.69,中位数Median=4.61,标准差STD=0.8616,P2.5=3.04,P97.5=6.45。

系统对变量x作频数分布表(此处只列出了开头部分),Vaild右侧为原始值,Frequency为频数,Percent为各组频数占总例数的百分比(包括缺失记录在内),Valid percent为各组频数占总例数的有效百分比,Cum Percent为各组频数占总例数的累积百分比。

§6.2 Descriptives过程Descriptives过程是连续资料统计描述应用最多的一个过程,他可对变量进行描述性统计分析,计算并列出一系列相应的统计指标。

这和其他过程相比并无不同。

但该过程还有个特殊功能就是可将原始数据转换成标准正态评分值并以变量的形式存入数据库供以后分析。

6.2.1 界面说明【Save standardized values as variables复选框】确定是否将原始数据的标准正态评分存为新变量。

【Options钮】弹出Options对话框,大部分内容均在前面Frequences过程的Statistics对话框中见过,只有最下方的Display Order单选钮组是新的,可以选择为变量列表顺序、字母顺序、均数升序或均数降序。

6.2.2 结果解释下面是一个典型的Descriptives过程结果统计表:一望可知,这里的大部分内容都在上一节见过,因此就不再多解释了。

讲了两个过程,也许大家已经发现了:结果中的统计专业单词多数在对话框中就已经出现,因此我们以后会详细解释对话框的内容,结果中相同的单词不再重复解释。

§6.3 Explo re过程Explore过程可对变量进行更为深入详尽的描述性统计分析,主要用于对资料的性质、分布特点等完全不清楚时,故又称之为探索性分析。

它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,如枝叶图、箱图等,显得更加详细、全面,有助于用户制定继续分析的方案。

6.3.1 界面说明【Display单选钮组】用于选择输出结果中是否包含统计描述、统计图或两者均包括。

【Dependent List框】用于选入需要分析的变量。

【Factor List框】如果想让所分析的变量按某种因素取值分组分析,则在这里选入分组变量。

【Label cases by框】选择一个变量,他的取值将作为每条记录的标签。

最典型的情况是使用记录ID 号的变量。

【Statistics钮】弹出Statistics对话框,用于选择所需要的描述统计量。

有如下选项:o Descriptives复选框:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误及指定的均数可信区间。

o M-estimators复选框:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数。

o Outliers复选框:输出五个最大值与五个最小值。

o Percentiles复选框:输出第5%、10%、25%、50%、75%、90%、95%位数。

【Plot钮】弹出Plot对话框,用于选择所需要的统计图。

有如下选项:o Boxplots单选框组:确定箱式图的绘制方式,可以是按组别分组绘制(Factor levels together),也可以不分组一起绘制(Depentendstogether),或者不绘制(None)。

o Descriptive复选框组:可以选择绘制茎叶图(Stem-and-leaf)和直方图(Histogram)。

o Normality plots with test复选框:绘制正态分布图并进行变量是否符合正态分布的检验。

相关文档
最新文档