统计学教程(含spss)二 统计量描述

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

结束
[据集2] 体重 44.1 53.0 36.4 30.1 40.4 57.0 58.5 51.0 58.0 55.0 44.7 45.4 44.3 42.8 51.1
由 descriptive statistics 计算
由 descriptive statistics 计算
选入分 析变量
由 descriptive statistics 计算
由 Explore 计算
选入分 析变量
由 Explore 计算
由 Explore 计算
结束
关键术语 平均数(mean)衡量数据集中心位置的量度。用所有数据值相加的和除以项数计算 中位数(median)衡量数据集中心位置的量度。中位数将所有的数据分为两个相等的部分,一部分的值都大于或等于它,而另一部分 都小于或等于它 众数(mode)衡量数据中心位置的量度。它是发生频数最高的数据值 百分位数(percentile)至少有p%的数据项小于等于这个值,且至少有(100-p)%的数据项大于等于这个值。第50百分位数即为中位 数 四分位数( quartile )第25、第50、第75百分位数即为第1、第2、第3四分位数。四分位数将数据集分为4个部分。每一部分含有25% 的数据 临界点(hinges)下端临界点为第1四分位数,上端临界点为第3四分位数。 全距(range)用以衡量变异程度的量度,它是最大值减最小值的差 四分位内距(interquartile range,IQR)用以衡量变异程度的量度,它是第3四分位数与第1四分位数之差 方差(variance)用以衡量数据集变异程度的量度,是建立在距平均数离差的平方值的基础上的 标准差(standard deviation)用以衡量数据集变异程度的量度,取方差的正的平方根 Z分数(z-score)以距平均数的离差除以标准差所得的值。是标准化的数值,指数据值距离平均数的标准差的个数 切贝谢夫定理(chebysher’s theorem)这一定理可以用于任何数据集,用来描述与平均数的距离在特定数目个标准差范围之内的数据 项的百分比 经验法则(empirical rule)这一法则适用于钟形分布的数据,用以描述与平均数的距离在1、2、3个标准差之内的数据项的百分比 异常值(outlier)异常大或异常小的数据值
选入分 析变量
由 Frequencies 计算
百分位数 四分位数 均值 中位数 众数 合计
标准差 方差 全距
最小值 最大值 均值标准误
偏度 峰度
由 Frequencies 计算
由 Frequencies 计算
由 Frequencies 计算
由 Frequencies 计算
由 Explore 计算
均值 离散趋势 标准差 方差 全距
合计
最小观测值
最大观测值 均值标准误
分布形态 峰度 偏度
输出顺序 按数据集中变量的排列顺序显示统计量 按变量名字母顺序显示统计量 按均值升序显示统计量 按均值降序显示统计量
由 descriptive staBiblioteka Baiduistics 计算
由 Frequencies 计算
由 Frequencies 计算
结束
案例
案例3-1 某联合食口公司抽取100个客户做为样本,记录其支付方式和支付金额。 公司经理要求从这个样本中得到客户实际支付情况的信息。样本数据见“案 例3-1”: 要求:以分析报告的形式,运用图表描述和统计量描述中介绍的描述统计学 方法,对样本数据加以概括。 概括中应包含下列的概括和讨论: 1、对于各个平均数和中位数的比较和理解; 2、对于各个显示变异程度的统计量,如极差和标准差进行比较和理解; 3、分别对于3种支付方式用五数概括法进行比较和理解。 4、分别对3种支付方式画盒形图 *报告的总结部分,讨论一下从中可以得出关于联合食品公司的客户支付方 式和支付金额的什么结论。
统计量 描 述
用SPSS作统计量描述
用SPSS作统计量描述
由 descriptive statistics 计算
由 Frequencies 计算 由 Explore 计算
由 descriptive statistics 计算
三十名学生的身高与体重数据 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 性别 男 男 男 男 男 女 女 女 女 女 男 男 男 男 男 年龄 13 13 13 13 13 13 13 13 13 13 13 14 14 14 14 身高 156.0 155.0 144.6 161.5 161.3 158.0 161.0 162.0 164.3 144.0 157.9 176.1 168.0 164.5 153.0 体重 47.5 37.8 38.6 41.6 43.3 47.3 47.1 47.0 33.8 33.8 49.2 54.5 50.0 44.0 58.0 序号 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 性别 女 女 女 女 女 男 男 男 男 男 女 女 女 女 女 年龄 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 身高 164.7 160.5 147.0 153.2 157.9 166.0 169.0 170.0 165.1 172.0 159.4 161.3 158.0 158.6 169.0
关键术语 五数概括法(five-number summary)是一种探索性数据分析的技术。用五个数据值:最小值、第1四分位数、平均数、第3四分位数 和最大值来概括数据集 盒形图(box plot)一种用图形概括数据的方法。用一个以第1和第3四分位数为边界的盒来表明在中心位置50%的数据。以一条横线 线 (须线)从方盒两侧延伸以表明大于第3四分位数和小于第1四分位数的数据值的位置。所有异常值民予以标明 协方差(covariance)用以衡量两变量间线性相关关系的数值量度。正值表示正相关,负值表示负相关 相关系数(correlation coefficient)用以衡量两变量间线性相关关系的数值量度。 加权平均数(weighted mean)将每个数据值予以一个权重以反映其在数据集中重要程度。以此获得的平均数即为加权平均数 分组数据(grouped data)将数据分为若干个组并配以频数分布,而不记录原始数据的个体值 偏度(skewness)对分布偏斜方向和程度的测度 峰度(kurtosis)对分布曲线尖削程度的测度
相关文档
最新文档