统计学上机实验——Excel在统计中的应用.doc

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学原理实习讲义-1
Excel在统计中的应用
《Excel在统计中的应用》
一、实验说明
(一)中文Excel 简介
Microsoft Excel 是美国微软公司开发的Windows 环境下的电子表格系统,它是目前应用最为广泛的办公室表格处理软件之一。

自Excel 诞生以来 Excel 历经了Excel5.0、Excel95、Excel97 和Excel2000 等不同版本。

随着版本的不断提高,Excel 软件的强大的数据处理功能和操作的简易性逐渐走入了一个新的境界,整个系统的智能化程度也不断提高,它甚至可以在某些方面判断用户的下一步操作,使用户操作大为简化。

Excel 具有强有力的数据库管理功能、丰富的宏命令和函数、强有力的决策支持工具、图表绘制功能、宏语言功能、样式功能、对象连接和嵌入功能、连接和合并功能,并且操作简捷,这些特性,已使Excel 成为现代办公软件重要的组成部分。

由于大家对Excel的常用办公功能都比较熟悉,本实验重点介绍Excel在统计分析中的应用。

(二)实验目的与要求
本实验重点介绍Excel在统计分析中的应用,包括Excel在描述统计中的应用以及Excel在推断统计中的应用,要求学生熟练掌握运用Excel 进行统计分析的方法,并能够对分析结果进行解释。

二、实验
实验一 Excel 在描述统计中的应用
实验目的及要求
要求学生掌握运用Excel进行描述统计分析、绘制各种图表的技术。

实验内容及步骤
(一)描述统计分析
例1-1:表1-1是1978-2005年我国城镇居民可支配收入数据,试求城镇居民可支配收入时间序列的基本统计量。

表1-1 1978-2005年我国城镇居民可支配收入(元)
年份城镇居民可
支配收入年份城镇居民

支配收入
1978 344 1992 2026.6 1979 405 1993 2577.4 1980 477.6 1994 3496.2 1981 500.4 1995 4283 1982 535.3 1996 4838.9 1983 564.6 1997 5160.3 1984 652.1 1998 5425.1 1985 739.1 1999 5854 1986 899.6 2000 6280 1987 1002.2 2001 6859.6 1988 1181.4 2002 7702.8
1989 1379 2003 8472.2
1990 1510.2 2004 9421.6
1991 1700.6 2005 10493
STEP1:用鼠标点击工作表中待分析数据的任一单元格。

STEP2:选择“工具”菜单的“数据分析”子菜单。

STEP3:用鼠标双击数据分析工具中的“描述统计”选项。

STEP4:出现“描述统计”对话框,如图1-1所示。

图 1-1
对话框内各选项的含义如下:
输入区域:在此输入待分析数据区域的单元格范围。

分组方式:如果需要指出输入区域中的数据是按行还是按列排列,则单
击“行”或“列”。

标志位于第一行/列:如果输入区域的第一行中包含标志项(变量名),则选中“标志位于第一行”复选框;如果输入区域的第一列中包含标志项,则选中“标志位于第一列”。

复选框:如果输入区域没有标志项,则不选任何复选框,Excel 将在输出表中生成适宜的数据标志。

均值置信度:若需要输出由样本均值推断总体均值的置信区间,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度。

例如,置信度 95%可计算出的总体样本均值置信区间为10,则表示:在5%的显著水平下总体均值的置信区间为( X -10, X +10)。

第 K 个最大/小值:如果需要在输出表的某一行中包含每个区域
的数据的第 k 个最大/小值,则选中此复选框。

然后在右侧的编辑框中,输入 k 的数值。

输出区域:在此框中可填写输出结果表左上角单元格地址,用于控
制输出结果的存放位置。

新工作表:单击此选项,可在当前工作簿中插入新工作表,并由新工作表的 A1 单元格开始存放计算结果。

如果需要给新工作表命名,则在右侧编辑框中键入名称。

新工作簿:单击此选项,可创建一新工作簿,并在新工作簿的新工作表中存放计算结果。

汇总统计:指定输出表中生成下列统计结果,则选中此复选框。

STEP5:填写完“描述统计”对话框之后,按“确定”按扭即可。

结果如图1-2所示。

图1-2 描述统计结果
结果说明:描述统计工具可生成以下统计指标,按从上到下的顺序其中包括样本的平均值、标准误差、组中值、众数、样本标准差、样本方差、峰度值、偏度值、极差、最小值、最大值、样本总和、样本个数和一定显著水平下总体均值的置信区间。

(二)绘图操作
例1-2:仍以例1-1的数据为例,绘制城镇居民可支配收入时间序列的散点图。

STEP1:拖动鼠标选定数值区域A2:C12,不包括数据上面的标志项。

STEP2:选择“插入”菜单的“图表”子菜单,进入图表向导,图1-3所
示。

STEP3:选择“图表类型”为“散点图”,然后单击“下一步”。

图1-3 图表向导图
STEP4:确定用于制作图表的数据区。

Excel 将自动把你前面所选定的数据区的地址放入图表数据区的内,单击下一步按钮,出现图1-4所示对话框。

图1-4 作图过程图
STEP5:填写图表标题、X 轴坐标名称、Y 轴坐标名称,此处不用填写,单击“下一步”。

STEP6:选择图表输出的位置,然后单击“完成”按扭即生成
实验二线性回归分析
实验目的及要求
掌握利用Excel计算相关系数、进行线性回归分析的步骤和方法,并能够解释实验结果。

实验内容及步骤
(一)线性回归分析
线性回归分析通过对一组观察值使用“最小二乘法”直线拟合,用来分析单个因变量是如何受一个或几个自变量影响的。

例1-11:如图1-35所示,我国1987 至1997年布匹的人均产量和人均纱产量,试用线性回归分析的方法分析两组数据之间的关系,并计算二者之间的相关系数。

图1-35
操作步骤:
STEP1:选择“工具”菜单的“数据分析”子菜单,双击“回归”选项,弹出回归分析对话框。

STEP2:按如下方式填写对话框:Y 值输入区域为$B$1:$B$12, X 值输入区域为$C$1:$c$12, 并选择“标志”和“线性拟合图”两个复选框STEP3:单击“确定”按扭即可,结果如图1-36所示。

图1-36
结果分析:结果可以分为四个部分,第一部分是回归统计的结果包括多元相关系数、可决系数R2、调整之后的相关系数、回归标准差以及样本个数。

第二部分是方差分析的结果包括可解释的离差、残差、总离差和它们的自由度以及由此计算出的F 统计量和相应的显著水平。

第三部分是回归方程的截距和斜率的估计值以及它们的估计标准误差、t 统计量大小双边拖尾概率值、以及估计值的上下界。

根据这部分的结果可知回归方程为Y=8.46433*X-18.288。

第四部分是样本散点图,其中蓝色的点是样本的真实散点图,红色的点是根据回归方程进行样本历史模拟的散点。

如果觉得散点图不够清晰可以用鼠标拖动图形的边界达到控制图形大小的目的。

用相同的方法可以进行多元线性方程的参数估计,还可以
《Excel在统计中的应用》实习讲义
在自变量中引入虚拟变量以增加方程的拟合程度。

对于非线性的方程的参数估计,可以在进行样本数据的线性化处理之后,再按以上步骤进行参数估计。

(二)相关系数计算
实验内容及步骤
STEP1:用鼠标点击表中待分析数据的任一单元格。

STEP2:选择“工具”菜单的“数据分析”子菜单。

STEP2:用鼠标双击数据分析工具中的“相关系数”选项。

STEP4:填写完“相关系数”对话框,单击“确定”按扭即可得到各个变量的相关系数矩阵,结果如图1-37 所示。

图1-37
结果说明:图1-37下三角矩阵计算出三个变量x,y,z 两两之间的相关系数,如变量x,y 之间的相关系数为:0.929167,所以可以判断x,y 之间存在着较高的正线性相关关系。

11。

相关文档
最新文档