用Excel进行统计推断

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三部分用Excel进行统计推断

利用Excel产生随机数

不论是利用抽签,或者是使用随机数表来进行抽样,过程都相当麻烦,尤其是样本数过大时,所必须花费的时间就会更多。此时,我们可以使用计算机软件来帮助我们进行随机抽样。

操作实例:使用Excel抽出随机数

使用Excel中的加载宏,从700个元素的总体当中取得100个元素作为抽样的样本。1)在A1单元格中,输入“抽样样本编号”,A2单元格中输入“1”,然后使用鼠标选取“编辑”-“填充”-“序列”命令,打开“序列”对话框。

2)在“序列”对话框当中的“序列产生在”区域选择“列”,“类型”区域选择“等差序列”,步长值填入“1”,终止值填入“700",最后单击“确定”按钮即可在单元格A2~A701中填入1—700的数值。

3)接着,选择“工具”-“数据分析”命令,打开“数据分析”对话框。在对话框中,选择“抽样”,屏幕上则会出现“抽样”对话框。

4)在“抽样”对话框中,“输入区域”指定为先前所填充的序列“A2:A701”单元格范围。“抽样方法”指定为“随机”,并输入“样本数”为“100",输出选项指定为“新工作表组”,表示将抽样出来的数值放置在新工作表中。最后单击“确定”按钮,您就会看到在工作簿中新增了一个工作表,而工作表中选出了100个抽样数值,

而我们就可以先将总体元素编号,再利用这些Excel所选出来的数值,挑选出100个相对编号的总体单位。

利用EXCEL进行参数估计

工具一数据分析一描述统计――估计总体均值的程序和输出表解读

在EXCEl工作表中,依次点击:工具一数据分析一描述统计,在对话框中指定数据区域和置信度(默认值为95%,也可自行指定)等其他选项,可得到包括如内容的输出表(空白处应为输出数值,表中删除了一些参数估计不必要的输出,最后一列为作者所加的对输出结果的解释):

表中对指定置信度所对应的抽样误差范围的输出结果,是基于正态总体、总体方差未知时的公式计算的。

(一)大样本条件下,单一总体均值的置信区间估计.(总体方差未知时)

应用案例1,2004年底北京市私家车拥有量已达到129.8万辆,位居全国之首,据业内人士分析其中国产中低档汽车的比例较大,为了估计目前北京市场个人购车的平均价

格,调查人员于某日在北京最大的车市随机抽取36位私人消费购车者,得到他(她)们所购汽车的价格如下(单位:万元):

6.88 11.28 19.98 13.6 10.6 14.8

6.88 11.78 20.98 24.4 12.3 14.8

6.88 13.68 13.6 30.3 14.6 14.8

8.28 14.98 14.7 9.6 14.6 17.4

9.6 15.68 15.8 9.6 12.9 5.38

10.18 15.68 20.5 10.6 14,8 7.38

根据这些调查数据怎样估计总体的平均消费价格?如果要进一步推断所购买车辆在15万元以上的消费者占有多大比例,应当如何分析呢?

对汽车销售价格的总体均值求90%置信区间,利用Excel在大样本条件下进行单一总体均值的置信区间估计。

具体步骤如下:

打开“年底汽车价格1”表

第1步:将相关数据输入Excel表格。第2步:选择“工具”下拉菜单。

第3步:选择“数据分析”选项。第4步:在分析工具中选择“描述统计”。

第5步:当对话框出现时,在“输入区域”设置框内键人数据单元格区域A1:A36,在“输出区域”设置框内键人数据单元格区域B1,并选择“汇总统计”,然后选择“确定”,得到输出结果,此时样本均值出现在单元格C3中,抽样误差的值出现在单元格C4。

第6步:选择单元格D2,并键人单元格公式=C3-1.645*C4,按下回车键;

选择单元格D3,并键人单元格公式=C3+1.645*C4,按下回车键,得到输出结果,即汽车销售价格的总体均值90%置信区间为(12.18795,15.02316)。见“年底汽车价格2”表中的操作及答案。

注:在第6步中,因为所求的是90%的置信区间,所以单元格公式中使用的值是1.645。

通常,使用者需要键人与所希望的置信水平相对应的z值。

(二) 大样本条件下,单一总体均值的置信区间估计.(总体方差已知)

------------------利用CONFIDENCE函数

当抽样数为大样本时,总体方差为已知的情况下,则总体平均数的置信区间为,在Excel 中,我们可以利用CONFIDENCE函数计算出置信区间的数值。

语法:CONFIDENCE(alpha,standard_dev,size)

其中alpha代表用来推算置信度的显著程度。置信等于100*(1·alpha)%,换言之,0.05的alpha值所指的是95%信赖度。

Standard dev为此数据的总体标准差,且假定为已知。

Size代表样本大小。

以搭车为例:“50位乘客,每天搭乘火车的平均时间为60分钟,总体标准差为10分钟,试计算总体平均数的95%信赖区间为多少?”

首先必须先算出信赖区间,接着才可以计算出信赖极限范围。

利用CONFIDENCE计算信赖极限范围的操作方法如下:

打开“乘车时间”表

步骤1:移动鼠标选择要计算信赖区间的单元格B9,然后输入“=CONFIDENCE(1-$B$3,$B$4,$B$5)”,再按下回车键。

步骤2:移动鼠标选择单元格B10,然后输入“=B6-B9”,再按下回车键。

步骤3:移动鼠标选择单元格B11,然后输入“=B6+B9”,再按下回车键。完成后,画面显示如下:完成后,得知每人每天搭乘火车的平均时间为57.22819404至62.77180596分钟。

(三)小样本条件下,单一总体均值的置信区间估计(用TINV函数,来求得t值。)

语法TINV(probability,degrees_freedom)

Probability为双测Student-t分布的概率值。

Degrees_freedom是构成该分布的自由度数目。

选取应用案例1中前26个数据,在小样本条件下利用Excel进行单一总体均值在95%

置信度下置信区间的估计。

具体步骤如下:打开“年底汽车价格1”表

相关文档
最新文档