统计案例分析---大学生月平均生活费的估计和检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计案例分析---大学生月平均生活费的估计和检验

统计案例分析

案例2.1 大学生月平均生活费的估计和检验

姓名:覃玉冰

学号:

班级: 16应用统计

一、数据

为了了解大学生日常生活费支出及生活费来源状况,对中国人民大学在校本科生的月生活费支出问题进行了抽样调查。该问卷随机抽取中国人民大学大一、大二、大三、大四在校本科生男女各30多人作为样本。调查采取分层抽样,对在校本科生各个年级男生、女生各发放问卷30多份,共发放问卷300份,回收问卷291份,其中有效问卷共272份。其中,男生的有效问卷为127份,女生为145份。调查得到的部分数据见表一。

表一大学生月平均生活费支出的调查数据(仅

截取部分)

性别所在年级家庭所在

地区平均月

生活费

(元)

性别所在年级家庭所在

地区

平均月

生活费

(元)

男1998级大型城市1000 女1998级大型城市500 男1998级大型城市800 女1998级大型城市800

男1998级大型城市1000 女1998级大型城市500 男1998级中小城市400 女1998级大型城市1000

二、生活费支出的区间估计和假设检验

(一)平均月生活费的描述统计量

为了更好地研究全校本科学生平均月生活费支出,我们先来看一下样本数据中平均月生活费支出的一些描述统计量。

在spss中,点分析→描述统计→描述→变量选择“平均月生活费”,选项选择“均值、标准差、均值的标准误”,得到的样本数据中平均月生活费的描述统计量见表二。

表二平均月生活费的描述统计量

N 均值标准差

统计量统计量标准误统计量

平均月生活费272 595.0414.761 243.444

有效的 N (列表状态)272

从表二可以看到,样本数据中平均月生活费支出的均值为595.04,标准差为243.444,均值的标准误为14.761.

(二)平均月生活费的假设检验

从表二中我们已经知道了样本数据中平均月生活费支出的均值为595.04,现在我们来检验一下全校本科学生即总体的月平均生活费支出是否等于500。

1.检验统计量的确定

样本数据的样本量n为272,其大于30,可以认为该数据是一个大样本。现在我们并不知道总体的月平均生活费支出是否服从正态分布,但是在样本量大的条件下,如果总体为正态分布,样本统计量服从正态分布:如果总体为非

正态分布,样本统计量也是渐进服从正态分布的。所以在这种情况下,我们都可以把样本统计量视为正态分布,这时可以使用z 统计量(z 分布)。即在总体标准差δ已知时,有

n

x /z 0

δμ-=

而我们这里总体标准差δ是未知的,此时可以用样本标准差s 代替,上式可以写为:

n

s x /z 0μ-=

2. 提出假设

原假设0H 为:全校本科学生月平均生活费支出u=500 备择假设1H 为:全校本科学生月平均生活费支出u=500 3. spss 操作及结果分析

在spss 中点分析→比较均值→单样本T 检验→检验变量选“平均月生活费”→检验值填“500”,得到的平均月生活费的假设检验的结果见表三。

表三 平均月生活费的假设检验的结果

检验值 = 500

t

df Sig.(双侧) 均值差值

差分的 95% 置信区间 下限 上限 平均月生活费

6.438

271

.000

95.037

65.98

124.10

从表三可以看到,检验的P 值接近于0,其小于0.05,根据小拒大接的原则,拒绝原假设,表面全校学生的月平均生活费支出与500元有显著差异。

(三)平均月生活费的区间估计

1. 数学模型的建立

样本数据的样本量n 为272,其大于30,可以认为该数据是一个大样本。

现在我们并不知道总体的月平均生活费支出是否服从正态分布,但是在样本量大的条件下,样本均值x 的抽样分布均为正态分布,其数学期望为总体均值μ,方差为n

2

δ

。x 经过标准化以后的随机变量服从标准正态分布,即

)1,0(~/z N n

x δμ

-=

由上式和正态分布的性质,可以得出总体均值μ在α-1置信水平下的置信区间为

⎥⎦⎤⎢⎣

+-n z x n z x δδαα22, 式中,n

z x δ

α

2

-称为置信下限,n

z x δ

α

2

+称为置信上限;α是事先所确

定的一个概率值,也称为风险值,它是总体均值不包括在置信区间的概率;α

-1称为置信水平;2αz 是标准正态分布右侧面积为2α时的z 值;n δ

是总体均值的

标准误;n

z δ

α

2

是估计总体均值时的估计误差。

这里,我们并不知道全校本科学生的平均月生活费支出的方差,但是由于样本数据的样本量较大,所以上式中的总体方差2δ可以用样本方差2s 代替,这时总体均值μ在α-1置信水平下的置信区间可以写为:

⎥⎦⎤⎢⎣

+-n s z x n s z x 22,αα 2.模型的求解

由表二可知,样本均值为595.04,样本均值的标准误

n

s

为14.761.当风险值α取0.05时,即置信水平α-1取95%时,全校学生月平均生活费支出的95%

相关文档
最新文档