数理统计课程设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课程设计
设计题目数理统计
学生姓名
学号
专业班级数学与应用数学11-2班指导教师凌能祥李彤
2014年7 月10 日
离散型变量分布的假设检验
实验
试验名称: 离散型变量分布的假设检验
试验目的: 随机变量分布的计算机实例分析
设计要求: 附表为某医院眼科门诊数据,基于卡方检验,说明数据近似分布,并估计有关参数。
问题描述
该医院眼科门诊主要分为四大类:白内障、视网膜疾病、青光眼和外伤。题目附录中给出了2008年7月13日至2008年9月11日这段时间里各类病人的情况。根据这些病人情况,得出数据的近似分布并估计有关参数。
模型假设
1.假定题目附录中给定的数据真实可靠,具有较好的代表性;
模型的建立与数据处理
数据处理
题目附录中给出了2008年7月13日至2008年9月11日这段时间里各类病人的情况,我们利用EXCEL软件对这些数据进行了相关统计分析,得到了相关信息。
各类病人每天门诊人数
根据统计分析,我们得出五类病人在2008年7月13日至2008年9月11日这段时间里每门诊的人数,见下表所示。、
由于医院排队问题都是典型的排队论问题,而一般的排队论模型都是泊松输入,所以我们先假定病人的门诊时间服从泊松分布。
根据表2中的数据,我们利用EXCEL软件进行统计分析。我们采用6SQ统计插件中的假设检验下的卡方拟和优度来对其进行泊松分布的检验,在显著性水平α=时,发现五类病人每天门诊的人数和总门诊人数都服从泊松分布。
0.1
白内障白内障(双眼)视网膜
统计量统计量统计量
数据个数61数据个数61数据个数61
总和100总和133总和170
最大值5最大值7最大值7
平均值 1.6平均值 2.2平均值 2.8
假设检验假设检验假设检验
零假设服从泊松分
布零假设
服从泊松分
布零假设
服从泊松分
布
自由度3自由度4自由度4卡方统计
量 1.8卡方统计量1.9卡方统计量3.7 p值0.6p值0.8p值0.5显著性水
平0.1显著性水平0.1显著性水平0.1结果
接受零假设
结果接受零假设
结果
接受零假设
外伤:青光眼:所有病人:
统计量统计量统计量
数据个数61数据个数61数据个数61总和64总和63总和530最大值3最大值4最大值16平均值1平均值1平均值8.7假设检验假设检验假设检验
零假设服从泊松分
布零假设
服从泊松分
布零假设
服从泊松分
布
自由度2自由度3自由度7
卡方统计
量1卡方统计量4卡方统计量5.1
p值1p值0p值0.6
显著性水
平0.1显著性水平0.1显著性水平0.1
结果接受零假设结果接受零假设结果接受零假设
通过P值得比较,可以得出该医院眼科门诊各类病人的到达均服从泊松分布。
根据指数分布及泊松分布的关系:如相继两个事件出现的间隔事件服从参数为λ的指数分布,则在单位时间间隔内事件出现的次数服从参数为λ的泊松分布,即在单位时间内该事件出现k次的概率为
(k=0,1,3,…)
视网膜疾病与外伤相关性检验:
WEIGHT OFF.
CROSSTABS
/TABLES=视网膜疾病 BY 外伤 /FORMAT=AVALUE TABLES
/STATISTICS=CHISQ
/CELLS=COUNT EXPECTED
/COUNT ROUND CELL.
交叉表
[数据集1]
合计计数21 20 16 4 61 期望的计数21.0 20.0 16.0 4.0 61.0
卡方检验
值df 渐进 Sig. (双
侧)
Pearson 卡方14.884a21 .829
似然比16.823 21 .722
线性和线性组合 1.631 1 .202
有效案例中的 N 61
a. 30 单元格(93.8%) 的期望计数少于 5。最小期望计数
为 .07。
卡方值为14.884和sig值为0.829大于0.05,说明视网膜
疾病与外伤相关不显著
总结
卡方检验是一种非参数检验,非参数统计是一种在不了解总体分布及全部参数的情况下的一种统计方法。这种方法的优点有:
1.不受总体分布的限制,适用范围广。
2.适宜定量模糊的变量和等级变量。
3.方法简便
缺点:
当测量的数据能够满足参数统计的所有假设时,非参数检验方法的效果就远不如参数检验方法,由于当数据满足假设条件时,参数检验方法能够从其中广泛的充分的提取有关信息。非参数统计方法对数据的限制较为宽松,只能从其中提取一般的信息。