统计学中常见分布的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学中常见分布的应用
1引言
在数理统计中,常见的分布包括指数分布,普哇松分布,正态分布, 分布, 分布, 分布.这些常见分布的参数的区间估计和假设检验问题是在日常生产生活中我们常用到的问题,在大部分的文献资料中对正态分布的这一问题讨论较多,本文将就其它五个常见分布的参数的区间估计和假设检验问题进行详细的介绍.其中包括这五种分布的密度函数、性质及其在数理统计中的应用.
那么
~ ,
所以假设拒绝域:对于给定的 和 ,由
,
是自由度为 的 分布之 水平双侧分位数,假设 之 水平的拒绝域是
,
接受域是
.
例某种中药饮片中成分 的含量规定为 ,现在抽验了该药物一批成品中的五个片剂,测得其中成分 的含量分别为: 假设该药物中成分 的含量 服从正态分布,问在 的显著性水平下,抽验结果是否与片剂中成分 的含量为 要求相符?
其中 为常数,这种分布叫作指数分布.显然,我们有
指数分布含有一个参数 ,通常把这分种分布记作 .如果随机变量 服从指数分布 ,则记为 ~ ,因为
(连续随机变量的分布函数 等于概率密度 在区间 上的反常积分)由此可得指数分布 的分布函数为
=
2.5 普哇松分布
定义5[3](P64)称随机变量 服从普哇松分布,如果
2五中常见分布的定义及其相关性质
2.1 分布
定义1[1](P225)称随机变量 服从 分布,自由度为 ,如果它有密度函数
性质假设 独立同标准正态分布,则随机变量
服从 分布,自由度等于 .
2.2 分布
定义2[1](P228)称随机变量 服从 分布,自由度为 ,如果它有密度函数
.
性质假设 服从标准正态分布, 服从 分布,自由度为 ,而且 和 相互独立,那么随机变量 ,服从 分布,自由度为 .
参数为 ,记作 ,且易于验证有
普哇松定理[3](P65)在 重贝努里试验中,事件 在一定试验中出现的概率为 (与试验总数 有关),如果当 时, ( 常数),则有
,
(普哇松定理可以用作近似计算和理论上服从普哇松分布的实例的计算).
普哇松分布的期望: ,方差: 即期望和方差相等.
3常见分布在数理统计中的应用
假设 未知,那么 的 水平置信区间为
其中
.
例某厂一车间生产铜丝的折断力已知服从正态分布,生产一直比较稳定.今从产品中随机抽出9根检查折断力,测得数据如下(单位:kg) , , , , , , , , 问是否可以相信该车间的铜丝折断力的方差为 ?
解设 表示铜丝的折断力且 ~ .基本假设 : ,对 对给定的显著性水平 ,查 分布表得: , ,
3.2.2 已知条件下的假设检验
在已知 的情形下,检验假设 对于显著性水平 ,选取统计量 由于 独立同正态分布,所以 , 为自由度.假设的否定域:对于给定的显著性水平 和自由度 ,有
其中 , 是 分布上侧分位数.因此,
就是假设 的 水平的否定域.
3.2.3 已知条件下 的置信区间
假设 ,其中 为已知数,那么区间.
3.4 指数分布的应用
设总体 服从指数分布,概率密度为
其中 为未知参数,我们有
, .
对于已给的置信水平 ,按公式
得
易知不等式
即
由此解得
其中
,
于是有
上式表明:未知参数 的置信水平为 的置信区间近似为 .基本假设 易知总体 的均值与方差分别是
,
当样本容量充分大时统计量
,
其中 是样本容量.
或者说
= .
例公共汽车站在一单位时间内(如半小时或一小时)到达的乘客数服从普哇松分布 ,对不同的车站,所不同的仅仅是参数 的取值,现对一城市某一公共汽车站进行 个单位时间的调查,这里单位时间是 分钟,计算得到 分钟内来到该车站的乘客数平均值 人,试求参数 的置信水平为 置信区间?
求参数 和 的字样均值 和子样方差 ?
求参数 的置信度为 的置信区间?
解 参数 和 的点估计值为 和 ,计算结果如下:
, , .
选取 ,对于 ,自由度为 ,查 分布得 ,由上面的结论 的 置信区间为
,
其中
, ,
计算得 的 得置信区间是
3.1.2 分布在假设检验上的应用
设总体 ~ ,未知方差,检验假设 , ,( 检验法)对于显著性水平 选取统计量: 其中 是样本均值,
2.3 分布
定义3[1](P230)称随机变量 服从 分布,自由度为 ,如果它有密度函数
注
性质 假设随机变量 和 相互独立,分别服从自由度为 和 得 分布,那么随机变量 服从 分布,自由度为 .
定理 设 相互独立,且都服从 分布,则有下列三条结论:
~ ;
~ ;
与 子样方差相互独立.
2.4 指数分布
定义4[2](P60)设连续随机变量 的概率密度为
3.1 分布的应用
3.1.1 分布在参数区间估计上的应用
设 ~ , 未知,那么 的置信度为 的置信区间为
其中
( ~ , )
可查 分布表,事实上,由
~
可知
~
而
~
再由 分布的性质,有
~
即
~
从而对于给定的 有
( 待查)
或
由此得, 的置信度为 的置信区间为
是自由度为 的 分布之 水平双侧分位数.
例 从一批产品中随机取出 件,并测量其尺寸,得到下列 个数据: 假设在正常条件下,产品尺寸 服从正态分布 ,上面的数据是对 的观测值.求:
~
对于给定的显著性水平 查 分布表,然后计算统计量 即可做出推断.
3.2 分布的应用
设 ~
3.2.1 未知条件下的假设检验
在未知均值 时,检验假设 取统计量
其中
在 : 成立时, 服从自由度为 的 分布.对于给定的显著性水平 ,查自由度为 的 分布表求值 .使得满足
, . ,
即是
,
得拒绝域:
计算统计量之值,若 则拒绝 : ,否则接受 : .
解假设该批药中成分 的含量 服从正态分布 ,其中 和 均为未知常数.基本假设 (成份 的平均含量与要求相符)给定显著性水平 , ,查 双侧分位数得 假设 之 水平的否定域是
计算 故不能否定假设 ,因此抽验结果说明该药中 的含量合格.
另:还可以用 检验法检验:未知 及 , = ,假设检验
.其中随机变量 ~ ,随机变量 ~ 取统计量
解 , , ,
应用公式
得
即 为参数 的置信水平为 的置信区间.
根据上述分析可见参数区间估计和假设检验问题在解决统计学实际问题上有着十分重要的作用.在文章中我们总结常见统计分布:普哇松分布,指数分布,卡方分布, 分布, 分布的定义、性质、并讨论了这些分布的参数的区间估计与假设检验问题.举例说明了分布参数的区间估计和假设检验问题在实际生产生活中的应用.相信通过这些总结会使我们对这类问题有一个更为全面的了解.也能为学习这方面知识的人提供一些参考.
按以上所求参数 的置信区间为 .
3.5 普哇松分布的应用
假设随机变量 服从普哇松分布,参数 未知; 是来自 的简单随机抽样,则总体的均值和方差分别是 , 因为样本 相互独立,与总体 服从相同的分布,所以有
, ,
在 充分大的条件下参数 的近似的置信水平为 的置信区间可以表示为 ,即
,
(注:按中心极限定理)即 可看成是下列二次方程的根:
近似地服从标准正态分布 由此计算统计量 的观测值得 ,已知显著性水平 ,查表得临界值 若 则接受原假设否则拒绝原假设.
例从一批电视配件中抽取 个样品,测的它们的使用寿命均值为 ,设电视配件的使用寿命服从指数分布 ,求未知参数 的置信水平为 的置信区间?
解有题设有 ,
已知置信水平为 , ,查表得
,
由此得
其中:
则
~
对显著性水平 ,由
确定 与 可得临界域: , 与 的求法, 可直接查 之 水平上侧分位数 ,由于
~
那么
,
记
.
所以假设 拒绝域是 接受域是 .
3.3.2 分布在参数区间估计上的应用
设 是独立同分布的随机变量, 的分布函数形如
, ,
是前 个次序统计量, .
令
, 其中 .
令
则 与 , 无关.记 的 分位点为 ,在 时 .
满足
,
由此确定临界域为 根据样本观测值,计算统计量 的观测值:
, , ,
由于
所以认为基本假设 : 成立.
3.3 分布的应用
3.3.1 分布在假设检验上的应用
设有两个随机变量 和 , ~ , ~ ,而 和 分别为来自 和来自 的两个相互独立的简单随机抽样.在 未知的情况下,基本假设 对显著性水平: 选取统计量
1引言
在数理统计中,常见的分布包括指数分布,普哇松分布,正态分布, 分布, 分布, 分布.这些常见分布的参数的区间估计和假设检验问题是在日常生产生活中我们常用到的问题,在大部分的文献资料中对正态分布的这一问题讨论较多,本文将就其它五个常见分布的参数的区间估计和假设检验问题进行详细的介绍.其中包括这五种分布的密度函数、性质及其在数理统计中的应用.
那么
~ ,
所以假设拒绝域:对于给定的 和 ,由
,
是自由度为 的 分布之 水平双侧分位数,假设 之 水平的拒绝域是
,
接受域是
.
例某种中药饮片中成分 的含量规定为 ,现在抽验了该药物一批成品中的五个片剂,测得其中成分 的含量分别为: 假设该药物中成分 的含量 服从正态分布,问在 的显著性水平下,抽验结果是否与片剂中成分 的含量为 要求相符?
其中 为常数,这种分布叫作指数分布.显然,我们有
指数分布含有一个参数 ,通常把这分种分布记作 .如果随机变量 服从指数分布 ,则记为 ~ ,因为
(连续随机变量的分布函数 等于概率密度 在区间 上的反常积分)由此可得指数分布 的分布函数为
=
2.5 普哇松分布
定义5[3](P64)称随机变量 服从普哇松分布,如果
2五中常见分布的定义及其相关性质
2.1 分布
定义1[1](P225)称随机变量 服从 分布,自由度为 ,如果它有密度函数
性质假设 独立同标准正态分布,则随机变量
服从 分布,自由度等于 .
2.2 分布
定义2[1](P228)称随机变量 服从 分布,自由度为 ,如果它有密度函数
.
性质假设 服从标准正态分布, 服从 分布,自由度为 ,而且 和 相互独立,那么随机变量 ,服从 分布,自由度为 .
参数为 ,记作 ,且易于验证有
普哇松定理[3](P65)在 重贝努里试验中,事件 在一定试验中出现的概率为 (与试验总数 有关),如果当 时, ( 常数),则有
,
(普哇松定理可以用作近似计算和理论上服从普哇松分布的实例的计算).
普哇松分布的期望: ,方差: 即期望和方差相等.
3常见分布在数理统计中的应用
假设 未知,那么 的 水平置信区间为
其中
.
例某厂一车间生产铜丝的折断力已知服从正态分布,生产一直比较稳定.今从产品中随机抽出9根检查折断力,测得数据如下(单位:kg) , , , , , , , , 问是否可以相信该车间的铜丝折断力的方差为 ?
解设 表示铜丝的折断力且 ~ .基本假设 : ,对 对给定的显著性水平 ,查 分布表得: , ,
3.2.2 已知条件下的假设检验
在已知 的情形下,检验假设 对于显著性水平 ,选取统计量 由于 独立同正态分布,所以 , 为自由度.假设的否定域:对于给定的显著性水平 和自由度 ,有
其中 , 是 分布上侧分位数.因此,
就是假设 的 水平的否定域.
3.2.3 已知条件下 的置信区间
假设 ,其中 为已知数,那么区间.
3.4 指数分布的应用
设总体 服从指数分布,概率密度为
其中 为未知参数,我们有
, .
对于已给的置信水平 ,按公式
得
易知不等式
即
由此解得
其中
,
于是有
上式表明:未知参数 的置信水平为 的置信区间近似为 .基本假设 易知总体 的均值与方差分别是
,
当样本容量充分大时统计量
,
其中 是样本容量.
或者说
= .
例公共汽车站在一单位时间内(如半小时或一小时)到达的乘客数服从普哇松分布 ,对不同的车站,所不同的仅仅是参数 的取值,现对一城市某一公共汽车站进行 个单位时间的调查,这里单位时间是 分钟,计算得到 分钟内来到该车站的乘客数平均值 人,试求参数 的置信水平为 置信区间?
求参数 和 的字样均值 和子样方差 ?
求参数 的置信度为 的置信区间?
解 参数 和 的点估计值为 和 ,计算结果如下:
, , .
选取 ,对于 ,自由度为 ,查 分布得 ,由上面的结论 的 置信区间为
,
其中
, ,
计算得 的 得置信区间是
3.1.2 分布在假设检验上的应用
设总体 ~ ,未知方差,检验假设 , ,( 检验法)对于显著性水平 选取统计量: 其中 是样本均值,
2.3 分布
定义3[1](P230)称随机变量 服从 分布,自由度为 ,如果它有密度函数
注
性质 假设随机变量 和 相互独立,分别服从自由度为 和 得 分布,那么随机变量 服从 分布,自由度为 .
定理 设 相互独立,且都服从 分布,则有下列三条结论:
~ ;
~ ;
与 子样方差相互独立.
2.4 指数分布
定义4[2](P60)设连续随机变量 的概率密度为
3.1 分布的应用
3.1.1 分布在参数区间估计上的应用
设 ~ , 未知,那么 的置信度为 的置信区间为
其中
( ~ , )
可查 分布表,事实上,由
~
可知
~
而
~
再由 分布的性质,有
~
即
~
从而对于给定的 有
( 待查)
或
由此得, 的置信度为 的置信区间为
是自由度为 的 分布之 水平双侧分位数.
例 从一批产品中随机取出 件,并测量其尺寸,得到下列 个数据: 假设在正常条件下,产品尺寸 服从正态分布 ,上面的数据是对 的观测值.求:
~
对于给定的显著性水平 查 分布表,然后计算统计量 即可做出推断.
3.2 分布的应用
设 ~
3.2.1 未知条件下的假设检验
在未知均值 时,检验假设 取统计量
其中
在 : 成立时, 服从自由度为 的 分布.对于给定的显著性水平 ,查自由度为 的 分布表求值 .使得满足
, . ,
即是
,
得拒绝域:
计算统计量之值,若 则拒绝 : ,否则接受 : .
解假设该批药中成分 的含量 服从正态分布 ,其中 和 均为未知常数.基本假设 (成份 的平均含量与要求相符)给定显著性水平 , ,查 双侧分位数得 假设 之 水平的否定域是
计算 故不能否定假设 ,因此抽验结果说明该药中 的含量合格.
另:还可以用 检验法检验:未知 及 , = ,假设检验
.其中随机变量 ~ ,随机变量 ~ 取统计量
解 , , ,
应用公式
得
即 为参数 的置信水平为 的置信区间.
根据上述分析可见参数区间估计和假设检验问题在解决统计学实际问题上有着十分重要的作用.在文章中我们总结常见统计分布:普哇松分布,指数分布,卡方分布, 分布, 分布的定义、性质、并讨论了这些分布的参数的区间估计与假设检验问题.举例说明了分布参数的区间估计和假设检验问题在实际生产生活中的应用.相信通过这些总结会使我们对这类问题有一个更为全面的了解.也能为学习这方面知识的人提供一些参考.
按以上所求参数 的置信区间为 .
3.5 普哇松分布的应用
假设随机变量 服从普哇松分布,参数 未知; 是来自 的简单随机抽样,则总体的均值和方差分别是 , 因为样本 相互独立,与总体 服从相同的分布,所以有
, ,
在 充分大的条件下参数 的近似的置信水平为 的置信区间可以表示为 ,即
,
(注:按中心极限定理)即 可看成是下列二次方程的根:
近似地服从标准正态分布 由此计算统计量 的观测值得 ,已知显著性水平 ,查表得临界值 若 则接受原假设否则拒绝原假设.
例从一批电视配件中抽取 个样品,测的它们的使用寿命均值为 ,设电视配件的使用寿命服从指数分布 ,求未知参数 的置信水平为 的置信区间?
解有题设有 ,
已知置信水平为 , ,查表得
,
由此得
其中:
则
~
对显著性水平 ,由
确定 与 可得临界域: , 与 的求法, 可直接查 之 水平上侧分位数 ,由于
~
那么
,
记
.
所以假设 拒绝域是 接受域是 .
3.3.2 分布在参数区间估计上的应用
设 是独立同分布的随机变量, 的分布函数形如
, ,
是前 个次序统计量, .
令
, 其中 .
令
则 与 , 无关.记 的 分位点为 ,在 时 .
满足
,
由此确定临界域为 根据样本观测值,计算统计量 的观测值:
, , ,
由于
所以认为基本假设 : 成立.
3.3 分布的应用
3.3.1 分布在假设检验上的应用
设有两个随机变量 和 , ~ , ~ ,而 和 分别为来自 和来自 的两个相互独立的简单随机抽样.在 未知的情况下,基本假设 对显著性水平: 选取统计量