数理统计大作业知识分享
应用数理统计大作业1——逐步回归法分析终教学提纲

应用数理统计大作业1——逐步回归法分析终应用数理统计多元线性回归分析(第一次作业)学院:机械工程及自动化学院姓名:学号:2014年12月逐步回归法在AMHS物流仿真结果中的应用摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS 数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。
关键词:逐步回归;残差;SPSS;AMHS;物流仿真目录1、引言 (1)2、逐步回归法原理 (4)3、模型建立 (6)3.1确定自变量和因变量 (6)3.2分析数据准备 (6)3.3逐步回归分析 (7)4、结果输出及分析 (9)4.1输入/移去的变量 (9)4.2模型汇总 (10)4.3方差分析 (10)4.4回归系数 (11)4.5已排除的变量 (12)4.6残差统计量 (13)4.7残差分布直方图和观测量累计概率P-P图 (14)5、异常情况说明 (15)5.1异方差检验 (15)5.2残差的独立性检验 (17)5.3多重共线性检验 (17)6、结论 (18)参考文献 (20)1、引言回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。
这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。
逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。
SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。
数理统计期末重点知识

数理统计期末重点知识期末考试重点目录5.3 统计量及其分布 (1)5.4 三大抽样分布 (2)内容概要 (2)§6.1 点估计的几种方式 (6)§ 6.2 点估计的评价标准 (11)内容概要 (11)§7.1 假设检验的基本思想 (19)内容概要 (19)§正态总体参数假设检验 (26)5.3 统计量及其分布样本方差与样本标准差 样本方差有两个,样本方差2*s 与样本无偏方差2*s2*s =n121)(-=-∑x x ni i , 112-=n s 21)(-=-∑x x ni i 。
实际中常用的是无偏样本方差2s ,这是因为:当2σ为总体方差时,总有E(2s *)=21σnn -, E(22)σ=s . 2s 的计算有如下三个公式可供选用:2s =22222()111()[][].111i i ii x x x x x nx n n n n -=-=----∑∑∑∑ 在分组样本场合,样本方差的近似计算公式为221111()[],11k ki i i i i i s f x x f x nx n n ===-=---∑∑ 1.从指数总体exp(1/θ)中抽取了40个样品,试求x 的渐进分布240(,)N θθ 2.设125,x x 是从均匀分布U(0,5)抽取的样本,试求样本均值x 的渐进分布 51,.212N ⎛⎫⎪⎝⎭3. 设x 1,, x20是从二点分布b(1,p)抽取得样本,试求样本均值x 的渐近线分布(1),20p p N p -⎛⎫ ⎪⎝⎭4.设116,,x x 是来自N ()4,8的样本,试求下列概率(1)(16)(10)P x >; (2)(1)(5)P x >.解:(1) 10(16)(16)1(10)1(10)1((10))P x P x P x >=-≤=-≤1616108110.84130.9370,0⎛-⎫⎛⎫=-Φ=-= ⎪ ⎪⎝⎭⎝⎭(2 )()()161616(1)158(5)(5)1 1.50.3308.2P x P x ⎛-⎫⎛⎫>=>=-Φ=Φ=⎡⎤ ⎪ ⎪⎣⎦⎝⎭⎝⎭5.4 三大抽样分布内容概要1. 三大抽样分布:χ2分步,F 分布,t 分布设x 1,x 2,…,x n 和y 1,y 2,…,y n 是来自标准正态分布的两个相互独立的样本,则此三个统计量的构造及其抽样分布人员下表所示2221)/)/n m n x y m x n y ++++++2)/n x n+今后正态总体参数的置信区间与假设检验大多数将基于这三大抽样分布 2. 一个重要的定理设x 1,x 2,…,x n 是来正态总体N(μ,σ2)的的样本,其样本均值与样本方差分别为∑==n i i x n x 11 和 ,)(1122∑--=x x n s i 则有(1)x 与2s 相互独立;(2)x ~)/,(2n N δμ;(3)22)1(δs n ⋅-~)1(2-n χ.3. 一些重要推论(1)设n x x ,,1 是来自正态总体),(2δμN 的样本,则有sx n t )(μ-=~)1(-n t , 其中x 为样本均值,为样本标准差.(2)设m x x ,,1 是来自),(211δμN 的样本,n y y ,,1 是来自),(222δμN 的样本,且此两样本相互独立,则有222212δδyx s s F =~)1,1(--n m F ,其中22,y x s s 分别是两个样本方差.若2221δδ=,则22y xs s F =~)1,1(--n m F .1. 在总体)4,6.7(N 中抽取容量为n 的样本,如果要求样本均值落在)6.9,6.5(内的概率不小于0.95,则至少为多少?解:样本均值x ~)4,6.7(nN ,从而按题意可建立如下不等式95.0)46.76.946.746.76.5()6.96.5(≥-<-<-=<<nnx nP x P ,即95.01)(2≥-Φn ,所以975.0)(≥Φn ,查表,975.0)96.1(=Φ,故96.1≥n 或84.3≥n ,即样本量n 至少为4.2.设n x x ,,1 是来自)25,(μN 的样本,问n 多大时才能使得95.0)1|(|≥<-μx P 成立?解:样本均值x ~)25,(nN μ,因而(||1)|210.95x P x P μ⎛⎫-<=<=Φ-≥ ⎝, 所以975.0)5(≥Φn ,96.15≥n ,这给出04.96≥n ,即n 至少为97时,上述概率不等式才成立..设161,,x x 是来自),(2δμN 的样本,经计算32.5,92==s x ,试求)6.0|(|<-μx P .解:因为)1()1(||)(22---=-n sn n x sx n δδμμ~)1(-n t ,用)(15x t 表示服从)15(t 的随机变量的分布函数,注意到t 分布是对称的,故1)0405.1(2)6.04||4()6.0|(|15-=⨯<-=<-t ss x P x P μμ. 统计软件可计算上式.譬如,使用MATLAB 软件在命令行输入tcdf(1.0405,15)则给出0.8427,直接输入2* tcdf(1.0405,15)-1则给出0.6854.这里的tcdf(x,k)就是表示自由度为可 k 的t 分布在x 处的分布函数,于是有(||0.6)20.842710.6854.P x μ-<=⨯-=3.设n x x ,,1 是来自)1,(μN 的样本,试确定最小的常数c,使得对任意的0≥μ,有α≤<P )|(|c x .解:由于)1,(~nx μN ,所以)|(|c x <P 的值依赖于μ,它是μ的函数,记为g(μ),于是))(())(()()|(|)(μμμμ--Φ---Φ=<<-P =<P =c n c n c x c c x g ,其导函数为))](())(([)('μϕμϕμ-----=c n c n n g , 其中)(x ϕ表示)1,0(N 的密度函数,由于0,0≥≥μc ,故μμ-≥--c c ,从而)),(())((μϕμϕ-≤--c n c n 这说明)(,0)('μμg g ≤为减函数,并在0=μ处取得最大值,即.1)(2)()())}(())(({m ax 0-Φ=-Φ-Φ=--Φ--Φ≥c n c n c n c n c n μμμ于是,只要,1)(2α≤-Φc n 即n u c /)0(2/)1(α+≤≤就可保证对任意的,0≥μ有.)|(|α≤<P c x 最大的常数为 ./2/)1(n u c α+=4.设21,x x 是来自),0(2σN 的样本,试求22121⎪⎪⎭⎫ ⎝⎛-+=x x x x Y 的分布.解: 由条件,),2,0(~),2,0(~221221σσN x x N x x -+故),1(~2),1(~222212221χσχσ⎪⎭⎫⎝⎛-⎪⎭⎫ ⎝⎛+x x x x 又0)()(),(212121=-=-+x Var x Var x x x x Cov ,且2121x x x x -+与服从二元正态分布,故 2121x x x x -+与独立,于是 ).1,1(~)2/)(()2/)((22122122121F x x x x x x x x Y σσ-+=⎪⎪⎭⎫ ⎝⎛-+=5.设总体为N(0,1),21,x x 为样本,试求常数k,使得.05.0)()()(221221221=⎪⎪⎭⎫ ⎝⎛>++-+P k x x x x x x 解:由上题,,1)()()(),1,1(~22122122122121Y Y x x x x x x z F x x x x Y +=++-+=⎪⎪⎭⎫ ⎝⎛-+= 由于Z 的取值与(0,1),故由题目所给要求有0<k<1,从而.05.0)1()1()(=->=>+=>kkY P k Y Y P k Z P于是,45.161)1,1(195.0==-F k k 这给出.9938.045.161145.161=+=k6.设从两个方差相等的正态总体中分别抽取容量为15,20的样本,其样本方差分别为,,2221s s 试求).2(2221>S S p 解 不妨设正太总体的方差为2σ,则有),19(~19),14(~1422222221χσχσs s 于是).19,14(~2221F s s F =利用统计软件计算可算出.0798.0)2()2(2221=>=>F P s s P 譬如,可使用MATLAB 软件计算上式:在命令行输入1-fcdf (2,14,19)则给出0.0798,这里的fcdf ),,(21k k x 就表示),(21k k 自由度为 的F 分布在x 处的分布函数。
根据数理统计知识点归纳总结(精华版)

根据数理统计知识点归纳总结(精华版)
1. 引言
本文旨在对数理统计的基本知识点进行归纳总结,帮助读者快速了解数理统计的核心概念和方法。
2. 概率论基础
- 概率的基本定义和性质
- 随机事件的运算规则
- 条件概率和独立性
- 贝叶斯定理
3. 随机变量和分布
- 随机变量的定义和分类
- 离散型随机变量和连续型随机变量
- 常见离散型分布(如伯努利分布、二项分布、泊松分布)
- 常见连续型分布(如均匀分布、正态分布、指数分布)
4. 数理统计的基本概念
- 总体和样本的概念
- 估计与抽样分布
- 统计量和抽样分布
5. 参数估计
- 点估计的定义和性质
- 常见的点估计方法(如最大似然估计、矩估计)
- 区间估计的基本原理和方法
6. 假设检验
- 假设检验的基本思想和步骤
- 单侧检验和双侧检验
- 假设检验中的错误类型和显著性水平
- 常见的假设检验方法(如正态总体均值的检验、两样本均值的检验)
7. 相关分析
- 相关系数的定义和计算方法
- 相关分析的假设检验
- 线性回归分析的基本原理和方法
8. 统计软件的应用
- 常见的统计软件介绍(如SPSS、R、Python)
- 统计软件的基本操作(如数据导入、数据处理、统计分析)
9. 结语
本文对数理统计的核心知识点进行了简要的概括,供读者参考和研究。
通过研究数理统计,读者可以更好地理解和应用统计学在实际问题中的作用,提高数据分析和决策能力。
以上是根据数理统计知识点的归纳总结,希望有助于您对数理统计的理解和学习。
如需深入了解各个知识点的具体内容,请参考相关教材或课程。
数理统计知识梳理

2、步骤
( 1) 提 出 原 假 设 H 0 ( 2) 选 择 检 验 的 统 计 量 并 找 出 在 假 设 H 0 成 立 的 条 件 下 , 该 统 计 量 所服从的概率分布 ( 3) 根 据 所 给 的 显 著 水 平 , 查 概 率 分 布 临 界 值 表 , 找 出 检 验 统 计 量 的 临 界 值 , 并 确 定 否 定 域 ( 4) 用 样 本 值 计 算 统 计 量 的 值 , 将 其 与 临 界 值 比 较 , 根 据 比 较 结 果 , 确 定 样 本 值 是 否 落 入 否 定 域 , 最 后 对 H 0作 出 结 论
( X 1 , X 2 ,… , X n )
是n次试验的结果,因此它们是
n个随机变量。但做了试验后,记录下来的是它们在试 验中所取得的数值,得到一串数据
( x1 , x 2 , … , x n )
这串数据称为样本的观察值。
样本的观察值就是指样本的一次实现, 是一个常数向量
有时样本观察值也称为样本,因此样本一词 具有二重性
服 从 自 由 度 为 ( k 1, k 2) 的 F 分 布 , 记 F ( k 1, k 2) 。
F分布一个重要特点
F1( k 1, k 2) =
1 F( k 2, k 1)
3、统计量
设 X 1 , X 2 , … , X n 是 来 自 总 体 X 的 一 个 样 本 , g( x1 , x 2 , … , x n ) 是 一 个 连 续 函 数 。 如 果 g中 不 包 涵 任 何 未 知 数 参 数 , 则 称 g(X 1 , X 2 , … , X n )为 统 计 量 。
2分 布 的 重 要 性 质
X 1 ~ ( m ) , X 2 ~ ( n ) ; n )
数理统计知识点总结

数理统计知识点总结一、概述数理统计是一门研究收集、整理、分析和解释数据的学科。
它在各个领域中发挥着重要作用,包括科学研究、经济学、社会学等。
二、基本概念1. 数据:指收集到的观察结果或实验结果,是进行统计分析的基础。
2. 总体和样本:总体指研究对象的全体,样本是从总体中选取的一部分。
3. 变量:指研究对象的性质或特征,分为定性变量和定量变量。
4. 频数和频率:频数是某一数值在样本中出现的次数,频率是某一数值在样本中出现的相对次数。
三、数据的整理与描述1. 数据的收集:可以通过实验、调查或观察等方式获取数据。
2. 数据的整理:包括数据的分类、排序和归纳等处理。
3. 数据的描述:使用统计指标如均值、方差、标准差等来描述数据分布的中心趋势和变异程度。
四、概率与概率分布1. 概率:指事件发生的可能性,可通过频率或理论推导计算得到。
2. 概率分布:描述随机变量取值与其概率之间的关系,包括离散概率分布和连续概率分布。
五、统计推断1. 参数估计:根据样本数据估计总体的参数,如均值、比例等。
2. 假设检验:根据样本数据判断总体参数是否符合某个假设。
3. 置信区间:给出总体参数的估计范围。
六、相关性与回归分析1. 相关性:描述两个变量之间的关联程度,可以通过相关系数来度量。
2. 简单线性回归:通过一条直线描述两个变量之间的函数关系。
3. 多元线性回归:通过多个变量来描述一个变量的线性关系。
七、抽样与实验设计1. 抽样方法:包括随机抽样、分层抽样等,确保样本具有代表性。
2. 实验设计:设计合理的实验方案,控制其他因素对结果的影响。
以上是数理统计的一些基本知识点总结,希望对您有所帮助。
数理统计第一次大作业——回归分析

北京市农业经济总产值的逐步回归分析姓名:学号:摘要:农业生产和农村经济是国民经济的基础,影响农村经济总产值的因素有多种,主要包括农林牧渔业。
本文以北京市农业生产和农村经济总产值为对象,首先分析了各种因素的线性相关性,建立回归模型,再利用逐步回归法进行回归分析,得到最符合实际情况的回归模型。
以SPSS 17.0为分析工具,给出了实验结果,并用预测值验证了结论的正确性。
关键词:农业生产和农村经济,线性回归模型,逐步回归分析,SPSS1.引言农林牧渔业统计范围包括辖区内全部农林牧渔业生产单位、非农行业单位附属的农林牧渔业生产活动单位以及农户的农业生产活动。
军委系统的农林牧渔业生产(除军马外)也应包括在内,但不包括农业科学试验机构进行的农业生产。
在近几年中国经济快速增长的带动下,各地区农林牧渔业也得到了突飞猛进的发展。
以北京地区为例,2005年的农业总产值为1993年的6倍。
因此用统计方法研究分析农业总产值对指导国民经济生产,合理有效的进行产业布局,提高生产力等有着重要意义。
表1 北京市农业经济产值及各产品产量统计数据本文以北京市农生产为对象,分析了农业经济总产值与粮食产量、棉花产量、油料产量、蔬菜产量、干鲜果品产量、猪牛羊肉产量、禽蛋产量、水产品产量的关系,并建立农业经济总产值的回归模型。
表1中列出了1999年至2008年间的统计数据(数据来源于北京统计信息网)。
2.线性回归模型的建立2.1 线性回归模型的假设为了研究农业经济总产值与各种农生产量的关系,必须要建立二者之间的数学模型。
数学模型可以有多种形式,比如线性模型,二次模型,指数模型,对数模型等等。
而实际生活中,影响农业经济总产值的因素很多,并且这些因素的影响不能简单的用某一种模型来描述,所以要建立农业经济总产值的数学模型往往是很难的。
但是为了便于研究,我们可以先假定一些前提条件,然后在这些条件下得到简化后的近似模型。
以下我们假定两个前提条件:1) 农产品的价格是不变的。
数理统计大作业题目和答案0348

1、设总体X 服从正态分布),(2σμN ,其中μ已知,2σ未知,n X X X ,,,21 为其样本,2≥n ,则下列说法中正确的是( )。
(A )∑=-ni iXn122)(μσ是统计量 (B )∑=ni iXn122σ是统计量(C )∑=--ni i X n 122)(1μσ是统计量 (D )∑=ni i X n12μ是统计量2、设两独立随机变量)1,0(~N X ,)9(~2χY ,则YX 3服从( )。
)(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F3、设两独立随机变量)1,0(~N X ,2~(16)Y χ)。
)(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ).)(A ∑-=-1111n i i X n )(B ∑=-n i i X n 111 )(C ∑=n i i X n 21 )(D ∑-=111n i i X n 5、设4321,,,X X X X 是总体2(0,)N σ的样本,2σ未知,则下列随机变量是统计量的是( ).(A )3/X σ; (B )414ii X=∑; (C )σ-1X ; (D )4221/ii Xσ=∑6、设总体),(~2σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则下列正确的是( ).2() ~(,)A X N μσ 2()~(,)B n X N μσ 22211()()~()ni i C X n μχσ=-∑(~()D t n7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ⋅⋅⋅是来自总体的简单随机样本,则下列随机变量不是统计量为( )( A ) . 12X X +( B ){}max ,15i X i ≤≤( C ) 52X p +( D )()251X X -8、设1,,n X X ⋅⋅⋅为来自正态总体2(,)N μσ的一个样本,μ,2σ未知。
数理统计知识点总结(总22页)

数理统计知识点总结(总22页)一、基本概念1、统计学:统计学是一门研究人群或事物特性及变化规律的学科,是应用数理统计方法研究某种规律的学科,是整理、综合和分析统计资料的学科。
2、统计资料:统计资料是从实际中收集的有关统计对象的数据,也可以称为实验资料。
3、变量:历史的发展过程中,统计中的变量可分为定量变量和定性变量。
前者是指可以用数字表示的变量,又被称为被观察变量或解释变量;后者多由文字描述,不能量化,又被称为因变量或行为变量。
4、分类变量:又称为分类统计数据,是指按照一定的范围将变量等分,主要用于描述变量的构成状况。
5、样本:样本是用于做统计分析的一部分数据,它按照一定的要求从某种群体中抽取出来,它是统计资料的简写总结。
样本本身并非具有代表性,但在发现规律方面与总体相比,它有许多独特的优势。
二、数理统计方法1、数据描述:数据描述是指用定量和定性的方式把统计对象描述出来,也就是用汇总统计和分类统计的方法研究统计资料的特征。
2、分布类型:经过研究的统计资料各变量的分布可分为三种基本形式:正态分布、对数分布和正玄分布。
3、抽样技术:抽样是指在随机或不完全随机的情况下,从一个总体中抽出一定数量的抽样单位,用它们反映整体的一般特性的科学方法。
4、统计推断:统计推断是指借助于统计技术去评价样本资料与总体资料之间的联系,并借以判断在一定概率水平上总体参数的取值情况,并对总体参数做出推断。
5、回归分析:回归分析是利用统计方法,探索两个或多个变量之间存在的关系,及掌握这种关系的参数。
三、统计推断1、假设检验:假设检验是统计推断的基本方法,是统计方法求出的取值所处位置在参数特定范围内的概率,通常用统计量在假设下把允许的概率建模出来。
2、置信区间:置信区间是统计学中定量评价事物变化范围的一种分析方法,其作用是加以比较研究结果,以及让相应的概率参数可以被确定的概率范围的压缩,使数据更有说服力。
3、方差分析:方差分析是检验研究变量之间是否存在显著的差异性的统计分析方法,其研究的是变量的变异程度。
数理统计主要知识点

《数理统计》的主要知识点 一.统计量及其抽样分布 (一)统计量的概念1. 统计量的定义: 简单地说,统计量就是样本i x 的函数,它除i x 外不含其它未知参数。
2. 简单随机抽样:从总体中抽取样本n x x x 21,若它们相互独立同分布 ,且分布与总体 相同,则称其为简单随机抽样。
3. 常见的统计量:(1)样本均值: ∑==n i i x n x 11 (2)样本方差:()21211∑=--=n i i x x n s (3)样本k 阶原点距: ∑==n i k i k x n a 11 (4)样本k 阶中心距: ()∑=-=ni k i k x x n b 11(二)抽样分布的结构和性质1. 2χ分布: 若 n X X X ,,21 是来自总体X 的简单随机抽样,且X ~()1,0N ,则随机变量2χ=22221n X X X +++ ,此时称其分布为自由度为n 的2χ分布,记2χ~()n 2χ性质: ①()n E =2χ② ()n D 22=χ2.F 分布:若X ~()n 2χ,Y ~()m 2χ,且Y X 与相互独立,记随机变量F mY n X=,称其分布为自由度为n 与m 的F 分布,记 F ~F ()m n ,性质:()()n m F m n F ,1,1αα-=3.t 分布:设随机变量Y X 与相互独立,且X ~()1,0N ,Y ~()n 2χ,则称 nY X t =的分布为自由度为n 的t 分布,记t ~t ()n性质:①自由度为1的t 分布是标准柯西分布,它的均值不存在;②1>n 时,t 分布的数学期望存在且为0;③1>n 时,t 分布的方差存在且为2-n n ④当自由度较大时,t 分布可以用()1,0N 近似。
二.参数估计:(一)点估计: 1. 矩估计:(替换原理)一般地:①用样本均值估计总体均值;即 ()x X E =②用样本二阶中心矩估计总体方差;()()2121∑=-==ni i nx x n s X D③用事件A 出现的频率估计事件A 发生的概率。
概率论与数理统计大作业

概率论与数理统计大作业一、选题背景概率论与数理统计是现代科学中的重要分支,具有广泛的应用领域。
在实际问题中,我们经常需要通过数据分析来了解事物的规律性和趋势,而概率论与数理统计正是提供了一种科学的方法来处理这些数据。
因此,在学习概率论与数理统计时进行一次大作业,不仅能够加深对知识点的理解,还能够提高自己的数据分析能力和实际问题解决能力。
二、选题内容本次概率论与数理统计大作业选题为“某超市销售数据分析”。
主要内容包括以下几个方面:1. 数据收集首先需要收集某超市近两年来各种商品的销售数据,并将其整理成表格形式。
表格中应包含商品名称、销售量、销售额等信息。
2. 数据处理在收集到数据后,需要对其进行初步处理。
可以使用Excel等工具进行数据清洗、去重、排序等操作,并计算出每种商品的年销售量、年销售额以及平均单价等指标。
3. 数据分析在完成数据处理后,可以开始进行数据分析。
可以从以下几个方面入手:(1)商品销售情况分析通过统计每种商品的销售量、销售额等指标,分析各种商品的销售情况,找出畅销商品和滞销商品,并探究其原因。
(2)季节性分析通过比较不同季节或不同月份的销售数据,分析商品在不同季节或月份的销售情况,找出季节性规律。
(3)地域性分析通过比较不同门店或不同城市的销售数据,分析商品在不同地域的销售情况,找出地域性规律。
(4)用户行为分析通过统计用户购买行为数据,如购买时间、购买频率、购买金额等指标,分析用户行为特点,并提出相应的营销策略。
4. 数据可视化为了更直观地展示数据分析结果,可以使用图表等工具进行数据可视化。
例如可以绘制柱状图、折线图、饼图等来展示各种商品的年销售量和年销售额;也可以使用热力图来展示不同城市或门店的销售情况。
三、选题意义本次概率论与数理统计大作业选题有以下几个意义:1. 提高数据处理能力在进行本次大作业时,需要进行数据收集、处理和分析等操作,这将有助于提高自己的数据处理能力和实际问题解决能力。
哈工大-概率论与数理统计大作业(论文)

————————————————————————————————概率论与数理统计大作业xxxxxxxxxxxxxxxxxxxxxxx2012年12月8日概率论与数理统计一点小结1.简介:概率论(probability theory):研究随机现象数量规律的数学分支。
随机现象是相对于决定性现象而言的。
在一定条件下必然发生某一结果的现象称为决定性现象。
例如在标准大气压下,纯水加热到100℃时水必然会沸腾等。
随机现象则是指在基本条件不变的情况下,一系列试验或观察会得到不同结果的现象。
每一次试验或观察前,不能肯定会出现哪种结果,呈现出偶然性。
例如,掷一硬币,可能出现正面或反面,在同一工艺条件下生产出的灯泡,其寿命长短参差不齐等等。
随机现象的实现和对它的观察称为随机试验。
随机试验的每一可能结果称为一个基本事件,一个或一组基本事件统称随机事件,或简称事件。
事件的概率则是衡量该事件发生的可能性的量度。
虽然在一次随机试验中某个事件的发生是带有偶然性的,但那些可在相同条件下大量重复的随机试验却往往呈现出明显的数量规律。
例如,连续多次掷一均匀的硬币,出现正面的频率随着投掷次数的增加逐渐趋向于1/2。
又如,多次测量一物体的长度,其测量结果的平均值随着测量次数的增加,逐渐稳定于一常数,并且诸测量值大都落在此常数的附近,其分布状况呈现中间多,两头少及某程度的对称性。
大数定律及中心极限定理就是描述和论证这些规律的。
在实际生活中,人们往往还需要研究某一特定随机现象的演变情况随机过程。
例如,微小粒子在液体中受周围分子的随机碰撞而形成不规则的运动(即布朗运动),这就是随机过程。
随机过程的统计特性、计算与随机过程有关的某些事件的概率,特别是研究与随机过程样本轨道(即过程的一次实现)有关的问题,是现代概率论的主要课题。
数理统计:数理统计是数学系各专业的一门重要课程。
随着研究随机现象规律性的科学—概率论的发展,应用概率论的结果更深入地分析研究统计资料,通过对某些现象的频率的观察来发现该现象的内在规律性,并作出一定精确程度的判断和预测;将这些研究的某些结果加以归纳整理,逐步形成一定的数学概型,这些组成了数理统计的内容。
(完整word版)北航数理统计大作业1-线性回归分析

应用数理统计作业一学号:姓名:电话:二〇一四年十二月国内生产总值的多元线性回归模型摘要:本文首先选取了选取我国自1978至2012年间的国内生产总值为因变量,并选取了7个主要影响因素,进一步利用统计软件SPSS对以上数据进行了多元逐步线性回归。
从而找到了能反映国内生产总值与各因素之间关系的“最优”回归方程.然后利用多重线性的诊断找出存在共线性的自变量,剔除缺失值较多的因子.再次进行主成份线性回归分析,找出最优回归方程。
所得结论与我国当前形势相印证。
关键词:多元线性回归,逐步回归法,多重共线性诊断,主成份分析目录0符号说明 (1)1 介绍 (2)2 统计分析步骤 (3)2。
1 数据的采集和整理 (3)2。
2采用多重逐步回归分析 (7)2.3进行共线性诊断 (17)2。
4进行主成分分析确定所需主成份 (24)2。
5进行主成分逐步回归分析 (27)3 结论 (30)参考文献 (31)致谢 (32)0符号说明1 介绍文中主要应用逐步回归的主成份分析方法,对数据进行分析处理,最终得出能够反映各个因素对国内生产总值影响的最“优”模型及线性回归方程.国内生产总值是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标.它不但可反映一个国家的经济表现,还可以反映一国的国力与财富。
2012年1月,国家统计局公布2011年重要经济数据,其中GDP增长9.2%,基本符合预期。
2012年10月18日,统计显示,2012年前三季度国内生产总值353480亿元,同比增长7.7%;其中,一季度增长8.1%,二季度增长7。
6%,三季度增长7.4%,三季度增幅创下2009年二季度以来14个季度新低。
中国的GDP核算历史不长,上世纪90年代之前通常用“社会总产值”来衡量经济发展情况。
上世纪80年代初中国开始研究联合国国民经济核算体系的国内生产总值(GDP)指标。
数理统计基础知识(一)(1)

数理统计的基本概念
c x0
CxnPx(1-P)n-x值表
c 0 1 0 1 2 0 1 2 3 0 1 2 3 4 0 1 2 3 4 5 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 p 0.001 0.9980 1.0000 0.9970 1.0000 0.9960 1.0000 0.002 0.9960 1.0000 0.9940 1.0000 0.9920 1.0000 0.003 0.9940 1.0000 1.9910 1.0000 0.9881 0.9999 1.0000 0.9851 0.9999 1.0000 0.005 0.9900 1.0000 0.9851 0.9999 1.0000 0.9801 0.9999 1.0000 0.9752 0.9998 1.0000 0.01 0.9801 0.9999 0.9703 0.9997 1.0000 0.9606 0.9994 1.0000 0.9510 0.9990 1.0000
数理统计的基本概念 随机变量 如果事前我们无法准确地知道变量的具体取值,这样的变量 就是随机变量;在6西格玛项目中,我们处理的大都是随机变 量。如: 每周所收到的定单的数量; 每批零件的报废数量; 每天接到的顾客服务电话数量;
每批产品的交付时间;
每个零件的加工尺寸等。 概率是研究随机变量的工具
数理统计的基本概念
是整数的X的值,相应的分布函数值列在中间。
例:设随机变量X服从二项分布b(8,0.01),求P(X≤2)及P(X=2). 解:由于P(X≤2)=F(2), 这里n=8,p=0.01,c=2, F(2)=0.9999,即P(X≤2)=0.9999 同理可查出F(1)=0.9973, 因此:P(X=2)=F(2)-F(1)=0.9999-0.9973=0.0026
数理统计相关知识汇总

其他: 设备维修、更新,项目选 择、评价,工程优化设计与管理等。
12
多元分析方法、时间序列分析和最优化等方法 都是依赖于计算机的发展而发展的,如果不使 用计算机,多元分析方法、时间序列分析和最 优化等方法中的许多计算几乎是不可能完成的。
网络计划 线性规划
排队论 非线性规划
动态规划 对策论
从不使用 有时使用 经常使用
3
各种方法在中国使用情况
(随机抽样)(1998年)
100 90 80 70 60 50 40 30 20 10 0
统计 计算机模拟
网络计划 线性规划
排队论 非线性规划
动态规划 对策论
从不使用 有时使用 经常使用
4
统计学(statistics)是用以收集数据、分析数据 和由数据得出结论的一组概念、原则和方法。
比如,北京GDP在一年中是快速增长的,而一个 刚出生的巴拿马婴儿在这一年中的体重也是快速 增长的。如果画出图来,它们有类似线性的关系 ,但它们之间显然没有因果关系。
29
只要有关系,即使不是因果关系也不妨碍人们利 用这种关系来进行推断。比如利用公鸡打鸣来预 报太阳升起;虽然公鸡打鸣绝对不是日出的原因 (虽然打鸣发生在先)
的方法主体都是统计。
18
§1.2 现实中的随机性和规律性、概率和机会
我们知道物理学的许多定律:
例如 v=v0+at ; F=ma 等等
然而在许多领域,很难用如此确定的公式或论述 来描述一些现象。一些现象既有规律性又有随机 性(randomness)。 例如:肺癌患者中(主动或被动)吸烟的比例 较大,这体现了规律性;而绝非每个吸烟的人都 会患肺癌,这体现了随机性。
北航-数理统计大作业

对中国各地财政收入情况的聚类分析和判别分析应用数理统计第二次大作业学院名称学号学生姓名摘要我国幅员辽阔,由于人才、地理位置、自然资源等条件的不同,各地区的财政收入类型各自呈现出不一样的发展趋势,通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。
本文以中国各地财政收入情况为研究对象,从《中国统计年鉴》中选取2011年期间中国各地财政收入情况为因变量,选取国内增值税、营业税、企业所得税、个人所得税、城市维护建设税、土地增值税、契税、专项收入、行政事业性收费收入、国有资本经营收入和国有资源(资产)有偿使用收入11个可能影响中国各地财政收入的因素为自变量,利用统计软件SPSS,对27个地区的财政收入进行了聚类分析,并对另外4个地区的财政收入进行了判别分析,并最终确定了中国各地区根据财政收入类型的分类情况。
关键词:聚类分析,判别分析,SPSS,中国各地财政收入类型1、引言财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。
财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。
财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。
通过准确定位中国各地区财政收入情况对于正确认识我国财政收入具有重要的意义。
本文利用统计软件SPSS,根据各地区的财政收入情况,对北京、天津、河北等27个地区进行聚类分析,并对青海、重庆、四川、贵州4个省市进行判别分析,判断属于聚类分析结果中的哪种财政收入类型。
1.1 聚类分析聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称,它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。
本文采用的是系统聚类分析,它又称集群分析,是聚类分析中应用最广的一种方法,其基本思想是:首先将每个聚类对象看作一类,然后根据对象间的相似程度,将相似程度最高的两类进行合并,并计算合并后的类与其他类之间的距离,再选择相近者进行合并,每合并一次减少一类,直至所有的对象都并为一类为止。
数理统计知识点

两个事件之间没有相互影响,即它们的概率不依 赖于对方。
贝叶斯公式
用于计算在已知一些信息的情况下某个事件发生 的概率。
贝叶斯定理与全概率公式
贝叶斯定理
描述在已知一些信息的情况下某个事件发生的概率,通常用于更新我们对某个事件发生的信念。
全概率公式
用于计算一个复杂事件发生的概率,将该事件分解为若干个互斥的事件,分别计算每个事件的概率,然后将它 们相加得到总概率。
02
该方法通过计算样本的均值, 然后对样本均值进行比较,以 确定它们之间是否存在显著差 异。
03
独立样本的均值比较适用于处 理数据量较大、数据分布不明 确或数据不符合正态分布的情 况。
配对样本的均值比较
配对样本的均值比较是一种用于比较 两个配对样本的平均值的非参数统计 方法。
该方法通过对配对样本的均值进行计 算和比较,以确定它们之间是否存在 显著差异。
03
回归方程的检验
通过F检验和R²检验等方法对回归方 程的显著性和拟合程度进行评估。同 时,需要对每个自变量的显著性进行 单独检验,以确定其对因变量的影响 是否显著。
05
非参数统计方法
非参数统计方法的概述
非参数统计方法是一种基于数据分布 特征的统计方法,与参数统计方法相 比,非参数统计方法对数据分布的假 设更少,因此具有更广泛的应用范围 。
ARMA模型是一种用来描述时间序列 数据动态变化的统计模型,由自回归 部分(AR)和移动平均部分(MA) 组成。
通过最小二乘法等统计方法,对 ARMA模型的参数进行估计。
ARMA模型的应用
ARMA模型可以用于时间序列数据的 预测、控制等领域。
时间序列的预测方法与评价
时间序列预测方法
数理统计 知识点总结

数理统计知识点总结概率论是数理统计的重要基础。
概率论研究的是随机事件发生的可能性。
在概率论中,我们可以通过概率分布函数来描述随机事件的发生规律,分析事件之间的关系。
常见的概率分布包括离散型概率分布和连续型概率分布。
其中,离散型概率分布包括二项分布、泊松分布和几何分布等,而连续型概率分布包括均匀分布、正态分布和指数分布等。
概率论的基本概念包括事件、样本空间、事件的概率、条件概率和独立事件等。
概率论是数理统计中的基础,它为后续的数理统计方法提供了理论基础。
数理统计是通过对数据的分析和推断来得出结论的方法。
它研究的是如何通过样本数据来估计总体参数、检验总体假设、进行回归分析以及制定决策等问题。
在数理统计中,抽样调查是一种常见的数据收集方法。
通过抽样调查,我们可以从总体中随机选择一部分样本,对样本数据进行分析,然后推断总体的性质。
抽样调查应该遵循随机性、代表性和重复性的原则,以确保结果的准确性和可靠性。
数理统计还包括估计和检验两大基本方法。
在估计方法中,我们需要通过样本数据来估计总体参数的值,例如平均值、方差和比例等。
而在检验方法中,我们通过对样本数据的分析,来判断总体参数的假设是否成立。
在实际应用中,数理统计的方法可以帮助我们更好地理解数据,从而做出更科学的决策。
回归分析是数理统计中的一种重要方法,它用来研究自变量和因变量之间的关系。
通过回归分析,我们可以建立模型来描述自变量对因变量的影响。
回归分析包括线性回归、多元回归、逻辑回归等。
线性回归是最常见的回归分析方法,它假设自变量和因变量之间呈线性关系。
通过线性回归,我们可以得到自变量对因变量的影响程度,以及模型的适配程度。
多元回归是对多个自变量与因变量之间的关系进行分析,它可以揭示多个因素对因变量的综合影响。
逻辑回归则适用于因变量为分类变量的情况,它可以用来预测因变量的分类概率。
回归分析的结果可以帮助我们更好地理解变量之间的关系,从而做出更准确的预测和决策。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数理统计大作业数理统计学大作业学院航空航天工程学部专业飞行器设计班级航宇二班学号142103130228 姓名张立指导教师姜永负责教师沈阳航空航天大学2014年12月目录目录 (2)前言 (3)一、采集样本数据整理及SPSS统计软件的实现 (5)1.1、数据的收集方法及说明 (5)1.2、数据整理:给出频数、频率分布表及偏度和峰度 (5)1.3、画出直方图和折线图 (7)1.4、经验分布函数和图形 (8)1.5、各种概率分布 (8)二、给出总体分布的参数估计 (13)2.1、矩估计法 (13)2.2、最大似然估计 (14)2.3、参数区间估计 (15)三、参数的假设检验 (18)3.1. 样本统计数据的t检验 (18)3.2样本统计数据的2χ检验 (19)四、非参数假设检验(2χ拟合优度检验) (20)4.1、2χ拟合优度检验 (20)五、结论 (22)参考文献 (23)前言数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。
随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。
由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。
了解数理统计能解决那些实际问题。
对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。
例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。
这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。
掌握了寻求估计的统计思想,具体寻求估计的步骤往往是“套路子”的,并不困难,然而如果没有从根本上理解,仅死背套路子往往会出现各种错误.一、采集样本数据整理及SPSS 统计软件的实现1.1、数据的收集方法及说明我的这次作业采取的数据是机械加工零件中,车床C6140其中一个传动轴的长度,由于这零件是大批量生产,数据很多,我选取了其中的100个数据进行计算,数据具体如下:84 69 73 77 88 83 65 74 79 6767 89 74 85 92 80 87 71 80 6777 76 77 73 53 68 79 81 67 7659 88 70 80 92 79 75 88 48 7274 73 83 68 65 78 88 84 58 7470 78 70 69 80 79 76 75 73 7065 81 81 80 76 52 66 69 77 7673 65 75 75 79 89 74 88 81 7377 82 74 88 84 82 81 88 90 6584 90 78 89 93 81 85 83 61 701.2、数据整理:给出频数、频率分布表及偏度和峰度其中,样本传动轴长度数据最小值为48,最大值为93,取a =40,b=100, 全距L =100-40=60,把数据分布的区间(40,100]等分为6个子区间,等组距为 Δt i =(100-40)/6=10,i =1,2,3,4,5,6。
通过计数要求落在子区间的个数,则得样本传动轴长度的频数i n 和频率i f分布,序号 区间 频数n i 频率f i1 (40,50] 1 0.012 (50,60]3 0.033 (60,70] 24 0.244 (70,80] 43 0.435 (80,90] 23 0.236 (90,100] 6 0.06偏度是对样本观察值分布的偏斜方向和程度的度量,通过样本数据计算的偏度为:3471.2)1()(3131=--=∑=S n X X V ni iV 1 0,分布呈右偏态。
峰度是描述样本观察值分布集中趋势高峰的程度,通过样本数据计算的峰度为:6328.4)1()(4142=--=∑=S n X X V ni iV 2 3,分布为尖峰分布。
1.3、画出直方图和折线图图一、数据段的直方图图二、数据分段的折线图1.4、经验分布函数和图形设X 1,X 2,...,X n 是来自总体X 的样本,样本的顺序统计量为X (1)≤X (2)≤...≤X (n ),当固定的一组顺序统计量的观察值x (1)≤x (2)≤...≤x (n )时,对于任何实数x 称下式:⎪⎪⎩⎪⎪⎨⎧≥-+<≤<+)(1)1(,11,......,2,1,,,0)(n k k n x x n k x x x nk x x x F为总体X 的经验分布函数。
图3经验分布函数图像1.5、各种概率分布概率分布类型主要分为离散型概率分布和连续型概率分布,我查阅了图书馆还有专业参考资料搜集到以下的概率分布,个别分布还画出了密度函数图像,还对各种概率密度的背景做了简单的介绍。
1.指数分布:⎩⎨⎧<>=-0,00,)(x x e x f x λλ 指数函数的一个重要特征是无记忆性(又称遗失记忆性)。
这表示如果一个随机变量呈指数分布,当s,t ≥0时有P(T>s+t|T>t)=P(T>s)。
即,如果T 是某一元件的寿命,已知元件使用了t 小时,它总共使用至少s+t 小时的条件概率,与从开始使用时算起它使用至少s 小时的概率相等。
21)(1)(λλ==X D X E ,2.威布尔分布:⎪⎩⎪⎨⎧<≥=-0,00,)(),,()(x x e x k k x f k x λλλλ 威布尔分布又称韦伯,是可靠性分析和寿命检验的理论基础。
在可靠性工程中被广泛应用,尤其适用于机电类产品的磨损累计失效的分布形式。
由于它可以利用概率值很容易地推断出它的分布参数,被广泛应用与各种寿命试验的数据处理。
22)21()(),11()(μλλ-+Γ=+Γ=kX D k X E3.正态分布222)(21)(σμπ--=x e x f正态分布是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
若随机变量X 服从一个数学期望为μ、方差为2σ的正态分布,记为N(μ,2σ)。
正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
因其曲线呈钟形,因此人们又经常称之为钟形曲线。
我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。
2)()(σμ==X D X E ,4.t 分布t 分布曲线形态与n (确切地说与自由度v )大小有关。
与标准正态分布曲线相比,自由度v 越小,t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度v 愈大,t 分布曲线愈接近正态分布曲线,当自由度v=∞时,t 分布曲线为标准正态分布曲线。
5.柯西分布R x x x f ∈-+=,)(1)(22μλλπ柯西分布是一个数学期望不存在的连续型分布函数,它同样具有自己的分布密度6.均匀分布⎪⎩⎪⎨⎧∉∈-=),(,0),(,1)(b a x b a x ab x f 这表明X 落在[a,b]的子区间内的概率只与子区间长度有关,而与子区间位置无关,因此X 落在[a,b]的长度相等的子区间内的可能性是相等的,所谓的均匀指的就是这种等可能性。
12)()(,2)(2a b X D b a X E -=+=7.伽马分布伽玛分布是统计学的一种连续概率函数。
伽玛分布中的参数α,称为形状参数,β称为尺度参数。
二、给出总体分布的参数估计2.1、矩估计法矩估计法是一种相对简单的估计方法,其理论依据是辛钦大数定律:设随机变量序列X1,X2,…,n X ,…独立同分布,且数学期望E(Xi)=µ存在.则对任意的є>0,有1)1(lim =<-∑∞→εμXi nP n 即当n →∞时,Xi n∑1依概率收敛到μ。
因此当样本很大时(因为采集的样本大于等于100,因此可以看作是大样本)又因为从数据分布图可以看出样本服从正态分布, X 的概率密度函数为:R x ex f u x ∈=--,21),,(222)(2σπσμμ=)(X E ,22)(μσ+=X E ,所以令⎩⎨⎧==2)()(A X E XX E 经过计算可得到X =μ,222X A -=σ 样本均值3.21001,5.8411221====∑∑==n i i n i i X nA X n X 。
所以 a 与 b 的矩估计量 分别为3.2100,5.842==∧∧σμ,。
2.2、最大似然估计因为最大似然估计法有较强的直观性,又能获得参数θ的合理的估计量,特别是在大样本时,最大似然估计有极好的性质。
所以他广泛应用于估计理论中。
最大似然估计的解题原理如下: X 的概率密度函数为:Rx ex f u x ∈=--,21),,(222)(2σπσμ所以μ,2σ的似然函数为:∏=--=ni x e L 12)(22221),(σμπσσμ取对数得:∑=---=ni i x L 12222]2)(ln 2121[ln),(ln σμσπσμ 令 ⎪⎪⎩⎪⎪⎨⎧=∂∂∂=∂∂0),(ln 0),(ln 222σμμσμL L解得:⎪⎩⎪⎨⎧-==∑=212)(1ni i X X n x σμ所以,2σμ,的极大似然估计量为:5.3185.61==∧∧σμ,2.3、参数区间估计假设样本总体服从正态分布进行计算。
(1)方差2σ未知,求数学期望μ的置信区间: 1)由于2σ未知,用样本的标准差21)(11∑=--=ni i X X n S 代替此时nS X μ-不再服从标准正态分布。
而是服从自由度为n-1的t 函数, 其分布记为:)1(~--=n t n S X t μ2)查分位数给定置信水平1-α=0.90,使:90.01)1(2=-=⎪⎪⎭⎫⎝⎛-<-αμαn t n S X P 根据自由度n-1和1-α,从t-分布表查出分位数为)1(2-n t α式等价于90.01))1()1((22=-=-+<<--αμααn t n SX n t n S X P 3)μ的随机置信区间μ的置信水平为0.90 的置信区间为:())1(),1(22-+--n t nS X n t nS Xαα4)μ的确定置信区间由X =74.4,方差S=9.49,47.420=,则3277.1)19(05.0=t 带入值可得:置信水平为0.9的区间为(71.6,77.2)。