数理统计--参数估计、假设检验、方差分析(李志强) (3)

合集下载

数理统计总结讲义

数理统计总结讲义

最大次序统计量X(n) = max {Xi }的密度函数为
1<i≤n ∗ fk (y ) = nf (y )[F (y )]n−1
Mathematics Statistics (College of Info. Science and Eng., at SDUST)
数理统计总结
2011.12.21
4 / 44
1 n
n
¯ )2 (Xi − X
i−1
3. 顺序统计量 X(1) ≤ X(2) ≤ ... ≤ X(n−1) ≤ X(n) 当总体X的分布函数为F (x)、密度函数为f (x)时,最小次序统计 量X(1) = min {Xi }的密度函数为
1<i≤n ∗ f1 (y ) = nf (y )[1 − F (y )]n−1
数理统计总结
Mathematics Statistics
山东科技大学 信息科学与工程学院
2011年12月
数理统计总结
第一部分 数理统计
Mathematics Statistics 一、 二、 三、 四、 五、 基本概念 参数估计 假设检验 回归分析 方差分析
1
一、 基本概念 二、 参数估计 三、 假设检验 四、 回归分析 五、 方差分析
Mathematics Statistics (College of Info. Science and Eng., at SDUST) 数理统计总结 2011.12.21 6 / 44
1 1 = F0.95 (6, 4) 6.16
一、 基本概念 V
n
数理统计总结
(1) X1 , ..., Xn iid N (0, 1), 则 Y =
1. 经验分布函数的求法

概率论与数理统计实验实验3参数估计假设检验

概率论与数理统计实验实验3参数估计假设检验

概率论与数理统计实验实验3 参数估计假设检验实验目的实验内容直观了解统计描述的基本内容。

2、假设检验1、参数估计3、实例4、作业一、参数估计参数估计问题的一般提法X1, X2,…, Xn要依据该样本对参数作出估计,或估计的某个已知函数.现从该总体抽样,得样本设有一个统计总体,总体的分布函数向量). 为F(x, ),其中为未知参数( 可以是参数估计点估计区间估计点估计——估计未知参数的值区间估计——根据样本构造出适当的区间,使他以一定的概率包含未知参数或未知参数的已知函数的真?(一)、点估计的求法1、矩估计法基本思想是用样本矩估计总体矩.令设总体分布含有个m未知参数??1 ,…,??m解此方程组得其根为分别估计参数??i ,i=1,...,m,并称其为??i 的矩估计。

2、最大似然估计法(二)、区间估计的求法反复抽取容量为n的样本,都可得到一个区间,这个区间可能包含未知参数的真值,也可能不包含未知参数的真值,包含真值的区间占置信区间的意义1、数学期望的置信区间设样本来自正态母体X(1) 方差?? 2已知, ?? 的置信区间(2) 方差?? 2 未知, ?? 的置信区间2、方差的区间估计未知时, 方差?? 2 的置信区间为(三)参数估计的命令1、正态总体的参数估计设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得:[muhat,sigmahat,muci,sigmaci] = normfit(X,alpha)此命令以alpha 为显著性水平,在数据X下,对参数进行估计。

(alpha缺省时设定为0.05),返回值muhat是X的均值的点估计值,sigmahat是标准差的点估计值, muci是均值的区间估计,sigmaci是标准差的区间估计.例1、给出两列参数?? =10, ??=2正态分布随机数,并以此为样本值,给出?? 和?? 的点估计和区间估计命令:r=normrnd(10,2,100,2);[mu,sigm,muci,sigmci]=normfit(r);[mu1,sigm1,muci1,si gmci1]=normfit(r,0.01);mu=9.8437 9.9803sigm=1.91381.9955muci=9.4639 9.584310.2234 10.3762sigmci=1.68031.75202.2232 2.3181mu1=9.8437 9.9803sigm1=1.91381.9955muci1=9.3410 9.456210.3463 10.5043sigmci1=1.6152 1.68412.3349 2.4346例2、产生正态分布随机数作为样本值,计算区间估计的覆盖率。

数理统计学中的参数估计和假设检验

数理统计学中的参数估计和假设检验

数理统计学中的参数估计和假设检验在现代统计学中,参数估计和假设检验是非常重要的概念。

这些概念互相关联,但是又有不同的应用。

在此,我们将讨论这两个概念的基本原则以及它们在现实生活中的应用。

参数估计可以被描述为研究一组数据的基本特征。

通过这个过程,我们试图推断出这个数据集的平均值、标准差和其他的参数。

这些参数会充当我们对整个数据集的总体特征的代表,是基于样本数据和概率等数学方法来实现的。

数理统计学中有两种常见的参数估计方法:点估计和区间估计。

点估计法指的是通过现有的样本数据,确定整体数据集的一个参数值。

这个参数值是一个点,代表了这个总体数据的典型特征。

例如,一个统计学家可能会利用一个样本数据集的均值来估计整个数据集的均值。

这个方法非常简单,但是也有缺点,因为单个点可能不能完整地反映出整个总体的信息。

相对于点估计方法,区间估计法则是根据样本数据并结合概率论提供一个充分范围内的参数估计值。

以信心水平的方式,给出估计结果的范围和信心度。

这样的区间被称为可信区间,其中的参数值处于一定的置信度内,一般用百分之几的置信度表示。

例如,一个样本数据的均值在一定的置信度下是x到y之间的。

区间估计法是一种更加准确的方法,因为它允许我们知道参数值的变化范围,而不仅仅是一个单点。

但是,这种技术会带来更多的复杂性,需要一些基本的统计技能。

另一方面,假设检验则是一种帮助我们确定一个假设是否正确的方法。

这个方法通常用于对两个数据组的统计分析中,并且可以用于比较一个数据集的平均值是否等于一个已知的值。

简单说就是,假设检验能够让我们确定样本数据是否足够代表总体,并且也让我们确认样本数据能否代表以前的观测和研究。

在假设检验中,我们制定一个假设被称为研究假设,并组对比之前已知的信息,提出一个对立假设。

之后,我们会挑选一个随机样本并采取测量行动。

我们利用这个测量行动来确定样本数据是否属于已知的总体比例,或者是否对研究假设做出了支持。

如果样本数据足够代表总体,并且不同于已知的比例,则我们可以拒绝研究假设并接受对立假设。

数理统计与数据分析第三版答案 (2)

数理统计与数据分析第三版答案 (2)

数理统计与数据分析第三版答案第一章简介1.1 概述本章主要介绍了数理统计与数据分析的基本概念和作用。

数理统计是对数据进行收集、整理和分析的方法,数据分析则是从数据中提取有用的信息和结论。

1.2 数理统计的基本概念与分析步骤数理统计的基本概念包括总体、样本、参数和统计量等。

分析步骤包括收集数据、描述性统计、概率分布、参数估计和假设检验等。

1.3 数据分析的基本方法数据分析的基本方法包括描述统计和推断统计。

描述统计主要是对数据的总体特征进行描述,推断统计则是通过样本数据对总体进行推断。

第二章概率分布2.1 离散型随机变量离散型随机变量是在有限个或可列无限个数值中取值的随机变量。

本节介绍了离散型随机变量的概率质量函数、分布函数、期望和方差等。

2.2 连续型随机变量连续型随机变量是在某个区间内取值的随机变量。

本节介绍了连续型随机变量的概率密度函数、分布函数、期望和方差等。

第三章参数估计3.1 点估计点估计是用样本数据估计总体参数的方法。

本节介绍了点估计的基本原理和常用的点估计方法,包括最大似然估计和矩估计。

3.2 区间估计区间估计是通过样本数据估计总体参数的范围。

本节介绍了区间估计的基本原理和常用的区间估计方法,包括置信区间和预测区间。

第四章假设检验4.1 基本概念假设检验是用样本数据对总体参数的假设进行检验的方法。

本节介绍了假设检验的基本概念,包括原假设、备择假设、显著性水平和拒绝域等。

4.2 单样本均值检验单样本均值检验是对总体均值是否等于某个给定值进行检验的方法。

本节介绍了单样本均值检验的假设检验步骤和常用的检验方法,包括正态总体和非正态总体的检验。

第五章方差分析5.1 单因素方差分析单因素方差分析是对一个因素的影响进行分析的方法。

本节介绍了单因素方差分析的基本原理和常用的分析方法,包括单因素方差分析的假设检验和效应大小的度量。

5.2 多因素方差分析多因素方差分析是对多个因素的交互作用进行分析的方法。

数理统计·参数的假设检验

数理统计·参数的假设检验

H0 : 0 12 H1 : 12
在 H0成立旳条件下即( 0 ) ,选用U统计量
U X 0 ~ N (0,1) n
由 P(|U | u ) 0.05 ,
2
(u
2
)
1
2
1
0.05 2
0.975
查正态分布表得u 1.96 , 于是拒绝域为|U | 1.96 ;
2
又由已知 0 12 , 1 ,n 100 , x 12.5 得
|
u
||
x
0
n
||
12.5 12 1 100
|
5
1.96
u
2
故拒绝 H0 ,即以为更新设备后产品旳质量均值与原
来产品旳质量均值有明显差别.
例3 切割机在正常工作时,切割出旳每段金属 棒长 X 服从正态分布 X ~ N (54, 0.752 ) ,今从生产出 旳一批产品中随机抽取10段进行测量,测得长度(单 位:mm)如下:
§7 参数旳假设检验
数理统计
参数估计 数理推断问题
假设检验
点估计 区间估计
一、假设检验旳基本概念与措施
1.统计假设:对未知或不完全懂得旳总体作出 某些假设.
2.假设检验:针对一种统计假设,利用一种样本 观察值,经过一定旳程序检验这个假设是否合理,从 而决定接受或拒绝假设.
3.假设检验旳两种情况: 参数假设检验:总体分布类型已知但有一种或几种
Sn
因为自由度 n 1 9 1 8 , 0.05 根据
P(| T | t (n 1)) 0.05
2
查t分布表得 t (n 1) t0.025 (8) 2.306
2
于是拒绝域为| T | 2.306 ;

第7章 假设检验与方差分析(统计学-湖北经济学院,李智)

第7章 假设检验与方差分析(统计学-湖北经济学院,李智)

样本统计量
观察到的样本统计量
左侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域 置信水平
a
1-a 接受域 H0值 样本统计量
临界值
右侧检验
(显著性水平与拒绝域 )
抽样分布
置信水平 拒绝域 1-a
a
接受域
H0值
观察到的样本统计量
临界值
样本统计量
右侧检验
(显著性水平与拒绝域 )
抽样分布
置信水平 拒绝域 1-a
均值的单尾U检验
(计算结果)
H0: 1000 H1: < 1000 a = 0.05 n = 100 临界值(s):
拒绝域 a
检验统计量:
x 0 960 1000 U= = = 2 n 20 100
决策:
在 a = 0.05的水平上拒绝H0
结论:
-1.645
0
均值的双尾 U 检验 (计算结果)
H0: = 0.081 H1: 0.081 a = 0.05 n = 200 检验统计量:
x 0 0.076 0.081 U= = = 2.83 n 0.025 200
决策:
拒绝H0
临界值(s):
拒绝 H0
.025
拒绝 H0
.025
关于总体平均数的假设有三种情况: (1) H0: μ =μ 0; H1: μ ≠μ 0 (2) H0: μ ≥μ 0; H1: μ <μ 0 (3) H0: μ ≤μ 0; H1: μ >μ 0
以上三种类型,对第一种类型的检验,称双边 检验,因为μ ≠μ 0,包含μ >μ 0和μ <μ 0。而 对第二、三种类型的检验,称单边检验。

数理统计--参数估计、假设检验、方差分析(李志强) (3)讲解

数理统计--参数估计、假设检验、方差分析(李志强) (3)讲解

教学单元案例: 参数估计与假设检验北京化工大学 李志强教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用(1)理解总体、样本和统计量等基本概念;了解常用的抽样分布;(2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法;(6)了解求区间估计、假设检验和方差分析的MA TLAB 命令。

教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟教学对象:大一各专业皆可用一、统计问题 引例例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:775,816,834,836,858,863,873,877,885,901问:新产品亩产是否超过了800斤?例2 设有一组来自正态总体),(2σμN 的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) 已知2σ=0.012,求μ的95%置信区间; (ii) 未知2σ,求μ的95%置信区间; (iii)求2σ的95%置信区间。

例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5只电池进行寿命测试, 数据如下表示, 这里假设第i 种电池的寿命),(.~2σμi i N X .(1) 试在检验水平下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.二 统计的基本概念: 总体、个体和样本(1)总体与样本总体 在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X 表示 为方便起见,今后我们把总体与随机变量X 等同起来看,即总体就是某随机变量X 可能取值的全体.它客观上存在一个分布,但我们对其分布一无所知,或部分未知,正因为如此,才有必要对总体进行研究.简单随机样本对总体进行研究,首先需要获取总体的有关信息. 一般采用两种方法:一是全面调查.如人口普查,该方法常要消耗大量的人力、物力、财力.有时甚至是不可能的,如测试某厂生产的所有电子元件的使用寿命. 二是抽样调查. 抽样调查是按照一定的方法,从总体X 中抽取n 个个体.这是我们对总体掌握的信息.数理统计就是要利用这一信息,对总体进行分析、估计、推断.因此,要求抽取的这n 个个体应具有很好的代表性.按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等,同时还要求每次的抽取是独立的,即每次抽样的结果不影响其他各次的抽样结果,同时也不受其他各次抽样结果的影响.这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本.从总体X 中抽取一个个体,就是对随机变量X 进行一次试验.抽取n 个个体就是对随机变量X 进行n 次试验,分别记为X1,X2,…,Xn.则样本就是n 维随机变量(X1,X2,…,Xn).在一次抽样以后, (X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看着一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间,称为子样空间.(2)样本函数与统计量设n x x x ,,,21 为总体的一个样本,称ϕϕ= (n x x x ,,,21 )为样本函数,其中ϕ为一个连续函数。

《数理统计》课程教学大纲(本科)

《数理统计》课程教学大纲(本科)

《数理统计》课程教学大纲课程编号:07209课程名称:数理统计英文名称: Mathematical Statistics课程类型:学科平台课课程要求:必修学时/学分:56/3.5(讲课学时:48 上机学时:8)开课学期:5适用专业:数学与应用数学、信息与计算科学授课语言:中文课程网站:无一、课程性质与任务数理统计课程是数学与应用数学专业和信息与计算科学专业的学科基础课,是研究随机现象统计规律性的一门数学课程,其理论及方法与数学其它分支相互交叉、渗透,已经成为许多自然科学学科、社会与经济科学学科、管理学科重要的理论工具。

由于其具有很强的应用性,特别是随着统计应用软件的普及和完善,使其应用面几乎涵盖了自然科学和社会科学的所有领域。

数理统计课程是以概率论作为理论基础,研究如何对试验结果进行统计推断。

包括数理统计的基本概念、参数估计、假设检验、方差分析和回归分析等。

在传授知识的同时,要通过各个教学环节逐步培养学生具有比较熟练的运算能力、抽象思维能力、逻辑推理能力、空间想象能力和自学能力。

还要培养学生具有抽象概括问题的能力和综合运用知识来分析解决问题的能力。

二、课程与其他课程的联系先修课程:《数学分析》、《概率论》后续课程:《随机过程》、《时间序列分析》、《多元统计分析》本课程以数学分析、概率论的知识作为学习辅助,为学习后续应用数学专业的课程打好基础。

三、课程教学目标1.通过本课程的学习,要求能够理解统计量的分布,熟悉数据处理、数据分析、数据推断的各种基本方法,能用所掌握的方法具体解决所遇到的各种社会经济问题,为学生进一步学习相关专业课打下坚实的基础,为学习后继课程及进一步获取其它学科的知识奠定必要的数学基础。

(支撑毕业要求指标点2.1)2.在传授知识的同时,要通过各个教学环节逐步培养学生具有比较熟练的数学运算能力、抽象思维能力、逻辑推理能力、空间想象能力和自学能力,还要特别注意综合运用、分析解决实际问题能力的训练。

第一讲参数估计、假定检验与方差分析

第一讲参数估计、假定检验与方差分析

prop ratio ci
比例 比率 区间
两个连续变量或 线性化 二分类变量 连续变量或二分 常规 类变量 by 单变量 样本量
假定检验
假定检验 (hypothesis test)
• 假定:对两个变量之间关系的陈述,也即是未经 检验的、对研究问题的回答;不是凭空捏造的
• 假定检验:利用样本特征对总体特征进行推断
• 样本容量与边际误差成反比:可以接受的边际误 差越大,所需的样本量就越小 • 可靠性、准确性与置信区间的关系
估计量的评估标准
• 无偏性 (unbiasedness):估计量抽样分布的数学期 望值 = 被估计的总体参数 (均值、方差、比例)
ˆ)= θ,则ˆ 为 θ 的无偏估计 若E(
• 有效性 (efficiency):无偏估计并非十分接近被估 计的参数。对同一总体参数的两个无偏点估计 量 ˆ1和ˆ2 ,标准差或方差越小,估计量有效性越大 • 一致性 (consistency):随着样本量的增加,估计量 的取值越来越接近总体参数(与 x 抽样的sd有关): x
常用区间的正态概率值
-2.58 sd
-1.69 sd
Mu
1.69 sd
2.58 sd
68.27% 95.44% 99.73%
区间估计:样本的均值分布(II)
x (样本标准差)
– 样本均值(x )在( 概率为 68.27%

2
3

n

n


2

n

n
)范围内的
– 样本均值(x )在( 概率为 95.44%
.tab urban sib,chi2
1=urban, | 0=rural | 0 sib(姊妹数量) 1 2 | Total

北化研究生数理统计李志强4-3

北化研究生数理统计李志强4-3

关于XY的符号:
相关系数的性质:
由方差Var(Y)是正的,故必有 2 证: 由方差的性质和协方差的定义知 , 1- ≥ 0,所以 | |≤1。 对任意实数b,有 0≤Var(Y-bX)= b2Var(X)+Var(Y)-2b Cov(X,Y )
[Cov( X , Y )] 2 Var(Y- bX)= Var (Y ) Var ( X ) 2 [Cov( X , Y )] Var (Y )[1 ] Var (Y )[1 2 ] Var ( X )Var (Y )
X和Y不相互独立.
3. 1
存在常数a,b(b≠0),
使P{Y=a+bX}=1,
即X和Y以概率1线性相关.
请看演示
相关系数的直观意义
前面,我们已经看到: 若X与Y独立,则X与Y不相关, 但由X与Y不相关,不一定能推出X与Y独立. 但对下述情形,独立与不相关等价 若(X,Y)服从二维正态分布,则
X与Y独立

X与Y不相关
参见书P121--122
小结:本节主要介绍了协方差与相关系数, 它们都是用来刻画两个随机变量之间的相关 程度的量,它们取值的正副,反映了两个随 机变量变化方向的趋势。
稍事休息
Var ( X i ) Var ( X i )
i 1 i 1
n
n
协方差的大小在一定程度上反映了X和Y 相互间的关系,但它还受X与Y本身度量单位 的影响. 例如: Cov(kX, kY)=k2Cov(X,Y)
为了克服这一缺点,对协方差进行标准化, 这就引入了相关系数 .
二、相关系数 定义: 设Var(X)>0, Var(Y)>0, 称
2
xdx dy

数理统计知识点

数理统计知识点

06
方差分析与回归分析
方差分析的基本原理与方法
方差分析的基本原理
通过比较不同组别数据的方 差,判断各因素对结果的影 响是否显著。
方差分析的基本方法
单因素方差分析、多因素方 差分析等。
方差分析的步骤
建立假设、构造检验统计量 、确定显著性水平、进行统 计决策。
一元线性回归分析的基本原理与方法
一元线性回归分析的基本原理
抽样分布
当从总体中随机抽取多个样本时,由这些样本统计量所构成的分布称为抽样分布。常见的抽样分布有t分布、F分 布和χ^2分布等。
中心极限定理
当样本量足够大时,样本均值的分布近似于正态分布,无论总体分布是什么形状。这一定理在统计学中具有重要 地位,为许多统计推断方法提供了理论依据。
04
参数估计
点估计的方法与性质
推断性统计
推断性统计是通过样本数据对总体进行推断的方法,包括参数估计和假设检验两种类型。参数估计是通过样本数据对 总体参数进行估计的方法,而假设检验则是通过样本数据对总体假设进行检验的方法。
实验设计与方差分析
实验设计是研究如何合理地安排实验以及实验数据收集的方法,而方差分析则是用于研究不同因素对实 验结果影响的方法。通过实验设计和方差分析,我们可以更加准确地了解各因素对实验结果的影响程度 。
协方差与相关系数
用于衡量两个变量之间的线性 关系强度和方向。
均值
样本均值是总体均值的无偏估 计,其分布随着样本量的增加 而逐渐趋近于正态分布。
标准差
样本标准差是总体标准差的无 偏估计,用于衡量数据的离散 程度。
偏度与峰度
用于描述数据分布的形态,偏 度衡量分布的偏斜程度,峰度 衡量分布的尖峭程度。
抽样分布与中心极限定理

北航数理统计课程简介

北航数理统计课程简介

Pre-request Course References
课程的目的 与地位
距离判别,Bayes 判别,Fisher 判别 第八章 相关分析(6 学时) 主成分析,因子分析,典型相关分析
讲授及学习 方法
课堂教学、课后作业及实践性大作业相结合,每周授课 4 学时
考核方式 先修课程
平时考查结合期末闭卷考试 高等数学、线性代数、概率论 作 是 为 校 师 是 者 否 本 教
参 考 书 主 要 参 考 书
名称
作者
出版社
出 版 时间
教材类别
数理统计
孙海燕等
试用版
2012
应用数理统计 数理统计
韩於羹 赵选民等 陈希孺
北京航空航天大 学出版社 科学出版社 科学出版社
1993 2002 1997
否 否 否
数理统计引论
Bickel, P. Mathematical Statistics, Basic J., ay Inc. 1977 Ideas and Selected Topics, Doksum, K.A. 教材类别指是否为“各级精品教材” 、 “全国研究生教学用书” 、 “国防系列教材”或“专著”等等

课程简介
课程代码 学时/开课季 节 课程内容关 键词(3 个) 48 / 秋 课程名称 数理统计 B 本课程英 Mathematical Statistics 文名称 估计和检验、回归分析、方差分析和试验 任课教师 设计、相关分析 应用数理统计是全校工科硕士研究生的重要公共基础课,也是一门应用性很广泛的数学 课。通过本课程的学习,使学生掌握数理统计的应用背景、基本原理和研究方法,了解基本 理论,着重培养学生应用数理统计方法分析问题和解决问题的能力,为培养合格的理论和应 用人才服务。 第一章 绪论(4 学时) 1) 数理统计学发展简史及其研究范畴,数据采集和整理 2) 基本概念:总体、样本、统计量及充分统计量 3) 抽样分布 第二章 参数估计(10 学时) 1) 参数的频率替换估计,矩估计和极大似然估计 2) 无偏估计,完全统计量,一致最小方差无偏估计 3) 信息不等式,优效估计,相合估计 4) 区间估计 第三章 假设检验(9 学时) 1) 参数假设检验的基本问题和 Neyman-Pearson 思想简介 2) 单个正态总体和两个正态总体参数的假设检验 课程的主要 章节学时分 配 3) 似然比检验 4) 检验优良性简介 5) Pearson 检验 第四章 回归分析(7 学时) 1) 一元线性回归,最小二乘估计,回归方程和回归系数检验,预测与控制 2) 多元线性回归,回归方程和回归系数检验 3) 多项式回归,一元曲线回归关 第五章 方差分析与正交设计(6 学时) 1) 基本概念,单因素方差分析 2) 双因素方差分析 3) 正交试验设计的直观分析及正交表 4) 正交试验设计的方差分析 第六章 多元正态总统的统计推断(2 学时) 多元正态分布的定义,参数估计与检验理论 第七章 判别分析(4 学时)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

教学单元案例: 参数估计与假设检验北京化工大学 李志强教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用(1)理解总体、样本和统计量等基本概念;了解常用的抽样分布;(2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法;(6)了解求区间估计、假设检验和方差分析的MA TLAB 命令。

教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟教学对象:大一各专业皆可用一、统计问题 引例例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:775,816,834,836,858,863,873,877,885,901问:新产品亩产是否超过了800斤?例2 设有一组来自正态总体),(2σμN 的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) 已知2σ=0.012,求μ的95%置信区间; (ii) 未知2σ,求μ的95%置信区间; (iii)求2σ的95%置信区间。

例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5只电池进行寿命测试, 数据如下表示, 这里假设第i 种电池的寿命),(.~2σμi i N X .(1) 试在检验水平下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.二 统计的基本概念: 总体、个体和样本(1)总体与样本总体 在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X 表示 为方便起见,今后我们把总体与随机变量X 等同起来看,即总体就是某随机变量X 可能取值的全体.它客观上存在一个分布,但我们对其分布一无所知,或部分未知,正因为如此,才有必要对总体进行研究.简单随机样本对总体进行研究,首先需要获取总体的有关信息. 一般采用两种方法:一是全面调查.如人口普查,该方法常要消耗大量的人力、物力、财力.有时甚至是不可能的,如测试某厂生产的所有电子元件的使用寿命. 二是抽样调查. 抽样调查是按照一定的方法,从总体X 中抽取n 个个体.这是我们对总体掌握的信息.数理统计就是要利用这一信息,对总体进行分析、估计、推断.因此,要求抽取的这n 个个体应具有很好的代表性.按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等,同时还要求每次的抽取是独立的,即每次抽样的结果不影响其他各次的抽样结果,同时也不受其他各次抽样结果的影响.这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本.从总体X 中抽取一个个体,就是对随机变量X 进行一次试验.抽取n 个个体就是对随机变量X 进行n 次试验,分别记为X1,X2,…,Xn.则样本就是n 维随机变量(X1,X2,…,Xn).在一次抽样以后, (X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看着一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间,称为子样空间.(2)样本函数与统计量设n x x x ,,,21 为总体的一个样本,称ϕϕ= (n x x x ,,,21 )为样本函数,其中ϕ为一个连续函数。

如果ϕ中不包含任何未知参数,则称ϕ(n x x x ,,,21 )为一个统计量。

2、统计量(1)常用统计量样本均值.11∑==ni i x n x样本方差∑=--=ni ix x n S 122.)(11 (与概率论中的方差定义不同)样本标准差.)(1112∑=--=ni i x x n S 样本k 阶原点矩∑===n i ki k k x n M 1.,2,1,1样本k 阶中心矩∑==-='ni k i kk x x n M 1.,3,2,)(1 (二阶中心矩∑=-=n i i X X n S 122)(1*与概率论中的方差定义相同)例6.2:用测温仪对一物体的温度测量5次,其结果为(℃):1250,1265,1245,1260,1275,求统计计量X ,S 2和S 的观察值.,,2s s x 和(2)统计量的期望和方差μ=)(X E ,nX D 2)(σ=,22)(σ=S E ,221)*(σnn S E -=, 其中∑=-=n i i X X n S 122)(1*,为二阶中心矩。

)(~,,,21x F X X X n ,i.i.d ,独立同分布。

无限总体抽样。

(3) 随机数生成在Matlab 中各种随机数可以认为是独立同分布的,即简单随机样本。

以下罗列在Matlab 中的实现方法。

)1,0U(~,,,21n X X X ,均匀分布样本n=10;x=rand(1,n)),U(~,,,21b a X X X nn=10;a=-1;b=3;x=rand(1,n);x=(b-a)*x+a)1,0N(~,,,21n X X X ,正态分布样本n=10;x=randn(1,n)),N(~,,,221b a X X X nmu=80.2;sigma=7.6;m=1;n=10; x=normrnd(mu,sigma,m,n)上面首先对总体均值赋值mu=80.2;再对标准差赋值sigma=7.6; m=1;n=10;分别对生成的随机阵对的行数和列数进行赋值,然后可直接利用Matlab 自带的函数normrnd 生成正态分布的随机数。

类似地可生成m 行n 列的随机矩阵,服从指定的分布。

生成随机数的函数后缀都是rnd ,前缀为分布的名称。

常用分布的随机数产生方法罗列如下,注意使用前先要对参数赋值。

x=betarnd(a,b,m,n) 参数为a,b 的beta 分布; x=binornd(N,p,m,n) 参数为N,p 的二项分布; x=chi2rnd(N,m,n) 自由度为N 的2χ分布; x=exprnd(mu,m,n) 总体期望为mu 的指数分布; x=frnd(n1,n2,m,n) 自由度为n1与n2的F 分布; x=gamrnd(a,b,m,n) 参数为a,b 的Γ分布;x=lognrnd(mu,sigma,m,n) 参数为mu 与sigma 的对数正态分布; x=poissrnd(mu,m,n) 总体均值为mu 的Poisson 分布; x=trnd(N,m,n) 自由度为N 的T 分布; Matlab 统计工具箱中还有一些其它分布,不再一一列举。

3、三个抽样分布(χ2、t 、F 分布)1.3 三个常用分布以下罗列出数理统计中三个重要分布的概念与性质。

1.3.1 2χ分布定义1.2 设一维连续型随机变量X 的密度函数为⎪⎩⎪⎨⎧≤>Γ=--0,00,e )2/(21)(2122/x x x n x f x n n n (1-2)则称X 服从自由度为n 的2χ分布,记为)(~2n X χ。

0.020.040.060.080.10.120.14图1-2 2χ分布密度函数示意图(1)期望与方差:n X =E ,n X 2=D(2)来源:若)1,0N(~,,,21n X X X 独立同分布,则)(~222221n X X X n χ+++(3)可加性:若)(~121n Y χ,)(~222n Y χ,且两者独立,则有)(~21221n n Y Y ++χ(4)重要结论:若),N(~,,,221σμn X X X ,则)1(~)()1(221222--=-∑=n X XS n ni iχσσ以下给出了自由度为5,10,20的2χ分布的密度函数,如图1-2所示。

1.3.2 t 分布定义1.3 设一维连续型随机变量X 的密度函数为2121)2()21()(+-⎪⎪⎭⎫ ⎝⎛+Γ+Γ=n n n x n nn x f π (1-3)则称X 服从自由度为n 的t 分布,记为)(~n t X 。

00.050.10.150.20.250.30.350.4图1-3 t 分布密度函数与标准正态分布密度函数(1)密度函数特点:与标准正态分布类似,方差较大。

∞→n 时,22e21)(x n x f -=→πϕ(标准正态分布密度函数)(2)来源:设)1,0N(~X ,)(~2n Y χ,且两者独立,则)(~/n t nY X(3)重要结论:设),N(~,,,221σμn X X X ,则)1(~/--=n t nS X T μ1.3.3 F 分布定义1.4 设一维连续型随机变量X 的密度函数为⎪⎪⎩⎪⎪⎨⎧≤>⎪⎪⎭⎫⎝⎛+=+--0,00,1)(22112211x x x n n cx x f n n n (1-4) 其中常数22121211)2()2()2(n n n n n n n c ⎪⎪⎭⎫⎝⎛ΓΓ+Γ=则称X 服从第一自由度1n ,第二自由度2n 的F 分布,记为),(~21n n F X 。

(1)密度函数特点:在1=x 附近密度函数取值较大,为单峰非对称的。

当两个自由度都很大时,X 取值以较大概率集中在1=x 附近。

以下画出了)12,8(F 的密度函数图1-4 F 分布密度函数(2)来源:设)(~12n X χ,)(~22n Y χ,且两者独立,则),(~//2121n n F n Y n X F =(3)重要结论:设1,,21n X X X 为来自总体),(211σμN 的简单随机样本,2,,,21n Y Y Y 为来自总体),(222σμN 的简单随机样本,且两者独立。

又设两个样本方差分别为21S 与22S ,则)1,1(~//2122212221--=n n F S S F σσ三、点估计的两种方法(1)矩法所谓矩法就是利用样本各阶原点矩代替相应的总体矩,来建立估计量应满足的方程,从而求得未知参数估计量的方法。

设总体X 的分布中包含有未知数m θθθ,,,21 ,则其分布函数可以表成).,,,;(21m x F θθθ 显示它的k 阶原点矩),,2,1)((m k X E v k k ==中也包含了未知参数m θθθ,,,21 ,即),,,(21m k k v v θθθ =。

相关文档
最新文档