数理统计的基本概念80651

合集下载

概率论-数理统计的基本概念

概率论-数理统计的基本概念

个随机变量,而样本是n维随机向量。
一旦取定一组样本 X1,… ,Xn ,得到 n 个具体 的数 (x1, x2, …, xn),称为样本的一次观测值,简 称样本值 .
随机抽样方法的基本要求
代表性——样本( X1 , X 2 ,, X n )的每个分量 X i
与总体 X 具有相同的分布。
独立性——每次抽样的结果既不影响其余各次抽 样的结果,也不受其它各次抽样结果的影响。
概率论和数理统计尽管两者有密切的联系,但本质 上是两门不同的课程。 1. 概率论是理论基础课,解决理论问题;数理统计是
应用专业课,解决实际问题。
2. 概率论更注重逻辑和体系的严密,是一门真正的数
学课。数理统计则对同一个具体问题也没有一个最 佳的答案,我们往往需要凭经验选择“较优”的方 法,不是纯粹的数学。 3. 学习方法也不同。概率论注重逻辑推导,而数理统 计则是以解决问题为导向,黑猫白猫,捉住老鼠就 是好猫;以案例为中心。
卡方分布的应用
定理 设(X1,X2,„,Xn)为来自正态总体 X~N( , 2)
的样本,则
2 X ~ N , n
(1)
(2) (3)


2 n
n nS 2 2 1 2 (X i X ) ~ (n 1) i 1
2 n 2
样本均值 X 和样本方差 S 独立
只证明(1): X 为X1,X2,„,Xn的线性组合,故仍然
n 2 1 2 Xi X 样本方差: Sn n i 1 n 1 2 Xi X 修正样本方差: Sn n 1 i 1 n 1 2 2 Sn Sn n




2
样本k阶原点矩: 样本k阶中心矩:

数理统计的基本概念

数理统计的基本概念

数理统计的基本概念6 数理统计的基本概念基本要求1 理解总体、样本(品)、样本容量、简单随机样本的概念。

能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。

2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。

3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。

4 理解样本均值、样本方差及样本矩的概念。

了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。

了解正态总体的某些常用抽样分布。

疑难解答1、采用抽样的方法推断总体,对样本应当有怎样的要求?答:为了对总体X的分布进行研究,逐个研究每个个体是不现实的。

采用抽样推断总体,其出发点是利用局部认识整体,因此抽出的样本要具有代表性。

即要求每个个体被抽取的机会均等,并且抽取一个个体后总体成分不变。

首先要求抽样具有“随机性”,第一次抽取的样品X1的可能取值应与总体的可能取值是完全一样的,且去取个个值的概率相同。

因此,X1是一个随机变量,并且是与X同分布的随机变量。

其次,应具有“独立性”,第一次抽样不改变总体成分,第二次抽取的样品X2可能的值也与X完全一样,且取值的概率也是相同的,因此X2也是与X同分布的一个随机变量且与X1是相互独立的,同样道理,X3,X4,…,X n都是与X同分布的随机变量,并且X1,X2,…,X n是一组相互独立的随机变量,故要求X1,X2,…,X n 是简单随机样本。

2、什么是简单随机样本?在实践中如何获得简单随机样本?答:设X1,X2,…,X n是来自总体X的容量为n的样本,如果它满足以下两个条件,则称它为简单随机样本:(1)X1,X2,…,X n与总体X具有相同的分布(2)X1,X2,…,X n相互独立由简单随机样本的定义知,用简单随机样本研究总体,可以更好地用概率论中独立条件下的一系列结论,正是这些结论为概率统计提供了必要的理论基础。

一般说来,对总体进行独立重复观测,便可以获得简单随机样本。

数理统计的基本概念汇总

数理统计的基本概念汇总

6数理统计的基本概念6.1 基本要求1 理解总体、样本(品)、样本容量、简单随机样本的概念。

能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。

2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。

3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。

4 理解样本均值、样本方差及样本矩的概念。

了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。

了解正态总体的某些常用抽样分布。

6.2 内容提要6.2.1 总体和样本1 总体和个体研究对象的某项特征指标值的全体称为总体(或母体),组成总体的每个元素称为个体。

总体是一个随机变量,常用X,Y等来表示。

2 样本从总体中随机抽出n个个体称为容量为n的样本,其中每个个体称为样品,它们都是随机变量。

3 简单随机样本设X1,X2,…,X n是来自总体X的容量为n 的样本,如果这n个随机变量X1,X2,…,X n相互独立且每个样品X i与总体X具有相同的分布,则称X1,X2,…,X n为总体X的简单随机样本。

4 样本的联合分布*该部分内容考研不作要求。

149150若总体X 具有分布函数F (x ),则样本(X 1,X 2,…,X n )的联合分布函数为∏==ni i n x F x x x F 121)(),,,(若总体X 为连续型随机变量,其概率密度函数为f (x ),则样本的联合概率密度为∏==ni in x f x x x f 121)(),,,( (6.1)若总体X 为离散型随机变量,其分布律为P {X =a i }=p i (i =1,2,…n),则样本的联合分布为∏======ni i i n n x X P x X x X x X P 12211}{},,,{ (6.2)其中),,,(21n x x x 为),,,(21n X X X 的任一组可能的观察值。

6.2.2 样本分布1 频率分布设样本值(x 1,x 2,…,x n )中不同的数值是x 1*,x 2*,…,x l *,记相应的频数分别为n 1,n 2,…,n l ,其中x 1*< x 2*<…< x l *且n n li i =∑=1。

数理统计的基本概念

数理统计的基本概念

证明:设F~F(n1,n2),则
P{F F1 (n1 , n2 )} 1
1 1 P{ } 1 F F1 (n1 , n2 ) 1 1 P{ } F F1 (n1 , n2 )
得证!
1 P{ F (n2 , n1 )} F
5.1.4 统计量及抽样分布
2. F分布的分位点 对于:0<<1,
若存在F(n1, n2)>0,
满足
P{FF(n1, n2)}=, 则
称F(n1, n2)为 F(n1, n2)的 上侧分位点;
F (n1 , n2 )
注:
1 F1 (n1 , n2 ) F (n2 , n1 )
1 ~ F ( n2 , n1 ) F
列出其频数频率分布表。
组序 分组区间 组中值 1 (147,157] 152 2 (157,167] 162 3 (167,177] 172 4 (177,187] 182 5 (187,197] 192 合计
频数 4 8 5 2 1 20
频率 累计频率(%) 0.20 20 0.40 60 0.25 85 0.10 95 0.05 100 1
1、设X 1 , X 2 ,
, X n (n 2)为来自总体N (0,1)的简单随机样本, (n 1) X 12
2 X i i 2 n
X 为样本均值,S 2为样本方差,则统计量

从 __________ 分布。 (05—06二)
2、设 X 1 , X 2 , X 3是来自正态分布 N (0, 2 )总 体的简单随机样本,则 统计量 2 服从 ________ 分布。(05—06三) X1 X X
3.总体、样本、样本观察值的关系 总体

第四节 数理统计的基本概念

第四节 数理统计的基本概念

第四节数理统计的基本概念数理统计是以概率论为理论基础的应用非常广泛的一个数学分支。

它是运用概率论的的知识,研究如何从试验资料出发,对随机变量的概率分布或某些特征(如数字特征)作出推断的一门学科。

数理统计的这种通过从局部观察去推断整体的方法具有普遍的意义,因此应用数理统计的方法,可以研究大量的自然现象和社会现象的规律性。

目前已应用于教育科学、工程技术、管理科学、自然科学以及社会科学等领域。

例如,教育科学中的教学质量的评估、预测以及试卷质量的评价、工业生产中的产品质量的控制与抽样检查、气象党的天气预报、地震学中的地震预报、医学中的疾病分析、药品疗效检验、农业生产中的产品估计与种子优选、人口学中的优生学和人口控制等等都渗透了数理统计的方法。

4.1总体与样本1.总体与个体在数理统计中,把研究对象的全体称为总体。

而把总体中的每一个对象称为个体。

例如,某厂生产一批电子元件共5000只,每只元件使用的寿命是一个随机变量X,故总体是指5000只电子元件的使用寿命,而个体则是每一只电子元件的使用寿命。

又如研究某市中学生身高时,该市中学生身高的全体就是总体,而个体就是每个学生的身高。

一般来说,对总体的研究,就是对相应的随机变量X的研究,因此,今后我们将总体与随机变量X等同起来,用随机变量X表示总体。

2.样本与样本值在数理统计学中,总是通过观测或试验以取得信息。

为了进行观测或试验,可以从客观存在的总体中按机会均等的原则随机地抽取一些个体,然后对这些个体进行观测或测试某一指标X的数值。

这样按机会均等的原则选取一些个体进行观测或测试的过程称为随机抽样。

用随机抽样的方法从总体X中随机抽取一个个体,就是对总体进行一次试验或观察,其结果是个随机变量,并且与总体X 有相同的分布。

在相同的条件下,对总体X 进行n 次重复的、独立的试或观察,即从总体中随机地抽取n 个个体,将n 次试验或观察得到的结果按次序记为n X X X ,,,21 ,它们都是随机变量,并且由于各次试验或观察是在相同的条件下进行的,所以有理由认为n X X X ,,,21 相互独立,并且都与总体X 具有相同的分布。

数理统计的基本概念

数理统计的基本概念
第二章 数理统计的基本概念
概率论与数理统计的区别: 在概率论中,假设随机变量的分布列或者分布函数已知,然 后描述随机变量的统计规律. 数理统计首先解决,如何知道 随机变量的分布规律,如何知道分布中所含的参数.
数理统计研究问题:它研究怎样有效地收集整理和分析带有随 机性的数据,以对所考察的问题作出推断或预测,直至为采取一 定的决策和行动提供依据和建议.
概率统计的基本问题:依据有限个观测或试验如何对整体所作 出推论的问题.这种伴随有一定概率的推断称为统计推断.
母体与子样、经验分布函数
1、母体:把研究对象的全体所构成的一个集合称为母体或总体; 组成母体的每一个成员称为个体. 注:10、实际应用中总体往往指研究对象的某项数值指标的全体。 20、总体的某个数值指标是一个具有分布函数F(x)随机变量,称 总体为具有分布函数F(x)的总体。 30、也可能是一个随机向量,相应的分布函数就为多元函数.
(i
n! 1)!(n
i)![F (
y)]i1[1
F(
y )] n1
f
(
y),
0 ,
a yb 其它
证明 第 i个次序统计量(i)落入无穷小区间 [ y , y y)
内这一事件等价于”容量为n的子样1 ,2 , n 中有(i 1)
个分量落入区间[a , y)内,1个分量落入区间[ y , y y)内,
n
F ( x1 ,, xn ) F ( xi ) i 1
例1 设总体 X 服从参数为 ( 0)的指数分布, ( X1, X2 ,, Xn )
是来自总体的样本, 求样本( X1, X2 ,, Xn )的概率密度.

总体 X 的概率密度为
ex ,
f (x)

数理统计的基本概念

数理统计的基本概念


m
Yi
~ 2
m
ni
i1
i1
19
对给定的概率, 0
1, 称满足条件

2 n
fn y dy
的点2
n为
2 n分布的上分位数,上分位数2 n的值可查 2分布表
20
例:求 20.1 25
通过Excel给出.
X1 X 2 ~ N (0, 1)
2
2X3

X4

X5
~
N (0, 6 2 ),
2X3

X4
6

X5
~
N (0, 1)
X1 X 2 与 2X3 X 4 X5 相互独立,
2
6
故 ( X1 X 2 )2 (2X3 X 4 X5 )2 ~ 2 (2)
2 2
6 2
性质:F ~ F (n1, n2 ),则F 1~ F (n2, n1)
29
.5:F n1, n2 分布的概率密度为:
f
x; n1, n2
1


B
, n1 n2 22
n n x n n x n1 2
n2 2
n1 2
1
12
2
n1 n2 2
1

0
其中B
N(, 2 ) 的简单随机样本, X 是样本均值,
S 2 是样本方差, 则有:
X
~
N


,
2
n
.
34
定理 6.3.2 设 X1, X 2 , , X n 为来自正态总体
N(, 2) 的简单随机样本, X 是样本均值,

概率论:第六章 数理统计的基本概念

概率论:第六章  数理统计的基本概念
为便于区分,将样本的观察值记为 (x1, x2 , , xn ) .
简单区分方法: 在抽样之前或理论研究时, (X1, X2 , , Xn ) 为 n 维随机变量.
在抽样之后或实际应用时, (x1, x2 , , xn ) 为观察值.
二、统计量
1.统计量的概念
定义 1.3 设 (X1, X2, , Xn ) 为来自总体 X 的一个样本, g(x1, x2 , , xn ) 为一个 n 元函数,且不依赖总体 X 中的任 何未知参数,就称随机变量 g( X1, X 2 , , X n ) 为一个统计 量.如果 (x1, x2 , , xn ) 为样本观察值,也称 g(x1, x2 , , xn )

例 1.5 设总体 X 的数学期望 EX ,方差 DX 2 , ( X1, X2 , , Xn ) (n 1) 为来自总体 X 的一个样本,则
E X , DX 2 , E(S2) 2 .
n
(此例实为结论,务必记住!)
⑵ 顺序统计量
定义 1.5 设 ( X1 , X2 , , Xn ) 为来自总体 X 的一个样本,
而在实际问题中,对于不同的个体,其数量指标 X 的取值是不同的,因此数量指标 X 是一个随机变量.
随机变量 X 的分布称为总体的分布,总体的特征是
由总体的分布刻画的.为此,常把总体与总体分布视为
等同,并称总体 X .
例 1.1 考察某产品的次品率,令总体
1, 产品为次品, X 0, 产品为正品, 因此总体 X 的取值为1和 0 ,总体 X 为有限总体,也 是离散型总体,如果记该产品的次品率为 p ,则总体
本,求 X1 X 2 所服从的分布.
X3 X4

利用正态分布的性质, X1 X 2

数理统计的基本概念

数理统计的基本概念
一类是如何科学地安排试验,以获取有效的随机数据。 此部分内容称为描述统计学如:试验设计、抽样方法。
另一类是研究如何分析所获得的随机数据,对所研究 的问题进行科学的、合理的估计和推断,尽可能地为 采取一定的决策提供依据,作出精确而可靠的结论. 这部分的内容称为推断统计学,如:参数估计、假设 检验等。
我们主要讨论有关推断统计学中几个最基本的 问题。
在数理统计中总体X的分布永远是未知的,即使 有足够的理由可以认为总体X服从某种类型的分布, 但这个分布的参数还是未知的。
例如本市家庭的月收入X是个随机变量,X服从什么
分布事先是不清楚的,根据资料可确信 X ~ N , 2 .
但 , 2 究竟取什么值还是未知的,
由于总体X的分布是未知的,因此X的数字特征如 均值、方差等往往也是一个未知的值。对于这些未知
不过在统计研究中,人们关心总体仅仅是关心
其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布
情况. 这时,每个个体具有的数量指标的全体就是总体.
称总体中所含个体的数目为总体容量, 总体容量有限的称为有 限总体, 总体容量无限的称为无限总体.
当个体个数很大时通常把有限总体看作无限总体。
从另一方面看: 统计的任务,是根据从总体中抽取的样本, 去推断总体的性质. 由于我们关心的是总体中的个体的某项指标(如人的身高、体重, 灯泡的寿命,汽车的耗油量…), 所谓总体的性质,无非就是这 些指标值集体的性质. 概率分布是刻划这种集体性质最适当的工具. 因此在理论上可 以把总体与概率分布等同起来. 如研究某批灯泡的寿命时, 关心的数量指标就是寿命, 那么, 此 总体就可用描述其寿命的随机变量 X 或用其分布函数 F(x)表示.
一个统计量.
ex1.设 X1, X 2, X3 是取自正态总体 X ~( , 2) 的一个样本,

第一章 数理统计的基本概念

第一章  数理统计的基本概念

第一章 数理统计的基本概念数理统计与概率论一样,也是研究随机现象统计规律性的一门数学学科.概率论主要研究在已知随机变量服从某种分布的情况下,讨论随机变量的性质、数字特征、随机变量序列的极限等.但是,对实际问题中的一个随机变量来说,如何判断它服从某种分布,如果知道它服从某种分布,又该如何确定其中的参数,这些问题概率论都没有涉及,它们都是数理统计研究的内容.并且这些问题的研究都直接或间接建立在试验的基础上.数理统计学就是利用概率论的理论,对要研究的随机现象进行多次独立重复的观察或试验,研究如何合理地获得数据,如何对所获得的数据进行整理、分析,如何对关心的问题进行估计或推断的一门数学学科.数理统计由基本原理和应用方法两大内容组成.本章介绍数理统计的基本概念和抽样分布.§1.1 基本概念一、总体与样本用数理统计研究某个问题时,把研究对象的全体称为总体(或母体),而把每一个研究对象称为个体.例如,一批灯泡的全体就组成一个总体,其中每一个灯泡是一个个体.再例如,一群人(一个班或一个年级)的全体就组成一个总体,其中每一个人是一个个体.在数理统计中,我们关心的并不是组成总体的各个个体本身,而是与它们的性能相联系的某个数量指标或者多个数量指标.例如,在研究一批灯泡组成的总体时,可能关心的是灯泡的使用寿命这个数量指标.再例如,在研究一群组成的总体时,可能关心的是人的身高和体重等多个数量指标.因此,总体可以认为是研究对象的全体的一个或多个数量指标.在研究一批灯泡组成的总体时,可能关心的是灯泡的使用寿命的分布情况.由于任何一个灯泡的寿命事先是不能确定的.而每一个灯泡都确实对应着一个寿命值,所以我们可认为灯泡寿命是一个随机变量.也就是说,我们把总体与一个随机变量(如灯泡寿命)联系起来.因此,对总体的研究就转化为对表示总体的随机变量的统计规律的研究,所以,今后我们说到总体,指的是一个具有确定概率分布的随机变量(但它的分布又是未知的或至少分布的某些参数是未知的),而每个个体则是随机变量可能取的每一个数值.为了推断出这批灯泡的使用寿命的分布(或这批灯泡的次品率),最精确的办法就是把每个灯泡的使用寿命都测试出来.然而,寿命试验是破坏性试验,即使是非破坏性试验,考虑到试验要花费时间、人力和钱,我们只能从总体中抽取一部分(个个体)进行试验(称这个个体为容量是的样本),试验结果可得一组数值,其中是第i 个个体的试验结果,我们要根据这组数值对总体n n n ),,,(21n x x x L i x ξ进行推断,这样对试验的抽取方式就有一定的要求.首先,要求抽取必须是随机的,即每次每个个体被抽到的机会是等可能的,这样被抽到的个体才具有代表性,即每每次抽取的都具有总体的特征.其次,抽取必须是独立的、即每次抽取互不影响.也就是每次抽取后不能改变总的成分,这就要求.如果试验是非破坏性的,那么抽取时应该是有放回的;如果试验是破坏性的,那么总体应该是无限的.或是很大的.满足以上两个条件的抽取方式称为简单随机抽样.用简单随机抽样方法对—次抽取个个体的试验结果而言是一组数值,但是它又随着每次抽样的不同而变化,因此,实际上是维随机变量n ),,,(21n x x x L n ),,,(21n x x x L ),,,(21n ξξξL 的一次观察值.即在抽样试验之前,将要抽取的样本可以认为是维维随机变量n ),,,(21n ξξξL n ξξξ,,,21L .又因抽样具有代表性和独立性,所以是相互独立同分布随机变量,每个都与总体ξ同分布的.我们称),,,(21n ξξξL 为总体ξ的容量为的简单随机样本,简称为样本.抽样试验后的结果称为样本n ),,,(21n x x x L ),,,(21n ξξξL 的观察值.由所有样本值组成的集合ℵ称为样本空间.),,,(21n ξξξL 设总体ξ的分布函数,则)(x F ξ的联合分布函数为的样本,1x ),,,(),,(22112n n n x x x P x x F =ξ<ξ<ξ<L L .∏∏===<=ni i ni i ix F x P 11)()(ξ),,,(21n ξξξL )(x ϕξ为连续型随机变量,且有密度函数为.则其样本如果总体为n 维连续型随机变量,且联合密度函数为:∏==ni i n x x x x 121)(),,,(ϕϕL .i i p a P ==)(ξL ,2,1=i ξ为离散型随机变量,且分布律为,,则其样本如果总体),,,(21n ξξξL 为维离散型随机变量,且联合概率函数为:n ∏======ni i n n x P x x x P 12211)(),,,(ξξξξL ,其中,.L ,,21a a x i =n i ,,2,1L = 例1 设总体,求样本),(~2σμξN ),,,(21n ξξξL 的联合密度函数.),,,(21n ξξξL 解: 样本的联合密度函数为∏=−−=ni x i e12)(2221σμσπ∏==ni i n x x x x 121)(),,,(ϕϕL∑⎟⎠⎞⎜⎝⎛==−−ni i x n e122)(2121μσσπ. 例2 设总体),(~p N B ξ,即,,.求总体k N kk N p p C k P −−==)1()(ξN k ,,1,0L =),,,(21n ξξξL 10<<p ξ的联合分布律.的样本),,,(21n ξξξL 的联合分布律为解: 样本∏===ni i x P 1)(ξ),,,(2211n n x x x P ===ξξξL. ∏=−∑−∑===ni x N x nN x i ni ini iC p p111)1(∏=−−=ni x N x x Niii p p C 1)1(二、统计量从总体中抽出样本的观测值后,只是得到了一组静态的数据.对于这些数据要进行处理,才能解决我们所关心的问题.有时候我们可能只想估计出总体的期望或者方差,有时候我们可能想了解总体的分布,对于不同的问题,必须对数据进行不同的处理,这就需要构造样本的不同函数.样本的函数常称为统计量.),,,(21n T ξξξL n ξξξ,,,21L n ξξξ,,,21L ξ定义: 设为取自总体的一个样本,样本的函数,且不含未知参数,则称),,,(21n T ξξξL 为统计量.如果是样本),,,(21n x x x L ),,,(21n x x x T L ),,,(21n ξξξL 的一个观测值(观察值),则称是统计量),,,(21n T ξξξL 的一个观测值(观察值).例3 设总体,),(~2σμξN μ未知,为已知,2σ),,,(21n ξξξL ξ为的一个样本,则∑=n i i 121ξσ是统计量.而∑不是统计量.=−ni i12)(μξn ξξξ,,,21L 根据统计量的定义,它是随机变量的函数,因此统计量也是一个随机变量,它也有概率分布.统计量的分布称为抽样分布.但要注意,尽管一个统计量不合任何未知参数,但它的分布却可能含有未知参数.例4 设621,,,ξξξL 是来自),0(θ上的均匀分布的样本,0>θ未知.指出下列样本函数中哪些是统计量,哪些不是?为什么?66211ξξξ+++=L T θξ−=62T 163EX T −=ξ},,,max{6214ξξξL =T ,,,.解:和是,和不是.因为和中不含总体中的未知参数1T 4T 2T 1T 4T 3T θ,而和中含有未知参数2T 3T θ.常用统计量n ξξξ,,,21L ξ设为取自总体的一个样本,∑==+++=ni i n n n 1211)(1ξξξξξL (1)样本均值:;[]∑∑==−=−=−++−=n i i n i i n n n n S 1221222121)(1)()(1ξξξξξξξξL (2)样本方差:;∑∑==−−−=−−=n i i n i i n n n n S 122122*111)(11ξξξξ(3)修正样本方差:;∑=−=ni i n S 12)(1ξξ; (4)样本标准差:∑=−−=ni i n S 12*)(11ξξ(5)修正样本标准差:; ∑===n i ki kk n A 11ξξL ,2,1=k (6)样本k 阶原点矩: , ;∑=−=n i ki k n B 1(1ξξL ,3,2=k (7)样本k 阶中心矩: .,若是样本),,,(21n x x x L ),,,(21n ξξξL 的一组观测值,则∑=−=n i i x x n s 12)(1∑=−=n i i x x n s 122(1∑=−−=n i i x x n s 122*(11∑==n i i x n x 11、、、、∑=−−=n i i x x n s 12*)(11∑===n i k i kk x n x a 11∑=−=n i k i k x x n b 1)(1、、 分别是样本均值、样本方差、修正样本方差、样本标准差、修正样本标准差、样本k 阶原点矩、样本k 阶中心矩的.例5 从—批机器零件毛坯中随机招取8件,测得其重量(单位:kg)为230,243,185,240, 228,196,246,200.求样本均值、样本方差和样本二阶原点矩的观测值.221)200246196228240185243230(8111=+++++++==∑=n i i x n x 解:;[]25.495)221200()221243()221230(81)(1222122=−++−+−=−=∑=L n i i x x n s ;25.49336)200243230(811222122=+++==∑=L n i i x n x 。

数理统计的基本概念

数理统计的基本概念

且相互独立
X / n X ~ t ( n 1) ( n 1) S 2 S / n 2 ( n 1)
说明:
X ~ N ( , 2 )
X 已 知 : U ~ N (0,1) / n
1. 未知, X
X 未知: t ~ t (n 1) S/ n
2
估计
EX
1 n 2 估计 ( 2) 样 本 方 差 S : ( Xi X ) n 1 i 1
DX
n 1 : ( X1 X ) ( X 2 X ) ( X n X ) 0
受到1个约束,独立的变量个数为n-1
( 3) 样本标准差 : S
1 n 估计 ( X i X )2 n 1 i 1
Y X X X ~ (n)
2 1 2 2 2 n 2
n
独立的r.v. 的个数
2
(4) 分位点 ( n)
P (n) n
2 2


X 轴上的一个数
P (n) n
2 2


2 (n )
2 ( n) 有表可查(P217附表5)
n1 1 2
n1 1 n2
y

n1 n2 2
,
y0
(2)构造性定理
设 X ~ 2 ( n1 ), Y ~ 2 ( n2 ), 相互独立,则有
X / n1 F ~ F ( n1 , n2 ) Y / n2 1 显然, ~ F ( n1 , n2 ), 则 ~ F ( n2 , n1 ) F F (3) 分位点F ( n1 , n2 )
四. 正态总体统计量的分布Fra bibliotek前提条件:X ~ N ( , 2 ), X1 , X2 ,, Xn ~ N ( , 2 ), 相互独立

数理统计的基本概念

数理统计的基本概念

数理统计的基本概念
1. 总体和样本:总体是研究对象的全体,样本是从总体中选取的一部分。

2. 参数和统计量:参数是总体的性质,统计量是样本的函数,用来估计总体的参数。

3. 随机变量和概率分布:随机变量是取值不确定的变量,概率分布是描述随机变量取值可能性的函数。

4. 分布特征:包括均值、方差、标准差、偏度和峰度等。

5. 假设检验:用样本的统计量推断总体参数的方法。

6. 置信区间:用来估计总体参数的区间,表示参数真值有一定概率落在该区间之内。

7. 方差分析:用来比较多组数据的差异来源和大小的方法。

8. 回归分析:用来研究自变量和因变量之间关系的方法。

数理统计学的基本概念

数理统计学的基本概念

第六章数理统计的基本概念一、教学要求1理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。

2. 了解一J分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。

3. 掌握正态总体的某些常用统计量的分布。

4 .了解最大次序统计量和最小次序统计量的分布。

本章重点:统计量的概念及其分布。

二、主要内容1. 总体与个体我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。

在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。

设x为总体的某个数值指标,常称这个总体为总体X。

X的分布函数称为总体分布函数。

当X为离散型随机变量时,称X的概率函数为总体概率函数。

当X为连续型随机变量时,称X的密度函数为总体密度函数。

当X服从正态分布'--时,称总体X为正态总体。

正态总体有以下三种类型:(1)“未知,但b已知;(2)丁未知,但-已知;(3)宀和’均未知。

2. 简单随机样本数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。

要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据兀、门宀-,这一过程称为抽样。

由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为J-" " ' ■■,n维随机向量(:「…J -)称为样本。

n称为样本容量。

(「匕…二)称为样本观测值。

如果样本满足(1)二:相互独立;(2)'-'-…■"服从相同的分布,即总体分布;则称'L)为简单随机样本。

简称样本。

设总体X的概率函数(密度函数)为「儿,贝U样本(二匚…凡)的联合概率函数(联合密度函数为)(i ) 样本均值: (2) 样本方差: Ri-L/3j-l Hi-1(3) 它们的观察值分别为:1 ”Ki-1Q = -2(^ -无『=-£x i -样本标准差:4炉=上丈可-尹这些观察值仍分别称为样本均值、样本方差和样本标准差。

数理统计学的基本概念

数理统计学的基本概念
数理统计学是研究统计工作的一般原理与方法的科学,它主要阐述如何搜集、整理、 分析统计数据,并据此对未知参数给出估计,或做出某种统计推断.如何获取数据的阶 段称为“统计计划”,包括抽样技术、试验设计等分支;有了数据以后,通过分析数据 达到某种结论,作出某种判断的阶段称为“统计推断”,包括参数估计和假设检验两个 主要部分.
但还应注意到,如上文所指出的:因 X 估计接受的准则定为 X ≥ l1 , l1 是某选定的数,可以大于、等于或 小于 l , l1 定得大些,表示我们的检验更严格,这在对元件质量要求很高且供货渠道较 多时可能是适当的.反之, l1 定得小些,表示检验更宽,这在对元件质量要求不很高, 或急需这些元件而供货渠道很少时,也可能采取.从统计上说,无论你怎么定 l1 ,理论 上你都可能犯两种错误之一:一是元件平均寿命达到要求而你拒收,一是元件平均寿命
数理统计学是一门应用性很强的学科,有其方法、应用和理论基础.在西方,“数 理统计学”一词是专指统计方法的数学基础理论那部分而言.在我国则有较广的含义, 即包括方法、应用及理论基础都在内,而这在西方是称为“统计学”.在我国,因为还 有一门被认为是社会科学的统计学存在,这两个名词的区别使用,有时是必要的.
达不到要求而你接受了,这两种错误各有一定的规律,它们在很大程度上决定了接受准
则 X ≥ l1 中的 l1 选择.
153
第二个问题与第一个问题不同:它不是要求对分布中的未知参数作出估计,而是
要在两个决定(就本问题而言就是接受或拒收该批产品)中选择一个.这类问题称为假
设检验问题,也是数理统计的重要内容之一.
本例提出的第一个问题称为参数估计问题,因为 λ 是元件寿命分布中的一个未知
参数,而我们的问题是要估计具有决定性的一个量,即1/ λ .也可以把问题提为要求估

数理统计基础知识(一)(1)

数理统计基础知识(一)(1)

数理统计的基本概念

c x0
CxnPx(1-P)n-x值表
c 0 1 0 1 2 0 1 2 3 0 1 2 3 4 0 1 2 3 4 5 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 p 0.001 0.9980 1.0000 0.9970 1.0000 0.9960 1.0000 0.002 0.9960 1.0000 0.9940 1.0000 0.9920 1.0000 0.003 0.9940 1.0000 1.9910 1.0000 0.9881 0.9999 1.0000 0.9851 0.9999 1.0000 0.005 0.9900 1.0000 0.9851 0.9999 1.0000 0.9801 0.9999 1.0000 0.9752 0.9998 1.0000 0.01 0.9801 0.9999 0.9703 0.9997 1.0000 0.9606 0.9994 1.0000 0.9510 0.9990 1.0000
数理统计的基本概念 随机变量 如果事前我们无法准确地知道变量的具体取值,这样的变量 就是随机变量;在6西格玛项目中,我们处理的大都是随机变 量。如: 每周所收到的定单的数量; 每批零件的报废数量; 每天接到的顾客服务电话数量;
每批产品的交付时间;
每个零件的加工尺寸等。 概率是研究随机变量的工具
数理统计的基本概念
是整数的X的值,相应的分布函数值列在中间。
例:设随机变量X服从二项分布b(8,0.01),求P(X≤2)及P(X=2). 解:由于P(X≤2)=F(2), 这里n=8,p=0.01,c=2, F(2)=0.9999,即P(X≤2)=0.9999 同理可查出F(1)=0.9973, 因此:P(X=2)=F(2)-F(1)=0.9999-0.9973=0.0026

数理统计的基本概念

数理统计的基本概念

i 1
若总体X是持续型r.v. ,d.f.为f(x),则样
本的联合d.f.为
n
fn( x1, x2 ,, xn ) f ( xi )
i 1
若总体X是离散型r.v. ,其概率分布为
p(x)=P(X=x),则样本的概率分布为: n
pn (x1, x2, , xn ) P(X1 x1, X2 x2, , Xn xn) p(xi ).
注:在统计研究中,人们关心总体仅仅是关心其每个 个体的一项(或几项)数量指标和该数量指标在总体中 的分布状况.这时,每个个体含有的数量指标的全体就 是总体.
样本 —— 从总体中抽取的部分个体. 用 ( X1, X 2,, X n )表示, n 为样本容量.
称 (x1, x2,为,总xn体) X 的一个容量为n
★K.皮尔森在1990年提出了检验拟合优
度的 2统计量,并证明了其极限分布就是 2分布。
★K.皮尔森的学生英国医生戈塞特1908
年导出了 t统计量的精确分布— t分布,开
创了小样本的先河。
★费希尔系统发展了正态分布总体下多 个统计量的抽样分布理论;建立了以极 大似然预计为中心的点预计理论;创立
了实验设计,并发展了对应的数据分析 办法——方差分析。
k 1
n ik e
sn
e n
k 1 ik !
i1 !i2 ! in !
其中ik (1 k n)取非负整数,sn i1 i2 in.
统计推断:运用总体的样本信息对未知的总
体分布进行推断。
总体、样本及样本值间的关系
总体(理论分布)?
样本值
样本
样本是联系两者的桥梁
总体分布决定了样本取值的概率规律,也就 是样本取到样本值的规律,因而能够由样本 值去推断总体.

数理统计的基本概念

数理统计的基本概念

其 中
1 n1 X = ∑ Xi n1 i =1
2

Байду номын сангаас
1 Y= n2 Sw
2
∑Y
i =1
n2
i
1 n1 2 S1 = ∑(X − X ) n1 − 1 i =1 i
2
1 n2 2 S2 = ∑ (Y − Y ) n2 − 1 i =1 i

( n1 − 1) S12 + ( n2 − 1) S 2 2 = n1 + n2 − 2
第五章 数理统计的基本概念 总体、 第一节 总体、样本及统计量 一.总体 将研究对象的某项数量指标值的全体称为总体, 将研究对象的某项数量指标值的全体称为总体,而构 成总体的每个元素称为个体, 例如, 要考察某批灯泡的寿命, 成总体的每个元素称为个体, 例如, 要考察某批灯泡的寿命, 则所有灯泡的寿命构成总体,每个灯泡的寿命即为个体。 则所有灯泡的寿命构成总体,每个灯泡的寿命即为个体。 研究总体时,关心的是个体在总体中的分布—— ——总体 研究总体时,关心的是个体在总体中的分布——总体 分布或理论分布,例如,要考察某批灯泡的寿命,用 X 表示 分布或理论分布,例如,要考察某批灯泡的寿命, 灯泡的寿命, 灯泡的寿命 ,记 F ( x ) = " X ≤ x " 的灯泡在各批灯泡中所占的比 为总体分布。 例,则 F ( x ) 为总体分布。
代入上述统计量, 将样本值 x1 , x2 ,⋯ , xn 代入上述统计量, 就得到相应的观测值或现 实:
1 n x = ∑ xi n i =1
n 2 1 n 1 s = ( xi − x ) = ( ∑ xi 2 − n x ) ∑ n − 1 i =1 n − 1 i =1 2

6.1.数理统计的基本概念

6.1.数理统计的基本概念

对容量较小的样本可分为5-6组,容量100左右的可分7-10组,
容量200左右的可分9-13组,容量300左右及以上的可分12-20 组,目的是使用足够的组来表示数据的变异。本例中只有20个 数据,我们将之分为5组,即k=5。
(2) 确定每组组距:每组区间长度可以相同也可以不同,实用中 常选用长度相同的区间以便于进行比较,此时各组区间的长度 称为组距,其近似公式为:
频数fi
3
4
8
3
2
试写出此分组样本的经验分布函数。
解:由经验分布函数的定义得到
0
0.15
Fn
(
x)
0.35 0.75
0.9
1
x 37.5 37.5 x47.5 47.5 x57.5 57.5 x67.5 67.5 x77.5 x 77.5
例6 以下是一组来自标准正态分布总体的样本的观测值: -1.4462 , -0.7012 , 1.2460 , -0.6390 , 0.5774 , -0.3600 , -0.1356, -1.3493 , -1.2704 , 0.9846
13
100—110
105
16
110—120
从总体X中抽取一个个体,就是对总体X进行一次观察并记 录其结果。取样是随机的,且观察前无法预知起结果,故每 个观察结果都是随机变量,且与总体同分布。
定义 1 在相同的条件下,对总体X进行n次重复的、独立的 观察,得到n个结果 X1, X 2 , , X n ,称随机变量X1, X 2 , , X n 为来自总体X的容量n的简单随机样本,简称样本。其观测值
641 635 640 637 642 638 645 643 639 640 这是一个容量为10的样本的观测值,对应的总体为该厂生产 的瓶装啤酒的净含量。

2数理统计的基本概念

2数理统计的基本概念

数理统计的基本概念重点:总体,样本,统计量,三个重要抽样分布 难点:抽样分布.数理统计是运用概率论的知识,研究如何有效地对带有随机性影响的数据进行收集、整理、分析和推断的学科,由于随机性现象广泛存在于工、农业生产、工程技术、自然科学和社会科学等领域中,因此数理统计有着最广泛的应用。

一、总体和样本数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个元素称为个体。

例如研究一批灯泡的平均寿命时,该批灯泡的全体构成了研究的总体,其中每个灯泡就是个体。

在实际问题中,研究对象往往是很具体的事物或现象,而我们所关心的不是每一个个体的种种具体的特征,而是其中某项或某几项数量指标,记为X 。

在上例中,X 即指该批灯泡的寿命。

对不同的个体,X 的取值一般是不同的。

例如在试验中观察若干个个体就会得到X 的一种数值但在试验或观察之前,无法确定会得到一组什么样的数值,所以X 是一个随机变量或随机向量,而X 的分布也就完全描述了我们所关心的指标,即总体的分布。

为方便起见,以后我们将X 的可能取值的全体组成的集合称为总体,或直接称X 为总体,X 的分布也就是总体的分布。

总体分布一般是全部或部分未知的,为了研究总体X 的分布规律,从总体中随机地抽出若干个个体进行观察或实验,称为随机抽样观察,从总体中抽出的若干个个体称为样本,一般记为),,,(21n X X X 或n X X X ,,,21 ,n 称为样本容量。

而一次具体的观察结果),,,(21n x x x 是完全确定的一组数值,称为样本观测值,它随着每次抽样观察而改变。

因此,容量为n 的样本),,,(21n X X X 是n 维随机向量,而具体的观测值),,,(21n x x x 是随机变量),,,(21n X X X 的一个样本观测值。

随机抽样的目的是为了对总体X 的分布进行各种分析推断,所以要求抽取的样本能很好地反映总体的特性,为此我们要求随机抽取的样本),,,(21n X X X 满足:(1)具有代表性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分布函数为
独立 n
F*(x1,x2,,xn) F(xi). i1
特别的,若X的概率密度为f(x),则 X1,X2,,Xn的联合
概率密度为
A
河南理工大学精品课程
8
概率论与数理统计
n
f*(x1,x2,,xn) f(xi). i1
若X的概率分布为p(x),则 X1,X2,,Xn的联合概率分
布为
n
p*(x1,x2,,xn) p(xi). i1
体。
灯泡的寿命检验是一个破坏性试验,即当得知一个灯
泡寿命时,该灯泡的使用价值也就消失了.因此,不可能抽
检每个灯泡! 可以逐一测量每个工大男生的身高,但工作量大.而我
们仅需对工大男生身高情况有个大致了解,因此,不必要抽
测每个工大男生!
河南理工大学精品课程
A
概率论与数理统计 4
做法 从总体中随机地抽取若干个体(灯泡、工大男 生),测试其所需数据(寿命、身高),最后对所得数据通过 整理加工和分析来推断总体(这批灯泡寿命、工大男生身 高)的分布情况,从而了解整体情况.
①、X ~ N(,2 ).
n
②、(n1)S2
2
~2(n1);
③、 X ~t(n1);
河南理工大学精品课程
A
概率论与数理统计 18
❖ 2 (n)-分布的概率密度为
f(x)2n/21(n/2)xn21e2x,
0,
x0, 其它 .ห้องสมุดไป่ตู้
f (x)
n 1
n5
n 15
O
A
河南理工大学精品课程
x
19
概率论与数理统计
2 (n)-分布的性质与数字特征
2 (n) -分布的可加性:
X ~ 2 ( n 1 ) Y ~ ,2 ( n 2 ) 且 X , , Y 独 X Y ~ 立 2 ( n 1 n 2 )
A
13
概率论与数理统计
说明
(修正)样本方差还可表示为
S2
1
n
[
n1 i1
Xi2nX2]
【推导】
S2
1n n1i1(Xi
X)2
n1 1i n1(Xi22XiXX2) n1 1[i n1Xi22Xi n1Xii n1X2]
n1 1[i n1Xi22nX2nX2]
1
n
[
n1 i1
Xi2 nX2]
2 (n) -分布的期望与方差为:
E(2)n,D (2)2n.
上α分位点(双侧α/2分位点)
定义 点 2 (n) 为 2 (n) 分布的上α分位点
P { 2 2(n ) } (0 1 ).
A
河南理工大学精品课程
20
概率论与数理统计
查附表5[P.443]:
0 2 .9(1) 26 .3,00 2 .9 49 (1 5) 02 .1.56
A
概率论与数理统计 7
定定义义22 设总体X的分布函数为F,若X1,X2,…,Xn
是相互独立且具有相同分布函数F的n个随机变量,则称
之是来自总体F(分布函数F,总体X)的容量为n的(简单随
机)样本,其观察值 x1,x2,,xn 称为样本值。
显然,若X的分布函数为F(x),则 X1,X2,,Xn 的联合
A
概率论与数理统计 10
总体X
随机抽样 获得样本
样本X1,X2,…,Xn
完成试验 获得数据
样本值x1,x2,…,xn
整理加工 统计推断
统计 工作
A
河南理工大学精品课程
11
概率论与数理统计
§2、抽样分 一布、统计量
样本是进行统计推断的依据。但在实际应用时,一
般不是直接使用样本本身,而是对样本进行整理和加工,
A
河南理工大学精品课程
9
概率论与数理统计
三、数理统计的基本任务
样本来自总体,必然携带有反映总体性质的各种信 息。
数理统计的基本任务就是通过对样本的研究来对总 体的未知参数或分布类型作出估计,对有关总体的假设 作出推断。
后面介绍的内容仅限于有关总体参数的估计与推断, 称为参数估计与参数假设检验。
河南理工大学精品课程
F分布上α分位点 f (x) 有如下性质:
1
F1(n1,n2)F(n2,n1)
查附表5[P.447]:
河南理工大学精品课程
O
x
F(n1,n2)
F 0.9(51,9 A2)F 0.0(5 19,1)22.1 80 0.325 8 7
概率论与数理统计
F分布的 分 上位点具有如 : 下性质
F1(n1,n2)F(n12,n1).
E(X),D (X)2,
X1,X2,,Xn 是来自X (无论X服从何种分布!)的一个
样本,则总有:
E(X),D(X)2.
n
特别的,当 X~N(,2)时,样本均值
河南理工大学精品课程
X ~ N(,2 ).
n
A
概率论与数理统计31
对于单正态总体N(μ,σ2)的均值与方差有:
定理1 设 X1,X2,,Xn是来自正态总体N(μ,σ2)的 样本,则
个体.
例如,检验灯泡厂生产的灯泡寿命:受检的全体灯泡就
是总体,每个灯泡就是个体。也可理解:全体灯泡寿命数
值构成总体,每个灯泡的寿命数值为一个体。
A
河南理工大学精品课程
3
概率论与数理统计
又如,调查工大男生身高情况:工大全体男生就是总
体,每个工大男生就是一个个体。也可理解:全体工大男
生身高数值构成总体,每个工大男生身高数值就是一个个
24
概率论与数理统计
双侧α/2分位点: t1/2(n)t,/2(n)
f (x)
/2
/2
显然,
t1/2(n) O t /2 (n) t1/2(n)t/2(n)
A
河南理工大学精品课程
x
25
概率论与数理统计
3、F-分布
定义 设 X~2(n 1)Y ,~2(n2)且, X与Y独立,则
称随机变量
F X / n1 Y / n2
服从自由度为(n1,n2)的F-分布,记为 F~F(n1,n2).
❖ F-分布的概率密度为
n1 n11
f(x) [(n1n2)/2](n1/n2)2x2 n1n2 , x0,
(n1/2)(n2/2)1[(n1x/n2)]2
0,
其它 .
河南理工大学精品课程
A
概率论与数理统计26
f (x)
n110,n225
即针对具体问题构造适当的函数—统计量,利用这些函数
来进行统计推断,揭示总体的统计特性.
定义3 设X1,X2,…,Xn是来自总体X的样本,x1,x2,
…,xn为其样本值,则称不含任何总体分布中未知参数的
连续函数g(X1,X2,,Xn)为统计量,相应实数 g(x1,x2,,xn)
称为其观察值。
河南理工大学精品课程
A
河南理工大学精品课程
14
概率论与数理统计
❖ 样本方差
S*2
1 n
n i1
(Xi
X)2
n 1 S2 n
样本均值是样本一阶原点矩;样本方差是样本二阶
中心矩。
上述各统计量的观察值为
x
1 n
n i 1
xi
s2
1 n n1i1
(xi
x)2
ak
1 n ni1
xik(k1,2,)
bk 1 ni n1(xi x)k(k1,2,)
第六章 数理统计的基本概念
总体与样本 统计量 χ2-分布,t-分布和F-分布 关于正态总体的重要定理
河南理工大学精品课程
A
概率论与数理统计 1
简介
概率论是数理统计的理论基础,数理统计是概率论 的重要应用。
数理统计是以概率论的理论为基础、通过试验所得 数据来研究随机现象的一门数学分支,应用广泛,内容 丰富。
双侧分位点
12/2(n),2/2(n)
查附表5:
0 .0,2 5 0 .0,2 1 2 /5 2 (1) 50 2 .9( 7 15 ) 5 6 .2,62
2/2(1)5 0 2.02 (1 5)5 2.4 788
A
河南理工大学精品课程
21
概率论与数理统计
2、t-分布
定义 设 X~N(0,1)Y , ~2(n)且, X与Y独立,则称
A
概率论与数理统计 12
常用统计量有: 样本均值
(修正)样本方差
X
1 n
n i 1
Xi
S2 n11in1(Xi X)2
(修正)样本标准差 S S2 n1 1i n1(Xi X)2
样本k阶原点矩
Ak
1n
ni1
Xik(k1,2,)
样本k阶中心矩
河南理工大学精品课程
B k1 ni n1(Xi X)k(k1,2,)
n11,0n25
O
x
F-分布的性质
由F分布定义可得:
F~F(n1,n2) F 1~F(n2,n1)
A
27
河南理工大学精品课程
概率论与数理统计
上α分位点(双侧α/2分位点)
定义 点 F(n1,n2)为 F(n1,n2) 分布的上α分位点
P { F F (n 1 ,n 2 ) } (0 1 ).
“从总体中抽取一个个体”就是对总体进行一次 观
察(试在验相),并同记条录件其下数对据总结体果X进. 行n次独立、重复的观察,
将n次试验结果依次记为 X1,X2,,Xn ,则称之为来自 总体X的容量为n的一个简单随机样本;n次试验完成后
所得样本的一组观察值 x1,x2,,xn 称为样本值.
相关文档
最新文档