样本及抽样分布知识讲解

合集下载

统计学中抽样和抽样分布基础知识

统计学中抽样和抽样分布基础知识
从无限总体的抽样 无限总体的随机样本 如果从一个无限总体中抽取一个容量为n的样本,使得以下条件被满足 抽取的每个个体来自于同一总体 每个个体的抽取是独立的
样本均值的抽样分布
定义:样本均值的所有可能值的概率分布 样本均值的数学期望:对于简单随机样本时,样本均值的数学期望与总体均值相等 样本均值样本中具有感兴趣特征的个体个数/样本容量 样本比率的抽样分布:是样本比率的所有可能值的概率分布
样本比率的数学期望:样本比率的数学期望与总体比率相等 样本比率的标准差
有限总体:有限总体修正系数*无限总体样本比率的标准差 无限总体:根号下p(1-p)/n 样本比率的抽样分布的形态 当样本容量足够大,同时np≥5和n(1-p)大于等于5时,样本比率的抽样分布可以 用正态分布近似
统计学中抽样和抽样分布基础知识
抽样基本属于
抽样总体:抽取样本的总体 抽样框:用于抽选样本的个体清单 参数:总体的数字特征
抽样
从有限总体的抽样 建议采用概率抽样 简单随机样本:从容量为N的有限总体中抽取一个容量为n的样本,如果容量为n 的每一个可能的样本都以相等的概率被抽出,则称该样本为简单随机样本 无放回抽样和有放回抽样 无放回抽样:被抽取对象已经选入样本,不希望该对象被多次选入 有放回抽样:对已经出现过的随机数仍选入样本
点估计
样本统计量:为了估计总体参数,计算样本的特征 抽样总体和目标总体
目标总体是我们想要推断的总体 抽样总体是指实际抽取样本的总体 点估计的性质 无偏性:样本统计量是相应总体参数的无偏估计量 有效性:采用标准误差较小的点估计量,给出的估计值与总体参数更接近 一致性:大样本容量给出的点估计与总体均值更接近
其他抽样方法
分层随机抽样:总体中的个体首先被分成层,总体中的每一个体属于且仅属于某一 层,从每一层抽一个简单随机样本 整群抽样:总体中的个体首先被分成单个组,总体中的每一个个体属于且仅属于某 一群,有群为单位抽取一个简单随机样本 系统抽样:对容量很大的总体,第一个个体为随机抽样,总体个体排列时个体的随 机顺序 方便抽样:非概率抽样 判断抽样:对总体非常了解主观确定总体中认为最具代表性的个体组成样本

概率论 第六章 样本及抽样分布

概率论 第六章 样本及抽样分布
函数Fn(x)为 Fn(x)=S(x)/n , -∞<x< +∞。
一般,设 x1,x2, …,xn 是总体F的一个容 量为n的样本值,先将x1,x2, …,xn 按自小到 大的次序排列,并重新编号,设为
x(1) ≤x(2) ≤…≤x(n) 则经验分布函数Fn(x)的观察值为
0,
若x x(1) ,
性质:
(1) limf (t)
1
e ; t2 2
n
2
(2)当n 45时 取t (n) Z .
(三)设X~2(n1), Y~ 2(n2), 且X 与Y相互独立,则随机变量
F X/ n1 Y / n2
则称F服从第一自由度为n1,第二自由 度为n2的F分布,记作
F~F(n1 ,n2)
F分布的分布密度为
2 2
E( X 2 ) D( X ) (E( X ))2
2 2
n
E(S 2 )
E[ 1 n 1
n i 1
(Xi
X
)2 ]
E[
1
n
(
n 1 i1
X
2 i
2
n X )]
1
n
E(
n 1 i1
X
2 i
nX
2
)
1 [E( n 1
n i 1
X
2 i
)
E(n X
2
)]
1[ n 1
n i 1
考察某厂生产的电容器
的使用寿命。在这个试验 中什么是总体,什么是个 体。
解 个体是每一个电容器 的使用寿命;总体X是各个 电容器的使用寿命的集合。
2. 样本
为推断总体分布及各种特征,按一定规 则从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本. 样 本中所包含的个体数称为样本容量.

样本及其抽样分布基本概念

样本及其抽样分布基本概念
概率论与数理统计优质学案
第六章
样本及抽样分布
第1,2节 基本概念
一、总体、个体 二、随机样本、直方图 三、样本函数与统计量 四、小结
一、总体与个体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体), 总体中每个成员称为个体.
总体
总体 …
研究某批灯泡的心每个 个体的一项(或几项)数量指标和该数量指标 在总体中的分布情况. 这时,每个个体具有 的数量指标的全体就是总体.
直方图
5
8
4.5
7
4 6
3.5 5
3
2.5
4
2
3
1.5 2
1
1 0.5
0
0
140
150
160
170
180
190
200
147
157
167
177
187
197
三、统计量
由样本推断总体特征,需要对样本进行 “加工”,“提炼”.这就需要构造一些样本的 函数,它把样本中所含的信息集中起来.
1. 代表性: X1,X2,…, Xn中每一个与所考察的 总体X有相同的分布. 2. 独立性: X1,X2,…, Xn是相互独立的随机变量.
满足上述两条性质的样本称为简单随机样本. 获得简单随机样本的抽样方法称为简单随机抽样.
为了使大家对总体和样本有一个明确的 概念,我们给出如下定义:
定义 一个随机变量X或其相应的分布 函数F(x)称为一个总体.
4. 直方图 4.1 频数--频率分布表
样本数据的整理是统计研究的基础,整理数据的最 常用方法之一是给出其频数分布表或频率分布表。
例3 为研究某厂工人生产某种产品的能力, 我们随机调查了20位工人某天生产的该种产品 的数量,数据如下

抽样及抽样分布

抽样及抽样分布

分层抽样 概念:分层抽样又称类型抽样。首先将总体单
位按某一个标志分层;然后在各层按随机抽样的方 法分别抽出各层的样本。
特点:分层抽样在层内是抽样调查,层间是全面调
查,所以分层时应该尽量让每层内的变异程度小,
而层间的变异程度大。分层抽样的抽样误差较简单 随机抽样小,样本具有很好的代表性。
抽样平均误差的计算公式:
z
(
X 1
X
)
2
( 1
2
)
s2 1
s2 2
n1 n2
渐近服从标准正态分布。
如果: X1 和 X2 是两个非正态总体,当和样本容
量足够大,
z
(
X1
X
2
)
(1
2
)
s2 1
s2 2
n1 n2
渐近服从标准正态分布。
NEXT
二、样本成数及成数差的抽样 分布
成数的概念 样本成数的分布 两个总体样本成数差的分布
,则样本的成数为p n1
n

例如,某工厂生产某种电子元件,某批产品
共10000件,其中不合格品100件原则抽100件,其中
有3件不合格品,则样本的成数为p 3% 。
NEXT
样本成数的分布
用途:推断或估计总体的成数。例如某项改革 方案工人的支持率,产品的正品率等。
假设A、B、C、D、E5位同学的统计学成绩分别为: 80、 86、90、92、96。可计算得总体均值为88.8,总体方 差为29.76。现在随机从中抽容量为2的样本。
重复抽样的所有可能的样本:
样本(AA)(AB)(AC)(AD)(AE)
均值 80 83 85
86 88
样本 (BA)(BB) (BC) (BD)(BE)

第六章样本及抽样分布

第六章样本及抽样分布

n
(
Xi
)2
,
i 1
max{ X i }
1i n
为什么要求统计量不含任何未知参数
试验前 g(X1, X2 ,是, 随Xn机) 变量 试验后 g(X1, X2 ,是, 具Xn体) 的数值
与均值和方差 有什么不同?
X
1
n
n
i 1
Xi
为什么不是
1 n
(下章说明)
S2
1
n1
n
(Xi
i 1
X
)2
S
S2
6, 故Q0.75
Q3
1 2
(123
132)
127.5
Min 102, Max 150,作出箱线图如图所示
102 113.5 120
120 150
分布的形状与箱线图
QL 中位数 QU
QL 中位数 QU
QL 中位数 QU
左偏分布
对称分布
不同分布的箱线图
右偏分布
箱线图适合比较两个或两个以上数据集的性质
一 直方图
为了研究总体分布的性质,人们通过实验得到许 多观测值,一般来说这些数据实杂乱无章的,为了利 用它们进行统计分析,将这些数据加以整理,还借助 于表格或图形对它们加以描述。
例1:下面列出了84个伊特拉斯坎(Etruscan)人男子的 头颅的最大宽度(mm),现在来画这些数据的“频率直 方图”
1 2 3 4 5 6 7 8 9 10 11
76 90 97 71 70 93 86 83 78 85 81 65 95 51 74 78 63 91 82 75 71 55 93 81 76 88 66 79 83 92 78 86 78 74 87 85 69 90 80 77 84 91 74 70 68 75 70 84 73 60 76 81 88 68 75 70 73 92 65 78 87 90 70 66 79 68 55 91 68 73 84 81 70 69 94 62 71 85 78 81 95 70 67 82 72 80 81 77

概率论第六章样本及抽样分布

概率论第六章样本及抽样分布
2 1 2 2
本相互独立,记
1 n1 X Xi n1 i 1 1 n2 Y Yi n2 i 1
则有 ⑴
2 1 2 2 2 1 2 2
1 n1 S12 ( X k X )2 n1 1 k 1 1 n2 2 S2 (Yk Y ) 2 n2 1 k 1
S / ~ F (n1 1, n2 1) S /
⑵ 当 时
2 1 2 2 2
X Y ( 1 2 ) ~ N (0,1) 1 1 n1 n2
(n1 1) S12

2 1

2 (n2 1) S2

2 2
~ 2 (n1 n2 2)
X Y ( 1 2 ) ~ t (n1 n2 2) 1 1 S n1 n2
2
又因为
(n 1)S 2

2
~ (n 1)
2
X n1 X n
故 Y

(n 1) S 2
n n 1 ~ t (n 1) /(n 1)

2
X n1 X n Y S
n ~ t (n 1) n 1
例4
设总体X , Y 相互独立 X ~ N (0,32 ) , Y ~ N (0,32 ) ,
2
X n1 X n n X 1 , X 2 ,, X n , X n1 , 求 Y 的分布 . S n 1 1 n 1 n 2 2 其中 X n X i , S ( Xi X n ) n i 1 n 1 i 1
1 2 解 由已知得 X n1 ~ N ( , ) , X n ~ N ( , ) , n n 1 2 所以 X n1 X n ~ N (0, ) n n 标准化得 X n1 X n ~ N (0,1) n 1

第四章--样本及抽样分布课件

第四章--样本及抽样分布课件

如果g(X1,X2,…,Xn)中不含有未知参数,称g(X1,X2,…,Xn) 为统计量。
(不含未知参数的样本的函数)
PPT学习交流
18
如 X~N(,2) , 2 未知,
(X1,X2,…,Xn)为X的一个样本
X
1 n
n i1
Xi
n
X
2 i
i1
均为统计量
X
1
2
X
2 i
不是统计量
若μ已知,σ2未知, (X1,X2,…,X5)为X的一个样本
PPT学习交流
20
2. 经验分布函数
设 X1,X2,,Xn是总 F的 体 一个s样 (x) x本 ,用 表x示 1,x2,,xn中不x的 大随 于机变 . 量的个数
定义经验分布函数为
Fn(x)n1s(x) x 例设总体F具有一个样本1,1值 ,2,则经验分布函数
F3(x)的观察值为
0, 若x1
F3(x)
具体方法 ①随机数字法 ② 抽签法
PPT学习交流
6
2、优缺点
①对所有观察单位编号,当数量大时,有难 度
② 抽样误差的计算较方便
PPT学习交流
7
3、抽样误差的估计 有限总体与无限总体
总体类型 无限总体
有限总体
均数标准误
s n
s 1 n nN
率的标准误
p1 p
n 1
p1p 1 n
n1 N
PPT学习交流
体的情况——总体分布。样本是联系两者的桥梁。总
体分布决定了样本取值的概率规律,也就是样本取到
样本观察值的规律,因而可以用样本观察值去推断总
体。
PPT学习交流
4
4.2 随机抽样方法

样本及抽样分布范文

样本及抽样分布范文

样本及抽样分布范文样本是从总体中抽取的一部分个体或观测值。

样本是对总体的一种估计,通过对样本进行分析和统计推断,可以得出关于总体的结论。

抽样是从总体中选择样本的过程。

抽样方法应该是随机的,以避免选择偏见和结果的错误推断。

抽样方法有很多种,常用的有简单随机抽样、系统抽样、分层抽样、群组抽样等。

抽样分布是样本统计量的分布。

当我们从总体中抽取不同的样本并计算出样本统计量时,这些统计量构成了抽样分布。

常见的样本统计量有样本均值、样本方差、样本比例等。

在统计推断中,我们通常使用样本统计量来估计总体参数。

样本统计量的抽样分布是用来描述这些统计量的变异情况的。

抽样分布的性质决定了我们对总体参数的估计的置信度。

中心极限定理是关于抽样分布的重要定理之一、中心极限定理指出,当样本容量足够大时,无论总体的形态如何,样本均值的抽样分布都近似服从正态分布。

这意味着当我们拥有一个具有较大样本容量的随机样本时,我们可以使用正态分布的性质来进行统计推断。

在使用抽样分布进行统计推断时,我们通常考虑置信区间和假设检验两个方面。

置信区间是对总体参数估计的一种方法。

通过计算样本统计量的抽样分布,我们可以构造一个区间,这个区间包含了总体参数的真实值的估计范围。

置信区间的计算通常使用样本统计量、抽样分布的分位数和置信水平来确定。

假设检验是用来检验总体参数的一些特定假设是否成立的方法。

在假设检验中,我们首先建立原假设和备择假设,然后根据样本统计量的抽样分布来计算一个检验统计量,并以此来判断原假设的可信性。

假设检验通常有三种结论:接受原假设、拒绝原假设或无法做出结论。

总之,样本及抽样分布是统计学中非常重要的概念。

通过对样本进行抽样分布的分析和推断,我们可以对总体的特征和参数进行估计,并进行统计推断。

中心极限定理、置信区间和假设检验是样本及抽样分布的重要理论和方法,为我们的研究和决策提供了有力的依据。

抽样检的基础必学知识点

抽样检的基础必学知识点

抽样检的基础必学知识点
抽样检的基础知识点包括以下内容:
1. 抽样方法:在进行抽样检时,需要选择适当的抽样方法,常见的抽
样方法有简单随机抽样、系统抽样、分层抽样、整群抽样等。

2. 抽样误差:抽样误差是指抽样所引入的估计误差,其大小通常取决
于样本容量的大小和抽样方法的选择。

抽样误差越小,样本代表性越好,估计结果越可靠。

3. 样本容量:样本容量是指进行抽样检的样本数量,通常样本容量越大,估计结果越可靠。

样本容量的确定需要考虑抽样误差允许范围、
资源和时间等因素。

4. 抽样分布:抽样分布是指某一统计量在大量独立抽样情况下的分布。

常见的抽样分布有正态分布、t分布、卡方分布等。

根据不同的情况选择适当的抽样分布进行参数估计和假设检验。

5. 抽样误差的控制:为了减小抽样误差,可以采取增加样本容量、改
进抽样方法、增加抽样次数等方法进行控制。

合理选择抽样方法和样
本容量可以有效控制抽样误差。

以上是抽样检的基础必学知识点,通过学习这些知识点可以帮助我们
正确进行抽样检,得到可靠的估计结果。

抽样及抽样分布

抽样及抽样分布

抽样及抽样分布引言在统计学中,抽样是从总体中选择一局部个体进行研究的过程。

通过抽样可以获得总体的估计值,从而对总体进行推断。

抽样是统计学的根底,也是进行统计推断的前提。

本文将介绍抽样的根本概念和方法,以及抽样分布的概念和特性。

抽样方法进行抽样时,需要选择适宜的抽样方法。

常见的抽样方法包括简单随机抽样、系统抽样、分层抽样和群组抽样等。

简单随机抽样简单随机抽样是最根本的抽样方法,每个个体被随机地选入样本,且每个个体被选入样本的概率相等。

这种方法可以确保样本具有代表性。

系统抽样系统抽样是按照一定的规那么从总体中选取样本,例如每隔一定间隔选取一个个体。

这种方法简单实用,但需要注意规那么的选择是否会引入偏差。

分层抽样分层抽样是将总体分成假设干层,然后从每层中随机选取个体组成样本。

这种方法可以保证每个层次都有足够的代表性。

群组抽样群组抽样是将总体划分为假设干群组,然后随机选取假设干群组作为样本。

这种方法适用于总体中包含多个群组,但群组内个体相似的情况。

抽样分布抽样分布是指抽样统计量的分布。

统计量可以是样本均值、样本方差、样本相关系数等。

样本均值的抽样分布假设总体服从正态分布,样本均值的抽样分布也会服从正态分布。

根据中心极限定理,当样本容量足够大时,样本均值的抽样分布将变得更加接近正态分布。

样本方差的抽样分布样本方差的抽样分布是以总体方差为参数的分布,通常服从卡方分布。

样本容量的大小将影响样本方差的抽样分布形状。

样本相关系数的抽样分布样本相关系数的抽样分布通常是以总体相关系数为参数的分布。

样本容量的增加会使样本相关系数的抽样分布趋向于正态分布。

抽样误差与置信区间抽样误差是指样本统计量与总体参数之间的差异。

抽样误差的大小会受到样本容量和抽样方法的影响。

为了评估抽样结果的可靠性,可以构建置信区间。

置信区间是总体参数的一个区间估计,表示总体参数落在该区间的概率。

置信区间的宽度与置信水平、样本容量以及总体标准差等相关。

第6章-样本及抽样分布

第6章-样本及抽样分布

X
k i
样本 k 阶中心矩
Bk
1 n
n i 1
(Xi
X )k,
§2 抽样分布
统计量旳分布称为抽样分布。数理统计中 常用到如下三个分布:
2分布、 t 分布和F分布。
一、 2分布
iid
n
1. 构造 设 X1,, X n ~ N (0,1), 则 2
X
2 i
~
2 (n).
i 1
称为自由度为n的 2 分布.
h(
y)
(
n1
2
n
2
)(n1
/
(
n1 2
)(
n2 2
)(1
0,
n2
n1 n2
) y n1 / 2
n1 1 2
,
y)(n1 n2 ) / 2
y0
y0
2. F分布旳分位点
对于:0<<1,
若存在F(n1, n2)>0 ,满足
P{FF(n1, n2)}=,
则称F(n1, n2)为
F(n1, n2)旳上侧分
位点;
P447附表5
F (n1, n2 )
注:
F1
(n1, n2 )
F
1 (n2 , n1)
证明:
设F~F(n1,n2), 则
1 F
~
F (n2 , n1)
P{F F1 (n1, n2 )} 1
P{ 1 1 } 1
F F1 (n1, n2 )
P{ 1 1 }
F F1 (n1, n2 )
4.性质:
(1)分布可加性 若X ~ 2(n1),Y~ 2(n2 ),X,Y 独立,则X + Y ~ 2(n1+n2 ) (2)期望与方差 若X~ 2(n),则

概率论与数理统计6.第六章:样本及抽样分布

概率论与数理统计6.第六章:样本及抽样分布

),
,
,
,
是来
Z=
(

证明统计量 Z 服从自由度为 2 的 t 分布。
14
),
,
,
,
是来 , .ຫໍສະໝຸດ 自 总 体 X 的 样 本 , E( ) 则 ,D( )=
是来自总体 X ,D(X)= . ,
,D( )=
11
3. 设 , 本 ,E(X)=
, , 为来自总体 X 的样 ,D(X)=9, 为样本均值 , 试用 < ≥ ,
切比雪夫不等式估计 P{ P{ 4.设 , 则当 K= > ≤ , , . 是总体 X
lim f (t ) (t )
n
1 e 2
t2 2
, x
3.分位点 设 T~t(n), 若对 :0<<1,存在 t(n)>0,
4
满足 P{Tt(n)}=, 则称 t(n)为 t(n)的上侧分位点 注: t1 (n) t (n) 三、F—分布 1.构造 若 1 ~2(n1), 2~2(n2),1, 2 独立,则
y0
2. F—分布的分位点 对于 :0<<1,若存在 F(n1, n2)>0, 满足 P{FF(n1, n2)}=, 则称 F(n1, n2)
5
为 F(n1, n2)的上侧 分位点; 注: F1 (n1 , n2 )
1 F (n2 , n1 )
§ 6.3 正态总体的抽样分布定理
X Y /n ~ t ( n)
t(n)称为自由度为 n 的 t—分布。 t(n) 的概率密度为
n 1 ) 1 t 2 n2 2 f (t ) (1 ) , t n n n ( ) 2 (

3样本及抽样分布

3样本及抽样分布

x
n n 1 1 2 2 2 2 s ( x x ) [ x n x ] i i n 1 i 1 n 1 i 1
x n
i 1
i
第三章 样本及抽样分布
s
1 2 ( xi x) n 1 i 1
n
§3 抽样分布
1 n k a k x i , k 1,2 n i 1 1 n bk ( x i x ) k , k 1,2 n i 1
2
n
第三章 样本及抽样分布
§3 抽样分布
二、 常用统计量的分布
1) 2 分布 设( X 1 , X n )为来自于正态总体 N (0,1)的样本,
则称统计量:
X X
2 2 1
2
2 n
所服从的分布为自由度 是n的 分布。
记为 ~ (n)
2 2
2 分布具有下面的性质:
t 0.95 (9) 1.___ 8331. 2 __________
第三章 样本及抽样分布
3) F 分布
X / n1 F Y / n2
§3 抽样分布
若 X ~ 2 (n1 ), Y ~ 2 (n2 ), X ,Y 独立, 则 称随机变量
所服从的分布为自由度
是n1 , n2 的 F 分布,记作 F ~ F (n1 , n2 ).
定理:若 F ~ F (n1 , n2 ),则 1 / F ~ F (n2 , n1 ).
对于给定的 (0 1), 称 满 足 条 件 : P{ F F ( n1 , n2 )}
的点 F (n1 , n2 )为F分布的 上分位点 。

F (n1 , n2 )

样本及抽样分布1随机样本与直方图

样本及抽样分布1随机样本与直方图

整群随机抽样
定义
将总体分成若干个群或组,然后从每个群或组中 随机抽取一定数量的观察单位组成样本。
优点
便于组织调查,适用于总体数量较小的情况。
ABCD
方法
先对总体进行分群,然后在每个群内进行随机抽 样。
缺点
如果群内差异较大,可能会影响样本的代表性。
03
直方图的绘制步骤
数据收集与整理
收集数据
通过调查、实验或其他方式获取原始数据。
标注信息
在直方图上标注标题、组距、组数等必要信 息。
04
直方图的解读与分析
直方图的形状分析
偏态分析
通过观察直方图的形状,判断数据分布是否对称。如果数据分布不对称,则说明存在偏态。
峰度分析
峰度是描述数据分布形态的统计量,如果峰度值较小,说明数据分布较为平坦;如果峰度值较大,则说明数据分 布较为尖锐。
论文数据支撑
02
在学术论文中,使用随机样本和直方图可以提供有力的数据支
撑,增强论文的说服力和可信度。
学术交流与合作
03
通过共享随机样本和直方图数据,促进学术交流与合作,推动
学科发展。
THANKS
感谢观看
质量改进
通过分析随机样本数据,可以了解产品质量分布和缺陷情况,针对 性地进行质量改进和优化。
持续改进
通过持续收集和分析随机样本数据,可以监测生产过程的持续改进效 果,确保稳定的质量输出。
科学研究与学术论文
实验数据分析
01
在科学实验中,通过收集随机样本数据,绘制直方图,可以对
实验结果进行统计分析,支持科学结论的得出。
数据筛选
去除异常值和缺失值,确保数据质量。
数据排序
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章 样本及抽样分布【内容提要】一、简单随机样本与统计量1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。

2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果12,,...,n X X X 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值12,,...,n x x x ,称其为12,,...,n X X X 的观察值。

注:若12,,...,n X X X 为总体X 的简单随机样本,则12,,...,n X X X 相互独立,且与总体X 同分布。

3. 统计量 设12,,...,n X X X 为总体X 的简单随机样本,12(,,...,)n T g X X X =为样本12,,...,n X X X 的实值函数,且不含任何未知参数,则称12(,,...,)n T g X X X =为一个统计量,将样本值12,,...,n x x x 代入后算出的函数值12(,,...,)n t g x x x =称为该统计量的值。

注:设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,则常用的统计量有:4. 经验分布函数 设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,将样本值按由小到大的顺序重新编号12,1r x x x r n ***<<⋅⋅⋅<≤≤,并设12,,...,n x x x 中取到k x *的频数为k m ,其中10k k k r m n m n ≤≤≤≤=∑且,则称1110,(),,111,k k i n k k i k x x r x x m m F x x x x k r n nx x ****+≤≤≤*⎧<⎪⎪==≤<≤≤-⎨⎪⎪≥⎩∑∑若若其中若为总体X 的经验分布函数(或样本分布函数)。

注:设(),()n F x F x 为总体X 的概率分布函数与经验分布函数,则x R ∀∈,有:()lim ()()01n n P F x F x →∞-==,即只要n 充分大,则()()n F x F x 与只有微小的差别。

二、抽样分布1.2χ-分布:设12,,...,n X X X 为总体(0,1)X N :的简单随机样本,则称221nk k X χ==∑服从自由度为n的2χ-分布,记为2221()nk k X n χχ==∑:。

【定理】设随机变量22(),()n m ξχηχ::,且二者相互独立,则⑴.ξ的密度函数为:2122,0()2(2)0,0n x n x e x f x n x --⎧>⎪=Γ⎨⎪≤⎩若若;⑵.2χ-分布的再生性:2()m n ξηχ++:; ⑶.2χ-分布的数字特征:(),()2E n D n ξξ==; ⑷.2χ-分布的临界值:()()221()()Pn P n ααξχξχα-<=>=.(查表)2. t -分布:设随机变量2(0,1),()X N Y n χ::,且二者相互独立,则称随机变量t =服从自由度为n 的t -分布,记为()t t n :。

【定理】设随机变量()t n ξ:,则2()()n y f x χ-=分布的密度函数⑴.ξ的密度函数为:2(1)2()),(,)n f x x x -+=+∈-∞+∞;⑵.t -分布的极限分布:n →+∞时,(0,1)Nξ:,即22lim ()(),(,)x n f x x x ϕ-→∞==∈-∞+∞; ⑶.t -分布的数字特征:若2n >,则()0,()(2)E D n n ξξ==-; ⑷.t -分布的临界值:()()()()P t n P t n ααξξα<=>-=.(查表)3. F -分布:设随机变量22(),()X m Y n χχ::,且二者相互独立,则称随机变量X mF Y n=服从自由度为(,)m n 的F -分布,记为(,)F F m n :。

【定理】设随机变量(,)F m n ξ:,则⑴.ξ的密度函数为:()21()2()2,0()(2)(2)()0,0m n m m n m n m n x x f x m n mx n x -+Γ+⎧⋅>⎪=ΓΓ+⎨⎪≤⎩若若;⑵.F -分布的倒数不变性:1(,)F n m ξ-:;⑶.F -分布的数字特征:若4n >,则222(2)(),()2(2)(4)n n m n E D n m n n ξξ+-==---; ⑷.F -分布的临界值:()()(,)1(,)P F m n P F n m ααξξα<=>=.(查表)(0,1)()()()N y x t n y f x ϕ=-=虚线:分布的密度函数实线:分布的密度函数三、正态总体的统计量的分布 1.单个正态总体的情形设12,,...,n X X X 为正态总体2(,)X N μσ:的简单随机样本,令2222111111,(),()1k k k k n k n k nX X S X X X n n n χμ≤≤≤≤≤≤==-=--∑∑∑,则 ⑴(0,1)X N :; ⑵.222()n n χχσ:;⑶. 2X S 与相互独立,且222(1)(1)n S n χσ--:; ⑷(1)X t n -:。

2.两个正态总体的情形设112,,...,n X X X 为总体211(,)X N μσ:的简单随机样本,212,,...,n Y Y Y 为总体222(,)Y N μσ:的简单随机样本,且两个样本之间相互独立,令1212222212111112121111,,(),()11k k k k k n k n k n k n X X Y Y S X X S Y Y n n n n ≤≤≤≤≤≤≤≤===-=---∑∑∑∑,1222221122111211(),(),k k w k n k n X Y S n n χμχμ≤≤≤≤=-=-=∑∑ ⑴)(0,1)X Y N :; ⑵.2211122222(,)F n n χσχσ:;(,)()F m n y f x -=分布的密度函数⑶.2211122222(1,1)S F n n S σσ--:; ⑷.若2212σσ=12)(2)X Y t n n +-:。

【第六章作业】一、填空题1、设12,,...,,...n X X X 独立同分布,且有有限的期望()k E X μ=与方差2()0k D X σ=>,则n 充分大时,近似地有211(,)n k k X X N n n μσ==∑:,即(0,1)X N :,特别当12,,...,,...n X X X 独立同分布于2(,)N μσ时,上述结论还是精确成立的。

2、设12,,...,,...n X X X 独立同分布,且有有限的期望()k E X μ=与方差2()0,1,2,...k D X k σ=>=,则211n k k Y X n ==∑依概率收敛到22()σμ+,即0ε∀>,有22211lim (())1n k n k P X n σμε→∞=-+<=∑。

3、设1234,,,X X X X 是2(0,2)N 的简单随机样本,且2221234()()(2)Y C X X X X χ⎡⎤=++-⎣⎦:,则18C =。

4、设容量为9n =的样本之观察值为8,7,6,9,8,7,5,9,6,则该样本之观察值的样本均值为659x =,样本方差为214081s =。

5、设12,,...,n X X X 是2(,)N μσ的简单随机样本,则211(,)n k k X X N n n μσ==∑:。

二、单项选择题1、设123,,X X X 是母体2(,)N μσ的简单随机样本,其中μ已知,0σ>未知,则下列选项中非统计量的是(C ):A .123X X X ++;B .{}123max ,,X X X ;C .2222123()X X X σ++; D .1X μ-。

2、设12,,...,n X X X 是母体(1,)B p 的简单随机样本,则下列选项中错误的是(,B D ): A .当n 充分大时,近似地有(,(1))X N p p p n -:;B .()(1),0,1,2,...,k k n kn P X k C p p k n -==-=; C .()(1),0,1,2,...,k k n kn P X k n C p p k n -==-=; D .()(1),0,1,2,...,k k n ki n P X k C p p k n -==-=。

3、设()X t n :,则 (A ):A .2(1,)X F n :; B .2(,1)X F n :; C .22()X n χ:; D .2()X t n :。

4、设12,,...,n X X X 是总体2(,)N μσ的简单随机样本,令2211111,()1k k k n k nX X S X X n n ≤≤≤≤==--∑∑,而222222234111111(),(),()1n n n k k k k k k S X X S X S X n n n μμ====-=-=--∑∑∑,则服从(1)t n -的是(C ):A.X t =B.X t = C.X t =; D.X t =5、设1212,,...,,,,...,n n n n m X X X X X X +++是总体2(0,)N σ的容量为()n m +的简单随机样本,则统计量2211()()k n k k nk mV m X n X +≤≤≤≤=∑∑服从的分布是(C ):A .(,)F m n ;B .(1,1)F n m --;C .(,)F n m ;D .(1,1)F m n --。

三、计算题1、为了研究某种零件的加工工时定额,随机观察了12人次的加工工时,测得如下数据(分钟):9.8,7.8,8.2,10.5,7.5,8.8,10.0,9.4,8.5,9.5,8.4,9.8,试求样本均值、样本方差、样本标准差。

解:2211119.02,()0.8359,0.91431n n k k k k x x s x x s n n ===≈=-≈=≈-∑∑。

2、从一批人中随机抽取10人,测得每个人的身高,得到如下数据 (cm ):173,170,148,160,168,181,151,168,154,177,求该样本观察值的样本分布函数。

解: 该样本观察值的样本分布函数为:3、在总体2(52.6,3)N 中随机抽取一容量为36的样本,求样本均值X 落在50.853.8:之间的概率。

相关文档
最新文档