6概率统计第六讲修

合集下载

(精选)概率与数理统计第六章

(精选)概率与数理统计第六章
2) 在原假设成立的前提下,选择检验统计量,并确定其分布
常用的统计量的分布为:N (0,1), t 分 布 , 2 分 布 , F 分 布 3)确定拒绝域: 根据小概率原理确定拒绝原假设的区域.
即确定满足 P (拒 绝 H 0|H 0 为 真 )拒绝域W.
4)作出统计推断:计算检验统计量的观测值. 若检验统计量的值落入拒绝域,则拒绝原假设 若检验统计量的值未落入拒绝域,则接受原假设
(2)在原假设 H 0 为真的前提下,确定统计量
UX X30390~N(0,1)
n
25
(3)确定拒绝域 W{Uu0.05}{U1.645}
6.2.2 单个正态总体方差的假设检验
6.1 假设检验的基本概念
例 用某种动物作试验材料,要求动物的平均体重 100g,若 100g 需要再饲养;若 100g则应淘汰.又知动物体重服从正态分布,且由 以往经验知 1.5g ,现从一批待试验的动物中,随机抽取8只,称 得体重(g)为:99.3 98.9 101.5 101.0 99.6 98.7 102.2 100.8
所以
X
~
N
(0,1)
n
6.2.1 单个正态总体均值的假设检验
y 对于给定的显著性水平 ,确定拒绝域W
① H 0 : 0 , H 1 : 0
W{|U|u}
2
2
u

2
2
u
2

② H 0 : 0 , H 1 : 0
W{Uu}
③ H 0 : 0 , H 1 : 0
W{Uu}
x y

6.2.1 单个正态总体均值的假设检验
H0:0100, H1:100
在原假设为真时选统计量

概率论数理统计课件第6讲

概率论数理统计课件第6讲

(2) X的分布函数为
F x
x

5 3 5 3 (3) P X F F 2 2 2 2 1 0.9375 0.0625
2.3.3 常见的连续型随机变量
均匀分布、指数分布、正态分布
1. 均匀分布 (Uniform) 若随机变量X 的概率密度为:
(2).
f ( x) dx 1;

这两条性质是判定函数 f(x) 是否为某随机变量 X 的概率密度函数的充 要条件。
f(x)与x轴所围 面积等于1。
(3). 对 f(x)的进一步理解:
若x是 f(x)的连续点,则 x x f (t )dt P( x X x x) x lim lim x 0 x 0 x x =f(x), 故, X的概率密度函数f(x)在 x 这一点的值, 恰 好是X 落在区间 [x , x +△x]上的概率与区间长 度△x 之比的极限。 这里, 如果把概率理解为 质量,f (x)相当于物理学中的线密度。
这100个数据中,最小值是128,最大值是155。
作频率直方图的步骤
(1). 先确定作图区间 (a, b); a = 最小数据-ε/ 2,b = 最大数据+ε/ 2,
ε 是数据的精度。 本例中 ε = 1, a = 127.5, b = 155.5 。
(2). 确定数据分组数 m = 7, 组距 d = (b − a) / m=28/7=4,
1

p k 0, k 1,2,,
2。
p
k 1

k
1.
随机变量X 的所有取值 随机变量X的 各个取值所 对应的概率
常用的离散型随机变量的分布
1.两点分布( 0-1分布) 模型:一个人射击,射中的概率为p,不中的概 率为 q=1-p. 规定:

《概率论与数理统计》第六章 讲义

《概率论与数理统计》第六章 讲义
思想(idea) 在已经得到试验结果的情况下,我们应该寻找 使这个结果出现的可能性最大的那个 ˆ 作为pter 6 参数估计

最大似然估计提供了一种给定观察数据来评估模 型参数的方法,即:“模型已定,参数未知”。 简单而言,假设我们要统计全国人口的身高,首 先假设这个身高服从服从正态分布,但是该分布 的均值与方差未知。我们没有人力与物力去统计 全国每个人的身高,但是可以通过采样,获取部 分人的身高,然后通过最大似然估计来获取上述 假设中的正态分布的均值与方差。
Page 9
Chapter 6 参数估计
ˆ ˆ ( x ,, x ) 定义6.2.1 设 ∈Θ为未知参数, n n 1 n 是 的一个估计量,n 是样本容量,若对任何 一个ε>0,有
ˆ | ) 0 limn P(| n
ˆ 为 参数的相合估计。 则称
n
(6.2.1)
2
ˆ 1/ s 1
s 为样本标准差。这说明矩估计可能是不唯一的, 这是矩法估计的一个缺点,此时通常应该尽量采用 低阶矩给出未知参数的估计。
Page 7
Chapter 6 参数估计
例 6.1.3 x 1 , x 2 , … , x n 是来自 ( a,b ) 上的均匀分布 U(a,b)的样本,a与b均是未知参数,这里k=2, 由于 2
ˆ1 ) 2 , Var( ˆ2 ) 2 / n Var(
ˆ2 比 ˆ1 有效。这表明用全部数据的 显然,只要 n>1, 平均估计总体均值要比只使用部分数据更有效。
Page 20
Chapter 6 参数估计
例6.2.7 均匀总体U(0, )中 的极大似然估计是x(n) n Ex ,由于 x(n)不是 的无偏估计,而是 (n) n ,所以 1 的渐近无偏估计。经过修偏后可以得到 的一个 ˆ n 1 x 。且 无偏估计: 1 (n )

概率论与数理统计第六章总结

概率论与数理统计第六章总结

概率论与数理统计第六章总结概率论与数理统计是数理学科中的重要分支,其应用广泛,涉及到许多领域,如工程、物理、自然科学、医学、经济学等等。

第六章主要讲述了离散型随机变量的概率分布、期望值、方差及其应用。

首先我们了解到离散型随机变量是指取值有限或者可以无限但是可以和自然数一一对应的随机变量,即不连续的随机变量。

其中概率分布的概念是很重要的,它告诉我们每种随机变量取值的可能性大小,从而可以计算一些重要的数值。

比如期望值,期望值是随机变量取值的平均值,它可以用概率分布函数计算得到。

期望值可以给我们一个随机变量所处于某个状态的平均位置,或者它对某个事件发生的平均贡献。

方差也是一个非常重要的概念,它是随机变量值与其期望值之差的平方的期望值。

方差表示了随机变量的分布范围,也就是它们取值的变化程度。

方差越大,代表随机变量距离其期望值越远,该随机变量取值的范围也相应较大。

求期望值和方差的过程中有一些公式会显著提高计算效率,比如线性变换的公式、缩放变换的公式、Chebyshev不等式等等。

这些公式的应用有助于简化计算,并且能帮助我们更容易地理解问题。

我们还讨论了一些常见离散型随机变量的概率分布,比如伯努利分布、二项分布、泊松分布等等。

这些分布的出现在实际问题中都有着很重要的意义,比如伯努利分布描述了实验只有两种可能结果的概率分布,比如是/否、头/尾等等。

而二项分布则描述了实验中成功的概率和试验次数的关系,给我们解决实际问题提供了基础。

除了离散型随机变量,我们还可以研究连续型随机变量的概率分布以及相应的数学理论。

这些知识在实际应用中也具有重要意义。

比如在统计财务账目时,需要研究一些连续型随机变量的概率分布,以便预测下一期客户付款时间的分布情况。

又比如在流量预测中,需要研究一些连续型随机变量的概率分布,以便预测某个时间段内的网络流量。

总之,离散型随机变量理论是概率论的核心内容,对于理解整个概率论课程和进行实际应用都有着重要的意义。

概率论与数理统计第六章总结

概率论与数理统计第六章总结

概率论与数理统计第六章总结一、概述在概率论与数理统计的第六章中,主要介绍了随机变量的概率分布以及常见的概率分布模型。

本章内容是概率论与数理统计的重点和难点之一,对于理解和应用概率统计的基本理论和方法具有重要意义。

二、随机变量的概率分布1. 随机变量及其概率分布的概念•随机变量是对随机试验结果的数值化描述,它的取值不仅依赖于随机试验的结果,还受到机会因素的影响。

•概率分布描述了随机变量可能取值的概率大小。

常用的概率分布有离散型和连续型两种。

2. 离散型随机变量及其概率分布•离散型随机变量的取值是有限或可列的,它的概率分布可以用概率质量函数来描述。

•常见的离散型随机变量包括伯努利随机变量、二项分布、泊松分布等。

3. 连续型随机变量及其概率分布•连续型随机变量的取值是无限的,它的概率分布可以用概率密度函数来描述。

•常见的连续型随机变量包括均匀分布、正态分布等。

三、常见概率分布模型1. 二项分布•二项分布是指在 n 重伯努利试验中,成功的次数服从的概率分布。

其概率质量函数为二项式系数与成功概率的乘积。

•二项分布在实际应用中常用于描述成功次数的分布情况,如抽样调查中的样本中某一特征出现的次数。

2. 泊松分布•泊松分布是定义在非负整数集上的概率分布,它描述了在一段时间或空间内事件发生的次数。

其概率质量函数为事件发生率与时间(或空间)长度的乘积。

•泊松分布常用于描述罕见事件发生的次数,如单位时间内电话呼叫次数、一段时间内事故发生次数等。

3. 正态分布•正态分布是最重要的连续型概率分布模型之一,也称为高斯分布。

它的概率密度函数呈钟形曲线,对称于均值。

•正态分布在实际应用中广泛存在,如身高体重、测量误差、考试成绩等符合正态分布的情况较多。

4. 指数分布•指数分布是定义在非负实数集上的连续型概率分布,它描述了连续时间间隔或空间间隔内事件发生的情况。

其概率密度函数呈指数下降曲线。

•指数分布在实际应用中常用于描述无记忆性随机事件的发生情况,如设备失效时间、极端天气事件的间隔等。

概率统计(6)剖析

概率统计(6)剖析
在上面的例子中,该厂生产的所有显像管的寿 命就是总体,而每一个显像管的寿命就是个体.
代表总体的指标(如显像管的寿命)是一个随 机变量,所以总体就是指某个随机变量可能取的值 的全体.
从总体中抽取一个个体,就是对代表总体的随机 变量进行一次试验(或观测),得到的一个试验数据 (或观测值).
从总体中抽取一部分个体,就是对随机变量进行 若干次试验(观测).
xi x
fi
求和,则称Fn x为样本分布函数,经验分布函数。
易知样本分布函数Fn x具有下列性质:
(1) 0 Fn x 1
(2) Fn x 是非减函数
(3) Fn 0, Fn 1 (4) Fn x 在每个观测值 xi处是右连续的,点 xi 是 Fn x 的跳跃间断点,Fn x在该点的跃度就等于
当n 时,样本分布函数 Fn x与总体分布函
数 Fx 之间存在着更密切的近似关系的结论.这
些结论就是我们在数理统计中可以依据样本来
推断总体的理论基础.
二、 直方图
数理统计中研究连续随机变量 X的样本分布时,
通常需要作出样本的频率直方图(简称直方图),
作直方图的步骤如下:
1.找出样本观测值x1, x2 ,, xn 中的最小值与最大值,
(2)独立性 各次抽样必须是相互独立的,即 每次抽样的结果既不影响其它各次抽样的结 果,也不受其它各次抽样结果的影响.
这种随机的、独立的抽样方法称为简单随机 抽样,由此得到的样本称为简单随机样本.
例如,从总体中进行放回抽样,显然是简单随机 抽样,得到的样本就是简单随机样本.
从有限总体(即其中只含有有限多个个体的总体) 中,进行不放回抽样,虽然不是简单随机抽样,但是 正如在前面我们已知的,若总体容量 N 很大而样本容

必修 统计与概率 第六讲 几何概型

必修 统计与概率 第六讲 几何概型

为 P(A)=3×23-×212×22=23.
其中第一个数表示 a 的取值,第二个数表示 b 的取值.事件 A 中包含 9 个
基【本小事结件】,古事典件概A型发和生几的何概率概为型P共(A同)=点19是2=,34.它们都是研究等可能事件概率的方法;不同点是古典概型研究的是由有限的、
离散的变量控制的随机试验,而几何概型研究的是无限的、连续的变量控制的随机试验.
D1 A1
C1 B1
D
C
O
A
B
【小结】几何概型除了可以用线段长度比、平面图形的面积比求得外,有时也需用到角度比、体积 比等.
技巧传播
解答几何概型问题,当考察对象为点且点的活动范围在线段上时,就是用线段长度比计算概率 值.当基本事件受两个连续的变量控制时,一般是把两个变量分别作为一个点的横坐标和纵坐标,这 样基本事件就构成了平面上的一个区域,即可借助平面区域面积比求概率.几何概型除了可以用线段 长度比、平面图形的面积比求得外,有时也需用到角度比、体积比等.
陷阱规避
C
【错解】 在线段 AB 上取一点 E,使得 AE=AC,在线段 EB 上任取一点 M,则|AM|>|AC|,
则所求概率值为 | EB | 1 | AC | 1 cos 30 2
3 .
| AB |
| AB |
2
【错因分析】该题中基本事件是角而非线段长.角的变化是等可能的,而线段长的变化
+2ax+b2=0 有实根的充要条件为 a≥b.
{(a,b)|0≤a≤3,0≤b≤2},构成事件 A 的区域为
(1) 基本事件共有 12 个:(0,0),(0,1),(0,2),
{(a,b)|0≤a≤3,0≤b≤2,a≥b},所以所求的概率

概率论与数理统计总结之第六章

概率论与数理统计总结之第六章

第六章 样本及抽样分布 总体与个体:我们将试验的全部可能的观察值称为总体,这些值不一定都不相同,数目上也不一定是有限的,每一个可能观察值称为个体 总体中所包含的个体的个数称为总体的容量 容量为有限的称为有限总体 容量为无限的称为无限总体设X 是具有分布函数F 的随机变量,若,,21X X …n X ,是具有同一分布函数F 的、相互独立的随机变量,则称,,21X X …n X ,为从分布函数F (或总体F 、或总体X )得到的容量为n 的简单随机样本,简称样本,它们的观察值,,21x x …n x ,称为样本值,又称为X 的n 个独立的观察值由定义得:若,,21X X …n X ,为F 的一个样本,则,,21X X …n X ,相互独立,且它们的分布函数都是F ,所以(,,21X X …n X ,)的分布函数为,,(21*x x F …)(),1∏==ni i n x F x又若X 具有概率密度f ,则(,,21X X …n X ,)的概率密度为,,(21*x x f …).(),1∏==ni i n x f x设,,21X X …n X ,是来自总体X 的一个样本,g(,,21X X …n X ,)是,,21X X …n X ,的函数,若g 中不含未知参数,则称g(,,21X X …n X ,)是一统计量设,,21X X …n X ,是来自总体X 的一个样本,n x x x ,^,,21是这一样本的观察值,定义:样本平均值∑==ni i X n X 11样本方差⎪⎭⎫ ⎝⎛--=--=∑∑==n i i n i i X n X n X X n S 12221211)(11样本标准差∑=--==ni i X X n S S 122)(11 样本k 阶(原点)矩,2,1,11==∑=k X n A n i ki k …样本k 阶中心矩,3,2,)(11=-=∑=k X X n B k ni i k …经验分布函数设,,21X X …n X ,是总体F 的一个样本,用∞<<-∞x x S ),(表示,,21X X …n X ,中不大于x 的随机变量的个数。

概率论6讲-精品

概率论6讲-精品

为1/6, 所以
x x x P { - 1 } 1 ,P { 2 } 3 1 ,P { 3 } 1 .
6
62
3
对于数轴上的集合S, P{xS}可以如下算得:
检查S含有-1,2,3中的哪几个, 把相应的概
率1/6, 1/2, 1/3中的有关几个相加.
11 2019/11/29
例如, 当S=[-1,2.5)时, S中含-1,2,3中的-1,2,
31 2019/11/29
因此, x的分布密度为
x0
1
2 i
n
概 ( 1 - 率 p ) n 1 n p ( 1 - p ) n - 1 n 2 p 2 ( 1 - p ) n - 2 n i p ( 1 - p ) n - i p n
这个离散分布称为二项分布. 它依赖于自然 数n及介于0,1之间的数p, 以后把这个分布简
记为B (n,p)
32 2019/11/29
在次品率为p的一大批产品中任取n件产
品, 那末取得次品的件数x服从B (n,p).
只要把每取一件产品做为一次试验, 令A 为取得次品的事件, 利用上面的结论便 可推得这个结果. 这里, 注意到, 由于这 批产品中产品的件中很多, 取去少许几 件可以认为并不影响留下部分的次品率.
P{axb}b-ab-a
1-0
对于数轴上任一个区间S, 由于x取区间
[0,1)外的值的概率为零, 所以
P{xS}=l(S),
其中l(S)为(S[0,1))的长度值.
下面来计算x的分布函数.
17 2019/11/29
当x0时, (-,x)[0,1)为空集, 所以
F(x)=P{x<x}=0.

《概率论与数理统计教学课件》6第六章.ppt

《概率论与数理统计教学课件》6第六章.ppt
一. 总体和个体 定义 将研究对象的某项数量指标的值的全体称
为总体(母体);将总体中的每个元素称为 个体 例1.(1) 当研究某地区中职工收入平均水平时,这地区 所有职工的月收入组成了总体;而每个职工月 收入就是个体。
(2) 研究某批灯泡的质量,则该批灯泡寿命的全体 就组成了总体;而每个灯泡的寿命就是个体。
概率统计
随机抽样法
在概率论中所研究和讨论的随机变量,它的分布 都是已知的,在这前提下去进一步的研究它的性质、 特点和规律性。而在数理统计中所研究和讨论的随机 变量,它的分布是未知的或不完全知道的。于是就必 须通过对所研究和讨论的随机变量进行重复独立的观 察和试验,得到许多观察值(数据),对这些数据进行 分析后才能对其分布作出种种判断。得到这些数据最 常用的方法是----随机抽样法。
的个 数是有限) 和 无限总体(个体的个数是无 限的)。但当有限总体它所含的个体的个 数很 大时也可视其为无限总体。
概率统计
二. 抽样和样本
抽样
为推断总体分布及各种特征,按一定规则 从总体中抽取若干个体进行观察试验,以
获得有关总体的信息,这一抽取过程称为
“抽样”,所抽取的部分个体称为 样本,
样本中所包含的个体数目称为 样本容量。 例如:
同时随着计算机的诞生与发展,为数据处 理提供了强有力的技术支持,这就导致了数理 统计与计算机结合的必然的发展趋势。
目前国内外著名的统计软件包:R, SAS,SPSS, STAT 等,都提供了快速、简便地进行数据处理 和分析的方法与工具。
概率统计
数理统计研究的对象 --- 带有随机性的数据
数理统计的任务 数理统计学是一门应用性很强的学科, 它
从某批国产轿车中抽 5 辆进行耗油量试验。 这一过程即为“抽样”
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4. 几个常用的统计量 1 n 1 n (1) 样本均值 X = ∑ X i , 其观测值为 x = ∑ xi n i =1 n i =1 1 n 1 n 2 2 2 (2) 样本方差 S = ( Xi − X ) , 其观测值为 s = ( xi − x)2 ∑ ∑ n − 1 i =1 n − 1 i =1
1 Y P → 1 EY = 1 n n ∑1 EX k , n n n k= 其中 Yn =
n
∑X
k =1
n
k
.
大数定律可以用来说明频率的稳定性。 大数定律可以用来说明频率的稳定性。 可以用来说明频率的稳定性
三. 中心极限定理
1. 定义 设{Xn}为随机变量序列,对于 Yn = 为随机变量序列, 为随机变量序列
按随机抽样原则得到的样本满足以下两个条件: 按随机抽样原则得到的样本满足以下两个条件: 相互独立; (1)独立性: X1,… ,Xn 相互独立; )独立性: 与总体同分布。 (2)同分布性: X1, … ,Xn与总体同分布。 )同分布性: 来自总体X的随机样本 来自总体 的随机样本X1, … ,Xn可记为 的随机样本 X1, … ,X n ~ X ,
第六讲 极限定理与抽样分布
随机变量序列的两种收敛性 大数定律LNL 大数定律 中心极限定理CLT 中心极限定理 总体与样本 经验分布函数与统计量 正态总体的抽样分布
[I] 内容提要
[II] 例题精讲
一. 随机变量序列的两种收敛性
1.依概率收敛 设{Xn}为随机变量序列,X为随机变量,若 依概率收敛 为随机变量序列, 为随机变量 为随机变量, 为随机变量序列 对任意ε 对任意ε>0, 有
χ 2 ( n)称为自由度为 n的 χ 2 − 分布 .
其密度函数为
n −1 − y 1 n/2 y2 e 2, y > 0 f ( y ) = 2 Γ( n / 2) 0, y≤0
f(y) η~χ η χ2(n)
2 χα ( n)
(2) 再生性 若η1 ~ χ2(n1),η2~ χ2(n2), η1, η2 独立, η , , 则 η1+ η2 ~ χ2(n1+n2)。 。 (3) 期望与方差 若η ~ χ2(n),则Eη= n,Dη=2n。 η , η , η (4) 分位点 设η ~ χ2(n),若对于α:0<α<1, 存在 η α α ,

∑X
k =1
n
k
,
→ 若 Yn的标准化 r .v .Yn* L ξ ~ N ( 0, 1), 则称 { X n }满足 中心极限定理 .
2. 两个常用的中心极限定理 (1) 独立同分布中心极限定理 独立同分布中心极限定理(Levy-Lindeberg) 为独立同分布随机变量序列, 设{Xn}为独立同分布随机变量序列,若EXk=µ<∞, 为独立同分布随机变量序列 µ ∞ DXk= σ2 <∞,k=1, 2, …, 则{Xn}满足中心极限定理。 满足中心极限定理 ∞ 满足中心极限定理。
(4) 极大、极小统计量 极大、 极大统计量: 极大统计量:X(n)=max{X1, … ,Xn}, , 其观测值: x(n)=max{x1, … ,xn} 观测值: 极小统计量: 极小统计量:X(1)=min{X1, … ,Xn}, , 其观测值: x(1)=min{x1, … ,xn} 观测值:
样本均方差 ( 标准差 ) S = S2 , 其观测值为 s = s2
(3) k 阶样本矩 原点矩 中心矩 1 n k 1 n k Ak = ∑ X i , 其观测值为 a k = ∑ x i n i =1 n i =1 1 n 1 n Bk = ∑ ( X i − X ) k , 其观测值为 bk = ∑ ( x i − x ) 2 n i =1 n i =1
n→ ∞
lim Fn ( x ) = F ( x ),
n→ ∞
则称{X 依分布收敛 依分布收敛于 则称 n}依分布收敛于X. 可记为 X n L → X .
二. 大数定律LNL 大数定律
1 1 1 n 1. 定义 令 Y n = ∑ X k , 若有 Y n P → EY n = ∑ EX k , n n n k =1 k =1 1 1 即对任意的 ε > 0 , lim P {| Y n − EY n |< ε } = 1 . n→ ∞ n n 则称 { X n } 服从大数定律 .
η* L→ ξ ~ N(0, 1). n
大数定律与中心极限定理的关系
对于独立同分布r.v.序列 n},大数定律给出了前n项 对于独立同分布 序列{X ,大数定律给出了前 项 序列 算术平均值所遵循的规律; 而中心极限定理则在n充分大时 充分大时, 算术平均值所遵循的规律 而中心极限定理则在 充分大时 给出了{X 前 项之和落在某区间 项之和落在某区间(a, 的近似概率 的近似概率, 给出了 n}前n项之和落在某区间 b]的近似概率,事实上 b − nµ a − nµ P {a < Yn ≤ b} ≈ Φ ( ) − Φ( ). nσ nσ
t
密度函数f 的图形与 的图形与N(0, 1)的密度函数的图形很象, 的密度函数的图形很象, 密度函数 (t)的图形与 的密度函数的图形很象 的图形两端尾巴厚一些, 只是 t(n)的图形两端尾巴厚一些,腰瘦一些。 的图形两端尾巴厚一些 腰瘦一些。 (2) 基本性质 基本性质: 10 f (t)关于 关于t=0(纵轴 对称。事实上,f (−t)=f (t); 纵轴)对称 关于 纵轴 对称。事实上, − 20 f (t)的极限为 的极限为N(0,1)的密度函数,即 的密度函数, 的极限为 , 的密度函数
lim D( 1 Yn ) = 0, n→ ∞ n
则{Xn}服从大数定律。 服从大数定律。 服从大数定律 (2) 伯努里大数定律 伯努里大数定律 为独立随机变量序列, 设{Xn}为独立随机变量序列 且Xk~b(1, pk), 0< pk <1, 为独立随机变量序列 k=1, 2, … 则{Xn}服从大数定律。(频率的稳定性 服从大数定律。 频率的稳定性) 服从大数定律 频率的稳定性
2. t -分布 分布
(1) 构造 若ξ~N(0, 1), η~χ2(n), ξ与η独立,则 独立, χ
T=
ξ ~ t ( n ). η/ n
0
f (t )
t(n)称为自由度为 的t—分布。 称为自由度为n的 分布 分布。 称为自由度为 其密度函数为
n+1 ) Γ( + t 2 − n2 1 2 f (t ) = (1 + ) , −∞< t < ∞ n n nπ Γ ( ) 2
iid iid
或X1, … ,X n ~ f ( x)
其中f 是 的概率函数 的概率函数。 其中 (x)是X的概率函数。 样本观测值:对样本 进行观测, 样本观测值:对样本X1, … ,Xn进行观测,即 可得一组观测值x 可得一组观测值 1, … ,xn
五、经验分布函数与统计量
1、构造 将样本观测值: x1,… ,xn从小到大排列得 、 将样本观测值:
2 2 2 χ α ( n ) > 0, 满足P{ η ≥ χ α ( n )} = α, 则称χ α ( n )为
χ 2 ( n )的上侧α分位点;
若存在 χ 12−α ( n ) > 0, 满足 P {η ≤ χ 12−α ( n )} = α , 则称
χ 12−α ( n )为 χ 2 ( n )的下侧 α分位点
六. 统计中的三个重要分布
统计量的分布称为抽样分布。 统计量的分布称为抽样分布。数理统计中主要研究 如下四个分布: 如下四个分布: U—分布 即N(0, 1))、χ2—分布、t —分布和F—分布。 分布(即 分布、 分布和 分布。 分布 、 分布 分布 分布
1. χ2-分布 分布
2 2 (1) 构造 设 X 1 , L , X n ~ N (0,1), 则 η = ∑ X i ~χ ( n). i =1 iid n
四、总体与样本
1、总体:研究对象的全体。通常指研究对象的某项 、总体:研究对象的全体。 数量指标,可记为X、Y、Z、ξ、η、ζ等,它是随机变量。 数量指标,可记为 、 、 、 它是随机变量。 2、个体:组成总体的单元。通常也指与总体对应的 、个体:组成总体的单元。通常也指与总体对应的 总体 某项数量指标,可用 等表示,它们也是随机变 某项数量指标,可用X1,X2, … 等表示,它们也是随机变 量。 3、样本:来自总体的部分个体X1, … ,Xn 。n称为样 、样本:来自总体的部分个体 称为样 本容量。若是按随机抽样原则得到的,则称其是“ 本容量。若是按随机抽样原则得到的,则称其是“简单随 机样本”或简称为“随机样本” 机样本”或简称为“随机样本”或“样本”。 样本”
lim P{| X n − X |< ε } = 1
则称{X 依概率收敛 依概率收敛于 则称 n}依概率收敛于X. 可记为 X n P → X .
2. 设{Xn}为随机变量序列,X为随机变量,其对应的分布函 为随机变量序列, 为随机变量 为随机变量, 为随机变量序列 数分别为F 若在F(x)的连续点,有 的连续点, 数分别为 n(x), F(x). 若在 的连续点
a .s Fn ( x ) → F ( x ),
即 P {lim Sup | Fn ( x ) − F ( x ) |= 0} = 1.
n →∞ x∈R
其中F(x)=P{X ≤ x}为总体 的分布函数。 为总体X的分布函数 其中 为总体 的分布函数。 3. 统计量 样本X 的函数g(X1, … ,Xn)称为是总体 的 称为是总体X的 样本 1, … ,Xn的函数 称为是总体 一个统计量, 与任何未知参数无关。 一个统计量,若g(X1, … ,Xn)与任何未知参数无关。 统计量 与任何未知参数无关 g(x1, … ,xn)是 g(X1, … ,Xn)的观测值 的观测值. 是 的观测值
相关文档
最新文档