第2章 统计学中概念复习

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 其中f(x)dx称概率元素 概率元素(与一连续变量的一个微小区间相对应 概率元素 的概率),而 指x落在a至b区间上的概率,用几何 图形表示,我们有图2。
当试验次数 无限增加, 直方图趋近 于光滑曲线 ,曲线下包 围的面积表 示概率。 图2. 连续 随机变量 的概率密 度函数
例3.
• 考虑如下密度函数:
3.3 随机变量定义: 随机变量定义:
• 一个变量如果他的值由随机试验的结果决定,就 叫做随机变量 随机变量(random variable, rv)。通常随机 随机变量 变量用大写字母X、Y、Z等表示,而它的值由小 写字母x、y、z等表示。
3.4 随机变量可以是离散的或连续的。 随机变量可以是离散的或连续的。
i i i
n
n
n
i
• 4.

n i =1
(a + bxi ) = na + b∑ i =1 xi,其中a和b是常数
n
• 多重总和运算子 ΣΣ的定义是:
∑∑ x = ∑ ( x
ij
n
m
n
i1
+ xi 2 + ⋅⋅⋅ + xim )
i =1 j =1
i =1
= ( x11 + x12 + ⋅⋅⋅ + x1m ) + ( x 21 + x 22 + ⋅⋅⋅ + x 2 m )
直觉上是指一事件的发生不会 影响到另一事件发生的概率。 影响到另一事件发生的概率。例如 骰子掷出“ ,骰子掷出“6”的事件和其在下 一次也掷出“ 一次也掷出“6”的事件是相互独 立的。 立的。
连续联合PDF 连续联合
• 两个连续变量X和Y的PDF f(x,y)是指
例8.
• 考虑如下PDF: • 显然
• 容易证实,对所有从0到3的x, 且 。注:这个积分是
,并 。。
如果我们想估计上述PDF比方说在0和1之间的 值,我们就得到 ; 就是说,x落在0和1之间的概率是1/27。
4.3 联合概率密度
• 离散联合 离散联合PDF 令X和Y为两个离散随机变量,则函数: f(x,y)=P(X=x且Y=y) =0 当X ≠x且Y ≠y 称离散联合概率密度函数,并给出X取值x和Y取值y的 离散联合概率密度函数, 离散联合概率密度函数 概率。
统计学中的若干概念复习




• • • • • • •
一、总和与乘积运算子 样本空间、 二、样本空间、样本点与事件 三、概率与随机变量概率 四、概率密度函数 五、概率分布的特征值 六、若干重要的理论概率分布 七、假设检验
一、总和与乘积运算子
• 希腊大写字母 Σ (sigma)表示总和。例如: n ∑ xi = x1 + x 2 + ⋅⋅⋅ + xn
• 1. 离散rv取有限多个值。例,掷两颗骰子,X为 两骰子出现的数码之和,则X为rv,X可取如下 数值:2,3,4,5,6,7,8,9,10,11,12。 • 2. 连续rv取某一区间任何值。例,某人身高,它 可以取某个范围,比方说170-180cm之间的任何 值。
四、概率密度函数
4.1 离散随机变量的概率密度函数
例1.
• 考虑投掷一颗有1到6点的骰子的试验, 样本空间由结果1,2,3,4,5和6构成。 • 这6个事件因此穷举了整个样本空间。 因为共有6个等可能结果,而任一结果 都有同等的机会出现,故出现任一结果 的概率都是1/6。 • 既然1,2,3,4,5和6构成事件的穷举集, 故 P(1+2+3+4+5+6)=P(1)+P(2)+…+P(6)=1
事件A 事件A 事件A可以出现2 (事件A可以出现2次)
三、概率与随机变量概率
3.1 概率的定义: 概率的定义:
•在n个等可能的试验结果中,如果有m个有利于事 件A的出现,则定义比率m/n为A的相对频率 相对频率 (relative frequency)。 n=4( HH、HT、TH、TT ),m=2( HT、TH ) 所以事件A的概率为P(A)=2/4=50%
n
百度文库
• 乘积运算子 Π 的定义为:
∏ x = x ⋅ x ⋅⋅⋅ x
i 1 2
n
n
i =1
• 例如,
∏x = x ⋅x ⋅x
i 1 2
3
3
i =1
二、样本空间、样本点与事件 样本空间、
• 一个随机实验的所有可能结果的集合叫做总体 总体 (population)或样本空间 样本空间(sample space),而此样本 样本空间 空间的每一个元素叫做一个样本点 样本点(sample point)。 样本点 • 例如,在抛掷两枚硬币的试验中,样本空间由HH、 HT、TH、TT四个可能结果构成。
4.4 边际概率密度函数
• 相对于f(x,y)来说,f(x)和f(y)称为个别或边际 边际 (marginal)概率密度函数 概率密度函数。这些边际PDF的推 概率密度函数 导如下:
X的边际PDF Y的边际PDF
其中, 表示对所有的Y值求和, 对所有X值求和。
表示
例5.
X=-2
• X的边际PDF可求得如下:
,此外,
• X和Y的边际PDF为:
X的边际PDF Y的边际PDF
例9.
• 例8所给的联合PDF的两个边际PDF如下:
• 因为 • 我们说这两个变量不是统计上独立的。
五、概率分布的特征值
• 一个概率分布常常能用少数几个特征值——称之 为分布的矩(moments)来概括它,用的最广泛的 矩 一些矩是均值 均值(mean)或期望值 期望值(expected value)和 均值 期望值 方差(variance)。 方差
两个随机变量X和Y是统计上独立的,当且仅当: 是统计上独立的, 两个随机变量 和 是统计上独立的 当且仅当: 就是联合PDF可表达为各边际 可表达为各边际PDF的乘积。 的乘积。 就是联合 可表达为各边际 的乘积 例7.
•袋中装有编号为1,2和3的三个球,从中有回置地随机 抽取两个(就是,第一次抽出的球被回置后再抽第二 次。)令X表示第一次抽出的球的号码,而Y表示第二 次抽出的球的号码,下表给出X和Y的联合PDF:
例4.
大家可 看到 个关 随 矩阵 机变 X Y 概 矩阵
• 下表给出离散随机变量X和Y的联合PDF。
• 此表告诉我们X取值-2的同时Y取值3的概率是0.27;X取值3的同时Y 取值6的概率是0.35;等等。
一个很浅显的小例子:“下雨、阴天、晴天”(X=1,2, 3),“游泳、踢球”(Y=1,2),那么下雨时踢球的 概率是P(X=1,Y=2)=?
4.2 连续随机变量的概率密度函数
• 令X为一连续rv。我们说f(x)是X的PDF如果如下条件成立
tips:当离散随机变量可看 作为单个分离的点 单个分离的点及其 单个分离的点 对应的概率,而连续随 机变量可看作为无数个 无数个 连续的点(区间) 连续的点(区间)及其 对应的概率,表现为曲 线和积分形式
• 现在, , 并且 • 因此 • 故在本例中我们说 两个变量在统计上独立。容易验 证,对上表所给的X和Y值的任意其他组合,联合 PDF都可分解为个别PDF因子。
• 可以证明,例4中所给的X和Y变量由于两边际PDF的乘积 不等于联合PDF,所以不是统计上独立的。【注:如果两 变量是统计上独立的,则必须对X和Y的一切组合都有 f(x,y)=f(x)f(y)】 什么叫独立? 什么叫独立?


如果举尽了一个试验的全部可能结果,我们说事件是穷举的 穷举的 (exhaustive)。例如,事件A两个正面,B两个反面,C一正一反举尽了 全部结果,因而是(集体地)穷举事件。 HH(两正),HT、TH(一正一反),TT (两反)为穷举
三、概率与随机变量概率
3.1 概率的定义: 概率的定义:
•令A为样本空间中的一个事件。事件A的概率,记 为P(A),是指在重复试验中事件A将出现的次数 的比例。
n m n m
n
∑ i=1 ∑ j =1 ( xij + yij ) =∑ i=1 ∑ j =1 xij + ∑ i=1 ∑ j =1 yij
n n n −1 n
m
[∑ i =1 xi ]2 = ∑ i =1 xi 2 + 2∑ i =1 ∑ j =i +1 xixj 4.
= ∑ i =1 xi 2 + 2∑ i < j xixj
3.2 概率的性质: 概率的性质:
P(A)是一个实值函数,并且有如下的性质: •1. 对每个A有 0 ≤ P ( A) ≤ 1。 •2.如果A、B、C,…构成事件的一个穷举集,则 P(A+B+C)=1,其中A+B+C表示A或B或C,如 此等等。 •3. 如果A、B、C…是互斥事件(e.g.HH,HT),则 P(A+B+C+…)=P(A)+P(B)+P(C) +…
HH
HT
TH
TT
二、样本空间、样本点与事件 样本空间、
• 一个事件 事件(event) 就是样本空间的一个子集。例如令A表示出现一个正面 事件 一个反面,HT和TH属于A,A就是一个事件。 将“一正一反” 一正一反” 设为事件A 设为事件A, 则有HT TH两 HT和 则有HT和TH两 种情况 • 如果一个事件的出现排斥另一事件的出现,我们说事件是互斥的 互斥的 (mutually exclusive),HH、HT不可能同时出现。 “一正一反”和 一正一反” 两正” “两正” 不可能同时出现
例5.
• Y的边际PDF可求得如下:
• 如本例所表明的,我们把列的数值相加而得X的边际 PDF,把行的数值相加而得Y的PDF。 • 注意:对所有的X值取 就等于1,对所有的Y 值取 也等于1。
条件PDF 条件 • 某事件发生的几率经常要以另一事件的发生为 条件。 条件。
例:一名早间新闻时段的气象预报员可能会说: “如果冷锋在今天抵达此地,那么下雨的概率为 80%,否则的话,下雨的概率就很低。”
• ΣΣ的一些性质是: •
n m m
+ ⋅⋅⋅ + ( xn1 + xn 2 + ⋅⋅⋅ + xnm)
1. ∑ i =1 ∑ j =1 xij =∑ j =1 ∑ i =1 xij
n
;双重总和的运算次序可交换。
m
• 2. • 3. •
∑ ∑
i =1
n
n
m j =1
xijyij =∑ i =1 xi ∑ j =1 yj
以上表达式表明,一个变量的条件PDF可表达 为联合PDF和另一变量的边际PDF之比。
例6.
• 计算以下概率:
• 注意:无条件概率f(X=-2)是0.27,但若Y已取定3,则X取 值-2的概率是0.53。
• 再次注意:X取值2的无条件概率是0.26,而不同于Y取定 6时的0.20。
4.5 统计独立性
函数 叫做X的条件 条件(conditional)PDF;它给出Y取给 条件 定值y的条件下X取值x的概率。类似地,
给出Y的条件PDF。
• 以上条件PDF可求得如下:
f(x|y)(即当Y=y的条 件下,X=x的概率)就 是:f(x,y)(X=x,Y=y的 概率)÷f(y)(Y=y的概 率)
X的条件PDF Y的条件PDF
i =1
• 总和运算子 的一些重要性质: • 1. ∑ i =k k = nk ,其中k是常数。如 • 2. ∑ i =1 kx = k ∑ i =1 x ,其中k是常数。
i i
n

4 i=1
3 = 4 ⋅ 3 = 12
n
n
• 3. ∑ i =1 ( x + y ) = ∑ i =1 x + ∑ i =1 y
•令X为取相异值x1 ,x2 ,…,xn ,…的一个离散随机变量,则 函数: f(x)=P(X=xi ) 当i=1,2,…,n,… =0 当x ≠ xi •叫做X的离散概率密度函数 离散概率密度函数(discrete probability density 离散概率密度函数 function,PDF) •其中P(X=xi)表示离散随机变量X取值xi的概率。
例2.
• 在两颗骰子的投掷中,两骰子所出现的数码之和这 在两颗骰子的投掷中, 一随机变量X,可取所示的11个数值之一 个数值之一。 一随机变量 ,可取所示的 个数值之一。此变量 可表示如下( 的PDF可表示如下(参看图 ): 可表示如下 参看图1)
注:这些概率容易加以证实。在 全部36个可能结果中,有一个总 和为2,有两个总和为3,余下类 推。 ——x代表数码之和的点数(2, 3…11,12),f(x)代表点数出现 的概率,例如“数码之和为7”可 出现6次,而其概率f(x)=6/36 (总共36种投掷中可出现6次“数 码之和为7”的情况) 图1. 例2的离散随机变量的概率 的离散随机变量的概率 密度函数
相关文档
最新文档