数理统计学_.

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

P{a X b} F (b) F (a) ;
(4) xlim F ( x) F ( x0 )( x ) ,即分布函数 x
0
处处右连续.
其中,性质(1),(2),(4)是鉴别一个函 数是否为某随机变量分布函数的充分必要条件.
2.离散型随机变量
随机变量通常可分两种类型,若随机变量全部可能 取值是有限个或可列无限个,则称这种随机变量为 离散型随机变量,否则称为非离散型的.
数理统计(统计推断)的特点是应用 面广,分支较多. 社会的发展不断向统 计提出新的问题.
计算机的诞生与发展,为数据处理 提供了强有力的技术支持,数理统计与 计算机的结合是必然的发展趋势.
由于学时有限,课程的的这部分内 容重点在于介绍数理统计的一些重要概 念和典型的统计方法,它们是实际中最 常用的知识.
虽然他不能精确地和肯定地确定 PA , 但可以期望获得一个(在某种意义下)比 较好的推断. 这就涉及到 (1)怎样设计试验,决定观察的数目; (2)怎样利用试验观察的结果作出一个“好 ”的推断等. 这都是数理统计所要研究的问题.
第一个问题是怎样进行抽样,使抽得的 样本更合理,并有更好的代表性?这是抽样 方法和试验设计问题:最简单易行的是进行 随机抽样.
则称 X 在区间 [a, b] 上服从均匀分布,记作
X ~ U [a, b] .
(2). 指数分布
随机变量 X 的概率密度为
e x , x 0 f ( x) 0, x 0
其中, 0 ,则称 X 服从参数为 的指数分 布,记作 X ~ E ( )
.
(3). 正态分布
f ( x) 0



f ( x)dx 1
x2
P{x1 X x2} f ( x)dx
x1
几种常见的连续型随机变量的概率分布.
(1). 均匀分布
连续型随机变量 X 的概率密度为
1 , a x b, a b, fቤተ መጻሕፍቲ ባይዱ( x) b a 0, others
数理统计学是一门应用性很强的学 科. 它是研究怎样以有效的方式收集、 整理和分析带有随机性的数据,以便对 所考察的问题作出推断和预测,直至为 采取一定的决策和行动提供依据和建议.
数理统计不同于一般的资料统计,它 更侧重于应用随机现象本身的规律性进行 资料的收集、整理和分析.
由于大量随机现象必然呈现出它的规 律性,因而从理论上讲,只要对随机现象 进行足够多次观察,被研究的随机现象的 规律性一定能清楚地呈现出来. 但客观上 只允许我们对随机现象进行次数不多的观 察试验,也就是说, 我们获得的只是局部 观察资料.
(1)、乘法公式
P( B) 0 ,则有
P( AB) P( B) P( A B) P ( A) P ( B A)
) 0 (1)对 两 个 事 件 A, B , 若 P( A ,
一般地,设有 n 个随机事件
A1 , A2 ,, An ,若 P( A1A2 A n1 ) 0 ,则有
其中, 0 p 1 ,则称 X 服从参数为 n, p 的二 项分布,记作 X ~ B(n, p)
.
(3).泊松分布
若随机变量 X 的分布律为
P{ X k}

k
k!
e ( k 0,1, 2,)
其中, 0 , 则称 X 服从参数为 的 Poisson 分布,记作 X ~ P( ) .
定义 1.2.3 设离散型随机变量 X 所有可能取值 为 xk (k 1,2,) ,而 X 取值 xk 的概率为 pk ,即
P{ X xk } pk
概率分布.
(k 1,2,)
(1.2.1) 式称为离散型随机变量 X 的分布律或
(1).两点分布
若随机变量 X 只取 a, b 两个值,且分布律为
第一章 概率论基础
一、 概率的定义与性质
设 (,F , P) 为概率空间, 则概率 P 有 如下性质: (1) P ( ) 0 ; (2) Ai F , i 1,2,, n , 且 Ai Aj (i j ) , 则
P( Ai ) P( Ai ) (有限可加性)
P ( A1 ) P A2 A1 P An A1 A2 An 1
P ( A1 A2 An )
(2)、全概率公式与Bayes公式
机事件.若
设 是样本空间, A, B1, B2 ,, Bn 为随
P( Bi ) 0(i 1,2, , n), Bi B j (i j ) ,
共100万包
即使 PA 是0.99,即种子 公司出售的一百万包中 有99万包是可接受的,
那些包是可 接受的呢??
零售商购买的200包仍有可能“碰巧” 是从不可接受的一万包中选取的.
这样他就要损失一笔资金.
这一类不肯定性是由于“随机性”所 引起的. 在已知 PA 的条件下,这种不肯定性 的程度已在概率论部分作过讨论. 下面我们回到第一类不肯定性:
P( AB) P( A) P( B)
则称事件 A 与事件 B 相互独 立.
定义 1.1.6 称 n 个事件 A1 , A2 ,, An 相 互独立,若对任意 s(2 s n) ,及 任意 ik , k 1,2,, s ,
1 i1 i2 is n ,

P( Ai1 Ai2 Ais ) P( Ai1 ) P( Ai2 ) P( Ais ) .
零售商对种子公司出售的小包中可接 受(即至少有22粒花籽将发芽)的包数所 占比例 PA 是多少没有把握.
零售商能够根据试验的方法(请公司进 行发芽试验)来改善他的处境. 根据试验他能作出天然 状况 PA 是多少的决策.
这就是抽取部分种籽进行发芽试验,通过这 部分中发芽数所占比例(频率)来对 PA 的真 值进行推断.
随机变量 X 的概率密度为
1 f ( x) e 2
( x )2 2 2
( x )
其中, , 是常数,且
0 ,则称 X 服从参
, 的正态分布,记作 X ~ N ( , 2 ) . 数为
特别的,当 0, 1 时的正态分布称为标准正 态分布,记作 X ~ N (0,1) .标准正态分布的概率 密度与分布函数分别用 ( x) 和 ( x) 表示
第二个问题是怎样从取得的样本去推断 总体?这种推断具有多大的可靠性? 这是统计推断问题. 本课程着重讨论第二个问题,即最常用统 计推断方法.
可见,在数理统计中必然要用到概率论 的理论和方法. 因为随机抽样的结果带有随 机性,不能不把它当作随机现象来处理 .
由此也可以说, 概率论是数理统计的基础,而数理统 计是概率论的重要应用. 但它们是并列的 两个学科,并无从属关系 .
从历史的典籍中,人们不难发现许 多关于钱粮、户口、地震、水灾等等的 记载,说明人们很早就开始了统计的工 作 . 但是当时的统计,只是对有关事实 的简单记录和整理,而没有在一定理论 的指导下,作出超越这些数据范围之外 的推断.
到了十九世纪末二十世纪初,随 着近代数学和概率论的发展,才真正 诞生了数理统计学这门学科.
3. 连续型随机变量
定义 1.2.4 设随机变量 X 的分布函数为 F ( x) , 若存在一个非负可积的函数 f ( x) ,对任意实数
x有
F ( x) f ( x)dx
x
成立, 则称 X 为连续型随机变量, 且称 f ( x) 为
X 的概率密度函数(简称概率密度).
概率密度 f ( x) 具有如下性质 (1) (2) (3)
随机变量常用大写英文字母 X ,Y , Z 或小写希腊字母 , , 表示.
1.分布函数及其性质
定义 1.2.2 设 X 是一个随机变量,称
F ( x) P{ X x} ( x )
为随机变量 X 的分布函数。
实际上,随机变量的分布函数就是事件{ X 的概率.
x}
每包要是有3粒不 发芽,马上免费退换! 每包25粒
零售商面临如下两种类型的不肯定性: (1) 他对种子公司出售的小包中可接受(即至 少有22粒花籽将发芽)的包数所占比例 PA 是 不清楚的. 这是第一类不肯定性.
每包25粒中 至少有22粒将 发芽 所有的包都 如此吗??
这种类型的不肯定性,即不知道种 子公司出售的小包中可接受的比例,它 是由于对总体的真实状态(天然状态) 无知所引起的不肯定性.
根据分布函数的定义,可得分布函数有如下性质:
(1) 0 F ( x) 1,且 F ( ) xlim F ( x) 0 ,
F () lim F ( x) 1 ;
x
(2)若 x1 x2 ,则 F ( x1 ) F ( x2 ) ,即分布函数 是单调不减的; (3)对 a b ,有
学习统计无须把过多时间化在计算 上,可以更有效地把时间用在基本概 念、方法原理的正确理解上. 国内外 著名的统计软件包: SAS,SPSS, MATLAB, EXCEL等,都可以让你快速、 简便地进行数据处理和分析.
下面我们以一例说明数理统计
某种子公司A,栽种了几种类别的 鲜花,收获了大量的花籽,并把每25粒 花籽扎成一小包出售. 一个零售商批发 了若干包,并向顾客保证:在每包25粒 花籽中至少有22粒将能发芽,否则的话 可免费调换另一包.
i 1 i 1 n n
(3) P( A) 1 P( A) (4) P( A B) P( A) P( AB) , 特别地,若 B A ,则 P( A B) P( A) P( B) , 从而有 若 B A ,则 P( B) P( A) ; (5) P( A B) P( A) P( B) P( AB)
(2)由于种子公司出售的花籽的货单上,这类 花籽共有一百万包,而零售商只购买了200包, 因此他又面临着另一类不肯定性;
从中购买 200包 共100万包
这就是尽管他知道了一百 万包可接受的比例 PA , 但对他所购买的200包, 其中可接受的比例仍旧没 有“把握”.
那些包是可 接受的呢??
从中购买 200包
三、 随机变量及其分布
(一) 一维随机变量的分 布 定义 1.2.1 设 (,F , P) 是一个概率空间,
对于 ,X ( ) 是一个取实数的单值函 数;若对任一实数 x ,{ : X ( ) x}是一 随机事件,亦即 { : X ( ) x}F ,则称
X ( ) 为随机变量.
P( A B) P( A) P( B)
二、 条件概率与事件的独立性
1.条件概率
定义 1.1.4 设 A, B 是两个随机事件,
P ( AB ) 且 P( B) 0 , 则称 P ( B ) 为事件 B 发生
的条件下事件 A 发生的条件概率, 记为
P ( AB ) P( A B) P( B)
X
a
1 p
b
p
P
其中,0 p 1 ,则称 X 服从两点分布.特别的, 当 a 0, b 1 时,称 X 服从 (0 1) 分布,记作
X ~ (0 1) .
(2).二项分布
若随机变量 X 的分布律为
k P{ X k} Cn p k (1 p)n k (k 0,1, 2, , n)
数理统计的任务就是研究怎样有效 地收集、整理、分析所获得的有限的资 料,对所研究的问题, 尽可能地作出精 确而可靠的结论.
在数理统计中,不是对所研究的对 象全体(称为总体)进行观察,而是抽取 其中的部分(称为样本)进行观察获得数 据(抽样),并通过这些数据对总体进 行推断.
由于推断是基于抽样数据,抽样数 据又不能包括研究对象的全部信息. 因 而由此获得的结论必然包含不肯定性.
且 A Bi ,则 i 1
P ( A P Bi (P A) Bi ( )
i 1 n
n
)
P( Bi ) P( A Bi ) P( Bi A) P( Bi A) n P( A) P( Bi ) P( A Bi )
i 1
2.事件的独立性
定义 1.1.5 设 A, B 是两个随机 事件,若
相关文档
最新文档