统计学原理 第六章 概率与抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学原理
正态分布是最重要的一种连续型随机变量分布,原因有三: 第一,它是最常见的一种分布,许多随机变量服从或接近服从正 态分布。如同龄人的身高、体重、农作物的产量、学生考试的成绩 等等。 第二,正态分布在一定条件下,还是一些其他分布的近似分布, 如大样本下的t分布与正态分布近似。 第三,许多有用的分布可以由正态分布推导出来,如卡方分布、 t分布和F分布都可由正态分布导出。
统计学原理
统计学原理
第一节 概率基础展
一、随机事件及其概率
统计学原理
(一)随机事件 随机现象在自然界和社会经济生活中都普遍存在,如购买彩票 可能中奖也可能不中;投一枚硬币可能出现正面也可能出现反面;手 机通话,可能一次拨通,也可能要二次、三次才能拨通。 随机试验,简称试验,它必须满足以下的性质: 每次实验的可能结果不是唯一的 每次试验之前不能确定何种结果会出现 试验可在相同条件下重复进行
统计学原理
(二)几种重要的连续型随机变量分布 1.正态分布。如果连续性随机变量X 的密度函数为:
则称随机变量X 服从均值为μ、方差为σ2的正态分布,记为 X~N(μ,σ2)。正态分布的密度函数图形一般称为正态曲线,它是 一条以均值为中心的对称钟形曲线,如图6-1所示。
统计学原理
图6-1 正态分布曲线
统计学原理
(三)随机事件的概率 进行n 次重复试验,随机事件A 发生的次数是m 次,发生频率是 m/n,当实验的次数n 很大时,如果频率在某一数值p 附近摆动,而 且随着试验次数n 的不断增加,频率的摆动幅度越来越小,则称P 为事件A 发生的概率,记为:
P(A)=p
Байду номын сангаас
二、概率的性质和运算
统计学原理
P(B)=P(A1∩B)+…+P(An∩B)
贝叶斯公式
统计学原理
第二节 随机变量及其概率分布
一、随机变量
统计学原理
无论随机试验的结果本身与数量有无关系,都可以把试验的每 个结果与实数对应起来,即把试验结果数量化。
由于这样的数量依赖式样的结果,而对随机试验来说,在每次试 验之前无法断言会出现何种结果,因而也就无法确定它会取什么值, 即它的取值具有随机性,称这样的变量为随机变量。
三、连续型随机变量的概率分布
统计学原理
(一)概率密度与分布函数 除了离散型随机变量之外,还有一类重要的随机变量———连 续型随机变量,这种随机变量X 可以取某个区间[a,b]或(-∞,+∞) 中的一切值。 由于这种随机变量的所有可能值无法像离散型随机变量那样一 一排列,因而也就不能用离散型随机变量的分布律来描述它的概率 分布,刻画这种随机变量的概率分布的一种方法是用分布函数,但在 理论上和实践中更常用的方法是用所谓的“概率密度”。
事实上,随机变量就f是随试验结果的不同而变化的量,因此可
以说,随机变量是试验结果的函数。
二、离散型随机变量的概率分布
统计学原理
若随机变量X 的所有可能取值为有限个或者虽有无限个但可以 一一排列,则称X 为离散型随机变量。
(一)概率分布 定义:设X 为离散型随机变量,其所有可能的取值为x1,x2…}, 则pi=P(X=xi) (i=1,2…)称为随机变量的X 的分布律,也称为概率函数。 随机变量X 的分布律具有以下性质: pi≥0(i=1,2…) p1+p2+…=1
(一)概率的性质 概率P 为定义在ξ 上的非负值函数,即对每一个事件A ∈ξ, 都可定义一个实数P(A),它们满足如下的条件: 非负性:对一切A∈ξ,有P(A)≥0。 规范性:P(Ω)=1。 可列可加性(或称可数可加性):若A1,A2,…∈ξ 为一列两两 互不相容的事件,则
统计学原理
(三)全概率公式和贝叶斯公式 全概率公式(law of total probability)
统计学原理
(三)几种重要的离散型随机变量分布 (1)二项分布 从一大批产品中随机抽取一件产品,检验它是否为次品,这就是 一次伯努利实验 超几何分布 当一个有限总体中只包含两类个体(即所谓的成功和失败)时,每次无放回 地从总体中随机抽取一个个体,即可看成是一次伯努利实验。 泊松分布 若随机变量X 的分布律为:
统计学原理
(二)数学期望和方差 直观地,随机变量取值有一个平均值,它应该是可能取得各个值 乘以其概率后求和(以概率为权重的加权平均数)。 我们将此概念写成如下定义: 设离散随机变量X 的概率分布为: P(X=x)=f(x) 如果级数xf(x)绝对收敛(绝对收敛的要求保证了求和不依赖于 通项的先后次序),则将它记为EX,即
2.指数分布。 定义 如果随机变量X 的概率密度为:
统计学原理
则称X 为参数λ 的指数随机变量,其分布称为参数为λ 的指 数分布。记为X~expλ,其分布函数为:
统计学原理
3.伽玛分布。 定义 参数为γ>0和γ<0的伽玛分布的概率密度函数:
统计学原理
4.对数正态分布。 一般情况下,正态分布对于包含离群值的数据是不适用的。当 数据包含离群值时,相对于正态分布而言,采用对数正态 (lognormal)分布通常是一个较好的选择。 对数正态分布式按下面方法由正态分布推导而来的:假设X 是 一个正态随机变量,其均值为μ,方差为σ2,则称随机变量Y =ex 服从参数为μ 和σ2的对数正态分布(lognormal distribution)。 注意,如果Y 服从参数为μ 和σ2的对数正态分布,则X=lnY服从均 值为μ、方差为σ2的正态分布。
统计学原理
统计学原理
第一章 概率与抽样分布
统计学原理
本章目录
第一节 概率基础 第二节 随机变量及其概率分布 第三节 抽样分布 第四节 大数定律与中心极限定律
学习目标
通过本章学习: 了解概率基础 了解抽样分布 了解大数定律 了解中心极限定律 掌握离散型随机变量 掌握连续型随机变量的概率分布
统计学原理
(二)随机事件间的关系和运算 对于试验E,不可能事件是空集Φ,必然事件是样本空间Ω 本身, 事件A 是样本空间Ω的子集。在讨论两个事件之间的关系和对若干 个事件进行运算时,均假定它们是同一个随机试验下的随机事件。 事件的包含与相等 事件的和 事件的积 事件的互斥和对立 事件的差