统计学之概率分布与抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5. 经典统计推断的基础
正态分布
= 正态随机变量X的均值 = 正态随机变量X的方差 = 3.1415926; e = 2.71828
x = 随机变量的取值 (- < x < )
则称X服从参数为 、 的正态分布,记作 X~N( , )
正态分布函数的性质
1. 图形是关于x=对称钟形曲线,且峰值在x= 处 2. 均值和标准差一旦确定,分布的具体形式也惟一确
2. 描述连如续t分型布随、机F变分量布的、最χ2分重布要都的是分在布正态分 3. 许多现布象的都基可础以上由推正导态出分来布的,来此描外述,t分布 4. 可用于、态近二分似项布离分,散布 在型、 一随定Po机条is变件so量下n分,的布可分的以布极按限正为态正分
➢ 例布如布:原理二项来分处布理当。n越来越大,越近似服从正态分
•称为随机变量X的分布函数。 • 有了分布函数定义,任意x1,x2∈R, x1<x2,随 机变量X落在(x1,x2]里的概率可用分布函数来计算:
•P {x1<X x2}=P{X x2}-P{Xx1}= F(x2)-F(x1).
• 在这个意义上可以说,分布函数完整地描述了随机 变量的统计规律性,或者说,分布函数完整地表示了 随机变量的概率分布情况。
统计学之概率பைடு நூலகம்布与抽 样分布
2020年4月29日星期三
第 3 章 概率分布与抽样分布
3.1 随机变量 3.2 正态分布 3.3 常用的抽样方法 3.4 抽样分布 3.5 中心极限定理的应用
3.1 随机变量
(random variables)
1.对随机事件的数值性描述
--例如:抛硬币的结果,正面定义为1,反 面定义为0
正态分布
(例题分析)
•【例】定某公司职员每周的加班津贴服从均值为50元、标 准差为10元的正态分布,那么全公司中有多少比例的职员每 周的加班津贴会超过70元,又有多少比例的职员每周的加班 津贴在40元到60元之间呢?
•解:设=50, =10,X~N(50,102)
3.3 常用的抽样方法
▪ 3.3.1 简单随机抽样 ▪ 3.3.2 分层抽样 ▪ 3.3.3 系统抽样 ▪ 3.3.4 整群抽样
1. 连续型随机变量可以取某一区间或整个实数轴 上的任意一个值
2. 它取任何一个特定的值的概率都等于0 3. 不能列出每一个值及其相应的概率 4. 通常研究它取某一区间值的概率 5. 用概率密度函数和分布函数的形式来描述
分布函数的定义
•
• 定义 设X是一随机变量,X是任意实数,则实值函数 •F(x)=P {Xx}, x∈(-∞,+∞)
•标准正态分布的分布函数表示为
•标准正态分布的图形
•例1 •解
•查表标准正态分布函数表
解 查标准正态分布表
正态分布的转换
1. 任何一个一般的正态分布,可通过下面的线性 变换转化为标准正态分布
X-μ表示将一般正态分布的曲线平衡到标准正态分布的 位置
除以σ表示将一般正态分布的曲线形状转换为标准正态 分布
简单随机抽样的优缺点
▪ 优点:简单随机抽样是最符合随机原则的 抽样方法,能保证总体的每个成员具有已 知的且同等的被选为样本单位的机会,因 此,产生的样本,不论其多大都是总体的 一个有效代表。
连续型随机变量的期望和方差
1. 连续型随机变量的数学期望
2. 方差
3.2 正态分布
(normal distribution)
1. 正态分布是最重要的一种概率分布。正态分布概 念是由德国的数学家(Carl Friedrich Gauss, 1777—1855)和天文学家Moivre于1733年首次 提出的,但由于Gauss率先将其应用于天文学 家▪研究正,态故分正布态是分许布多又统叫计高方法斯的分理布论。基础:
2.一般用 X,Y,Z 来表示 3.根据取值情况的不同分为
离散型随机变量:数轴上可列个孤立的点 连续型随机变量:数轴上一个或多个区间
离散型随机变量
1. 随机变量 X 取有限个值或所有取值都可以 逐个列举出来 x1 , x2,…
2. 以确定的概率取这些不同的值 3. 离散型随机变量的一些例子
连续型随机变量
分布函数的性质 • 1、单调不减性:若x1<x2, 则F(x1)F(x2); • 2、归一 性:对任意实数x,0F(x)1,且
•3、右连续性:对任意实数x,
•反之,具有上述三个性质的实函数,必是某个 随机变量的分布函数。故该三个性质是分布函 数的充分必要性质。
•试求出X的分布函数。 •解
连续型随机变量与概率密度
定,不同参数正态分布构成一个完整的“正态分布族”
3. 均值可取实数轴上的任意数值,决定正态曲线的具
体位置;标准差决定曲线的“陡峭”或“扁平”程度
。越大,正态曲线扁平;越小,正态曲线越高陡峭 4. 当X的取值向横轴左右两个方向无限延伸时,曲线的
两个尾端也无限渐近横轴,理论上永远不会与之相交 5. 正态随机变量在特定区间上的取值概率由正态曲线下
设X是随机变量,如果存在定义在整个实数轴上的 函数f(x),满足条件
•则称X是连续型随机变量,f(X)称为X的概率密度函
数,简称概率密度。
注意f(x)不是概 率
• 概率密度函数的性质
•1) •2)
•1
•这两条性质是判定一 •个函数 f(x)是否为某 •个随机变量X的概率 •密度函数的充要条件
•3) X落入区间[a,b]内的概率=
的面积给出,而且其曲线下的总面积等于1
•正态概率密度函数的几何特征
•μ决定曲线的位置,σ决定曲线的“胖瘦”
•正态分布下的概率计算
•方法一:利用统计软件计算
•方法二:转化为标准正态分布查表计算
•标准正态分布
(standardize the normal distribution)
•标准正态分布的概率密度表示为
简单随机抽样
(simple random sampling)
1. 从 得总 每体一N个个总、单体也最位单称基中位纯本随都随的机有机抽地相抽样抽同样方取的,法n机个是之会单应一(位用概作最率为多)被样抽本中,使 2. 抽取元素的具体方法有重复抽样和不重复抽样 3. 特点
➢ 简单、直观,在抽样框完整时,可直接从中抽取样本 ➢ 用样本统计量对目标量进行估计比较方便 ➢ 但是当N很大时,不易构造抽样框 ➢ 抽出的单位很分散,给实施调查增加了困难 ➢ 没有利用其他辅助信息以提高估计的效率
正态分布
= 正态随机变量X的均值 = 正态随机变量X的方差 = 3.1415926; e = 2.71828
x = 随机变量的取值 (- < x < )
则称X服从参数为 、 的正态分布,记作 X~N( , )
正态分布函数的性质
1. 图形是关于x=对称钟形曲线,且峰值在x= 处 2. 均值和标准差一旦确定,分布的具体形式也惟一确
2. 描述连如续t分型布随、机F变分量布的、最χ2分重布要都的是分在布正态分 3. 许多现布象的都基可础以上由推正导态出分来布的,来此描外述,t分布 4. 可用于、态近二分似项布离分,散布 在型、 一随定Po机条is变件so量下n分,的布可分的以布极按限正为态正分
➢ 例布如布:原理二项来分处布理当。n越来越大,越近似服从正态分
•称为随机变量X的分布函数。 • 有了分布函数定义,任意x1,x2∈R, x1<x2,随 机变量X落在(x1,x2]里的概率可用分布函数来计算:
•P {x1<X x2}=P{X x2}-P{Xx1}= F(x2)-F(x1).
• 在这个意义上可以说,分布函数完整地描述了随机 变量的统计规律性,或者说,分布函数完整地表示了 随机变量的概率分布情况。
统计学之概率பைடு நூலகம்布与抽 样分布
2020年4月29日星期三
第 3 章 概率分布与抽样分布
3.1 随机变量 3.2 正态分布 3.3 常用的抽样方法 3.4 抽样分布 3.5 中心极限定理的应用
3.1 随机变量
(random variables)
1.对随机事件的数值性描述
--例如:抛硬币的结果,正面定义为1,反 面定义为0
正态分布
(例题分析)
•【例】定某公司职员每周的加班津贴服从均值为50元、标 准差为10元的正态分布,那么全公司中有多少比例的职员每 周的加班津贴会超过70元,又有多少比例的职员每周的加班 津贴在40元到60元之间呢?
•解:设=50, =10,X~N(50,102)
3.3 常用的抽样方法
▪ 3.3.1 简单随机抽样 ▪ 3.3.2 分层抽样 ▪ 3.3.3 系统抽样 ▪ 3.3.4 整群抽样
1. 连续型随机变量可以取某一区间或整个实数轴 上的任意一个值
2. 它取任何一个特定的值的概率都等于0 3. 不能列出每一个值及其相应的概率 4. 通常研究它取某一区间值的概率 5. 用概率密度函数和分布函数的形式来描述
分布函数的定义
•
• 定义 设X是一随机变量,X是任意实数,则实值函数 •F(x)=P {Xx}, x∈(-∞,+∞)
•标准正态分布的分布函数表示为
•标准正态分布的图形
•例1 •解
•查表标准正态分布函数表
解 查标准正态分布表
正态分布的转换
1. 任何一个一般的正态分布,可通过下面的线性 变换转化为标准正态分布
X-μ表示将一般正态分布的曲线平衡到标准正态分布的 位置
除以σ表示将一般正态分布的曲线形状转换为标准正态 分布
简单随机抽样的优缺点
▪ 优点:简单随机抽样是最符合随机原则的 抽样方法,能保证总体的每个成员具有已 知的且同等的被选为样本单位的机会,因 此,产生的样本,不论其多大都是总体的 一个有效代表。
连续型随机变量的期望和方差
1. 连续型随机变量的数学期望
2. 方差
3.2 正态分布
(normal distribution)
1. 正态分布是最重要的一种概率分布。正态分布概 念是由德国的数学家(Carl Friedrich Gauss, 1777—1855)和天文学家Moivre于1733年首次 提出的,但由于Gauss率先将其应用于天文学 家▪研究正,态故分正布态是分许布多又统叫计高方法斯的分理布论。基础:
2.一般用 X,Y,Z 来表示 3.根据取值情况的不同分为
离散型随机变量:数轴上可列个孤立的点 连续型随机变量:数轴上一个或多个区间
离散型随机变量
1. 随机变量 X 取有限个值或所有取值都可以 逐个列举出来 x1 , x2,…
2. 以确定的概率取这些不同的值 3. 离散型随机变量的一些例子
连续型随机变量
分布函数的性质 • 1、单调不减性:若x1<x2, 则F(x1)F(x2); • 2、归一 性:对任意实数x,0F(x)1,且
•3、右连续性:对任意实数x,
•反之,具有上述三个性质的实函数,必是某个 随机变量的分布函数。故该三个性质是分布函 数的充分必要性质。
•试求出X的分布函数。 •解
连续型随机变量与概率密度
定,不同参数正态分布构成一个完整的“正态分布族”
3. 均值可取实数轴上的任意数值,决定正态曲线的具
体位置;标准差决定曲线的“陡峭”或“扁平”程度
。越大,正态曲线扁平;越小,正态曲线越高陡峭 4. 当X的取值向横轴左右两个方向无限延伸时,曲线的
两个尾端也无限渐近横轴,理论上永远不会与之相交 5. 正态随机变量在特定区间上的取值概率由正态曲线下
设X是随机变量,如果存在定义在整个实数轴上的 函数f(x),满足条件
•则称X是连续型随机变量,f(X)称为X的概率密度函
数,简称概率密度。
注意f(x)不是概 率
• 概率密度函数的性质
•1) •2)
•1
•这两条性质是判定一 •个函数 f(x)是否为某 •个随机变量X的概率 •密度函数的充要条件
•3) X落入区间[a,b]内的概率=
的面积给出,而且其曲线下的总面积等于1
•正态概率密度函数的几何特征
•μ决定曲线的位置,σ决定曲线的“胖瘦”
•正态分布下的概率计算
•方法一:利用统计软件计算
•方法二:转化为标准正态分布查表计算
•标准正态分布
(standardize the normal distribution)
•标准正态分布的概率密度表示为
简单随机抽样
(simple random sampling)
1. 从 得总 每体一N个个总、单体也最位单称基中位纯本随都随的机有机抽地相抽样抽同样方取的,法n机个是之会单应一(位用概作最率为多)被样抽本中,使 2. 抽取元素的具体方法有重复抽样和不重复抽样 3. 特点
➢ 简单、直观,在抽样框完整时,可直接从中抽取样本 ➢ 用样本统计量对目标量进行估计比较方便 ➢ 但是当N很大时,不易构造抽样框 ➢ 抽出的单位很分散,给实施调查增加了困难 ➢ 没有利用其他辅助信息以提高估计的效率