统计学课件第5-7章概率分布、抽样分布及参数估计

合集下载

抽样分布与参数估计

抽样分布与参数估计

抽样分布与参数估计首先,我们来了解什么是抽样分布。

在统计学中,抽样分布是指从总体中多次抽样得到的样本统计量的分布。

假设我们的总体是指所有感兴趣的个体的集合,而样本是从总体中选取的一部分个体。

抽样分布的形状和性质取决于总体的分布和样本的大小。

通过分析抽样分布,可以得到有关总体参数的有用信息。

例如,我们想要知道一些城市成年人的平均年收入。

在实际情况下,我们无法调查每个人的收入情况,因此我们需要从总体中随机抽取一部分个体作为样本,并计算他们的平均年收入。

如果我们多次从总体中抽取样本并计算平均年收入,然后绘制这些平均值的分布图,我们就可以得到平均年收入的抽样分布。

这个抽样分布将给我们提供有关总体平均年收入的估计和推断。

接下来,我们将讨论参数估计。

参数估计是指使用样本数据来估计总体参数的过程。

总体参数是用于描述总体特征的数值,如总体平均值、总体标准差等。

通过从总体中抽取样本,并计算样本统计量,我们可以利用样本统计量来估计总体参数。

常用的参数估计方法有点估计和区间估计。

点估计是指用单个数值来估计总体参数,例如用样本均值来估计总体均值。

点估计给出了一个单一的值,但不能提供关于估计的精度的信息。

因此,我们常常使用区间估计。

区间估计是指给出一个区间,这个区间内有一定的置信水平使得总体参数落在这个区间内的概率最高。

区间估计能够向我们提供关于估计的精确程度的信息。

区间估计依赖于抽样分布的性质。

中心极限定理是制定抽样分布理论的一个重要原则。

根据中心极限定理,当样本容量足够大时,样本均值的抽样分布将近似于正态分布。

这使得我们可以使用正态分布的性质来计算置信区间。

构建置信区间的一种常用方法是使用样本均值的标准误差。

标准误差是样本均值的标准差,它用来衡量样本均值和总体均值之间的误差。

根据正态分布的性质,当样本容量足够大时,样本均值与总体均值之间的误差可以用标准误差来估计。

通过计算标准误差并结合正态分布的性质,我们可以得到样本均值的置信区间。

统计学课件第5-7章概率分布、抽样分布及参数估计剖析.

统计学课件第5-7章概率分布、抽样分布及参数估计剖析.
第5、6、7章
概率分布、抽样分布及参数估计
Probability Distributions & Sampling Distributions
& Parameter Estimation
Wednesday, January 16, 2019
Statistical Research Office
1
本部分主要研究的问题有:
● 遵循随机性原则 --- 体现在在每一层抽选中;
● 每一层内应包含足够多的个体;
● 在同等条件下,抽样误差要小于简单随机抽 样和系统抽样的抽样误差。
Wednesday, January 16, 2019 Statistical Research Office 12
Wednesday, January 16, 2019
Statistical Research Office
7

常用的随机抽样组织方式
► 简单随机抽样(Simple random sampling)
►分层随机抽样(Stratified sampling)
►系统随机抽样(Systematic sampling)
►整群随机抽样 (Cluster sampling) 常用的随机抽样方法: ►重复抽样 (Sampling with replacement) ►不重复抽样(Sampling without replacement)
8
Wednesday, January 16, 2019
Statistical Research Office
★ 简单随机抽样 -定义:从总体中,按照随机的原则,使得总体 中每个个体都有同等被选中的机会,而先后抽 出的n个个体作为一个容量为n的样本。

统计学ppt课件

统计学ppt课件

概率的定义
从样本空间到实数的映射,满 足非负性、规范性、可数可加 性。
随机变量及其分布
随机变量的定义
定义在样本空间上的 函数,取值依赖于随 机试验的结果。
离散型随机变量
取值有限或可数可列 的随机变量。
连续型随机变量
取值连续的随机变量 。
分布函数
描述随机变量概率分 布的函数。
概率密度函数
描述连续型随机变量 的函数。
时间序列分析
使用统计方法来分析和预测金融时间序列数据,如股票价格、利率 等。
金融风险管理
使用统计方法来衡量和管理金融风险,如信用风险、市场风险等。
THANKS 感谢观看
行拟合和预测。
时间序列的季节性分析
季节性的定义
01
季节性是指时间序列数据在一年内或固定周期内重复出现的波
动。
季节性分析的意义
02
通过分析时间序列的季节性规律,可以更好地理解数据的周期
性变化,为预测提供依据。
季节性分析的方法
03
常见的季节性分析方法包括绘制季节指数图、计算季节性比率
、构建季节性回归模型等。
策。
统计学可以帮助人们理解数据背 后的规律和趋势,从而做出更明
智的决策。
统计学的应用领域
01
02
03
04
商业
市场调研、消费者行为分析、 销售预测等。
医学
临床试验、流行病学、健康状 况调查等。
社会学
社会调查、民意测验、人口统 计等。
自然科学
实验设计、质量控制、科研数 据分析等。
统计学的历史与发展
统计学的起源可以追溯到17世纪,当时欧洲的一些学者开始研究如何从数据中得出 可靠的结论。

《统计学原理》课件第七章抽样调查

《统计学原理》课件第七章抽样调查
4 -6
第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序

究 原
总体分布 样本分布 抽样分布

一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析

医学统计学课件PPT

医学统计学课件PPT
(variable)、变量值(value of variable)
(1)、 研究单位(unit) :研究中的个体 (individual),是根据研究目的确定的。
二、统计学中的几个基本概念
例如:研究7岁男孩身高的正常值范围 研究大学生视力 研究水污染情况 研究细胞变性 研究肝癌的地区分布
一个人 一只眼睛 一毫升水 一个细胞 一个地区
二、统计学中的几个基本概念
• 实验者
投掷次数
• Hu Pingcheng 1
• Hu Pingcheng 2
• Hu Pingcheng 3
• Hu Pingcheng 4
• Hu Pingcheng 5
• Hu Pingcheng 6
• Hu Pingcheng 7
• Buffon
4040
• K.Pearson
• 同质:同长沙市、同7岁、同男孩、同无 影响身高的疾病。
二、统计学中的几个基本概念
• (2)、变异 (variation)
• 变异 (variation):同质研究单位中变 量值间的差异。
• 例如:1)长沙市2004年7岁男孩身高有 高有矮

2)相同的药方治疗相同的疾病的
病人,疗效有好有坏
二、统计学中的几个基本概念
• 特点:1)不可避免性

2)有统计规律性
二、统计学中的几个基本概念
• 产生原因: • 个体差异(生物变异)
二、统计学中的几个基本概念
• 6、频率(relative frequency)、概率 (probability)、小概率事件
.(1)、频率(relative freguency): 一次随机试 验有几种可能结果,在重复进行试验时,个别 结果看来是偶然发生的,但当重复试验次数相 当多时,将显现某种规律性。例如,投掷一枚 硬币,结果不外乎出现“正面”与“反面”两 种,现在,我们看一掷币模拟试验:

统计学抽样与参数估计

统计学抽样与参数估计

12
12
2

N
n )
1.25
(
4
2)
5
n N -1 2 4 1 12
样本平均数的标准差又称为抽样平均误差(或抽样标 准差)。
第19页/共87页
样本均值的分布与总体分布的比较
总体分布
.3
.2
.1 0
1
234
= 2.5
σ2 =1.25
.3 P ( X ) 抽样分布
.2
.1
0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X

x
n
N n ,即均值推断的抽样误差 N 1
第25页/共87页
样本均值抽样分布的实际应用

样本统计量的估计值与其所要测度的总体参数值之
间的绝对差距,被称为抽样误差(sampling error)。
• 抽样分布能够用来提供抽样误差大小的可能性(概
率)。
在例1中,如果人事部经理认为
在一次抽样中所得到的中层干部的
第22页/共87页
B、当总体分布未知时,需要用到中心极 限定理(Central limit Theorem)
对容量为n 的简单随机样本,样本均值的分 布随样本容量的增大而趋于正态分布。
经验上验证,当样本容量等于或大于30时,无 论总体的分布如何,样本均值的分布则非常接近正 态分布。
因此统计上常称容量在30(含30)以上的样本 为大样本(large-sample-size)。
n+1)
Nn
32、、不考考虑虑顺顺序序的的重不复重抽复样抽:样:
C
n N
N! n!(N n)!
4、不考虑顺序的重复抽样:

统计学原理:第7章 参数估计

统计学原理:第7章 参数估计
7 - 25
一个总体参数的区间估计
总体参数 均值 比例 方差
7 - 26
符号表示 样本统计量
x
p
2
s2
7.2.1 总体均值的区间估计
1、正态总体、2已知,
非正态总体、大样本
2、正态总体、2未知,小样本
7 - 27
总体均值的区间估计
(1、Z分布)
1. 假定条件
总体服从正态分布,且方差(2) 已知
量进行监测,企业质检部门经常要进行抽检,以分析每袋重 量是否符合要求。现从某天生产的一批食品中随机抽取了25 袋,测得每袋重量如下表所示。已知产品重量的分布服从正 态分布,且总体标准差为10g。试估计该批产品平均重量的 置信区间,置信水平为95%
这表明一个具体的点估计值无法给出估计的可 靠性的度量,一个点估计量的可靠性是由它的 抽样标准误差来衡量的。
7 -9
抽样分布回顾
Xi ~
, 2
..X
~
,
2
n
p Z Z Z 1
2
2
p Z 2
X
X
Z 2
1
p
Z 7 - 10
2
X
X
Z
2
X
1
抽样分布回顾
p
Z
2
X
X
7 - 12
实际情况是,样本均值已知,而总体均值未知 。
x
样本均值与总体均值的距离是对称的,
若某个样本均值落在总体均值的两个标准差范围以内, 则总体均值就会被包括在以样本均值为中心左右两个标 准差的范围之内。
7 - 13
区间估计
(interval estimate)
1. 总体参数估计的一个区间: 样本统计量 加减 估计误差

《统计学》教学课件

《统计学》教学课件

教育部普通高等教育“十一五”国家级规划教材《统计学》教学课件(PowerPoint )制作人:徐国祥马俊玲赵宁目录《统计学》第1章总论第7章抽样和抽样分布第6章概率分布第2章统计资料的搜集和整理第3章集中趋势和离散趋势第4章相对指标和指数第5章概率第10章非参数统计第8章参数估计第9章假设检验第13章统计决策第11章相关分析与回归分析第12章时间序列分析和预测教育部普通高等教育“十一五”国家级规划教材第1章总论统计学的产生和发展最早的统计是作为国家重要事项的记录。

从统计学的产生和发展过程来看,可以把统计学划分为三个时期:统计学的萌芽期、统计学的近代期、统计学的现代期1.统计学的萌芽期统计学的萌芽期始于17世纪中叶至18世纪中、末叶,当时主要有国势学派和政治算术学派。

(1)国势学派国势学派对统计学的创立和发展所作的贡献:为统计学这门学科起了一个至今仍为世界公认的名词“统计学”(Statistics),并提出了一些仍为统计学者采用的术语:如“显著事项”等。

国势学派在研究各国的显著事项时,主要是系统运用对比的方法来研究各国实力和强弱,实际上是“对比”思想的形象化的产物。

(2)政治算术学派政治算术学派在统计发展史上的作用:在数量统计资料的基础上进行全面系统的总结,并从中提炼出理论原则。

同时,政治算术学派第一次有意识地运用可度量的方法,力求把自己的论证建筑在具体的、有说服力的数字上面,依靠数量的观察来解释与说明社会经济生活。

主要的代表人物:威廉·配第(W.Petty)、约翰·格朗特(J.Graunt)政治算术学派在很大程度上毕竟还处于统计核算的初创阶段,它只能从简单的、粗略的算术方法来对社会2.统计学的近代期统计学的近代期始于18世纪末至19世纪末,在这时期的统计学主要有数理统计学派和社会统计学派。

(1)数理统计学派主要代表人:拉普拉斯(place)凯特勒(A.Quetelet)——统计学之父,他把统计学发展中的三个主要源泉,即德国的国势学派、英国的政治算术派和意大利、法国的古典概率派加以统一、改造并融合成具有近代意(2)社会统计学派社会统计学派由德国大学教授尼斯(K.G.A.Knies)首创,主要代表人物为恩格尔(C.K.E.Engel)和梅尔(G.V.Mayr)他们认为,统计学的研究对象是社会现象,目的在于明确社会现象内部的联系和相互关系;统计方法应当包括社会统计调查中资料的搜集、整理,以及对其分析研究。

《统计学》完整ppt课件

《统计学》完整ppt课件
秩和检验的应用场景
适用于等级资料或无法精确测量的数据,如医学 领域的疗效评价、心理学中的量表评分等。
3
秩和检验的优缺点
优点在于对数据分布的假设较为宽松,适用范围 广;缺点是当样本量较大时,检验效率可能降低 。
符号检验
符号检验的基本原理
通过比较样本数据的中位数或均值与某个参考值的大小关 系,判断总体分布是否存在显著差异。
推论性统计分析
介绍如何在Excel中进行推论性统计分析, 如假设检验、方差分析等。
Python编程实现统计分析案例展示
Python统计分析库介绍
数据处理与可视化
简要介绍Python中常用的统计分析库,如 NumPy、Pandas、SciPy等。
演示如何使用Python进行数据清洗、处理 及可视化,包括缺失值处理、异常值检测 等。
相关分析与回归分析
相关分析
研究两个或多个变量之间相关关系的统计分析方法,通过计算相关系数来衡量变量之间 的相关程度。
回归分析
研究因变量与一个或多个自变量之间关系的统计分析方法,通过建立回归模型来预测因 变量的取值。
04
CATALOGUE
非参数统计方法
卡方检验
卡方检验的基本原理
通过比较实际观测值与理论期望值之间的差异,判断两个或多个分 类变量之间是否存在显著关联。
03
CATALOGUE
推论性统计方法
参数估计方法
点估计
用样本统计量直接作为总体参数的估计值。
区间估计
根据样本统计量和抽样分布,构造一个包含总体参数的真值的置信区间,并给出该区间被总体参数真值覆盖的概 率。
假设检验原理及步骤
假设检验的基本原理
先对总体参数提出一个假设,然后利用样本信息判断这一假设是否合理,即判断总体参数与假设值是 否有显著差异。

统计学课件05第5章抽样与参数估计

统计学课件05第5章抽样与参数估计

反映样本数据的集中趋势和平均水平。
样本方差
定义
样本方差是每个样本数据与样本均值差的平方和的平均值,即 $s^2 = frac{1}{n} sum_{i=1}^{n} (x_i - overline{x})^2$。
计算方法
先计算每个样本数据与样本均值的差,然后将差平方,最后求和平 均。
作用
反映样本数据的离散程度和波动情况。
样本量的确定
根据调查目的和精度要求确定样 本量:精度要求越高,需要的样
本量越大。
根据总体规模和抽样方法确定样 本量:总体规模越大,需要的样 本量越大;分层或整群抽样较简 单随机抽样需要的样本量更大。
根据调查资源确定样本量:资源 有限时,需要在满足调查目的和 精度要求的前提下,合理确定样
本量。
02 参数估计
大数定律的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布函数F(x),则对于任意正实数ε,有 lim(n->∞)P(|X1+X2+...+Xn/n-E(X))/ε)=0,其中E(X)是随机变量X的期望值。
大数定律的实例
在抛硬币实验中,随着实验次数的增加,正面朝上的频率将趋近于0.5。
中心极限定理
中心极限定理定义
中心极限定理是指在大量独立同分布的随机变量中,不论 这些随机变量的分布是什么,它们的平均值的分布总是趋 近于正态分布。
中心极限定理的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布 函数F(x),则对于任意实数x,有lim(n->∞)P(∑Xi≤x)=∫(∞->x)F(t)dt。
样本分布的性质
无偏性
如果样本统计量的数学期 望等于总体参数,则该统 计量是无偏的。

第五章抽样分布与参数估计

第五章抽样分布与参数估计
第五章 抽样分布与参数估计
本章主要内容
❖ 一、抽样调查概述 ❖ 二、抽样推断的原理 ❖ 三、抽样分布与误差 ❖ 四、必要样本容量的确定
第一节 抽样调查概述
一、抽样调查的意义
按照一定的程序,从总体中抽取一部分单位 进行调查,根据样本资料的估计值,对总体待 估参数做出具有一定可靠程度的估计和推断, 以反映总体的数量特征或数量表现。
七.样本单位的抽选方法
在组织抽样调查时,根据样本单位是否重复抽取,分 别有重复抽样和不重复抽样两种方法。
1、重复抽样
重复抽样是指每次从总体中抽取一个单位进行观察后, 再把这个单位重新放回总体,使之继续参加下次抽选。这 种抽选法也称为放回抽样。
对于分层抽样Байду номын сангаас 层内是抽样调查 , 层间是全面调查
对于整群抽样: 群内是全面调查 , 群间是抽样调查
4.系统随机抽样
系统随机抽样又称为机械随机抽样或等距随机抽样。 它是先将总体中各单位按一定的标志排队,然后每隔一定 的距离抽取一个总体单位(个体)的抽样方式。
例如:从100人中抽取10人构成样本,先将100人排队编号, 然后在1~10号之间随机抽取一个数字,比如抽到3,那么 编号为 3,13,23,33,43,53,63,73,83,93的10个 人组成样本。
另外还有二重抽样法、比估计法、回归估计等
七、抽样调查中的几个基本概念
(一)全及总体与样本总体
1.全及总体是指根据调查目的所确定的研究对象全体.简称 为总体.常用 N 表示总体单位数。 2.样本总体是指根据随机原则从总体中抽取一部分单位所组 成的整体.常用 n 表示样本单位数(样本容量)。
一般 n 30 时,称为大样本;n 30 时,称为小样本

概率论与数理统计基本概念及抽样分布PPT课件

概率论与数理统计基本概念及抽样分布PPT课件

~
2 (n1 ),
2 2
~
2 (n2 ), 且它们相互独立,

2 1
2 2
~
2 (n1
n2 )
《概率统计》
返回
下页
结束
4. 2分布的百分位点
对给定的α(0<α<1)
(1)称满足
P{ 2
2
(n)}
,即
f ( y)dy
x2 ( n)
的点为 2分布的上100α百分位点。
f(y)
(2)称满足
注:在研究中,往往关心每个个体的一个(或几个)数量指标和 该数量指标在总体中的分布情况. 这时,每个个体具有的数量 指标的全体就是总体.
或,总体:研究对象的某项数量指标的值的全体.
《概率统计》
某批 灯泡的 寿命
该批灯泡寿命的 全体就是总体
返回
下页
结束
为推断总体分布及各种特征,按一定规则从总体中抽取若 干个体进行观察试验,以获得有关总体的信息,这一抽取过程 为 “抽样”.
( x)
(1)称满足条件 P{X>Xα} =α,
α

( x)dx
X
的点Xα为N(0,1)分布的上100α百分位点.
X1-α
0
由于 P{X X } 1 记 -Xα= X1-α
(2)称满足条件 P {| X | X }
2
2
的点 X 为N(0,1)分布的双侧100α百分位点.
X
2

E(X )
E(1 n
n i 1
Xi)
1 n
n i 1
E(Xi )
1 n
n
D(X ) D(1 n
n i1
Xi)

第3章-抽样分布与参数估计PPT优秀课件

第3章-抽样分布与参数估计PPT优秀课件
I 1 N
N
(XI X )2
2 I 1
N
• 总体比率(总体成数)
P N1 N
6
第三章 抽样分布与参数估计
• 样本平均数 • 样本方差 • 样本标准差
nXix ຫໍສະໝຸດ 1 nn(Xi x)2
s2 i1 n 1
s
• 样本比率(样本成数)
p n1 n
7
第三章 抽样分布与参数估计
• 样本统计量经常被用作估计总体参数。 • 点估计就是运用样本数据值计算出一个样本统计量的
• (3)
P ( 7 . 2 X 7 . 5 ) P ( 7 . 2 7 X 7 7 . 5 7 ) P ( 0 . 5 Z 1 1 . 2 ) 0 8 . 2
0 . 39 0 . 39 0 . 39
28
第三章 抽样分布与参数估计
27
第三章 抽样分布与参数估计
• (1) P ( X 7 .5 ) P (X 7 7 .5 7 ) P (X 7 1 .2 ) 8 0 .1 0 .39 0 .390 .39

(2)
P (X 7 .2 ) P (X 7 7 .2 7 ) P (X 7 0 .5 ) 1 0 .6 0 .39 0 .390 .39
值,将其作为总体参数的估计值。
• 如用 x5去0估计
• 问题是不同的样本提供不同的估计值 • 样本越大,估计的性质越好,但成本也越高 • 了解估计的性质有多好
• 解决办法:以样本的抽样分布作为理论基础。
8
第三章 抽样分布与参数估计
抽样分布
• 从一个总体中随机抽出容量相同的各种样本,从这些 样本计算出的某统计量所有可能值的概率分布,称为 这个统计量的抽样分布。

第5章抽样与参数估计

第5章抽样与参数估计
2008-2009
❖ 方便抽样是从便利的角度来考虑获取样本的。 样本的选取主要是让调查员来决定。
❖ 判断抽样是指根据调查人员的主观经验从总 体样本中选择那些被判断为最能代表总体的 单位作样本的抽样方法。
❖ 滚雪球抽样是指先对随机选择的一些被调查 者实施访问,然后再请他们推荐属于研究目 标总体特征的调查对象。
合计
单位数
N1 N0
N
变量值 1 0 —
均 值
μ p
X f 1N 10N 0N 1π
f
N
N

(Xμ )2f p
1π 2N0π 2N
1
0
准p
f
NN
1
0

( 1π )2π π ( 21π ) π (1π )1π π π (1π )
2008-2009
✓样本比例的抽样分布
• 容量相同的所有可能样本的样本比例的概率 分布
• 表示为 (1 - a
a 为是总体参数未在区间内的比例
• 常用的置信水平值有 99%, 95%, 90%
相应的 a 为0.01,0.05,0.10
2008-2009
✓置信区间 (confidence interval)
• 由样本统计量所构造的总体参数的估计区间称 为置信区间
• 统计学家在某种程度上确信这个区间会包含真 正的总体参数,所以给它取名为置信区间
• 估计量:用于估计总体参数的随机变量
如样本均值,样本比例、样本方差等 例如: 样本均值就是总体均值 的一个估计量
• 参数用 表示,估计量用 ˆ 表示 • 估计值:估计参数时计算出来的统计量的具
体值
如果样本均值 x =80,则80就是 的估计值
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

p( x) P{X x} x (1 )1 x , x 0,1
- 数学期望
EX
- 方差 DX (1 )

二项分布 X ~ B( N , p)
- 模型
x x N x p ( x ) P { X x } C p ( 1 p ) , x 0,1,, N - 概率函数 N
- 样本比率(Sample Proportion) vn p ( 其中 vn为样本中具有某种特性 的个体总数) n
n 1 2 - 样本方差(Sample Variance) S ( X X ) i n 1 i 1 2
Monday, July 06, 2015 Statistical Research Office 15
7

常用的随机抽样组织方式
► 简单随机抽样(Simple random sampling)
►分层随机抽样(Stratified sampling)
►系统随机抽样(Systematic sampling)
►整群随机抽样 (Cluster sampling) 常用的随机抽样方法: ►重复抽样 (Sampling with replacement) ►不重复抽样(Sampling without replacement)

均匀分布 X ~ U[ a,b]
- 模型
1 , x [a, b] - 概率函数 p( x) b a 0 其它
ab (b a) 2 , DX - 数学期望与方差 EX 2 12

指数分布

● ● ●
正态分布
e x x 0 f ( x) 其它 0
注 当总体标准差δ已知时,则可利用上述不等 式求出总体均值μ的概率为1- α的取值范围。 所求区间称作置信区间, 1- α称作置信水平。

n 称作抽样标准误差( S tandard Error)
当给定1- α数值时,对应的临界值为 Z 1- α

2
0.80 0.90 0.95 0.9545 0.98 0.99
位数N及样本容量n的大小,将总体单位划分为 n 组(段);最后,在第一组的单位中,按照随机 性原则选出第一个单位作为样本中的一个个体, 以后每隔相同的间隔保证在每一组中抽取一个个 体,则由这n组中所抽取的共n个个体构成一个 样本。
Monday, July 06, 2015 Statistical Research Office 10
N 1
,
上限为: X Z
2
2 N n
n


N 1

其中,
2 N n
n N 1
2
n (1 ) n N
(当N很大时)
n (当 3%时) N n
Monday, July 06, 2015 Statistical Research Office

21

来自正态总体的样本均值的分布
则,不管样本容量的大小,都有:
1 X X i ~ N ( , ) n i 1 n X 标准化之, ~ N (0,1) 给定α(0<α<1) n
n 2
有,
P{ Z
2
X-

n
Z } 1
2
22
Monday, July 06, 2015
Statistical Research Office
所以,总体均值1- α的置信区间为:
[ X Z
2

n
,
X Z
2

n
]
其中,δ为已知。

若δ为未知,以
S*
替代δ,因为
X- ~ t (n 1) * S n
Monday, July 06, 2015 Statistical Research Office 23
给定α(0<α<1)有,
X-

n
~ N (0,1)
给定α(0<α<1)
则,
P{ Z
2
X-

n
Z } 1
2
解不等式,得
P{ X Z
2

n
X Z
2

n
} 1
即 总体均值位于上述区间内的概率是1-α.
Monday, July 06, 2015 Statistical Research Office 18
★ 整群随机抽样 -定义:首先将总体划分为若干群(类、组), 然后根据样本容量大小及各群所含个体数的多
少,从所有群中按照随机性原则而抽取一定数
量的群作为样本群,则由所抽样本群中的所有
个体构成一个样本。
Monday, July 06, 2015
Statistical Research Office
13
可见,若一个总体的期望与方差存在,只要样 本容量足够地大,则从总体中抽选出的简单随 机样本的样本均值将近似于正态分布。
Monday, July 06, 2015 Statistical Research Office 16
★ 抽样分布:统计量的统计分布称作抽样分布。 求统计量的抽样分布,就是用已知随机变量的分 布表示统计量的分布。 ★ 样本均值的分布
2
S n
, X Z
2
S n
]
当采用简单随机不重复抽样时,
抽样标准误差为: 2 N n
n
Monday, July 06, 2015

N 1
20
Statistical Research Office
的 1 的置信区间下限为 : 2 N n
X Z
2
n

- 特点: ●简单易行、调查成本相对较低; ● 划分的群数应足够多; ● 各群内个体差异较大,而群与群之间差别较小。 ● 在其他条件相同的情况下,抽样误差要大于分 层随机抽样的抽样误差。 要求:能简述各随机抽样组织方式的实施,及其 各种方式主要实施的条件。
Monday, July 06, 2015

随机变量的概率分布
●常用的随机抽样组织方式
●样本均值的抽样分布及总体均值的估计
●样本比率的抽样分布及总体比率的估计
Monday, July 06, 2015
Statistical Research Office
2
▲ 常见随机变量的分布

0-1分布
X ~ B(1, )
- 模型
- 概率分布率(概率函数)
2
s*
n
]
n
Monday, July 06, 2015
Statistical Research Office
24
关于t-分布的说明:
若 随机变量 X ~ N(0, 1 ), 2 随机变量 Y ~ ( n),
-分布
t-分布 F分布
2
f ( x)
1 e 2
( x )2 2 2
xR
Monday, July 06, 2015
Statistical Research Office
6
● 利用EXCEL进行相关概率计算 (略)
Monday, July 06, 2015
Statistical Research Office
● 遵循随机性原则 --- 体现在在每一层抽选中;
● 每一层内应包含足够多的个体;
● 在同等条件下,抽样误差要小于简单随机抽 样和系统抽样的抽样误差。
Monday, July 06, 2015 Statistical Research Office 12
● 要求层内个体差异较小,而层与层之间差别 较大。
● 简单易行 --- 特别是当总体中的个体总数相 当多时。
Monday, July 06, 2015 Statistical Research Office
11
★ 分层随机抽样
-定义:将总体首先划分为若干层(类、组),
然后在每一层(类、组)内按一定的方法抽取个 体(按简单随机抽样或按系统随机抽样),则由 每一层所抽个体构成一个样本。 - 特点:
- 特点:
● 遵循随机性原则 --- 随机性主要体现在第一 个样本点的选取; ● 需要一个抽样框; ● 对抽样框中的个体要排队 --- 若按无关变量 排队,则等同于简单随机抽样;若按有关变 量排队,则在其他条件相同的情况下,抽样 误差要小于简单随机抽样。
● 排队后个体的相关特性不能有规律地或周 期地出现。
Monday, July 06, 2015
Statistical Research Office
4
超几何分布 X ~ H (n, N , M ) x n x - 模型 CM CN M p ( x ) P { X x } , x 0,1,2,, n - 概率函数 n

-期望
M M N n - 方差 DX n (1 ) N N N 1
X- P{t * t } 1 s 2 2
解上述不等式,得
n
n 1 2 其中,s * ( x x ) i n 1 i 1
X t
2
s
*
n
2
X t
s* n
2
s
*

[ X t
的概率为 1 - .
,
X t
● 对总体不作任何划分;
● 总体本身就是一个确定的抽样框。
- 抽样方法:重复抽样、不重复抽样
Monday, July 06, 2015 Statistical Research Office 9
★ 系统随机抽样
相关文档
最新文档