统计学第六章ppt
合集下载
金融统计学第六章商业银行统计精品PPT课件
响赢利水平的因素进行分析预测; (3)真实评价银行面对的风险水平,预测可
能对银行风险造成冲击的变量走势; (4)满足中央银行的监管要求; (5)银行客户重要情况的调查分析;
08.10.2020
6
四、商业银行资产与负债的分类
资产分类
1、流动资产:包括现金、存放中央银行款项、 存放同业款项、拆放同业、短期贷款、应收 账款、坏帐准备、贴现、短期投资、一年内 到期的长期投资;
第六章 商业银行统计
教学课件
2008.10
08.10.2020
1
第一节 商业银行统计概述
08.10.2020
2
一、商业银行主要业务和职能
商业银行的主要业务包括:
负债业务:吸收资金业务;
资产业务:将负债业务获得的资金加以运用,从而取得收 益的业务(现金业务、放款业务、投资业务、贴现业务和 固定资产业务);
业务经营数据:资产负债表、损益表、信贷 收支表;
金融市场和同业数据:货币供应量、利率环 境、汇率环境、同业竞争数据;
宏观经济数据:GDP、物价水平、投资水平、 消费、就业等;
专门调查所得数据。
08.10.2020
5
三、商业银行统计的任务
(1)客观、及时地反映经营运作情况; (2)评价、分析银行的赢利能力并对可能影
4、未分配利润:商业银行利润尚未分配的部分,等于可供分 配的利润扣除盈余公积之后的余额。
08.10.2020
9
第二节 商业银行收益统计
08.10.2020
10
收益分析的数据主要来自损益表,通过对损 益表的分析,了解商业银行的经济效益和盈 亏情况,分析利润增减变化的原因,为经营 决策提供依据。
损益表是用来反映一家银行在报告期收入、 支出、税金、利润等情况的报告。
能对银行风险造成冲击的变量走势; (4)满足中央银行的监管要求; (5)银行客户重要情况的调查分析;
08.10.2020
6
四、商业银行资产与负债的分类
资产分类
1、流动资产:包括现金、存放中央银行款项、 存放同业款项、拆放同业、短期贷款、应收 账款、坏帐准备、贴现、短期投资、一年内 到期的长期投资;
第六章 商业银行统计
教学课件
2008.10
08.10.2020
1
第一节 商业银行统计概述
08.10.2020
2
一、商业银行主要业务和职能
商业银行的主要业务包括:
负债业务:吸收资金业务;
资产业务:将负债业务获得的资金加以运用,从而取得收 益的业务(现金业务、放款业务、投资业务、贴现业务和 固定资产业务);
业务经营数据:资产负债表、损益表、信贷 收支表;
金融市场和同业数据:货币供应量、利率环 境、汇率环境、同业竞争数据;
宏观经济数据:GDP、物价水平、投资水平、 消费、就业等;
专门调查所得数据。
08.10.2020
5
三、商业银行统计的任务
(1)客观、及时地反映经营运作情况; (2)评价、分析银行的赢利能力并对可能影
4、未分配利润:商业银行利润尚未分配的部分,等于可供分 配的利润扣除盈余公积之后的余额。
08.10.2020
9
第二节 商业银行收益统计
08.10.2020
10
收益分析的数据主要来自损益表,通过对损 益表的分析,了解商业银行的经济效益和盈 亏情况,分析利润增减变化的原因,为经营 决策提供依据。
损益表是用来反映一家银行在报告期收入、 支出、税金、利润等情况的报告。
统计学第六章抽样和抽样分布
2021/3/4
统计学第六章抽样和抽样分布
4
一、总体与样本
▪ 把握两个问题: ▪ 1、总体和总体参数; ▪ 2、样本和样本统计量。
2021/3/4
统计学第六章抽样和抽样分布
5
1、总体与总体参数
(1)总体:指根据研究目的确定的所 要研究的同类事物的全体,是所要说 明其数量特征的研究对象。按所研究 标志性质不同,分为变量总体和属性 总体,分别研究总体的数量特征和品 质特征。 构成总体的个别事物(基本单元 )就是总体单位,也称个体。总体单 位的总数称为总体容量,记作N。
缺点:受主观影响易产生倾向性误差; 不能计算、控制误差,无法说明调查结果 的可靠程度。
抽样一般都是指概率抽样。
2021/3/4
统计学第六章抽样和抽样分布
15
2、重复抽样和非重复抽样
(1)重复抽样:又称重置抽样,是指从总体 中抽出一个样本单位,记录其标志值后,又将 其放回总体中继续参加下一轮单位的抽取。特 点是:第一,n个单位的样本是由n次试验的结 果构成的。第二,每次试验是独立的,即其试 验的结果与前次、后次的结果无关。第三,每 次试验是在相同条件下进行的,每个单位在多 次试验中选中的机会(概率)是相同的。在重复 试验中,样本可能的个数是 N n ,N为总体单位 数,n为样本容量。
2021/3/4
统计学第六章抽样和抽样分布
16
2、重复抽样和非重复抽样
(2)非重复抽样:又称为不重置抽样,即每次从
总体抽取一个单位,登记后不放回原总体,不参加下
一轮抽样。下一次继续从总体中余下的单位抽取样本
。特点是:第一,n个单位的样本由 n 次试验结果构成
统计学第六章抽样和抽样分 布
第六章 抽样与抽样分布
江西财经大学统计学课件第六章抽样分布
第六章 抽样和抽样分布
STAT
[例]某养猪场共有存栏生猪10万头,现欲了解这批生猪的平均 毛重及健康比例。调查者按随机原则从中抽取了100头生猪进行 调查,以计算其平均毛重和健康比例。
(一)总体参数:反映总体特征的变量。
X P N 1 2 (X )2
N
N
N
(二)样本统计量:反映样本特征的变量。任何样本的函数, 只要不包含总体的未知参数,都称为统计量。样本的随机性决 定统计量的随机性(统计量是随机变量)。
x1
x1 E(x)
N n x2 E(x) x2 E(x)xi E(x) ?
x 总 总个 离 = 数 差 [xi M E(x)]
理论公 x 式 [xi: M E(x)2 ]
第六章 抽样和抽样分布
STAT
[计算] N=3人,(A,B,C)=(1,2,3) n=2
x
[xi
E(x)]0 M
STAT
5. 抽样分布:样本统计量的所有可能取值及其出现概率的分
布。 →理论分布
抽样分布的形成:
样本及样本平均数
抽样分布的影响因素:总体分布、 样 本
样本容量、抽样方法、抽样组织形
A ,A
式、统计量构造
A,B A,C
B ,A
[例] n=2,计算样本平均年龄。
B ,B
样本平均年龄的抽样分布
B ,C C ,A
x 1 1.5 2 2.5 3
C ,B
P 1/9 2/9 3/9 2/9 1/9 C , C
x
x
1, 1 1
1 , 2 1 .5
1, 3 2
2 , 1 1 .5
2, 2 2
2 , 3 2 .5
3, 1 2
STAT
[例]某养猪场共有存栏生猪10万头,现欲了解这批生猪的平均 毛重及健康比例。调查者按随机原则从中抽取了100头生猪进行 调查,以计算其平均毛重和健康比例。
(一)总体参数:反映总体特征的变量。
X P N 1 2 (X )2
N
N
N
(二)样本统计量:反映样本特征的变量。任何样本的函数, 只要不包含总体的未知参数,都称为统计量。样本的随机性决 定统计量的随机性(统计量是随机变量)。
x1
x1 E(x)
N n x2 E(x) x2 E(x)xi E(x) ?
x 总 总个 离 = 数 差 [xi M E(x)]
理论公 x 式 [xi: M E(x)2 ]
第六章 抽样和抽样分布
STAT
[计算] N=3人,(A,B,C)=(1,2,3) n=2
x
[xi
E(x)]0 M
STAT
5. 抽样分布:样本统计量的所有可能取值及其出现概率的分
布。 →理论分布
抽样分布的形成:
样本及样本平均数
抽样分布的影响因素:总体分布、 样 本
样本容量、抽样方法、抽样组织形
A ,A
式、统计量构造
A,B A,C
B ,A
[例] n=2,计算样本平均年龄。
B ,B
样本平均年龄的抽样分布
B ,C C ,A
x 1 1.5 2 2.5 3
C ,B
P 1/9 2/9 3/9 2/9 1/9 C , C
x
x
1, 1 1
1 , 2 1 .5
1, 3 2
2 , 1 1 .5
2, 2 2
2 , 3 2 .5
3, 1 2
统计学 第六章 统计指数
•不变价格事实上只是一段时间不变,随着经济增长和价格水平的变化,不 变价格也要不定期地变化。 •我国曾经使用过1952年、1957年、1965年、1970年、1980年、1990年和 2000年不变价格 •当不变价格发生变化时,采用两个不同时期的不变价格计算的工业总产出 进行对比,就要消除不变价格变动的影响。
K p
p1
q0
2
q1
p0
q0
q1 2
p1 q0 q1 p0 q0 q1
Kq
q1
p0
2
p1
q0
p0 p1 2
q1 p0 p1 q0 p0 p1
将例1资料带入公式,可得:
k p
p1q0 p0q0
p1q1 26120 38600 64720 108.59% p0q1 23800 35800 59600
在选择指数形式时,主要考虑指数的经济意义,还要考虑 实际编制工作的可能性及对指数分析性质的特殊要求。
(一)工业生产指数 编制过程:
首先,对各种工业产品分别制定相应的不变价格标准,记为P0 然后,逐项计算各种产品的不变价格产值,加总起来就得到全部工 业产品的不变价格总产值 最后将不同时期的不变价格总产值加以对比,就得到相应时期的工 业生产指数
与马埃公式一样,虽然从数量上不偏不倚,但缺乏经济意义,所 用资料较多,计算困难。
是对拉氏指数和帕氏指数直接进行平均(型交叉)的结果,公式 为:
kp
p1q0
p1q1
p0 q0
p0 q1
kq
q1 p0
q1 p1
q0 p0
q0 p1
将例1资料带入公式,可得:
k p
p1q0 p0q0k p
K p
p1
q0
2
q1
p0
q0
q1 2
p1 q0 q1 p0 q0 q1
Kq
q1
p0
2
p1
q0
p0 p1 2
q1 p0 p1 q0 p0 p1
将例1资料带入公式,可得:
k p
p1q0 p0q0
p1q1 26120 38600 64720 108.59% p0q1 23800 35800 59600
在选择指数形式时,主要考虑指数的经济意义,还要考虑 实际编制工作的可能性及对指数分析性质的特殊要求。
(一)工业生产指数 编制过程:
首先,对各种工业产品分别制定相应的不变价格标准,记为P0 然后,逐项计算各种产品的不变价格产值,加总起来就得到全部工 业产品的不变价格总产值 最后将不同时期的不变价格总产值加以对比,就得到相应时期的工 业生产指数
与马埃公式一样,虽然从数量上不偏不倚,但缺乏经济意义,所 用资料较多,计算困难。
是对拉氏指数和帕氏指数直接进行平均(型交叉)的结果,公式 为:
kp
p1q0
p1q1
p0 q0
p0 q1
kq
q1 p0
q1 p1
q0 p0
q0 p1
将例1资料带入公式,可得:
k p
p1q0 p0q0k p
统计学第6章统计量及其抽样分布
均值的标准差
3
0.43(年 )
X n 49
X ~N(10, 0.432)
_
P (X _9)1P (X _9)1P (X 109 10)
0.43 0.43
=1-Φ(-2.33)= Φ(2.33)=0.9901
整理ppt
12
练习题
某类产品的抗拉强度服从正态分布,平均 值为99.8公斤/平方厘米,标准差为5.48公斤/平 方厘米,从这个总体抽出一个容量为12的样本, 问这一样本的平均值介于98.8公斤/平方厘米和 100.9公斤/平方厘米之间的概率有多大。
1.从一个总体中随机抽出容量相同的各种样本, 从这些样本计算出的某统计量所有可能值的概 率分布,称为这个统计量的抽样分布。
2. 设X1,X2,…,Xn是取自总体X的样本,样本
均值
_
X
1 n
n i 1
Xi
,所有可能样本的均值
_
X
构成
的概率分布即为样本均值的抽样分布。
整理ppt
3
【例】设一个总体,含有4个元素(个体),即
第六章 统计量及其抽样分布
整理ppt
1
6.1 统计量
1. 统计量的形成
抽样
样本 构造函数
2. 统计量是样本X1,X2……Xn的一个函数 3. 统计量不依赖任何未知参数
4. 将一组样本的具体观测值代入统计量函 数,可以计算出一个具体的统计量值。
整理ppt
2
6.2 样本均值的抽样分布 和中心极限定理
第二个观察值
1
2
3
4
.3 P ( x )
1
1.0 1.5 2.0 2.5 .2
2
1.5 2.0 2.5 3.0
卫生统计学课件_第六章_假设检验
16
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。
统计学第六章 研究变量的关系:相关与回归
• 例:
第三节 简单线性回归:推断
• 前两节从数据分析的角度对数据之间关系 的模式进行搜寻,如果将可观察的数据作 为总体的一个样本,搜寻到的模式就是总 体变量关系的一种估计,由此需要统计推 断方法来估计与检验此种关系。 • 推断问题开始于对总体模型的假定,本节 仅限于一个解释变量与一个响应变量线性 关系的研究,这被称为简单线性回归或一 元线性回归。
• 最小二乘回归特点:
第二节 数值型数据之间关系研究:相关与回归
• 可决系数R-squared: 表示在响应变量的总变动中能被回归方程解 释的百分比,用来描述直线关系的强度。 在一元线性回归中,其值等于相关系数的 平方。
第二节 数值型数据之间关系研究:相关与回归
• 残差(residuals):
回归线是解释变量与响应变量之间线性关系整体模 式的数学模型,研究与整体模式的偏差也是很重 要的。
第二节 数值型数据之间关系研究:相关与回归
残差图:
第二节 数值型数据之间关系研究:相关与回归
• 回归中的异常观测点和有影响的观测点
第二节 数值型数据之间关系研究:相关与回归
• 小心使用相关与回归方法:
第二节 数值型数据之间关系研究:相关与回归
• 例:
第二节 数值型数据之间关系研究:相关与回归
第一节 分类数据之间关系研究:列联表
模型2:检验独立性
Model for Examining Independence in Two-Way Tables Select an SRS of size n from a population. Measure two categorical variables for each individual. The null hypothesis is that the row and column variables are independent. The alternative hypothesis is that the row and column variables are dependent. CASE7.2
统计学6
6 - 33
经济、管理类 基础课程
统计学
三、样本方差的分布
6 - 34
经济、管理类 基础课程
统计学
(一)样本方差的分布
设总体服从正态分布N 设总体服从正态分布N ~ (µ,σ2 ), X1,X2,… ,Xn为来自该正态总体的样本,则样本方差 为来自该正态总体的样本, s2 的分布为
(n −1)s
2
2. 3.
,则
Z=
X −µ
令 Y = Z 2 ,则 Y 服从自由度为1的χ2分布,即 服从自由度为1 分布,
σ
~ N(0,1)
Y ~ χ (1)
2
4.
当总体 X ~ N(µ,σ 2 ) ,从中抽取容量为n的样本,则 从中抽取容量为n的样本,
样 本 6 - 10
经济、管理类 基础课程
(三)抽样分布
(sampling distribution) distribution)
统计学
1. 样本统计量的概率分布 2. 是一种理论概率分布 3. 随机变量是 样本统计量
样本均值, 样本均值, 样本比例,样本方差等
4. 结果来自容量相同的所有可能样本 结果来自容量相同的所有可能样本 5. 提供了样本统计量长远我们稳定的信息,是进 行推断的理论基础,也是抽样推断科学性的重 要依据
总体分布、样本分布、抽样分布
三、渐进分布和近似分布
6-3
经济、管理类 基础课程
统计学
一、统计量
(一)统计量的概念 • 是样本的特征值 • 设X1 , X2 ,…, Xn是从总体中抽取的容量 为n的一个样本,如果由此样本构造一 个函数T 个函数T( X1 , X2 ,…, Xn ),不依赖于 任何未知参数,则称函数T 任何未知参数,则称函数T( X1 , X2 ,…, Xn )是一个统计量。
大学统计学 第6章 假设检验与方差分析
18
35%
16
30%
14
12
25%
10
20%
8
`
15%
6
10%
4
2
5%
0
0%
50-60
70-80
90-100
统计学导论
第六章 假设检验与方差分析
第一节 假设检验的基本原理 第二节 总体均值的假设检验 第三节 总体比例的假设检验 第四节 单因子方差分析 第五节 双因子方差分析 第六节 Excel在假设检验与方差分析
记为 H1:。150
整理课件
6-7
三、检验统计量
所谓检验统计量,就是根据所抽取的样本计 算的用于检验原假设是否成立的随机变量。
检验统计量中应当含有所要检验的总体参数, 以便在“总体参数等于某数值”的假定下研 究样本统计量的观测结果。
检验统计量还应该在“H0成立”的前提下有 已知的分布,从而便于计算出现某种特定的 观测结果的概率。
为 =x 149.8克,样本标准差s=0.872克。问该
生产线的装袋净重的期望值是否为150克(即 问生产线是否处于控制状态)?
整理课件
6-4
所谓假设检验,就是事先对总体的参数 或总体分布形式做出一个假设,然后利用抽 取的样本信息来判断这个假设(原假设)是 否合理,即判断总体的真实情况与原假设是 否存在显著的系统性差异,所以假设检验又 被称为显著性检验。
量所得结果落入接受域的概率。
问题,对于 和 大小的选择有
不同的考虑。例如,在例 6-1 中,如果检验者站在卖方 的立场上,他较为关心的是不要犯第一类错误,即不 要发生产品本来合格却被错误地拒收这样的事情,这
时, 要较小。反之,如果检验者站在买者的立场上,
35%
16
30%
14
12
25%
10
20%
8
`
15%
6
10%
4
2
5%
0
0%
50-60
70-80
90-100
统计学导论
第六章 假设检验与方差分析
第一节 假设检验的基本原理 第二节 总体均值的假设检验 第三节 总体比例的假设检验 第四节 单因子方差分析 第五节 双因子方差分析 第六节 Excel在假设检验与方差分析
记为 H1:。150
整理课件
6-7
三、检验统计量
所谓检验统计量,就是根据所抽取的样本计 算的用于检验原假设是否成立的随机变量。
检验统计量中应当含有所要检验的总体参数, 以便在“总体参数等于某数值”的假定下研 究样本统计量的观测结果。
检验统计量还应该在“H0成立”的前提下有 已知的分布,从而便于计算出现某种特定的 观测结果的概率。
为 =x 149.8克,样本标准差s=0.872克。问该
生产线的装袋净重的期望值是否为150克(即 问生产线是否处于控制状态)?
整理课件
6-4
所谓假设检验,就是事先对总体的参数 或总体分布形式做出一个假设,然后利用抽 取的样本信息来判断这个假设(原假设)是 否合理,即判断总体的真实情况与原假设是 否存在显著的系统性差异,所以假设检验又 被称为显著性检验。
量所得结果落入接受域的概率。
问题,对于 和 大小的选择有
不同的考虑。例如,在例 6-1 中,如果检验者站在卖方 的立场上,他较为关心的是不要犯第一类错误,即不 要发生产品本来合格却被错误地拒收这样的事情,这
时, 要较小。反之,如果检验者站在买者的立场上,
心理统计学课件第六章 概率分布
(三)正态分布的特征
正态分布的形式是对称的,它的对称轴是 经过平均数点的垂线。
正态分布的中央点(即平均数点)最高, 然后逐渐向两侧下降。
正态曲线下的面积为1,平均数点的垂线 将面积划分为相等的两部分0.50。
正态分布曲线,标准差与概率有一定的数 量关系。
二、正态分布表的结构与使用
2、已知P值,求Z分数
已知从平均数开始的概率值,求Z值 已知位于两端的概率值,求该概率分界点
上的Z值 已知正态曲线中间部分的概率,特定区间的人数 求考试成绩中某一特定人数比率的分数界
限 按能力分组或等级评定时确定人数 将等级评定结果转化为测量数据
按能力分组或等级评定时确定人数
要把100人在某一能力上分成5个等级, 各等级应该有多少人?
将等级评定结果转化为测量数据
某教师评价全班50人的作文,有8人优, 17人良,20人中,5人及格,求各等级的 标准分数
求考试成绩中特定区间的人数
已知某年级200名学生考试呈正态分布, 平均分为85分,标准差为10分,学生甲 的成绩为70分,问全年级成绩比学生甲低 的学生人数是多少?
求考试成绩中某一特定人数比率的分数界限
某次招生考试,学生成绩符合正态分布, 学生成绩的平均分为80分,标准差为10 分,要择优录取25%的学生进入高一级学 校学习,问最低分数线应是多少?
第六章 概率分布 第三节 正态分布
一、正态分布特征
(一)正态分布的概念 与二项概率分布对比 变量类型 图形
正态分布:
在一个概率分布中,中间频数多,两 端频数对称地减少,成为一种“钟”形对 称的理论概率分布。
(二)正态分布曲线
标准正态分布的密度函数:
统计学课件第六章抽样调查PPT课件
特点
每个样本被选中的机会都 相等,样本的代表性相对 较好。
分层抽样
定义
先将总体按一定标准分成 若干层次或群,然后从各 层或群中按随机原则抽取 样本。
方法
分类抽样、比例抽样、类 型抽样。
特点
能够提高样本的代表性, 降低误差,减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列,然后按 照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术,如分层抽样、系统抽样等,以提 高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差,如无回答、不完整数据等, 以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图,为后 续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式,以提高 问卷的易用性和回答率。
确定调查方式
选择合适的调查方式,如自填式、面访式等, 并确定数据收集的途径。
测试与修正
对问卷进行测试和修正,确保问卷的准确性 和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训,确保他们了解调 查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组,然后从每个 群集或组中抽取一定数量的样本,也称为 簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者 进行调查,了解市场需求、消 费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员 进行调查,了解社会现象、人 口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课 件
统计学第六章抽样法
分层多阶段抽样
在总体分层的基础上,再在各层内进行多阶段抽 样。
3
集群抽样
先将总体划分为若干个集群,再随机抽取部分集 群进行调查,适用于地理区域等自然形成的集群。
多阶段抽样优缺点
适用范围广
适用于总体单位分布广泛、数量众多 的情况。
抽样误差小
通过多阶段抽样可以减小抽样误差, 提高估计精度。
多阶段抽样优缺点
06
多阶段抽样
多阶段抽样原理
抽样单位划分
多阶段抽样中,首先将总体划分为若干个初级抽样单位,再从初级抽样单位中抽 取若干个二级抽样单位,以此类推,直至抽取最终样本。
逐级抽取
在每一阶段,都按照随机原则从上一级抽样单位中抽取下一级抽样单位,直至获 得最终样本。
多阶段抽样方法
1 2
PPS抽样
即“概率与规模成比例”的抽样方法,每个初级 抽样单位被抽中的概率与其规模大小成比例。
分层抽样优缺点
分层标志选择困难
选择合适的分层标志是分层抽样 的关键,选择不当可能导致分层
效果不佳。
层间差异影响
如果各层间差异较大,可能导致 样本对总体的代表性降低。
需要较多样本量
相对于简单随机抽样,分层抽样 通常需要较多的样本量才能达到
相同的精度要求。
05
整群抽样
整群抽样原理
以群为抽样单位
整群抽样是将总体划分为若干个互不重叠的群,然后以群为 抽样单位进行随机抽样。
等距抽样
系统抽样中最常用的一种方法,它是按照某 种顺序给总体中的各个体编号,然后随机地 抽取一个编号作为第一调查个体,其他的调 查个体则按照某种确定的规则“系统地”抽 取出来。
周期性
系统抽样中,样本的抽取具有周期性,即每 隔一定的间隔就抽取一个样本。
在总体分层的基础上,再在各层内进行多阶段抽 样。
3
集群抽样
先将总体划分为若干个集群,再随机抽取部分集 群进行调查,适用于地理区域等自然形成的集群。
多阶段抽样优缺点
适用范围广
适用于总体单位分布广泛、数量众多 的情况。
抽样误差小
通过多阶段抽样可以减小抽样误差, 提高估计精度。
多阶段抽样优缺点
06
多阶段抽样
多阶段抽样原理
抽样单位划分
多阶段抽样中,首先将总体划分为若干个初级抽样单位,再从初级抽样单位中抽 取若干个二级抽样单位,以此类推,直至抽取最终样本。
逐级抽取
在每一阶段,都按照随机原则从上一级抽样单位中抽取下一级抽样单位,直至获 得最终样本。
多阶段抽样方法
1 2
PPS抽样
即“概率与规模成比例”的抽样方法,每个初级 抽样单位被抽中的概率与其规模大小成比例。
分层抽样优缺点
分层标志选择困难
选择合适的分层标志是分层抽样 的关键,选择不当可能导致分层
效果不佳。
层间差异影响
如果各层间差异较大,可能导致 样本对总体的代表性降低。
需要较多样本量
相对于简单随机抽样,分层抽样 通常需要较多的样本量才能达到
相同的精度要求。
05
整群抽样
整群抽样原理
以群为抽样单位
整群抽样是将总体划分为若干个互不重叠的群,然后以群为 抽样单位进行随机抽样。
等距抽样
系统抽样中最常用的一种方法,它是按照某 种顺序给总体中的各个体编号,然后随机地 抽取一个编号作为第一调查个体,其他的调 查个体则按照某种确定的规则“系统地”抽 取出来。
周期性
系统抽样中,样本的抽取具有周期性,即每 隔一定的间隔就抽取一个样本。
统计学课件及习题的答案06第六章 时间数列分析
★年距增长量=报告年某期水平—上年同期水平
四、平均增长量
平均增长量:是某一现象各逐期增长量的序时平
均数,反映现象在较长一段时期 内 平 量。均增 逐 逐 长 增减期 期 量 变化增 增 的一般长 长 水平累 量 量 。又计 n 项 之 叫递增 增数 和长
【教学资料】河南1954年总耕地面积9062千公顷,到2019年耕地面积 减少至8080千公顷,平均每年减少18.9千公顷,人均耕地也由1954年 的0.2公顷减少到2019年的0.08公顷,也低于全国人均耕地面积0.1公顷 的平均水平。。
动态 平均 指标
四、时间数列的编制原则
编制时间数列应遵守的基本原则:可比性。表现在:
(一)时间上要可比 (二)总体范围要可比 (三)指标的经济内容要可比 (四)计算方法、计算价格和计量单位上要可比
第二节 时间数列的水平分析指标
主要内容 ★ 发展水平 ☆ 平均发展水平 ★ 增长量 ☆ 平均增长量
一、发展水平
时间 1月初 人数 100
某企业职工人数资料
5月初
8月初
160
200
12月末 180
1 010 64 0 3 0 1 620 03 0 3 0 2 010 85 0 30101064016200302010850
a 2
2
2
2
2
2
4 3 0 3 3 0 5 30
第三节 时间数列的速度分析指标
本节内容
发展速度和增长速度 平均速度(平均发展速度和平均增长速度) 计算和运用速度指标应注意的问题
一、发展速度
发展速度:说明现象发展变动的相对程度。其值可 大于、等于或小于1。基本公式为:
按对比的 基期不同
四、平均增长量
平均增长量:是某一现象各逐期增长量的序时平
均数,反映现象在较长一段时期 内 平 量。均增 逐 逐 长 增减期 期 量 变化增 增 的一般长 长 水平累 量 量 。又计 n 项 之 叫递增 增数 和长
【教学资料】河南1954年总耕地面积9062千公顷,到2019年耕地面积 减少至8080千公顷,平均每年减少18.9千公顷,人均耕地也由1954年 的0.2公顷减少到2019年的0.08公顷,也低于全国人均耕地面积0.1公顷 的平均水平。。
动态 平均 指标
四、时间数列的编制原则
编制时间数列应遵守的基本原则:可比性。表现在:
(一)时间上要可比 (二)总体范围要可比 (三)指标的经济内容要可比 (四)计算方法、计算价格和计量单位上要可比
第二节 时间数列的水平分析指标
主要内容 ★ 发展水平 ☆ 平均发展水平 ★ 增长量 ☆ 平均增长量
一、发展水平
时间 1月初 人数 100
某企业职工人数资料
5月初
8月初
160
200
12月末 180
1 010 64 0 3 0 1 620 03 0 3 0 2 010 85 0 30101064016200302010850
a 2
2
2
2
2
2
4 3 0 3 3 0 5 30
第三节 时间数列的速度分析指标
本节内容
发展速度和增长速度 平均速度(平均发展速度和平均增长速度) 计算和运用速度指标应注意的问题
一、发展速度
发展速度:说明现象发展变动的相对程度。其值可 大于、等于或小于1。基本公式为:
按对比的 基期不同
统计学(本科)教学课件第六章时间数列
(二)平均增长速度
是指各环比增长速度的平均数,它说明某 种现象在一个较长时期内逐年平均增长变 化的程度。
其计算公式为:平均增长速度=平均发展速 度-1(或100%)
平均发展速度始终为正值,而平均增长速 度则可为正值,也可为负值。正值表明现 象在一段时期内平均递增程度;负值表明 现象逐期平均递减程度。
②由间断时点数列计算序时平均数
(a)由间隔相等的间断时点数列计算序时 平均数。
首先假定所研究的现象在两个相邻时点之 间的变动是均匀的,因而可将相邻两个时 点数值相加除以2,求得表明两个时点之间 的简单平均数,然后根据这些平均数,再 用简单算术平均法计算整个所研究的时间 内的现象的平均发展水平。
一、发展水平
发展水平是时间数列中具体时间条件下的指 标数值,用来反映社会经济现象在各个时期 或时点上所达到的规模或水平。
发展水平按其在时间数列中所处的位置不同, 可分为:
最初水平、最末水平和中间水平。 报告期水平、基期水平
二、平均发展水平
(一)概念 平均发展水平是把现象在不同时间上的发
在社会经济统计中一般将一天看作一个时 点,即以“一天”作为最小时间单位。根 据登记天数是否连续,可分为连续时点数 列和间断时点数列两种。
①由连续时点数列计算序时平均数
(a)在统计中,如果根据每日资料编制 所得到的时间数列,称为间隔相等的连 续时点资料。直接采用简单算术平均法 计算。
(b)如果登记资料每隔一段时期才有变动 所得到的数列,称为间隔不等的连续时 点数列,采用加权算术平均法进行计算, 即以每次变动持续的时间间隔长度为权 数(f)对各时点数值(a)加权。
累计增长量=报告期水平-固定期水平
二者之间有一定的数量关系,即:
统计学 第6章 统计推断(1、2节)
即,我们有95%的把握认为,该外资 企业员工平均每周加班时间为52.3小时 至57.7小时之间。
第六章 统计推断
总体成数(比例)
1、假定条件
的区间估计
对于试验结果只有两种情况的总体(二项 总体),且为大样本,即满足
np 5和n(1 - p) 5
2、使用正态分布 z 统计量
第六章 统计推断
第六章 统计推断
设 是总体 的一个参数, 是参数 2的 1 和 X 两个统计量,且 ,对给定的常 1 2 数 ,及任意的 1) , 有 , (0 则称随机区间 ) 1 P( 1 2 是臵信度(臵信水平)为 的臵信区间 1 1 , 2 (区间估计)。其中 分别为臵信下限和 1 和 2 臵信上限。
(比例)为: 225 因为是大样本,故得: p 500 45% p (1 p ) p (1 p ) p z 2 , p z 2 n n
即,我们有95%的把握认为,19岁以下的青少年上网比例 在40.64%至49.36%之间。
第六章 统计推断
在简单随机抽样条件下,样本均值和样本 比例的抽样误差: 样本均值的抽样误差
重复抽样:
x
n
2
不重复抽样:
x
当总体方差 未知时,可用样本方差 代替。
第六章 统计推断
N n ( ) n N 1
2
s
2
样本比例的抽样误差
重复抽样: 不重复抽样:
p
1
n
p
2
第六章 统计推断
、1
2
方式一
统计学第六章方差分析
第27页,共55页。
总离差平方和=组间离差平方和+组内离差平方和
方差的分解
组间方差反映出不同的因子对样本波动的影响;组内方差则是不考虑组间方差的纯随机影响。
如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引起波动的主要原因,可认为因子对实验的结果存在显著的影响 ;
第28页,共55页。
X4
第24页,共55页。
如果备择假设成立,即H1: (i=1,2,3,4)不全相等
– 至少有一个总体的均值是不同的
– 有系统误差
Xi
这意味着四个样本分别来自均值不同的四个正态总体 。
第25页,共55页。
f(X)
X
X1 X2 X3
X4
第26页,共55页。
方差的分解 样本数据的波动又两个来源:一个是随机波动;一个是因子影响。样本数据的波动,可通过离差平方和来反映。这个离差平 方和可分解为组间方差与组内方差两部份。即
算术均值
x1 x...2....
x3
方差
S12 S22
.......
Sr2
si2ni1 1jn i1
2
xijxi
(i1,2, ,r)
第37页,共55页。
SST是全部观察值 与总平均值的离差平方和,反映全部观察值的离散状况。 其计算公式为:
r n
2
SST
xij X
i1 j1
SST反映了全部数据总的误差程度。
样本均值越不同,我们推断总体均值不同的证据就越充分。
第22页,共55页。
• 如果原假设成立,即H0: = = • 四种颜色饮料销售的均值都相等
– 没有系统误差
•
这意味着每个样本都来自均值为 、方差为2的同一正态总体
总离差平方和=组间离差平方和+组内离差平方和
方差的分解
组间方差反映出不同的因子对样本波动的影响;组内方差则是不考虑组间方差的纯随机影响。
如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引起波动的主要原因,可认为因子对实验的结果存在显著的影响 ;
第28页,共55页。
X4
第24页,共55页。
如果备择假设成立,即H1: (i=1,2,3,4)不全相等
– 至少有一个总体的均值是不同的
– 有系统误差
Xi
这意味着四个样本分别来自均值不同的四个正态总体 。
第25页,共55页。
f(X)
X
X1 X2 X3
X4
第26页,共55页。
方差的分解 样本数据的波动又两个来源:一个是随机波动;一个是因子影响。样本数据的波动,可通过离差平方和来反映。这个离差平 方和可分解为组间方差与组内方差两部份。即
算术均值
x1 x...2....
x3
方差
S12 S22
.......
Sr2
si2ni1 1jn i1
2
xijxi
(i1,2, ,r)
第37页,共55页。
SST是全部观察值 与总平均值的离差平方和,反映全部观察值的离散状况。 其计算公式为:
r n
2
SST
xij X
i1 j1
SST反映了全部数据总的误差程度。
样本均值越不同,我们推断总体均值不同的证据就越充分。
第22页,共55页。
• 如果原假设成立,即H0: = = • 四种颜色饮料销售的均值都相等
– 没有系统误差
•
这意味着每个样本都来自均值为 、方差为2的同一正态总体
第六章 统计数据的离散趋势分析 (《统计学》PPT课件)
第六章 统计数据的离散趋势分析
统计工作的第四个阶段——统计分析的基础
2020/5/31
引例
哪名运动员的发挥更稳定?
在奥运会女子10米气手枪比赛中,每个运动员首 先进行每组10枪共4组的资格赛,然后根据资格赛总 成绩确定进入决赛的8名运动员。决赛时8名运动员再 进行10枪射击,资格赛成绩加上决赛成绩确定最后的 名次。在2012年7月29日举行的第30届伦敦奥运会女 子10米气手枪决赛中,进入决赛的8名运动员的资格 赛成绩和最后10枪的决赛成绩如下表6-1所示:
由此可见,在射击比赛中,运动员能否取得好的
成绩,发挥的稳定性至关重要。那么,怎样评价一 名运动员的发挥是否稳定呢?通过本章内容的学习 就能很容易回答这样的问题。
学习目标
通过本章学习,理解掌握变异指标的意义与作用, 理解变异指标的统计思想;掌握全距、平均差、 方差和标准差、离散系数等各种变异指标的概念、 计算方法和适用场合。
-1
1
1
70
0
0
0
70
0
0
0
组
组
80 10 10 100
71
1
1
1
100 30 30 900
72
2
2
4
120 50 50 2500
73
3
3
9
180 7000
12
28
第一组:R=100; A.D=180/7=25.71; 第二组:R=6; A.D=12/7=1.71;
答:第二组平均数代表性更大。
7000 31.62
乙
68
5
丙
72
8
丁
75
3
合计
统计工作的第四个阶段——统计分析的基础
2020/5/31
引例
哪名运动员的发挥更稳定?
在奥运会女子10米气手枪比赛中,每个运动员首 先进行每组10枪共4组的资格赛,然后根据资格赛总 成绩确定进入决赛的8名运动员。决赛时8名运动员再 进行10枪射击,资格赛成绩加上决赛成绩确定最后的 名次。在2012年7月29日举行的第30届伦敦奥运会女 子10米气手枪决赛中,进入决赛的8名运动员的资格 赛成绩和最后10枪的决赛成绩如下表6-1所示:
由此可见,在射击比赛中,运动员能否取得好的
成绩,发挥的稳定性至关重要。那么,怎样评价一 名运动员的发挥是否稳定呢?通过本章内容的学习 就能很容易回答这样的问题。
学习目标
通过本章学习,理解掌握变异指标的意义与作用, 理解变异指标的统计思想;掌握全距、平均差、 方差和标准差、离散系数等各种变异指标的概念、 计算方法和适用场合。
-1
1
1
70
0
0
0
70
0
0
0
组
组
80 10 10 100
71
1
1
1
100 30 30 900
72
2
2
4
120 50 50 2500
73
3
3
9
180 7000
12
28
第一组:R=100; A.D=180/7=25.71; 第二组:R=6; A.D=12/7=1.71;
答:第二组平均数代表性更大。
7000 31.62
乙
68
5
丙
72
8
丁
75
3
合计
统计学-第六章 统计数据的离散趋势分析
包含全距R、平均差A.D、标准差
反映某种现象变量绝对或平均离散程度;
不宜直接来比较不同水平数列之间的标志离 散程度。离散系数也称为标志变动系数。最常用 的是根据标准差与算术平均数对比的离散系数, 称作“标准差系数”。
V
X
100%
课堂练习
1、已知下列资料,试比较哪组数据更集中(整齐)。
幼儿组 王甜 张琴 李朋 英洁 伍平
第二节 全距和平均差
测定方法:全距R、平均差(A.D)、标准差。
(一)全距(极差)
(1)概念:总体各单位标志的最大值和最小值之差,用以说
明标志值变动范围的大小。 R =Xmax– Xmin
当x1
x2时
R越大 R越小
x的代表性越小 x的代表性越大
(2)特点: ①计算方便,易于理解。但很粗略,不全面; ②开口组
x x x x
0分 14分
C : 34,51,95,100 xC 70分
x x 110分
2020/1/10
第一节 变异指标的意义与作用
(二)变异指标的作用
(2)反映变量值分布的离中趋势和分散程度。
x x 越大 x的代表性越小
第三节 方差与标准差(重点)
(一)概念
各单位标志值与其算术平均数的离差平方的算术平均数 的平方根,又称“均方差”。标准差的平方为方差2。
(二)计算方法
未分组资料: (X X )2 n
分组资料: (X X )2 f f
当x1
x2时
越大 越小
x的代表性越小 x的代表性越大
2020/1/10
第三节 方差与标准差(重点)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2018/6/4
统计学院
3
第六章 抽样和抽样分布
STAT
第一节 抽样及抽样组织形式 [例] 某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平 均每头毛重,如果将每头肉猪都过秤去秤而获取数据将是 不合算的。我们可以按照“等机会原则” 从中抽出100头 肉猪称其重量,计算这100头猪的平均每头毛重,以达到我 们期望的目的。 本例中存栏肉猪10000头组成的总体,则称为全及总体, 它是指在统计抽样中所要了解的研究对象整体,又称为母 体,当我确定了研究目标时,它具有惟一性。一般全及总 体的单位总数用N表示,称作总体容量。
统计学院
7077434431 1422890012 0874321123 0437575967 2132577995 4365789796 4358650841 9343252534 4387670769 4637567488 2365879048 8765980234 1268803235 9323314766 2366897431 . . .
14
第六章 抽样和抽样分布
3.重置(复)抽样与不重置(复)抽样
(1)重置(复)抽样:也称放回抽样,抽样安排为对每次被抽 到的单位经登记后再放回总体,重新参与下一次抽选的抽样方法 。在每次的抽取中样本单位被抽中的概率都相等。统计中称这样 的抽样为相互独立的试验。
(2)不重置(复)抽样:也称不放回抽样,抽样安排为对被 抽到的单位登记后不再放回总体的抽样方法。
2018/6/4
统计学院
9
第六章 抽样和抽样分布
统计上讲的抽样一般都是指随机抽样(概率抽样)
STAT
二、抽样推断的特点
1 .是非全面调查 与普查的区别; 2 .按随机原则抽取样本 与典型调查和重点调查的区别; 3 .根据样本指标推断总体指标与重点调查的区别; 4 .抽样误差可以事先计算与控制与典型调查的区别。
2018/6/4
统计学院
6
第六章 抽样和抽样分布
STAT
非概率抽样也叫非随机抽样,是根据经验或判断从总体中选 取若干单位构成样本。如重点调查、典型调查(属于一种判断 抽样)、方便抽样、配额抽样等。非概率抽样难免掺杂调查者 的主观偏见,存在系统性误差、不可以计算和控制抽样误差、 不可以说明估计结果的可靠程度。
统计学院
17
第六章 抽样和抽样分布
为了便于抽取样本单位,一般在明确抽样框的条件下,对总体 的每个单位都要编号,然后用抽签式或利用《随机数字表》进行 抽取。 例如:N=500 n=10 编码从1-500号
在随机数表中随意点二个数字,假设得到4行,34列。则选取 的号码从这个被选中的数开始,由于500是个三位数,则小于或 等于500的连续三位数即为中选号码。见表中所示。
2018/6/4 统计学院 4
第六章 抽样和抽样分布
STAT
[例] 某养猪场共有存栏肉猪10000头,现欲了解这批肉猪平均每 头毛重(设为 ),如果将每头肉猪过秤去秤而获取数据将是不 合算的。我们可以按照“等机会原则” 从中抽出100头称其重量, 计算出这100头猪的平均毛重(假定平均每头95.5kg),以达到我们 期望的目的。 本例中所抽出的100头肉猪组成的总体,则称为样本总体,它是 指在统计抽样中按照“等机会原则” 从全及总体的N(10000)中 抽出的部分单位(每个单位称作样本单位)所组成的整体,简称样 本,又称子样。一般样本总体的单位总数用n(100)表示,称作样 本容量。样本总体则不具惟一性,它的可能个数与N、n及抽样 方法有关。通常n<30称为小样本,n≥30称为大样本,在抽样调 查中取大或小样本会直接影响到抽样分布的特征。
1287087765 2136217721 9878764346 4890832769 2164896589 6476793243 4387005345 2164878454 2176590879 2167608965 3254776907 3243700435 2187799990 1358787008 2125749768 . . .
第六章 抽样和抽样分布
本章重点: 1.简单随机抽样; 2. x 的抽样分布; 3. p 的抽样分布; 4.其他组织形式的抽样; 5.正态分布原理。 本章难点: 抽样分布原理。
STAT
2018/6/4
统计学院
1
第六章 抽样和抽样分布
统计实例(Statistics in Practice)
我国某家用电器公司是国内空调最大的生产厂家之一,2004 年时其空调年销售就已达到700万台,销售额为120亿元。这家低 调、在外界看来有些神秘的家电企业,尽管不作声张,极少炒作 ,甚至喊出“不想做行业老大”的话,之后3年来却成长势头迅 猛,增长率一直40%以上,赢利率极高。为了避免当今家用电器 行业低价利薄的局面,实现多条腿走路,以在新一轮竞争中保持 优势,该电器集团决策人又提出了进军汽车行业的战略目标。为 此他要求公司营销部对国际国内各大汽车生产厂家生产能力、销 售额、营利能力、市场占有率等方面作调查分析。 作为公司营销部负责人来说,他必须思考怎样去采集汽车生 产厂家的这些经济机密数据?获得这些数据后,应采用什么方法 作数据分析与推断。这必然会用到统计推断的知识。
2018/6/4
统计学院
10
第六章 抽样和抽样分布
三、抽样推断的作用
STAT
1 .对某些社会现象不可能或不必要进行全面调查,但又必 须了解其全面情况时,可采用抽样推断。(如:破坏性检验、 无限总体、家计调查等等); 2 .与全面调查比较,省时、省力、省费用、时效性高; 3 .可用抽样推断资料对全面调查资料加以补充或修正; 4 .可用于工业生产过程中的质量控制。
2018/6/4
统计学院
13
第六章 抽样和抽样分布
名称 单位数 平均数 成数 方差 标准差 总体参数 N
X N
STAT
样本统计量 n
x x n
s2
P=N1/N
2 ( X X ) 2 N
p=n1/n ( x x ) 2 n 1 s
2018/6/4
统计学院
抽签 编号 摇号 产生样本 随机数字表
2018/6/4
统计学院
16
第六章 抽样和抽样分布
其样本抽取过程按总体为有限和无限的不同加以区别 1.有限总体抽样 从容量为N的有限总体中进行抽样,如果容量为n的每个可能 样本被抽到的可能性相等,则称被抽的样本为简单随机样本。
2018/6/4
2018/6/4 统计学院 8
第六章 抽样和抽样分布
STAT
2.滚雪球抽样:先找少量或个别的调查对象进行访问,然后 通过他(她)们再去寻找新的调查对象,依此类推,就像滚雪 球一样越来越大,直至达到调查目的为止。 滚雪球适用于总体的个体信息不充分或难以获得,不能使用 其他抽样方法抽取样本的调查研究。对于具有特殊癖好、同性 恋者、乞丐、吸毒者、爱滋病患者等特殊群体的调查尤为适用。
9424252386 4879903443 2177609554 2148797544 7537697997 1254876987 6743219845 3248906034 0765433245 8707867698 7694432767 9094232155 0232337932 0362212379 3478794235 . . .
2018/6/4
统计学院
20
第六章 抽样和抽样分布
六、点估计
点估计就是用样本估计量的一个具体观测值直接作为总体的未 知参数的估计值的方法。 如上例中随机抽取的100头肉猪的平均毛重(95.5kg)可作为 10000头肉猪平均毛重 的点估计值
常用的估计量有: (1)样本平均数
(2)样本方差 S 2为总体方差 的估计量; (3)样本成数 p为总体成数 P 估计量。
2018/6/4
统计学院
11
第六章 抽样和抽样分布
四、统计抽样的几个基本概念
1.全及总体和样本总体
全及总体:研究对象全体,又称母体。容量用N表示。具备 惟一性。
样本总体:按随机原则从总体中抽出的部分单位的全体, 简称样本,被抽出的每个单位称样本单位。容量用n表示。样 本不具惟一性。
2018/6/4
2018/6/4 统计学院 2
第六章 抽样和抽样分布
从这一章开始便进入推断统计学的学习内容,它会节省人们 的时间和财物来达到认识对象的最佳限度。 现实世界包含的素材集合非常庞大,从中提取需要的信息 非常困难。如: •选民人数:每个候选人的支持率是多少? •产品:不合格率是多少? •环境:污染程度如何? •市场:品种、价格、质量状况、购买力等情况的了解。 在这一章里,你将会了解到样本是怎样抽取的,样本统计 量是怎样分布的,如何根据样本统计量对总体参数做估计。
19
第六章 抽样和抽样分布
2.无限总体抽样 在实际应用中,若总体单位数很多,要逐一编号是难以办到 的,特别是有些现象,事前也不可能编号(如一些连续大量正 在生产的产品) 因此我们定义:被研究的总体中所涉及某一正在进行的过程 使得不可能列出总体中的所有元素,则可视为无限总体。 无限总体抽样条件:同一总体 相互独立
2018/6/4
统计学院
第六章 抽样和抽样分布
随机数字表
9745238942 1276465909 9874763642 2659305984 1676587006 0377797684 9877808423 2778006869 2133768790 8262130892 3286548900 8084634212 4332657790 7963645324 9087434329 . . .
2018/6/4
统计学院
7
第六章 抽样和抽样分布
STAT
附:1.方便抽样:又称任意抽样、偶遇抽样,是指样本的选定 完全根据调查人员的方便来决定。调查对象的选取常常是因为 他们恰好在恰当的时间、恰当的地点出现。如: (1)没有认定调查对象身份的商场拦截式访问; (2)利用客户的名单(名片、往来信件等方式获得)进行 调查; (3)访问大街上的人们; (4)利用学生、社会组织的成员或工厂机关的职工作为调 查对象; (5)报纸、杂志上填好、寄回的调查。 实施方便抽样时,样本单位一个一个地抽取,直到满足样本 容量要求为止。这种抽样方法的一个基本原则是假定总体的特 性是相同的。方便抽样一般只用于市场预调查和试探性调查。