《统计学》第七章(抽样调查)

合集下载

《统计学》-第7章-习题答案

《统计学》-第7章-习题答案

第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。

2.答:相关和回归都是研究现象及变量之间相互关系的方法。

相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。

3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。

复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。

偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。

4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。

根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。

总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。

两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。

第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。

统计学课件-第七章抽样调查

统计学课件-第七章抽样调查

分层抽样特点
03
04
05
适用于总体内部差异较 大的情况,能够提高样 本的代表性。
可以根据各层的具体情 分层抽样能够降低抽样 况采用不同的抽样方法, 误差,提高估计的精度。 灵活性强。
分层标准选择与确定
选择分层标准的原则
各层之间具有明显的 区分度,避免出现重 复或遗漏。
与调查目的密切相关, 能够反映总体内部差 异的标志。
3
灵活性高,可以在不同阶段采用不同的抽样方法 和技术。
多阶段抽样优缺点分析
• 节约成本,减少调查人员和资源的需求。
多阶段抽样优缺点分析
抽样误差可能增加
01
由于多阶段抽样的复杂性,可能导致抽样误差的增加。
对抽样设计的要求较高
02
需要仔细设计和规划每个阶段的抽样方法和样本量分配,以确
保抽样的有效性和代表性。
抽样调查作用
抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料, 因而,也可起到全面调查的作用。
抽样方法与类型
抽样方法
简单随机抽样、系统抽样、分层抽样和整群抽样。
抽样类型
概率抽样和非概率抽样。
抽样误差与置信水平
抽样误差
是指由于随机抽样的偶然因素使样本各单位的结构不足以代 表总体各单位的结构,而引起抽样指标和全局指标的绝对离 差。
成本考虑
当总体差异较大时,简单随机抽样的 精度可能受到影响。
对于大规模调查,简单随机抽样可能 需要较高的成本。
实施难度
在某些情况下,获取完整的抽样框可 能较为困难。
03 分层抽样技术及应用
分层抽样原理及特点
01
02
分层抽样原理:将总体 按照某种特征或标志分 成若干层,然后从每一 层中随机抽取一定数量 的样本,最后将这些样 本合并起来构成总体的 样本。

《统计学原理》课件第七章抽样调查

《统计学原理》课件第七章抽样调查
4 -6
第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序

究 原
总体分布 样本分布 抽样分布

一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析

最新(笔记整理)2011年统计基础知识与统计实务 第七章 抽样调查基础知识

最新(笔记整理)2011年统计基础知识与统计实务 第七章  抽样调查基础知识

(笔记整理)2011年统计基础知识与统计实务第七章抽样调查基础知识第七章抽样调查基础知识第一节抽样调查的概念、特点及分类一、抽样调查的概念与特点抽样调查的概念●从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。

如:平均工资、1%人口调查●随机原则:在抽取调查单位时,完全排除人为的主观因素影响,保证每一个调查单位都有相等的中选可能的原则。

就概率意抽样调查的特点●按照随机原则抽取样本这个原则要求总体中每个单位都有同等被抽中的机会,使样本结构近似于总体结构,具有代表性●根据样本的资料推断总体的数值这种推断存在一定的抽样误差,但误差范围是可以计算和控制的,有一定可信度●费用低●时效性强比如:电视节目收视率调查●抽样调查有时是唯一的选择如:产品破坏实验、检验一批灯泡的平均寿命、水质调查二、抽样调查的种类(一)用主观(非随机)方法从总体中抽选单元进行调查,它是一种快速、简便且省钱的抽选样本的方法。

风险大,代表性差假定总体是同质,总体单元都相似,那么可抽选任何单元入样。

例如:街道拦截访问法是最常见的随意抽样,弊端就是调查员倾向有差别,所遇到的人差别较大例如:研究非典疫苗,需要人体试验,需要志愿者专家或者熟悉行业的人事,对抽样对象有所了解,采用判断抽样例如:按男女比例抽样。

总体的推断更具有代表性概率抽样的两条基本准则:第一,样本单位是随意抽取的;第二,调查总体中的每个单位都有一个非零的入样概率。

总体单位数始终是相同的,每个总体单位有多,每抽一次,总体会相应减少,每个总体单位只能被抽中一次。

按(组织方式不同),分为:●-----一步抽样法,不分组,随机原则进行抽样●机械随机抽样)或(等距随即抽样)等距抽样,按照一定的距离抽取样本例如:4000户居民中抽40人,平均每100户抽取1户;1-100号中随机抽取1个号码在第一组中抽取了5号,则5、105、205、以+100为单位抽取●分层抽样又称(类型随机抽样)或(分类随机抽样)先分组,后抽组内比如每个组抽5人;某地区三种地形:平原、丘陵、山区的粮食产量,先分地区,然后按每个组内按简单随机抽样抽取调查地块,构成样本●比如:全市居委会为不同群,抽不同的群,整群进行研究;了解某地区职工家庭生活状况,按居民委员会分群,一个居委会为一群,对抽中的居民委员会所辖每户职工家庭一一调查。

经济统计学第7章抽样调查

经济统计学第7章抽样调查
CHAPTER ONE
参数的假设检验是根据样本,对总体参数某种假设的正确性作出判断。 可以分别提出两种假设: 前一种不能轻易拒绝的假设为原假 设,后一种为备选假设。假设检验就是根据样本,检验 是否成立, 不成立就接受备选假设 。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概率事件的概率为显著性水平 。
一个总体的检验
Z 检验 (单尾和双尾)
t 检验 (单尾和双尾)
Z 检验 (单尾和双尾)
2检验 (单尾和双尾)
均值
一个总体
比例
方差
总体方差已知时的均值检验 (双尾 Z 检验)
均值的双尾 Z 检验 (2 已知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0;备择假设为:H1: 0
单侧检验 (原假设与备择假设的确定) 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上
除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为
H0: 1000 H1: < 1000
第二节
一个正态总体参数的假设检验
-10
100
20
25
-5
25
30
30
0
0
离差
40
35
5
25
50
40
10
100
10
25
-5
25
20
30
0
0
30
35
5
25
40
40
10
100
50
45
15

经济统计学第7章抽样调查

经济统计学第7章抽样调查
经济统计学第7章抽样调查
目录
• 抽样调查概述 • 抽样调查的基本方法 • 样本量的确定 • 抽样误差与推断方法 • 抽样调查的组织与实施
01 抽样调查概述
定义与特点
定义
抽样调查是一种统计学方法,通过对 总体中的一部分进行调查,来推断总 体的特征和规律。
特点
经济高效、快速、准确度高、可操作 性强、误差可控。
THANKS FOR WATCHING
感谢您的观看
准备辅助工具
根据调查需要,准备辅 助工具,如调查表格、 录音设备等。
调查过程的控制
培训调查人员
对调查人员进行培训,确保他们了解调查目 的、问卷内容、抽样方法等。
现场实施
按照抽样计划进行现场调查,确保每个样本 都得到有效的调查。
数据采集
对收集到的数据进行整理、分类和编码,确 保数据的准确性和完整性。
适用于总体内各单位之间存在明显的差异性。
系统抽样
定义
先将总体中的所有单位按一定的顺序排 列,然后按照固定的间隔或系统地抽取
样本单位的方法。
操作方法
首先确定一个合理的起始点,然后按 照固定的间隔依次抽取样本单位。
特点
每隔一个固定数量的单位抽取一个样 本单位,每个样本单位被抽中的概率 都相等。
适用范围
抽样调查的分类
按样本选取方式
随机抽样、分层抽样、系统抽样、整群抽样等。
按样本规模
大样本、中样本、小样本。
按调查目的
探索性调查、描述性调查、因果性调查。
抽样调查的应用场景
01
市场调研
了解市场需求、消费者行为、品牌 知名度等。
质量控制
产品检验、过程控制、质量评估等。
03

统计学中的抽样调查方法

统计学中的抽样调查方法

统计学中的抽样调查方法统计学是研究收集、分析、解释和展示数据的学科,而抽样调查是统计学中一种常用的数据收集方法。

抽样调查通过从总体中选择一部分样本来进行数据收集,然后通过对样本数据进行统计分析,得出关于总体的推断和结论。

本文将介绍统计学中常用的抽样调查方法。

一、简单随机抽样简单随机抽样是抽样调查中最基本的方法之一。

它要求从总体中以等概率随机的方式选择样本,保证每个样本有同样的机会被选中。

简单随机抽样有助于减小抽样误差,并且可以充分代表总体特征。

在实际应用中,可以使用随机数表或计算机随机数生成器来进行简单随机抽样。

二、系统抽样系统抽样是指按照一定的系统规则从总体中选择样本的抽样方法。

在系统抽样中,首先确定抽样的间隔,然后从总体中随机选择一个起始点,依照固定的间隔排列顺序选择样本。

系统抽样简单易行,且适用于总体规模较大的情况,例如市场调查和民意调查。

三、分层抽样分层抽样是将总体划分为若干个相似的子总体,然后分别从每个子总体中进行简单随机抽样。

通过分层抽样,可以更好地代表总体中不同子总体的特征。

分层抽样常用于调查研究中,特别是在总体中存在着明显的差异的情况下,例如不同地区、不同年龄段的人群。

四、整群抽样整群抽样是将总体划分为若干个互不重叠的群体,然后从其中选择若干个群体作为样本。

整群抽样通常用于样本群体之间差异较小的情况下,可以简化调查过程,并提高调查效率。

整群抽样常用于社会学调查和教育调查中,例如在学校中选择部分班级进行问卷调查。

五、多阶段抽样多阶段抽样是将样本选择过程分为多个阶段,并在每个阶段中采用不同的抽样方法。

多阶段抽样适用于总体分布复杂,且难以直接进行抽样调查的情况。

通过分阶段的抽样过程,可以逐步缩小样本范围,并最终选出符合调查要求的样本。

多阶段抽样常用于大型调查和跨国调查,它能够在保证样本代表性的同时,减少调查成本。

综上所述,统计学中的抽样调查方法多种多样,每种方法都适用于不同的研究目的和数据情况。

《统计学》第七章(抽样调查)

《统计学》第七章(抽样调查)

20
(1)以99.73%的概率保证程度估计这批茶叶平均每包重量的 范围,以便确定平均重量是否达到规格要求。
第七章 抽样调查
第一节 抽样调查概述 第二节 抽样估计 第三节 抽样的组织形式
1
第一节 抽样调查概述 一、抽样调查的含义
(一)抽样推断的含义 抽样调查是按随机原则,从全部研究对象中抽取一
部分单位进行观察,并根据样本的实际数据,对总体的 数量特征做出具有一定可靠程度的估计和判断,从而达 到对全部研究对象的认识的一种统计方法。其中心问题 是如何根据已知的部分资料来推断未知的总体情况。
(3)抽样总体标准差和抽样总体方差。
说明抽样总体之间标志值变异程度的指标,叫做抽样
总体标准差。抽样总体标准差的平方称为抽样总体方
差(简称样本方差)。其计算公式为:
s
2
xx n
2
s2 x x n
20
一个总体可以抽取许多个样本,而样本不同, 抽样指标的数值也各不相同。可见,抽样指标的数 值不是惟一确定的。因为抽样指标是样本变量的函数, 是随机可变的变量。也就是说,由 样本观测值所决定的 统计量是随机变量。
x=2*60=120
8480~8720
(2) up=3.1%
p=6.2%
68.8%~81.2%
50
例4,某外贸公司出口一种茶叶,规定每包规格不低于150克。 现在用不重复抽样的方法抽取其中1%进行检验,其结果如下:
每包重量 (克)
包数
148~149
10
149~150
20
150~151
50
151~152
21
(三)重复抽样和不重复抽样 1.重复抽样(重置抽样) 采用这种方法抽取样本单位的特点是:同一单位 有多次重复被抽中的机会,并且总体单位数目始 终不变,每个单位抽中或抽不中的机会在各次都 是相同的。

统计学原理第七章抽样调查

统计学原理第七章抽样调查
只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ►交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ►交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;
第七章 抽样调查
1
第ห้องสมุดไป่ตู้节 抽样调查的基本概念 及理论依据
一、估计量和估计值 二、全及总体和抽样总体 三、全及指标和样本指标 四、抽样方式和样本可能数目 五、抽样理论依据
2
一、估计量和估计值
►1. 估计量:是指用于估计相关的总体参数的 统计量。样本均值、样本比例(样本成数) 和样本方差都是估计量,估计量是随机的。
►2. 抽样总体(样本):是从全及总体中随机 抽取出来一部分单位的集合体。有大样本和 小样本之分,以30个样本单位为划分依据。
►样本总体是随机的、已知的,常用“n”表示。
4
三、全及指标和样本指标
►(一) 全及指标 ►根据全体总体各个单位的标志值或标志
特征计算的、反映总体某种属性的综合 指标。全及指标也是惟一确定的,但也 是未知的。
13
(二)中心极限定律 ►1. 独立同分布中心极限定理:证明不论变量
总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布. ►2. 德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
xxf2114010057 f 200
样本平均数
灯 泡 P 2 合 0 10 格 7 18 率 9 3 .5 1 % 200 200

统计学课件--第七章抽样调查

统计学课件--第七章抽样调查

不重置抽样,是指每次从总体中抽取一个单位记录
其标志表现后不再放回,从剩余的单位中抽取下一
个单位。
2021/3/2
12
第七章 抽样调查
第二节 总体和样本
(二)样本可能数目
样本可能数目是指抽样组织和抽样方法一定时,从总体N 个单位中随机抽取一个容量为n的样本,该样本不同构成 的可能数目,一般用m来表示。
2021/3/2
10
第七章 抽样调查
第二节 总体和样本
(二)样本指标
由样本总体各个单位的标志值计算的综合指标称 为样本指标,样本指标又称为样本统计量 (Statistic),简称为统计量。
样本指标主要有:样本平均数: x 样本比率 p(或 q)
样本方差: s 2 样本标准差: s
2021/3/2
11
某外国公司在大连进 行微波炉市场调查: 在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
7
时间表抽样框
连续出产的产品总体 可以编制抽样框:均 匀的出产时间、可以 预见到的产品总量。
连续到加油站加油的
汽车总体无法编制抽
样框:时间不定、总
2021/3/2
量也无法确定。 8
第七章 抽样调查
第二节 总体和样本
四、中心极限定理及其意义
中心极限定理论证了如下几点 :
1) 如果总体服从正态分布,样本平均数也同样服从正态分布。
2) 如果总体很大,但不服从正态分布,只要样本足够大, 样本的总和或平均数就会趋近于正态分布。

3) 样本平均数分布的数学期望(该抽样的所有可能样本平均
数的均值) 等于总体均值。即 E(x) X 。
<x<
2

《统计学教学课件》i第七章抽样调查

《统计学教学课件》i第七章抽样调查

将总体按一定顺序排列,按固定 间隔抽取样本,适用于有明显顺 序的总体的调查。
变量间隔抽样
根据变量的值来决定间隔,适用 于具有某种变量的总体的调查。
分层抽样
比例分层抽样
根据各层在总体中的比例来分配样本 量,适用于各层在总体中比例不同的 调查。
最佳分层抽样
根据各层的变异程度来分配样本量, 适用于各层变异程度不同的调查。
最小样本容量的确定
最小样本容量可以根据总体方差、置信水平、允许误差范围 等参数进行计算,以避免样本容量过小导致估计不准确的问 题。
样本代表性的评价
样本代表性的评价方法
样本代表性的评价可以通过比较样本 统计量与总体参数的接近程度、考察 样本的分布情况以及使用统计检验的 方法来进行。
提高样本代表性的措施
整群抽样
简单整群抽样
将总体分成若干群,对每个群进行全面调查,适用于群间差异小、群内差异大 的调查。
分层整群抽样
将总体按某种特征分成若干层次,在每一层内进行整群抽样,适用于群间差异 大、群内差异小的调查。
03
抽样误差与样本容量
抽样误差的概念及计算方法
抽样误差的概念
抽样误差是由于抽样方法的随机性所引起的样本结果与总体真实值之间的差异。
评估社会项目
通过抽样调查,评估社会项目的实 施效果和影响。
在科学研究中的应用
实验设计
在科学实验中,通过抽样调查选 择代表性的样本,以减少实验误
差。
探索性研究
在科学研究初期,抽样调查可以 帮助研究者了解研究对象的基本
特征和规律。
验证假设
通过抽样调查,验证科学假设的 正确性和可靠性。
THANK YOU
抽样调查的特点
经济性

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

统计学第七章、第⼋章课后题答案统计学复习笔记第七章参数估计⼀、思考题1.解释估计量和估计值在参数估计中,⽤来估计总体参数的统计量称为估计量。

估计量也是随机变量。

如样本均值,样本⽐例、样本⽅差等。

根据⼀个具体的样本计算出来的估计量的数值称为估计值。

2.简述评价估计量好坏的标准(1)⽆偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的⽅差尽可能⼩。

对同⼀总体参数的两个⽆偏估计量,有更⼩⽅差的估计量更有效。

(3)⼀致性:是指随着样本量的增⼤,点估计量的值越来越接近被估总体的参数。

3.怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。

置信区间的论述是由区间和置信度两部分组成。

有些新闻媒体报道⼀些调查结果只给出百分⽐和误差(即置信区间),并不说明置信度,也不给出被调查的⼈数,这是不负责的表现。

因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。

在公布调查结果时给出被调查⼈数是负责任的表现。

这样则可以由此推算出置信度(由后⾯给出的公式),反之亦然。

4.解释95%的置信区间的含义是什么置信区间95%仅仅描述⽤来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。

也就是说,⽆穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。

不要认为由某⼀样本数据得到总体参数的某⼀个95%置信区间,就以为该区间以的概率覆盖总体参数。

5.简述样本量与置信⽔平、总体⽅差、估计误差的关系。

1. 估计总体均值时样本量n 为2. 样本量n 与置信⽔平1-α、总体⽅差、估计误差E 之间的关系为与置信⽔平成正⽐,在其他条件不变的情况下,置信⽔平越⼤,所其中: 2222α2222)(E z n σα=n z E σα2=需要的样本量越⼤;与总体⽅差成正⽐,总体的差异越⼤,所要求的样本量也越⼤;与与总体⽅差成正⽐,样本量与估计误差的平⽅成反⽐,即可以接受的估计误差的平⽅越⼤,所需的样本量越⼩。

2015年《统计学》第七章 抽样调查习题及满分答案

2015年《统计学》第七章 抽样调查习题及满分答案

2015年《统计学》第七章抽样调查习题及满分答案一、单选题1. 反映样本指标与总体指标之间抽样误差可能范围的指标是( B)。

A、样本平均误差B、抽样极限误差C、可靠程度D、概率度2.在其它条件不变的情况下,抽样单位数目和抽样误差的关系是(B)。

A.抽样单位数目越大,抽样误差越大B.抽样单位数目越大,抽样误差越小C.抽样单位数目的变化与抽样误差的数值无关D.抽样误差变化程度是抽样单位数变动程度的1/23.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为(D)。

A、分层抽样B、简单随机抽样C、整群抽样D、等距抽样4.在同样条件下,不重置抽样的抽样平均误差与重置抽样的抽样平均误差相比(A)。

A、前者小于后者B、前者大于后者C、两者相等D、无法判断5.如果总体成数方差未知,计算必要抽样数目时,可用总体方差的最大值,最大值为(B)。

A、0.24B、0.25C、0.50D、1 6.抽样估计的置信度是( C )A.概率度 B.区间范围的大小C.概率保证程度或置信概率D.与概率度无关的量7.随机抽样的基本要求是严格遵守(B)A、准确性原则B、随机性原则C、代表性原则D、可靠性原则8.抽样调查的主要目的是(D)A.广泛运用数学方法B.计算和控制抽样误差C.修正普查资料D.用样本指标推算总体指标9. 抽样调查中(A)A、既有登记性误差,也有代表性误差B、只有登记性误差,没有代表性误差C、没有登记性误差,只有代表性误差D、既没有登记性误差,也没有代表性误差10.要使抽样误差减少一半(在其它条件不变的情况下),则抽样单位数必须(D)。

A、增加2倍B、增加到2倍C、增加4倍D、增加到4倍11.抽样平均误差反映了样本指标与总体指标之间的( C )A、实际误差B、实际误差的绝对值C、平均误差程度D、可能误差范围12.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是(A)A、抽样单位数占总体单位数的比重很小时B、抽样单位数占总体单位数的比重很大时C、抽样单位数目很少时D、抽样单位数目很多时13.在其它条件不变的情况下,提高抽样估计的可靠程度,其精确度将(C )。

吉珠统计学期末考试重点第7章 抽样及抽样分布

吉珠统计学期末考试重点第7章  抽样及抽样分布

x
时, f (x) 的曲线以 x 轴为渐近线。
第七章 抽样调查
4. 标准正态分布
标准正态分布的概率密度函数为:
1 ( z) e , <z< 2
若随机变量 Z 服从标准正态分布, 则记为 Z~ (0, 1)
z2 2
1. 任何一个一般的正态分布,可通过下面的 线性变换转化为标准正态分布
总体均值的区间估计
(一) 大样本时总体均值的区间估计
第七章 抽样调查
例:某企业生产A产品的工人有1000人, 某日采用不重复抽样从中随机抽取100人调查 他们的当日产量,样本人均产量为35件,产量 的样本标准差为4.5件。请以95.45%的臵信度
估计该日人均产量的臵信区间。
解:①计算抽样平均误差
x 0
x a
第七章 抽样调查
标准差 决定密度函数曲线 f (x) 的陡缓程度.
0.5
1
2
第七章 抽样调查
3. 正态分布密度函数的特点
(1) 对称性。 (2) 非负性。
(3) f (x) 在 X x 时达到极大值 f(x ) 1 2
(4) f (x) 的曲线在 X x 处有拐点。 (5 )当
Z X

x2 2
~ N (0,1)
2. 标准正态分布的概率密度函数
1 ( x) e 2 , x
3. 标准正态分布的分布函数 t2 x x 1 -2 ( x) (t )dt e dt 2
第七章 抽样调查
标准正态分布, 具有如下性质或结论:
③计算抽样极限误差
由 1 ) 0.95 ,查t分布表得, (
t n 1 t 2.5% (9)=2.2622

统计学抽样调查ppt课件

统计学抽样调查ppt课件
三、抽样调查的作用
(一)用于一些不可能或不必要进行全面调查 的社会经济现象,以达到对总体数量特征的 认识,可以取得事半功倍的效果
(二)对全面调查的资料进行补充和修正 (三)广泛运用于工业生产过程中的质量检验
与控制
病原体侵入机体,消弱机体防御机能 ,破坏 机体内 环境的 相对稳 定性, 且在一 定部位 生长繁 殖,引 起不同 程度的 病理生 理过程
样本成数的平均误差的计算公式。
1.在重复抽样下:
μp=
σ2
n
n
=
p (1 p )
n
2.在不重复抽样下:
μp=
2 Nn
( )= n N 1
p (1 p ) n
(N n) N 1
病原体侵入机体,消弱机体防御机能 ,破坏 机体内 环境的 相对稳 定性, 且在一 定部位 生长繁 殖,引 起不同 程度的 病理生 理过程
第二节、抽样误差和抽样估计
一、抽样误差 (一)概念:是指抽样估计值与被估计的
未知的真实参数( 总体特征值)之差。 (二)误差的来源
1、登记性误差 2、系统性误差 3、偶然性误差
病原体侵入机体,消弱机体防御机能 ,破坏 机体内 环境的 相对稳 定性, 且在一 定部位 生长繁 殖,引 起不同 程度的 病理生 理过程
病原体侵入机体,消弱机体防御机能 ,破坏 机体内 环境的 相对稳 定性, 且在一 定部位 生长繁 殖,引 起不同 程度的 病理生 理过程
2、区间估计
对于总体的未知指标X, 根据样本确定 总体指标所在的区间,并指出估计推断的可 靠程度。
x1、x2(x1 x < 2),使随机区间 (x1,x2)
包含X的概率等于给定值1-α(0<α<1),
病原体侵入机体,消弱机体防御机能 ,破坏 机体内 环境的 相对稳 定性, 且在一 定部位 生长繁 殖,引 起不同 程度的 病理生 理过程

统计学原理——抽样调查

统计学原理——抽样调查

x
(x )2
4000 18.2(6 元)
M
12
x
2 (N n)
n N 1
1000 (4 2) 18.2(6 元) 2 41
抽样平均误差
②样本成数(比例)的抽样平均误差
总体中具有某种特征的单位占全部总体单位数的比例称为总体比
例,记作 ,P样本中具有此种特征的单位占全部样本单位数的比例 称为样本比例,记作 。 p
或:
p
p(1 p) (1 n )
n
N
0.8 0.2 (1 500 ) 1.78%
500
100000
例7.3:对某天生产的2000件电子元件的耐用时间 进行全面检测,又抽取5%进行复测
耐用时间 (小时) 3000以下 3000-4000 4000-5000 5000以上 合计
全面检测 (件) 50 600 990 360 2000
重复抽样条件下:
p
P(1 P) n
不重复抽样条件下:
p
P(1 P) (1 n )
n
N
例7.2 要估计某地区100000名适龄儿童的入学率, 随机从这一地区抽取500名儿童,检查有400 名儿童入学,求抽样误差。
p 400 80% 500
p
p(1 p) n
0.8 0.2 1.78% 500
则称 X 服从标准正态分布,记作 X ~ N(0 ,1)。
标准正态分布的分布密度 (x) 和分布函数 (x) 的性质如下: (1)(x) 是偶函数,即 (x) = (x) (2)(x) =1- (x)
(一)概念
抽样分布是样本统计量的概率分布。从一个总体中随 机抽取容量相等的样本,根据样本资料计算某一统计量 所有可能的概率分布,称为这个统计量的抽样分布。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

N1 p = N
N代表总体单位数;
N 0 Q = N
N1代表具有某一种表现的总体单位数; No代表具有另一种表现的总体单位数; P、Q代表成数。
11
Q N
1
+ N
0
= N N + N N = 1
∴ P + Q 则 Q
=
1
0
= 1 − P
12
〔例1〕 某公司生产的10000件产品中,有500件 为不合格品。则 产品不合格率 P= N 1 /N=500/10000=5.0% 产品合格率 Q=1—P=1-5.0%=95%
µ
p
=
p
×
(1 − n 0 . 95
p )
=
0 . 05 × 1000
=
0 . 69
%
37
按不重复抽样计算:
µ
p
=
p × (1 − p ) n (1 − ) n N
=
0 . 05 × 0 . 95 1000 × (1 − 1000 10000
)
= 0 . 65 %
38
(三)极限误差 极限误差是指抽样推断中依一定的概率保证下的误 差的最大范围。 1.抽样平均数的极限误差:
= 95 %
19
(3)抽样总体标准差和抽样总体方差。 说明抽样总体之间标志值变异程度的指标,叫做抽样 总体标准差。抽样总体标准差的平方称为抽样总体方 差(简称样本方差)。其计算公式为:
s =

(x
− n
x
)
2
s
2
=

(x
− n
x
)
2
20
一个总体可以抽取许多个样本,而样本不同, 抽样指标的数值也各不相同。可见,抽样指标的数 值不是惟一确定的。因为抽样指标是样本变量的函数, 是随机可变的变量。也就是说,由 样本观测值所决定的 统计量是随机变量。
49
例3,某单位从全部职工中随机抽取196名进行调查,得知 全年平均收入为8600元,标准差为840元。其中,有存款的职工 为147人。要求在95.45%的概率保证程度下,分别对全部职工每 人年平均收入和存款职工比重进行区间估计。 解:由于没有全及总体(N)的资料,只能用重复抽样计 算 1 u (1)ux=840/(196)1/2=60 ∆x=2*60=120 8480~8720 (2) up=3.1% ∆p=6.2% 68.8%~81.2%
47
(二)区间估计的两种模式:
1.根据给定的抽样极限误差范围
∆ X ,求出相应的可信度F(t)
2.根据给定的可信度F(t),求出相应的抽样极限误差范围 ∆ X
48
例1,已知:x=80,δ2=40,n=10,P(t)=0.95,在重复条件下对总体平 均数进行估计。 解:u=2 t=1.96 ∆=tu=3.92 x-∆<X<x+∆, 80-3.92<X<80+3.92 点估计:总体平均数为80 区间估计:以95%的概率保证总体平均数在76.08-83.92之间 例2,已知:x=80,δ2=40,n=10, ∆=4,在重复条件下对总体平均数进 行估计。 解:u=2 ,t= ∆/u=2 点估计:总体平均数为80 区间估计:以95.45%的概率保证总体平均数在76-84之间
解:
µ

x

s n 480

50 25 500

10
t =
µ
p ( F
x x

- 10

2
∴ =
500

20

X

500
+
20

45
( 2 )=
0 . 9545
三、影响抽样误差的因素
(一)抽样单位数目的多少
(二)总体被研究的标志的变异程度
(三)抽样方法
(四)组织形式的不同
46
四、抽样估计 (一)点估计和区间估计。 点估计也叫定值估计,它是以抽样得到的样本指 标作为总体指标的估计值。 区间估计是根据一定的精确度和可靠程度的要求, 用样本指标和抽样误差去推断总体指标的可能范围 的一种估计方法。
∆ x x
t
=
µ
;
t
=

p p
µ
42
抽样极限误差也可以表示为抽样平均误差的若干倍,其 倍数即概率度t:
∆ x =
x − X
= t µ x
= t
2 σ n
= t
σ
n
43
同理:
∆ p = p − P = t µ p P (1 − P ) n
44
= t
〔例5.5〕某农场种植小麦5000亩,收获前夕随机抽取 25亩进行实割实测,测得平均亩产500千克,标准差为 50千克,试求全部5000亩小麦的平均亩产在480千克至 520千克之间的概率。
32
在重复抽样条件下,其计算公式为:
µ
p
=
p × (1 − n
p )
在不重复抽样条件下,其计算公式为:
µ
p
=
p × (1 − n
p )
N ( N
− n ) − 1
33
当N很大时,以N代替N—1,则可简化为:
µp =
p × (1 − p ) n (1 − ) n N
34
[例3〕某公司生产一批灯泡,共1000只,从中随机抽取 100只,测其寿命平均为1000小时,样本标准差为60小时, 计算其抽样误差。 按重复抽样计算:
µ
x
=
σ
n
2
(1 −
n N
)
31
2.成数的平均误差 统计成数(比重)是一种结构相对数,它实际属于是非
标志平均数的特例。统计上习惯以1表示“是”,以0表 示“非”。p为1的概率,q=1—p为0的概率。成数的方差是
P(1-P)其特点为,最大值为0.25(0.5×0.5),即当两种表现
的总体单位各占一半时,它的变异程度最大。
21
(三)重复抽样和不重复抽样 1.重复抽样(重置抽样) 采用这种方法抽取样本单位的特点是:同一单位 有多次重复被抽中的机会,并且总体单位数目始 终不变,每个单位抽中或抽不中的机会在各次都 是相同的。
22
2.不重复抽样(不重置抽样)
采用这种方法抽取样本单位的特点是:同一单位 只有一次被抽中的机会,并且总体单位数目随着 样本单位数目抽取的次数的增多而愈变愈少。每 个单位抽中或抽不中的机会在各次是不同的。
第 七 章
抽 样 调 查
第一节 抽样调查概述
第二节 抽样估计 第三节 抽样的组织形式
1
第一节 抽样调查概述 一、抽样调查的含义 (一)抽样推断的含义 抽样调查是按随机原则,从全部研究对象中抽取一 部分单位进行观察,并根据样本的实际数据,对总体的 数量特征做出具有一定可靠程度的估计和判断,从而达 到对全部研究对象的认识的一种统计方法。其中心问题 是如何根据已知的部分资料来推断未知的总体情况。
µ
x=s 2 n Nhomakorabea=
60 100
2
= (小时) 6
35
按不重复抽样计算:
µ
x
=
s n 60 100
2
2
( 1

n N
)
= =
( 1

100 1000
)
5
. 69
( 小时)
36
〔例5.4〕 某公司有员工10000人,从中随机抽选1000 人调查电脑的拥有率,发现50家有,问这一调查的抽样 误差为多少? 解:p=50/1000=0.05 按重复抽样计算:
6
2.抽样总体(样本、子样) 是指在总体中按随机原则抽取的那一部分 单位所构成的集合体。 组成样本的单位称为样本单位,样本单位数亦称样本 容量,通常用n表示。样本单位数总是大于1而小于总体单 位数N的,即1<n<N。
7
样本单位数n相对于总体的单位数N要小得多。 统计把n/N称为抽样比例。样本单位数达到或超过 30个(n≥30)称为大样本,而在30个以下(n<30)称为 小样本。社会经济现象的抽样调查多取大样本,而自然实 验观察则多取小样本。以很小的样本来推断很大的总体, 这是抽样推断法的重要特点。
4
三、抽样推断的作用 (一)解决了无法进行全面调查或很难进行 全面调查的问题 (二)可以补充或修正全面调查的数据
(三)可以节省调查费用和调查时间
5
四、抽样推断涉及的基本概念 (一)总体和样本 1.全及总体(总体、母体) 它是指调查对象的全部单位,是由具有某种共同性 质的许多单位组成的。组成总体的单位称为总体单 位,总体的单位数通常用N表示。
n1 p= n
n0 q = n
17
同总体成数
n
1
+ +
n
0
= =
n ( n + n n ) = 1
p
q
1
0

q = 1-
p
18
[例5.2) 从某公司生产的产品中,抽样检查了 100件产品,其中有5件不合格,则: 样本产品不合格率 :
p
=
n n
1
=
5 100
=
5 %
样本产品合格率
q = 1 − p = 1 − 5%
27
(二)抽样平均误差的计算 1.抽样平均数的平均误差 (1)在重复抽样的条件下总体方差已知,样本平均 数服从正态分布,其抽样平均数的平均误差计算公式为:
µ
x
=
σ
n
2
=
σ
n
28
由上式可以看出,抽样平均数的平均误差就是抽样平 抽样平均数的平均误差就是抽样平
相关文档
最新文档