统计学提纲第五章

合集下载

统计学 第五章

统计学      第五章

第五章 抽样推断抽样推断定义:是一种非全面调查,是按随机原则,从总体中抽取一部分单位进行调查,并以其结果对总体某一数量特征作出估计和推断的一种统计方法。

(一) 总体和样本在抽样推断中面临两个不同的总体,即全及总体和样本总体,全及总体也叫母体,简称总体。

全及总体的单位数用N 表示全及总体⎪⎩⎪⎨⎧⎩⎨⎧属性总体有限总体无限总体变量总体样本总体又叫抽样总体、子样,简称样本,样本总体的单位数称样本容量,用n 表示。

(二) 参数和统计量参数亦称全及指标,由于全及总体是唯一确定的,故根据全及总体计算的参数也是个定值 对于属性总体,可以有如下参数,全及总体成数p ,全及总体标准差)(2p p σσ方差 属性总体标准差:()p p p-=1σ统计量即样本指标设样本总体有n 个变量:n x x x x ,...,,,321 则:样本平均数 nx x ∑=(三) 样本容量与样本个数样本容量是指一个样本所包含的单位数,用n 来表示,一般地,样本单位数达到或超过30个的样本称为大样本,而在30个以下称为小样本。

社会经济统计的抽样推断多属于大样本,而科学实验的抽样观察则多取小样本。

样本个数又称样本可能数目,是指从全及总体中可能抽取的样本的个数。

一个总体可能抽取多少样本,与样本容量大小有关,也与抽样的方法有关。

在样本容量确定之后,样本的可能数目便完全取决于抽样方法。

抽样误差是抽样调查自身所固有的,不可避免的误差,虽然不能消除这种误差,但有办法进行计算,并能对其加以控制。

抽样平均误差越大,表示样本的代表性越低;抽样平均误差越小,表示样本的代表性越高。

在重复简单随机抽样时,样本平均数的抽样分布有数学期望值E(a)=a(a代表全及总体平均数,即X)X⇔。

样本平均数的平均数=总体平均数抽样平均误差=抽样标准误差=样本平均数的标准差(它反映抽样平均数与总体平均数的平均误差程度)例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用重复简单随机抽样的方法从全及总体中抽选出容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(15501700160015001400元=+++=X全及总体标准差()4500002=-=∑NX Xσ抽样平均误差x μ=nnσσ=2=)(0569.792*450000元=例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用不重复简单随机抽样的方法从全部总体中抽选容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(155041700160015001400元=+++==∑NXX全及总体标准差()4500002=-=∑NX Xσx μ=⎪⎭⎫ ⎝⎛--∙12N n N n σ=)(55.6414244*250000元=--∙例题:某电子元件厂,生产某型号晶体管,按正常生产试验,产品中属于一级品的占70%,现在从10000件晶体管中,抽取100件进行抽查检验,求一级品率的抽样平均误差? 解:已知:P=0.7 , P(1-P)=0.21在重复抽样的情况下,抽样平均误差为:()np p p -=1μ=%58.410021.0=在不重复抽样的情况下,抽样平均误差为:()⎪⎭⎫⎝⎛-∙-=N n n p p p 11μ=%56.410000*********.0=⎪⎭⎫ ⎝⎛-∙参数估计()()⎪⎪⎩⎪⎪⎨⎧→-==+≤≤是概率度是置信度,极限误差)样本指标总体指标极限误差—(样本指标区间估计:求不高的情况准确程度与可靠程度要点估计:适用于推断的t t F t F P α1例题:已知某车间某产品的合格率在某个置信度下的估计区间是(85%,95%),还已知样本容量为100,求置信度?解:显然p p ∆-=85%,p p ∆+=95%,即p=90%,p ∆=5%p ∆=μ⋅t μpt ∆=⇒=()()67.1100%901%90%51=-∙=-∆np p p ()t F =0.9052即置信度为90.51% ★求置信度,只需要求出t影响抽样数目的因素⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧∆样本单位不重置抽样可以少抽些单位,抽样需要多抽一些样本、在同等条件下,重置单位,则反之值越大,则多抽些样本、概率度则反之单位,的值大可以少抽些样本)、允许误差(极限误差越多,则反之值越大,必要抽样数目、总体标准差4321t x σ例题:某城市组织职工家庭生活抽样调查,职工家庭平均每户每月收入的标准差为11.50元,要求把握程度为95.45%,允许误差为1元,问需抽选多少户? 解:()t F =0.95452=⇒t , 元元,150.11=∆=x σxt n 222∆=σ=()户529150.1142=∙。

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断

σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理

统计学基础第五章时间数列

统计学基础第五章时间数列

statistics
统计学——第五章时间数列
解:根据上面计算资料再计算第三季度的月平均库存额为:
an-1 an a1 a2 a2 a3 … 2 2 a 2 n 1 an a1 a2 an-1 2 2 n 1
700 900 900 1000 2 2 4 1
均衡的期末登记排列。通常将前者称为间隔相等的间断 时点数列,后者称为间断不等的间断时点数列。
statistics
统计学——第五章时间数列
间隔相等的间断时点数列的平均发展水平的计算公式:
an1 an a1 a2 a2 a3 2 2 a 2 n 1 an a1 a2 an-1 2 2 n 1
statistics
统计学——第五章时间数列
(3)分子、分母由一个时期数列和一个时点数列对比组成 相对数时间数列。
a a 1 a 2 a n 1 a n c b0 bn b1 b n 1 b 2 2
(分子为时期数列,分母为时点数列) a0 an a 1 a 2 a n 1 a 2 或 2 c b1 b n 1 b n
可见,该商场2006年的第三、第四季度的月平均销售 额大于第一、第三季度的月平均销售额。 statistics
统计学——第五章时间数列
2.依据时点数列计算序时平均数
连续时点数列 时点数列 间断时点数列 间隔不等的间断时点数列 间隔相等的间断时点数列
statistics
统计学——第五章时间数列
(1)连续时点数列的序时平均数。
5-4所示,试求第一季度的平均完成率。 表5-4 某厂某年第一季度各月商品销售额 计划完成情况统计表 目 1月 200 210 105 2月 240 260 105 3月 250 280 112 statistics

统计学基础复习提纲复习内容统计数据数据搜集

统计学基础复习提纲复习内容统计数据数据搜集

统计学基础复习提纲复习内容:第一章:统计数据;第二章;数据搜集;第四章:数据分布特征的测度;第五章:抽样与参数估计;第六章:假设检验;第七章:相关与回归分析;第八章:时间序列分析和预测:第九章:指数。

重点内容:第一章统计和数据(1)统计的概念和应用(2)统计数据类型:分类数据、顺序数据、数值型数据;观测数据和实验数据;截面和时间序列数据。

(3)统计中的基本概念:总体与样本;参数与统计量;变量。

第二章数据搜集(1)数据来源:直接来源和间接来源(2)调查设计:调查方案设计和调查问卷设计(3)统计数据质量第四章数据分布特征的测度(1)集中趋势的测度:平均数;中位数和分位数;众数(2)离散程度的度量:极差和四分位差;平均差;方程和标准差;离散系数(3)偏态与峰态度量:偏态系数;峰态系数第五、六章参数估计与假设检验(1)参数估计的基本原理:点估计与区间估计(2)总体均值的区间估计和总体比率的区间估计(3)样本容量的确定(4)假设检验的基本原理:原假设与备择假设;两类错误与显著性水平;检验统计量与拒绝域。

(5)总体均值的检验:大样本检验方法;小样本检验方法。

第七章相关与回归分析(1)变量间关系度量:相关关系的描述和测度;散点图与离散系数。

(2)一元线性回归:一元线性回归模型;参数的最小二乘估计;回归方程的拟合优度;显著性检验。

(3)利用回归房产进行估计和预测第八章时间序列分析与预测(1)时间序列的分解和描述:图形描述;增长率分析(2)预测方法的选择和估计(3)平稳序列的预测:移动平均法;指数平滑法(4)趋势序列的预测:线性趋势预测;非线性趋势预测平均数:x 二2 4 10 11| 14 151096 9.610(2-9.6)2(4-9.6)2 川(15-9.6)2n -110-12、一家公司在招收职员时,首先要进行两项能力测试。

在A 测试中,其平均分数是100分, 标准差是15分;在B 项测试中,其平均数是 400分,标准分数是50分。

统计学 第五章 动态分析方法汇总

统计学 第五章 动态分析方法汇总

可分为: 1、时期数列:反映某种社会经济现象在一段时间内发展过 程总量的绝对数数列。 特点: A、资料通过连续登记取得 B、每个指标数值的大小与其包含的时间的长短有直 接的关系,包含的时期长则指标数值大 C、各项指标数值可以直接相加 2、时点数列:是指反映某种社会经济现象在一定时点上的 状况及其水平的绝对数动态数列。 特点: A、指标数值是通过一次性登记取得 B、数值大小与时点间隔的长短无直接的关系 C、数列中各项指标数值不能直接相加
a

n
例如,已知某企业一个月内每天的工人数,如果计算该月 每天平均工人数,遇将每天工人数相加之和除以该月的日历天 数即可求得。
B、数列中的各项指标不是逐日登记,只是在发生变动时进行 登记,称为间隔不等的连续时点数列。 计算公式为: af a f 例2:某企业的一个商品部某年一月份职工人数变动情况记录如下:
发展速度=报告期水平/基期水平
(二)分类: 按对比基期不同,分为定基发展速度和环比发展速度。 1.定基发展速度:又称总发展速度 2.计算公式: 报告期水平 定基发展速度= 固定基期水平
即:
a1 a2 a3 an 、 、 ... a0 a0 a0 a0
B、举例说明: 例1:我国社会消费品零售总额的定基发展速度和环比发展速度 如下表:
我国社会消费品零售总额 发展水 平 (1) 20 24 27 29 31 34 620 774 299 153 135 153 增长量 发展速度 增长速度 增长1%绝 对值 (8) -206.20 247.74 272.99 291.53 311.35
年份 (甲) 1995 1996 1997 1998 1999 2000
a0
a0
a1
a2
i

统计学第5章抽样推断

统计学第5章抽样推断
就 是 由 样 本 指 标 直 接 代 替 全 及 指 标 , 不 考 虑
任 何 抽 样 误 差 因 素 。 即 用 x直 接 代 表 X , 用 p 直 接 代 表 P。
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98% 。
(1)
2
n
(1 )
12 2 (1
100
) 1.19 (千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X : x 400 2 1.19 x
X (: 397 .62 ,402.38 ) (3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均
在重复抽样情况下:
p (1 p )
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N

某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
N15000n150
二、区间估计
根据样本指标和抽样误差去推断全及 指标的可能范围,它能说清楚估计的准 确程度和把握程度。
总体平均数和总体成数的估计
X :(x x, x x)
1的概率保证下:x tx
P:(pp, pp)
1的概率保证下: p tp

统计学原理第五章

统计学原理第五章
• 公式
比例相对指标
总体中某一部分数值 总体中另一部分数值
例:
设某校教学人员为200人,行政人员为300人, 教学人员占行政人员的比例为66.7%,也可用1: 1.5来表示。
• 一般以总量指标进行对比,依据分析任务和提供 资料的情况,也可运用现象总体各部分的相对数 或平均值进行对比。
3、比较相对指标
②实物指标还是计算价值指标的基础。 ③实物单位有局限性,它缺乏对不同类产品或商
品的综合性能。
2、货币单位计算的总量指标又称货币指标和价值指标, 货币单位体现现象和过程的社会属性。
• 价值指标的作用: ①用于反映经济活动总成果,并通过分类指标的计算, 研究它们之间的比例关系。 ②价值指标又经常被用于综合表明总物量在不同时间的 变动程度 ③它还是经济核算和考核效益必不可少的手段。
• 计算相对指标可以使不能直接对比的现象找到可以对比 的基础,进行有效的分析。
4、相对指标的表现形式是它的计算单位,其数值
可分为:
• 有名数:主要用于强调相对指标数值的表示,它把计算 强度相对指标时的分子和分母指标数值的计量单位同时 使用
无名数:一般表现,是一种抽象化的计算单位。
①倍数:是将对比的基数定为1而计算出来的相对 数。
• 定义:是不同单位(国家、部门、地区、企业、 个人等等)的同类现象数量对比而确定的相对 指标,用以说明某一同类现象在同一时间内各 单位发展的不平衡程度,以表明同类事物在不 同条件下的数量对比关系。
总量指标,它反映的是一段时间连续发生变化过程,又称流 量指标。 • 时点指标是反映社会经济现象在某一时间(瞬间)状况上的 总量指标,又称存量指标。
三、总量指标的计量单位
1. 实物单位是根据事物的自然属性和特点采用的计量单位。 实物单位的分类: ①自然单位:它是按照研究现象的自然状况来计量其数量

统计学提纲

统计学提纲

统计学习重点:第一章绪论1.统计的含义:三个方面和关系2.狭义统计学研究对象3.社会经济统计的四个特点4.统计数据处理步骤:统计设计贯穿始终、统计分析是统计工作的决定性环节5.统计学中基本概念:统计总体和总体单位、标志与指标的区别、变异和变量(重在理解),品质标志和数量标志的区分第二章数据收集1.统计调查对象与统计调查单位的区别2.统计调查误差,误差的分类,误差的差生原因和特点3.科学合理的数据收集具备的要求:准确性、及时性、全面性和经济学(记忆)4.数据收集方式特点(统计报表、普查、抽样调查(随机性)、重点调查、典型调查)第三章统计整理1.统计整理的作用:承上启下,二个动作(分类、汇总)记忆2.分组的目的:组间差异性和组间同质性3.第三节分布数列的举例,组距和组数的确定、确定组限的规定第四章集中趋势与离中趋势(会有大的计算题和小题目)1.两类总量(标志总量和总体单位数)2.时期指标和时点指标的区分3.六个相对指标的计算4.简单算术平均数的计算一般学生问题不大,注意加权算术平均数的计算,关注书本的例题(告诉比重、告诉具体各组人数,以及组距的处理)5.调和平均数和几何平均数的计算(主要是关注课后习题和作业上的题目)6.中位数和众数的计算关注书本习题和作业即可(中位数、众数、算术平均数关系)7.标志变异指标和是非标志的平均数、标准差的计算全部要会,见作业第五章统计推断1、全及总体和样本总体的区别,具体情形能区分即可2、样本容量和样本个数3、关于抽样误差和我抽样平均误差,根据我上课理解4、样本平均数的数学期望等于总体平均数以及样本平均数的标准差结论要记住,推算过程不要5、三个特殊的正态分布值6、课后习题类似的题目第六章时间数列(大的计算题和小题)1.水平指标和速度指标(间作业)2.平均发展水平的计算(作业都有)3.平均发展速度与增长速度关系4.长期趋势的测定(见书本和作业习题),曲线的不考5.季节变动的测定,作业和书本第七章统计指数(大计算题+个别小题)1.个别指数和总指数(综合指数、平均数指数、平均指标指数)2.质量指标和数量指标的区分3.两因素和三因素的分析4.平均指标指数的因素分析(见书本例题和课后习题)5.平均数指数(个体和总量指数相结合)第八章相关和回归分析1.函数和相关关系的区别2.相关分析包括的内容:方向、关系密切程度3.相关系数的计算(最基本的公式),注意下如果是组距是的求相关系数4.等级相关(必考小题)5.一元线性回归方差的测算6.判断系数和估计标准误差的计算,直接套用公式,小题。

《统计学概论》第五章课后练习题答案

《统计学概论》第五章课后练习题答案

《统计学概论》第五章课后练习题答案一、思考题1.什么叫时间序列,构成时间序列的基本要素有哪些?P1212.序时平均数与一般平均数有何异同?P1273.时间数列与时点数列有哪些区别?P124-1254.环比增长速度与定基增长速度之间有什么关系?P1365.什么是平均发展速度?说说水平法和累计法计算平均发展速度的基本思路,各在什么情况下选用?P1386.测定长期趋势有哪些常用的方法?测定的目的是什么?P1367.实际中如何根据时间序列的发展变化的数列特征来判断合适的趋势方程形式?P1458.影响时间序列指标数值大小的因素有哪些?这些因素共同作用的理论模型有哪些?P140二、判断题1.时间序列也称动态数列,它是变量数列的一种形式。

(×)【解析】时间序列是数列,而变量数列是静态数列。

2.时间数列和时点数列属于总量指标时间序列。

(√)3.所谓序时平均数是指将同一总体的不同时期的平均数按时间先后顺序排列起来。

(×)【解析】序时平均数是将不同时期的发展水平加以平均而得到的平均数。

4.间隔相等的时期数列计算平均发展水平时,应用首末折半法。

(×)【解析】间隔相等的时点数列计算平均发展水平时,应用首末折半法。

5.平均增长速度等于各期环比增长速度连乘积开n次方。

(×)【解析】平均发展速度等于各期环比发展速度连乘积开n次方,平均增长速度=平均发展速度-1(或100%)6.两个相邻时期的定基发展速度之比等于相应的环比发展速度。

(√)7.用移动平均法测定长期趋势时,移动平均项数越多越好。

(×)【解析】移动平均法所取项数的多少,应视资料的特点而定。

8.某一时间序列有25年的数据,若采用五项移动平均,则修匀后的数列缺少4项数据。

(√)9.如果时间序列是年度数据,则不存在季节变动。

(√)10.用相同方法拟合趋势方程时,t的取值不同,则得到的趋势方程也不同,但趋势预测值不变。

(√)三、单项选择题1.时间序列的构成要素是()。

统计学提纲第五章汇总

统计学提纲第五章汇总

第五章抽样推断第一节抽样推断的相关基本概念一、抽样调查(一)什么是抽样调查抽样调查是按随机原则从总体中选取部分单位进行观察,用所获得的样本数据推算总体数量特征的一种非全面调查。

(二)抽样调查的特点:1.按随机原则去抽取调查单位。

随机原则也就是机会均等的原则,每个单位被抽中的机会相等。

其目的是保证抽出的样本是随机样本。

2.以样本数据估计总体参数或检验总体的某种假设。

抽样调查虽仅是直接调查被抽取的那一部分样本,但其目的是着眼于研究总体的数量特征。

3.抽样误差可以事先计算并加以控制。

(三)抽样调查的适用范围:1.能够解决全面调查无法或难以解决的问题;2.对能取得全面资料,但不必进行全面调查的情况。

3.可以补充和订正全面调查的结果;4.可用于对总体的某种假设进行检验,为行动决策提供依据。

(四)抽样调查的基本形式基本形式有简单随机抽样、类型随机抽样、等距抽样、整群抽样。

1.简单随机抽样按随机原则直接从总体中抽选样本单位进行调查。

这里,不论是重复抽样还是不重复抽样,每个单位都有相等的中选机会。

2.类型随机抽样(分层抽样)先将总体单位按某一标志分类,然后按随机原则直接从各类中抽取一定的样本单位进行调查。

3.等距抽样(机械抽样或系统抽样)它是先将总体单位按某一标志进行排列,再按照一定的间隔抽取样本单位进行调查。

4.整群抽样(集团抽样)整群抽样是先将总体单位按某一标志进行分群,再按随机原则从各群中抽取部分群,对抽中的群的所有单位进行调查是抽样组织方式。

二、抽样推断的概念及主要内容(一)抽样推断是在抽样调查的基础上,以样本实际数据计算的样本指标推算总体相应数量特征的一种统计分析方法。

(二)抽样推断的主要内容为:参数估计和假设检验三、抽样的有关基本概念(一)全及总体和样本总体1.全及总体简称总体,又称母体,它是指所要认识的研究对象的全体。

也就是具有某种共同性质的许多单位的集合体。

2.样本总体简称样本,又称子样,是从全及总体中抽取,代表全及总体的那部分单位的集合体。

统计学--第五章两均数差别的统计意义

统计学--第五章两均数差别的统计意义

四、可信区间与假设检验的区别和联系
可信区间用于说明量的大小 即是否不同。
1、可信区间亦可回答假设检验的问题:算
得的可信区若包含了H0 ,则按α 水准不拒绝H0; 若不包含H0,则按α 水准,拒绝H0接受H1。
2、可信区间比假设检验可提供更多的信息:
也是对自由度进行校正重点介绍第一种方法见书p48例56第六节两种检验与两类错误一单侧检验与双侧检验1若检验目的在于检验两总体均数是否相等两者谁大谁小都有可能只的绝对值大于005界值即认为均数差别有统计学意义称双侧检验twotailedtest或双尾检验2若已知一个均数不可能低于另一个均数检验时只需考虑一侧的临界值称单侧onetailedtest或单尾检验单双侧检验时界值间的关系见面积示意图图51图52p4950二第一类错误与第二类错误型错误typeerror
三、假设检验应注意的问题 1、要有严密的研究设计 2、不同变量或资料应选用不同的检验方法 3、正确理解“ 显著性” 一词的含义:差 别有统计学意义,亦称差别有“ 显著性”, 不能理解为差异大。假设检验的结果并不 指差异的大小,只能反映两者是否相同, 差异的大小只能根据专业知识予以确定。 4、作结论不能绝对化:因统计结论具有概 率性质,不宜用“ 肯定”、“ 一定”、 “ 必定‘”等词。报告中最好列出统计量 的值和P值确切范围。以便读者与同类研究
二、第一类错误与第二类错误 I型错误type I error:拒绝了实际上成立的H0, 这类“ 弃真”的错误称I型错误,其概率大 小用α 表示,α 可取单尾亦可取双尾。取 0.05时,表示当无效假设正确时,在100次 抽样中可以有5次推断是错误的。false positive error II型错误:“接受”〔不拒绝〕了实际不 成立的H0 ,这类“取伪”的错误,称type II error。其概率大小用β 表示,β 只取 单尾,其值的大小在进行检验时一般并不 知道。false negative error

统计学提纲第五章

统计学提纲第五章

第五章抽样推断第一节抽样推断的相关基本概念一、抽样调查(一)什么是抽样调查抽样调查是按随机原则从总体中选取部分单位进行观察,用所获得的样本数据推算总体数量特征的一种非全面调查。

(二)抽样调查的特点:1.按随机原则去抽取调查单位。

随机原则也就是机会均等的原则,每个单位被抽中的机会相等。

其目的是保证抽出的样本是随机样本。

2.以样本数据估计总体参数或检验总体的某种假设。

抽样调查虽仅是直接调查被抽取的那一部分样本,但其目的是着眼于研究总体的数量特征。

3.抽样误差可以事先计算并加以控制。

(三)抽样调查的适用范围:1.能够解决全面调查无法或难以解决的问题;2.对能取得全面资料,但不必进行全面调查的情况。

3.可以补充和订正全面调查的结果;4.可用于对总体的某种假设进行检验,为行动决策提供依据。

(四)抽样调查的基本形式基本形式有简单随机抽样、类型随机抽样、等距抽样、整群抽样。

1.简单随机抽样按随机原则直接从总体中抽选样本单位进行调查。

这里,不论是重复抽样还是不重复抽样,每个单位都有相等的中选机会。

2.类型随机抽样(分层抽样)先将总体单位按某一标志分类,然后按随机原则直接从各类中抽取一定的样本单位进行调查。

3.等距抽样(机械抽样或系统抽样)它是先将总体单位按某一标志进行排列,再按照一定的间隔抽取样本单位进行调查。

4.整群抽样(集团抽样)整群抽样是先将总体单位按某一标志进行分群,再按随机原则从各群中抽取部分群,对抽中的群的所有单位进行调查是抽样组织方式。

二、抽样推断的概念及主要内容(一)抽样推断是在抽样调查的基础上,以样本实际数据计算的样本指标推算总体相应数量特征的一种统计分析方法。

(二)抽样推断的主要内容为:参数估计和假设检验三、抽样的有关基本概念(一)全及总体和样本总体1.全及总体简称总体,又称母体,它是指所要认识的研究对象的全体。

也就是具有某种共同性质的许多单位的集合体。

2.样本总体简称样本,又称子样,是从全及总体中抽取,代表全及总体的那部分单位的集合体。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章抽样推断第一节抽样推断的相关基本概念一、抽样调查(一)什么是抽样调查抽样调查是按随机原则从总体中选取部分单位进行观察,用所获得的样本数据推算总体数量特征的一种非全面调查。

(二)抽样调查的特点:1.按随机原则去抽取调查单位。

随机原则也就是机会均等的原则,每个单位被抽中的机会相等。

其目的是保证抽出的样本是随机样本。

2.以样本数据估计总体参数或检验总体的某种假设。

抽样调查虽仅是直接调查被抽取的那一部分样本,但其目的是着眼于研究总体的数量特征。

3.抽样误差可以事先计算并加以控制。

(三)抽样调查的适用范围:1.能够解决全面调查无法或难以解决的问题;2.对能取得全面资料,但不必进行全面调查的情况。

3.可以补充和订正全面调查的结果;4.可用于对总体的某种假设进行检验,为行动决策提供依据。

(四)抽样调查的基本形式基本形式有简单随机抽样、类型随机抽样、等距抽样、整群抽样。

1.简单随机抽样按随机原则直接从总体中抽选样本单位进行调查。

这里,不论是重复抽样还是不重复抽样,每个单位都有相等的中选机会。

2.类型随机抽样(分层抽样)先将总体单位按某一标志分类,然后按随机原则直接从各类中抽取一定的样本单位进行调查。

3.等距抽样(机械抽样或系统抽样)它是先将总体单位按某一标志进行排列,再按照一定的间隔抽取样本单位进行调查。

4.整群抽样(集团抽样)整群抽样是先将总体单位按某一标志进行分群,再按随机原则从各群中抽取部分群,对抽中的群的所有单位进行调查是抽样组织方式。

二、抽样推断的概念及主要内容(一)抽样推断是在抽样调查的基础上,以样本实际数据计算的样本指标推算总体相应数量特征的一种统计分析方法。

(二)抽样推断的主要内容为:参数估计和假设检验三、抽样的有关基本概念(一)全及总体和样本总体1.全及总体简称总体,又称母体,它是指所要认识的研究对象的全体。

也就是具有某种共同性质的许多单位的集合体。

2.样本总体简称样本,又称子样,是从全及总体中抽取,代表全及总体的那部分单位的集合体。

全及总体是我们所要研究的对象,而样本总体则是我们所要观察和采集数据的对象,两者是有区别。

(二)样本容量和样本个数1.样本容量是指样本所包含的单位数。

2.样本个数又称样本可能数目,也就是从一个总体中可能抽取的样本个数。

重复抽样时:■冷:;对于一次抽样调查,全及总体是唯一确定的,而一个全及总体可能抽出很多个样本总体;样本的个数和样本的容量有关,也和抽样的方法有关。

(三)参数和统计量1.根据全及总体各个单位的标志值或标志属性计算的,反映总体某一数量特征的综合指标称为全及指标,也称为总体参数,简称参数。

2.由样本总体各单位标志值或标志属性计算的,反映样本数量特征,并用以估计全及指标的综合指标称为样本指标,或称为抽样指标、统计量。

统计量有:样本平均数二抽样成数x = pn-- 2样本方差:厂2「X-Xnp(1-p)二pq样本标准差:二' x-x [注意:W p(l-P)p:pq对于一个问题,全及总体是唯一确定的,而一个总体有多少样本;总体指标值是唯一确定的;而统计量是样本变量的函数,也就是样本统计量就有多种取值(四)重复抽样和不重复抽样重复抽样:从有N个单位的总体中,每次随机抽取1个单位,登记其标志表现后放回,再从总体中重新抽取,一直抽取n次。

不重复抽样:从有N个单位的总体中,每次随机抽取1个单位,登记其标志表现后不放回,再从总体中重新抽取,一直抽取n次。

第二节抽样误差一、误差调查资料的检查是指对资料的准确性、完整性、及时性检查(一)登记性误差凡是由于错误判断事实、错误登记事实或错误计算而发生的误差,登记性误差在全面调查与非全面调查中都可能存在。

它分为1.偶然登记性误差;2.系统登记性误差其特点是具有明显的倾向性和一贯性。

(二)代表性误差在没有登记性误差的条件下,由于用样本指标代表总体指标而产生的误差,它分为:1.偏差凡是由于违反随机原则抽样而产生的代表性误差,又称为系统性代表误差、非偶然性代表误差。

2. 抽样误差 是指由于随机抽样的偶然因素,使样本的结构不 足以代表总体各单位的结构,而引起抽样指标和总体指标之间的误 差,也称为随机误差、偶然性代表误差。

抽样误差既不包括登记误差,也不包括系统性代表误差。

影响抽样误差的因素有:总体各单位标志值的差异程度;样本的 单位数;抽样的方法;抽样调查的组织形式。

二、抽样平均误差。

抽样平均误差是反映抽样误差一般水平的指标,它反映了抽样指 标与总体指标的平均离差程度,即样本指标与总体指标的标准差 常用抽样平均数的标准差来衡量抽样平均误差的作用首先表现在它能够说明样本指标代表性的大 小。

平均误差大,说明样本指标对总体指标的代表性低;反之,则说 明代表性高。

抽样平均数的平均数二总体平均数。

抽样平均误差的计算: (一)简单随机抽样条件下:-- 21、 重复抽样:匚亠V n J n当N 很大且很小时,.-二N麻其中,。

为总体标准差,n 为样本单位数,在总体标准差未知, 用样本标准差s ;=国E 亘代替但如果是大样本时,可以用样本\ n _1标准差s -、(x_x )代替S ;。

卩-"-刃 2 X _, M X 为第i 个样本的平均数;X 为总体平均数;M 为样本个数a (P -P)2MPi 为第i 个样本的成数 P 为总体成数; M 为样本个数(二)分层抽样条件下:抽重复抽样:不重复抽样:若总体标准差未知时,可用样本标准差代替。

分层抽样为等比例抽样时:一一—n N(三)整群抽样条件下:由于整群抽样一般采用不重复抽样,因而有:_ 卜(R-R)其中,R为总体群数;r为样本群数;二为群(组)间方差。

r•为第i群的样本平均数;[为全样本平均数, 7。

三、抽样极限误差抽样极限误差是指用绝对值形式表示的样本指标与总体指标之间偏差的最大允许范围。

△x =|x -x| A p =|p _P即:x- x 乞X 3 x p-/P^pAp四、抽样误差的概率度抽样极限误差以抽样平均误差为标准单位来衡量。

即把极限误差△ x 或△ p 相应除以或二p ,得出相对的误差程度t 倍,t 称为抽样 误差的概率度。

于是有:厶 X =t 'x 或二 p =t 」p概率度与概率保证程度之间的几个数值关系:五、样本容量的确定在简单随机抽样下:1. 在重复抽样的条件下,样本容量的确定:tG 2t 2p(l-p) ln 厂也x 也x2. 在不重复抽样的条件下,样本容量:Nt 2p(1-p) n 2 2N p t p(1 - p)第三节抽样估计一、抽样估计的的概念抽样估计就是利用实际调查计算的样本指标值来估计相应的总体 指标值。

抽样估计有点估计和区间估计两种估计量是根据样本数据来估计总体参数的形式。

一般情况下估计 量就是样本统计量。

估计量的优良标准:2 2Nt O xn2~~2~2(1)无偏性要求样本指标值的平均数等于被估计的总体指标值,即无系统性误差。

(2)有效性要求作为优良估计量的方差(标准差)应比其它估计量的方差(标准差)小,即估计量的数学期望等于总体参数;(3)一致性当作为优良估计量的样本容量充分大时,抽样指标也应充分地靠近总体指标.即估计量的误差随着样本容量的增大而减小。

二、点估计参数的点估计:直接以样本指标作为相应总体参数的估计量。

总体平均数的估计:用样本平均数估计总体平均数三、区间估计参数的区间估计:根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限。

抽样估计的置信度是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。

注意:抽样估计的置信度并不是概率度,但两者之间存在一一对应的关系。

2.区间估计步骤:(1)计算抽样平均数和标准差。

(2)计算抽样平均误差(3)计算抽样极限误差■"-=x二t'x_ ( 4)根据给定的抽样极限误差计算总体平均数的上下限x - x -X -x \如果抽样误差的概率度已给出,查《正态分布概率表》得出置信度。

四、抽样估计的精度误差率_ △二日估计精度=1-误差率x x误差率是抽样的相对误差率。

概率保证程度,置信区间长度及估计精度的关系:概率保证程度越大,置信区间长度越长,估计精度越低;反之,概率保证程度越小,置信区间长度越短,估计精度越高。

例1、某学校进行一次统计学测验,为了解学生的考试情况,随机从全校统计学考生中抽选部分学生进行调查,所得资料如下:(1)试以95.45%的可靠性估计该校学生统计学的平均成绩的范围;(2)试以95.45%的可靠性估计该校学生成绩在80分以上的学生所占的比重的范围;(3)如果其它条件不变,将允许极限误差缩小一半,应抽取多少名学生?解:1、该校学生统计学平均成绩的范围:计算样本平均数:x 址r X 丄=551°958=76 . 6 (分)r 、了1oo计算样本标准差' (x-x) f i =11.38 (分)计算抽样平均误差:I二11.377 =1.1377 (分)查《正态概率表》得出误差概率度t=2计算抽样极限误差:△ x = t卩x = 2X 1.1377 = 2.2754 该校学生考试的平均成绩的区间范围是:x - △ x WXWx +△ x76.6 — 2.2754 <X< 76.6 + 2.275474.32 <X< 78.89在95.45 %概率保证程度下,该校学生的平均成绩74.32%— 78 89.99%之间。

2、估计该校学生成绩在80分以上的学生所占的比重的范围计算样本成数平均数:—48x — p =0.48100计算样本成数标准差:二二p(1 -p)二0.48 0.52 =0.4996 计算抽样平均误差:一,0需查《正态概率表》得出误差概率度t=2= 0.04996计算抽样极限误差:.爲二t」p=2 0.04996 =0.0999280分以上学生所占的比重的范围:p _ )p 辽P 冬P • SP = p±A P = 0.48 士0.09992 0.3801 <P< 0.5799 在95.45 %概率保证程度下,该校学生成绩在80分以上学生所占的比重在38.01%—57.99%之间3、如果其它条件不变,允许极限误差缩小一半时应抽取的样本容.-■:x 2=4X 100=400 (人)第四节抽样组织设计的基本原则一、抽样组织设计的基本原则(一) 要保证随机抽样抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对 样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位。

(二) 要保证抽样误差最小在其他条件相同的情况下,选抽样误差最小的方案。

(三) 费用最少在其他条件相同的情况下,选费用最少的方案。

本章计算题1. 从一批元件中按简单随机重复抽样抽取 100件产品进行检 验,结果发现10件不合格品。

相关文档
最新文档