优选第五章抽样与抽样估计
《抽样与估计》PPT课件
第二讲 抽样与估计
1. 什么是推断统计 2. 概率与概率方法 3. 概率分布 4. 抽样方法与中心界限定理 5. 点估计与区间估计 6. 样本容量的确定
南京财经大学统计学系 管于华
什么是推断统计?
描述统计学强调的是:汇总从过去发生 的事件中搜集到的数据。例如,描述某个汽 车销售公司上个月的汽车销售价格;推断统 计学(inferential statistics),又称统计推断 (statistical inference)是根据从总体中抽取 的样本来对总体特征进行研究,计算某个事 件在将来发生的可能性。
精选ppt
10
概率分布
概率分布(probability distribution)出了一 次试验中可能发生的数值的全部范围。概率分 布类似于相对频数分布,但描述的不是过去, 而是事件在未来发生的可能性。
【例】一家制药厂声称某种治疗可以帮助80%的人减 肥。消费者保护协会可以用6个人的样本来检验这种
治疗的效果。如果药厂所说属实,那么没有一个人能
够成功减肥的情况几乎不可能发生,最有可能的情况 是6个人中有5个人减肥成功。
精选ppt
11
概率分布
随机变量(random variable)从一次试验中得到的 一个数量,由于偶然性,它可以取不同的值。例如,一 周内在302国道上发生事故的次数可能是10、11或12次, 也可能是其他一些数值。分离散型随机变量(discrete random variable)只能取一些单独数值的随机变量;连 续型随机变量(continuous random variable)可以在一个 给定的范围内,取无穷多个数值的随机变量。
一张写有“获胜者”,另一张空白。为了确定哪一
第五章 抽样法
抽样的作用
抽样调查能够解决全面调查无法或难以解决的问
题。
抽样调查可以补充和订正全面调查的结果。
抽样调查方法可以用于生产过程中产品质量的检
查和控制。 抽样调查方法可以用于对总体的某种假设进行检 验,以判断这种假设的真伪,决定行动的取舍。
抽样中的几个基本术语
总体(Population):调查研究的事物或现象的全体 个体(Item unit):组成总体的每个元素
一、抽样的概念、特点、作用 二、抽样中的基本术语 (一)总体和样本 (二)参数和统计量 (三)样本容量和样本个数 (四)重复抽样和不重复抽样 (五)概率抽样与非概率抽样 (六)抽样框 三、抽样误差
抽样的概念 特点
(一)概念 抽样调查是按照随机原则从全部研究对象中抽取 一部分单位进行观察,并依据获得的数据对全部研 究对象的数量特征做出具有一定可靠性的估计和判 断.达到对现象总体认识的一种方法. (二)特点 它是按照随机原则从总体中抽取样本。 它是由部分推算整体的一种方法。 它是运用概率估计的方法。 抽样误差可事先计算并加以控制。
抽样中的几个基本术语
X
i 1 N
总体均值
X
i
N
或
X F
i 1 K i
K
i
F
i 1
i
标准差
X
N i 1
i
X
2
N
或
X
K i 1
i K
X Fi
i
2
F
i 1
抽样中的几个基本术语
总体方差
2
( X i X )2
i 1
N
N
或
( X i X ) 2 Fi
抽样与抽样估计课件
分布
2 X ~ N ( , ) ,( x1 , x2 ,, xn ) [定理7–1] 设总体 是一个简单随机样本,则有: x ~ N ( , 2 / n)
E( x)
V ( x) 2 / n
将样本平均数标准化,即有:
Z x x ~(0,1) ( x) / n
第 一 节 抽样及抽样估计中的基本概念
一、抽样估计的概念和特征
(一)抽样及抽样估计的概念 1.抽样即抽样调查,是指在总体中选取部分单位组
成样本并收集样本单位的数据资料的过程
2. 抽样估计 是在抽样调查的基础上,利用样本的
数据资料计算样本指标,以样本特征值对总体特征 值作出具有一定可靠程度的估计和判断
当总体方差 2 未知时,可以用样本方差 S 2 代替总体方差 2 ,或用样本标准差 S 代替总体 标准差 ,则有: 2 X ~ N ( [定理7—3] 设总体 , ), ( x1 , x2 ,, xn )是其一个简单随机样本,样 本平均数为 x ,样本标准差 S , x ~ t( n 1 ) 则统计量 t
(3)如果 X ~ N ( , 2 ) ,则 X 的分布函数为
F ( x) (
x
上述公式称为正态分布函数的标准化公式
)
常见的抽样分布
2 (二) 分布
设 x1 , x2 ,, xn 是独立同分布的随机变量,且每 个随机变量都服从标准正态分布,即 x i ~(0,1), 则随机变量
二、抽样及抽样估计中的相关概念
(四)抽样框
1.概念:抽样框是包括全部抽样单位的名单框架 2.形式 名单抽样框:如学生名单、职工名单、企业名单等 区域抽样框:如将一个城市按行政区划分为若干区、街 道、居委会等 时间抽样框:如对流水线上的产品每隔一定时间抽取 一定单位
统计学之抽样与抽样估计概述
重复抽样:
(1)总体是正态分布,样本必然是正态分布
(2)样本平均数的平均数等于总体平均数
(3)样本平均数的方差等于总体方差除以样本
容量n
2 x
2
n
(4)n越大,样本平均数越趋近于正态分布
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。 总体的均值、方差及分布如下
.2
.1 0
1
234
= 2.5
σ2 =1.25
.3 P ( X ) 抽样分布
.2
.1
0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
X 2.5
2 X
1.25 2
0.625
不重复抽样:
(1)总体是正态分布,样本必然是正态分布
(2)样本平均数的平均数等于总体平均数
(3)样本平均数的方差等于总体方差除以样本
对于给定置信度,有
P(1 P)
P { p z / 2
n
P p z / 2
x
z / 2 p
z / 2
P(1 P) n
P(1 P) } 1
n
总体比例的置信区间为
P(1 P)
P(1 P)
( p z / 2
n
, p z / 2
) n
小样本条件下,不作介绍。
【例】某城市想 要估计下岗职工 中女性所占的比 例,随机抽取了 100 个 下 岗 职 工 , 其 中 65 人 为 女 性职工。试以 95% 的 置 信 水 平 估计该城市下岗 职工中女性比例 的置信区间
p
P(1 P) n
0.95 0.05 100
抽 样 与 抽 样 推断
(四)总体参数和样本统计量符号
总体指标符号 总体容量: N 总体平均数: X 总体成数: P 总体方差: 2 总体标准差: 样本指标符号 样本容量: n 样本平均数: x 样本成数: p 样本方差: S 2 样本标准差: S
第二节
抽样误差
一、抽样误差
(一)概念:抽样误差是指抽样估计值与被 估计总体的特征值之间的离差。即: 抽样误差(平均数)= 抽样误差(成 数) =
2)代表性误差:指在用样本数据进行推 断时所产生的随机误差。原因有: A. 抽取样本时没有遵循随机原则; B. 样本结构与总体结构的差异; C. 样本容量不足; 这类误差通常无法消除,但可以事先 控制或计算。
2. 根据是否带有倾向性,分为:
系统性误差(系统性登记误差、系统性代表误差) 非系统性误差(非系统性登记误差、非系统性代表误 差). 1)系统性误差:登记时有意识地虚报、瞒报以及在选 择代表性单位时有意识地选大或小造成的,带有明显 的系统偏高或偏低倾向; 2.非系统性误差:由于技术的原因或客观的偶然性造成 的,不带有倾向性。相比而言,系统性误差危害更大。
(二)抽样推断的特征
1.抽样估计是由部分推断总体的一种认识方法。 2.抽样估计建立在随机取样的基础上。 3.抽样估计运用的是不确定的概率估计方法。 4.抽样估计的误差可以事先计算并加以控制。
(三)抽样推断的应用范围:
1.对无限总体不可能进行全面调查 2.总体范围过大,或过于分散,很难或不 必要进行全面调查 3.对于具有破坏性的质量检验不能进行全 面调查 4.限于人力、物力、财力不便进行全面调 查 5.对全面调查统计资料的质量进行检查和 修正
xi
xi X
x
i
X
2
抽样与抽样估计
第五章抽样与抽样估计教学目的与要求:参照教学大纲。
教学重点:抽样误差、区间估计的方法、样本容量的确定、抽样组织形式等教学难点:抽样平均误差的概念及计算、区间估计的几种方法、各种不同抽样组织形式的特点第一节抽样调查中的基本概念一、抽样推断的一般概念抽样推断是在根据随机原则从总体中抽取部分实际数据的基础上,运用数理统计方法,对总体某一现象的数量性作出具有一定可靠程度的估计判断。
抽样推断的特点:它是由部分推算整体的一种认识方法;它是建立在随机取样的基础上。
它是运用概率估计的方法;抽样推断的误差可以事先计算并加以控制。
抽样推断的主要内容为:参数估计和假设检验二、抽样的基本概念1、全及总体和样本总体全及总体是我们所要研究的对象,又称母体,简称总体,它是指所要认识的,具有某种共同性质的许多单位的集合体。
总体单位的总数称为总体容量,一般用N表示。
样本总体则是我们所要观察的对象,样本总体又称子样,简称样本,是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。
样本总体的单位数称为样本容量,通常用小写英文字母n来表示。
对于一次抽样调查,全及总体是唯一确定的。
而样本是不确定的,具有随机性,一个全及总体可能抽出很多个样本总体,样本的个数和样本的容量有关,也和抽样的方法有关。
根据总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的综合指示称为总体指标,也称总体参数。
常用的总体指标有总体平均数(或总体成数)、总体标准差(或总体方差)。
由样本总体各单位标志值计算出来反映样本特征,用来估计全及指标的综合指标称为统计量(抽样指标)。
统计量是样本变量的函数,用来估计总体参数,因此与总体参数相对应,统计量有样本平均数(或抽样成数)、样本标准差(或样本方差)。
2、样本容量和样本个数样本容量是指一个样本所包含的单位数。
通常将样本单位数不少于30个的样本称为大样本,不及30个的称为小样本。
社会经济统计的抽样调查多属于大样本调查。
抽样和抽样分布详解演示文稿
第18页,共83页。
简单随机抽样
(simple random sampling)
——对总体单位逐一编号,然后按随机原则 直接从总体中抽出若干单位构成样本
应用
仅适用于规模不大、内部各单位 标志值差异较小的总体
是最简单、最基本、最符合随机原则, 但同时也是抽样误差最大的抽样组织形式
生产性投资情况。
第一阶段:从该省所有县中抽取5个县 第二阶段:从被抽中的5个县中各抽4个乡 第三阶段:从被抽中的20个乡中各抽5个村 第四阶段:从被抽中的100个村中各抽10户
样本n=100×10=1000(户)
第25页,共83页。
抽样组织方式的选择 在实际工作中,选择适当的抽样组织方 式主要应考虑:
例:总体群数R=16 样本群数r=4
A D
E
B F G
CM N
J
LP KO
HI
LP HD
样本容量
n nd np nl nh
简单、方便,能节省人力、物力、财 力和时间,但其样本代表性可能较差
第24页,共83页。
多阶段抽样
—— 指分两个或两个以上的阶段来完成抽取 样本单位的过程
例:在某省100多万农户抽取1000户调查农户
样本抽样分布特征的证明
设从总体中抽出的样本为x1,x2,x3…xn ,由于是重复抽样, 每个xi都是从总体中随机抽出的,都是与总体同分布的随机
变量,并且是相互独立的。总体的平均数为,方差为 2,则:
E(
x)
E(
x1 +x2
x3 n
xn
)
1 n
[E(x1)+E(x2 )+E(x3)
统计学多选题
第一章导论1.统计的基本方法包括( )。
A.大量观察法B.综合分析法C.统计分组法D.归纳推断法E.指标体系法2.统计总体的基本特征表现在( )。
A.客观性B.数量性C大量性D.同质性E.差异性3.要了解某地区全部成年人口的就业情况,那么( )。
A.全部成年人是研究的总体B成年人口总数是统计指标C.成年人口就业率是统计标志D.“职业”是每个人的特征,“职业”是数量指标E.某人职业是“教师”,这里的“教师”是标志表现4.国家统计系统的功能或统计的职能是( )。
A。
信息职能B.咨询职能C监督职能D.决策职能E.协调职能5.下列统计指标中,属于质量指标的有( )。
A.工资总额B.单位产品成本C出勤人数D.人口密度E.合格品率6.我国统计调查的方法有( )。
A.,统计报表B.普查C抽样调查D.重点调查 E.典型调7.在工业设备普查中( )。
A.工业企业是调查对象B.工业企业的全部设备是调查对象C.每台设备是填报单位D.每台设备是调查单位E.每个工业企业是填报单位8.对某市工业生产进行调查,得到以下资料,其中的统计指标是( )。
A.某企业为亏损企业B.实际产值为1.1亿元C职工人数为10万人 D.某企业资金利税率为30%E.机器台数为750台9.设某地区五家全民所有制企业的工业总产值分别为25万元、22万元、40万元、33万元和65万元,则( )。
A. “全民所有制”是企业的品质标志B.“工业总产值”是企业的数量标志C “工业总产值”是个变量D “工业总产值”是企业的统计指标E.25、22、40、33、65这几个数字是变量值10.某商场800名职工的每个人的工资资料中( )。
A.职工资总额是统计指标B.800名职工是总体单位C有800个标志值D.职工工资是统计标志E.该商场工资总额等于800人乘以其平均工资11.在全国人口普查当中( )。
A.每个人是总体单位B.男性是品质标志C年龄是数量标志D.人口平均寿命是数量标志E.全国人口数是数量总体第二章数据的收集1.人口普查属于( )。
第抽样分布与参数估计演示文稿
(二)点估计
点估计,主要有矩估计法和最大似然估计法。
矩估计法是用样本矩去估计总体矩(或是用样本矩的 函数去估计总体矩的相应函数)的一种估计方法,由此 获得的估计量称作矩估计量;
最大似然估计法是把待估计的总体参数看作一个可 以取不同数值的变量,计算当总体参数取上述不同数 值的时候,发生我们当前所得到的样本观测值的不同 概率,总体参数取哪一个数值的时候这种概率最大, 便把这个数值作为对总体参数的估计结果。
解: P 320 80% 400
p
( 1
n
) N n N 1
P( 1 N
P
)1
n N
80% 20% 400
1
400 6000
1.932
第二十五页,共87页。
第三节 参数估计
一、参数估计概述 二、总体均值的估计 三、总体比例的估计 四、总体方差的估计
第二十六页,共87页。
放回抽样分布--样本平均数的分布
某班组5个工人的日工资 为34、38、42、46、50 元。
= 42
2 = 32
现用放回抽样的方法从5 人中随机抽2个构成样本。 共有52=25个样本。如右 图。
样本
34,34 34,38 34,42 34,46 34,50 38,34 38,38 38,42 38,46 38,50 42,34 42,38 42,42 42,46 42,50
极限误差来反映。 显然,Δ越小,估计的精 度要求越高,Δ越大,估计的精度要求越低。
极限误差的大小要根据研究对象的变异程度 和分析任务的性质来确定。
第三十三页,共87页。
所谓可靠性是指估计结果正确的概率保证,可用 置信度来反映。在区间估计中,置信度十分重要。只 有精度而没有置信度的估计是毫无意义的。能够给出 置信度的前提条件是,能够证实估计量ˆ 服从(精确 地或是近似地)某种已知的常见分布。
统计知识学知识题第五章抽样与抽样估计答案解析
第五章抽样与抽样估计复习题一、填空题1、在实际工作中,人们通常把n≥30 的样本称为大样本,而把n<30 的样本称为小样本。
2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。
3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。
4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。
5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。
二、选择题单选题:1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须((2))(1)增加到原来的3倍(2)增加到原来的9倍(3)增加到原来的6倍(4)也是原来的1/32、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用((3))(1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1小时的全部产进行检验,这种方式是((4))(1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2))(1)提高(2)降低(3)不变(4)不一定降低5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为0.8分钟,则概率为0.9545时,通话平均持续时间的抽样极限误差为((2))(1)0.8 (2)0.16 (3)0.84 (4)3.166、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小多选题:1、降低抽样误差,可以通过下列那些途径((2)(4)(5))(1)降低总体方差(2)增加样本容量。
第5章抽样与参数估计1
统计学
STATISTICS
抽样单元与抽样框
5 - 35
统计学
STATISTICS
抽样单元与抽样框
1. 抽样单元(Sampling unit):将总体划分成互不重迭且 又穷尽的若干部分,每个部分称为一个抽样单元
• 每个抽样单元都是由若干个体组成的集合 • 只由一个个体组成就称为最小抽样单元
• 抽样单元可以是自然形成的,也可以是人为划定的
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
5 - 23
x
x
统计学
STATISTICS
中心极限定理
(central limit theorem)
x 的分布趋 于正态分布 的过程
5 - 24
统计学 抽样分布与总体分布的关系
STATISTICS
2. 一种理论概率分布
3. 推断总体均值的理论基础
5 - 17
统计学
STATISTICS
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 体的均值、方差及分布如下
总体分布
.3
.2
.1 0
1
5 - 18
2. 特点
抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便
调查的实施 缺点是估计的精度较差
5 - 42
统计学
STATISTICS
系统抽样
(systematic sampling)
1. 将总体中的所有单位(抽样单位)按一定顺 序排列,在规定的范围内随机地抽取一个 单位作为初始单位,然后按事先规定好的 规则确定其他样本单位
第5章抽样与抽样估计演示
PPT文档演模板
第5章抽样与抽样估计演示
三、样本比例的抽样分布
∵样本中具有某种特征的单位数x~B(n,P)
∴样本比例的精确分布——二项分布
PPT文档演模板
样本比例的近似分布——正态分布
•(大样本下)
•均值、比率 抽样分布一览 表
第5章抽样与抽样估计演示
第三节 抽样估计的基本方法
这节是本章的中心。参数估计最基本的方 法是简单估计(又有点估计和区间估计 两种)。不讨论比估计和回归估计。抽 样数目也是事先必须估计的量。
(一)正态总体,总体方差已知时 样本均值的抽样分布——正态分布
样本均值的标准值的抽样分布——标准正态分布
大样本下,样本均值的抽样分布—— —渐进正态分布
均值的抽样平均误差=样本均值的标准差
(二)正态总体,总体方差未知时 样本均值的标准值的抽样分布——t分布
PPT文档演模板
第5章抽样与抽样估计演示
均值的抽样分布
第5章_抽样与抽样估计 演示
PPT文档演模板
2020/11/26
第5章抽样与抽样估计演示
本章要解决的主要问题
• 抽样——抽取样本
• 什么是样本 • 怎么抽——抽样方式、方法 • 从哪里抽——抽样框 • 抽 多 少 —— 样本大小
• 抽样估计——用所抽取样本去估计总体
• 要估计什么——总体参数(总体特征) • 用什么来估计——样本估计量 • 用什么估计方法 • 估计结果的形式 • 估计结果的可靠性和准确性
再见,see you again
PPT文档演模板
2020/11/26
第5章抽样与抽样估计演示
第一节 抽样调查中的基本概念
本节的目的、说明
本节的主要内容——
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率抽样和非概率抽样
➢ 概率抽样(probability sampling)也叫随机抽 样(random sampling), 即抽样时遵循随机原 则。基本的组织方式有:简单随机抽样、分层 (stratified)随机抽样、系统(systematic)随机 抽样、整群(cluster)随机抽样。
n
ai
xiai 不全为0,
i 1
也服从正态分布,且
n
E
ai
i
i 1
n
V
ar
a2 i
2。
i
i 1
设 x1, xn 相互独立,都服从
标准正态分布,则它们的平均
x 数x 1 n 与它们的离均差 n i1 i
n
平方和
2相互独立,
i 1
n
且
xix
2 ~
2 n 1。
i 1
x x 设 ,, 是取自正态总体N , 2 的样本,
Y ~ 2 (n),则 X 的分布密度函数f x
Y n
由下式给出,称服从具有n个自由
度的t分布,记作t(n)。
x
f
x
n 1 2
n n
2
1
x2 2
n1
2
3. F分布
若连续型随机变量X与Y独立,且
X
X
~
2 (n1), Y
~
2 (n2 ),则ξ
n1 Y
n2
的分布密度函数由下式给出,称
➢ 随机误差是抽样调查所特有的。抽样估计中的 抽样误差就是指由于抽样的随机性而产生的估 计量与被估计的总体参数之间的代表性误差。
✓ 由于总体参数的未知性,某次具体抽样结果的实际抽 样误差是无法计算的。
✓ 但由于对确定的总体和确定的抽样方案,估计量的取 值存在一定的分布规律,因此可以从所有可能的样本 来考察抽样误差。抽样平均误差则是反映确定的抽样 方案下所有可能抽样实际误差绝对值的一般水平的统 计指标。
• 样本中具有某种特征的单位占全部样本单位的 比例称作样本比例,记作p。
• 如:民众对某项政策的支持率为P。随机选择n 个人询问他们是否支持某政策,结果有m个回 答支持,则p=m/n为样本支持率。
• 采用重复抽样时,m~B(n,P), E(m)=nP, D(m)=nP(1-P)。因此E(p)=P, D(p)=P(1-P)/n。
优选第五章抽样与抽样估计
2020/9/8
宁波大学商学院 郑建华
1
• 说出以下问题的总体和总体单位:
• (1)研究某部门职工收入的水平?
• (2)对某厂某月生产的电视机进行质量 检查?
• (3)研究某地区农村居民家庭的生活水 平?
• (4)研究“十五大”以来宁波市居民家 庭生活条件发生的变化?
• (5)测定一个物件的精确重量?检查某 种新型纱线的拉力强度?
• 避免系统误差,统计推断时可以计算和控制抽 样误差。
➢ 非概率抽样:根据经验或需要,主观选取若干 总体单位构成样本。
抽样误差
➢ 统计调查误差:调查结果与真实值间的差异。 按来源有登记性误差和代表性误差之分。
• 登记误差:观察、登记、测量、计算等引起。 可存在于一切调查中。
• 代表性误差:用样本资料对总体特征进行推断 时所引起的。有系统误差(非随机因素引起) 和随机误差(随机因素引起)之分。
• 2. 样本与统计量
➢总体的一部分,或者从总体中抽取的部 分单位所构成的整体,称为总体的一个 样本(sample)。样本中包含的总体单位 数称为样本容量,常用n表示。
• 有大样本和小样本之说。样本是不确定 的。
➢根据样本资料确定的数量指标,称为统 计量(statistic),或者说统计量是样本 资料的函数(不含有未知数)。
xi
x
2
n
xi
x
2
i1
i1
n
xi
2
x
2
2 n 2 1 2 n 1
i1 / n
设 x1,, xn 是取自正态总体
N , 2 的样本,x、s分别
是样本的平均数和标准差,
则t x ~ tn 1。
s/ n
证明: x ~ N 0,1
/ n
1
n
则有:
2
x
~
N
,
n
;
x ~ N 0,1
/ n
x x 设 ,, 是取自正态总体N , 2 的样本,则有:
1
n
1 n 2
xix
2
~
2 n 1
i1
n
x与
xix
2相互独立。
i 1
x x 证明 ,, 取自正态总体N , 2 ,且相互独立
1
n
1 n
2
i1
xix
2
n
✓ 对于无偏估计量,抽样平均误差定义为估计量的标准 差。他是可以计算的。
✓ 在一定的概率保证程度下,抽样实际误差的可能取值 的允许范围(称为抽样极限误差)也是可以计算和控 制的。
✓ 抽样误差率(极限误差/估计量)与抽样精度的概念。
5.2 常用的抽样分布
1. χ2 分布
概
N=7
率
N为自由度
N=11
1 n 2
xix
2
~
2 n 1
i1
且,相互独立
T
/ n
1
~
tn
1
x
x
而T
/ n
in1
xi
x
2
n1
1/ n
n
xi
x
2
i 1
n1
x ~ tn 1
s/ n
x 1/ n x
s s/ n
5. 样本比例数的抽样分布
• 总体中具有某种特征的个体数占总体单位总数 的比例称作总体比例,记作P。
2
如果X1
,
X
2
,,
X
为相互独立的标准
n
正态分布的随机变量,则 2 X i 2
称为具有n个自由度的 2 分布,记作
2 n。密度函数为
1
x e f
x
2
n
2 2
n 1 x
2
2
0
x0 x0
2. t分布
概率密度 标准正态分布
t-分布
0
若连续型随机变量X和Y独立,X ~ N (0,1),
概率密度
ξ服从第一自由度为n1,第二自由
x
度为n2的F分布,简记为F
n1
,
n
。
2
f
x
n1
2
n
2
n1
2
n2
2
n1 n2
n1
2
x
n1
2
1
1
n1 n2
n n
1 2
2 x
,
x
0
0
x0
4. 正态分布的有关性质
设 x1,, xn 相互独立,xi 服从
正态分布N , 2 ,则它们
i
i
的线性函数
➢ 总体某一方面数量特征(称为总体的一个指标) 的数值虽然是客观存在的确定的常数,但又是 未知的,因此也称为总体参数(parameter)。
• 比如:职工总体可以从不同的方面进行认识, 总平均工资,工资的总标准差,不同学历层次 的工资水平及其差异程度,所占的比例,工资 总量等。
• 总体的数量特征是对个体的数量特征或属性特 征进行计数、加总或运算的结果。如总量、平 均量、比例数、方差或标准差等是常用的总体 参数。