统计学第六版贾俊平
统计学第六版贾俊平第13章
人均GDP等时间序列
时间序列的分类
时间序列
平稳序列
非平稳序列
有趋势序列 复合型序列
时间序列的分类
1.平稳序列(stationary series) 基本上不存在趋势的序列,各观察值基本上在某个固定的 水平上波动或虽有波动,但并不存在某种规律,而其波动可 以看成是随机的. 2.非平稳序列 (non-stationary series) 包含趋势、季节性或周期性的序列,分为有趋势的序列, 或有趋势、季节性和周期性的复合型序列.
Y0
1634
2005年和2006年的人均GDP的预测为
Yˆ2005 2004年数值 (1 年平均增长率) 10561 (114.26%) 12067.0(元)
Yˆ2006 2004年数值 (1 年平均增长率)2
10561 (114.26%)2 13787.8(元)
图13-8 啤酒销售量的年度折叠时间序列图
13.3.2 选择预测方法
确定时间序列的成分,即确定时间序列的类型后,则可选择 适当的预测方法.时间序列预测是按过去一段时间的变动规律 来估计今后的变动,也就是根据过去一段时间的变动规律对今 后作预测.
由于不含趋势和季节成分的时间序列, 即平稳时间序列只 包随机成分, 则通过平滑就可以消除随机波动. 因而, 这类预测 方法称为平滑预测法. 对于只含趋势成分的时间序列,可以采用 趋势预测法. 而对于既有趋势又有季节成分的时间序列,则采用 季节性预测法.
第13章 时间序列分析和预测
13.1 时间序列及其分解 13.2 时间序列的描述性分析 13.3 时间序列预测的程序 13.4 平稳序列的预测 13.5 趋势型序列的预测 13.6 复合型序列的分解预测
统计学第六版贾俊平第1章无水印
本章小节
1. 统计学与统计规律 2. 统计的应用领域 3. 统计数据的类型 4. 统计中的几个基本概念
Copyright 1994-2000 Encyclopaedia Britannica, Inc.
(不列颠百科全书)
统计研究的过程
收集数据 (取得数据)
实际问题
解释数据 (结果说明)
整理数据
(处理数据 )
分析数据
(研究数据 )
统计规律
(一些例子)
1. 正常条件下新生婴儿的性别比为107:100 2. 投掷一枚均匀的硬币,出现正面和反面的频
1. 观测的数据(observational data)
通过调查或观测而收集到的数据 在没有对事物人为控制的条件下而得到的 有关社会经济现象的统计数据几乎都是观测数据
2. 试验的数据(experimental data)
在试验中控制试验对象而收集到的数据 比如,对一种新药疗效的试验,对一种新的农作物
archaeology (考古学)
auditing (审计学)
crystallography (晶体学)
demography (人口统计学)
dentistry (牙医学)
ecology (生态学)
econometrics (经济计量学)
education (教育学)
election forecasting and projection (选举预测和策划)
统计的应用领域
hydrology (水文学)
Industry (工业)
linguistics (语言学)
literature (文学)
manpower planning (劳动力计划)
management science (管理科学)
统计学 贾俊平 第六版
《统计学(第六版)》是2015年1月中国人民大学出版社出版的图书,作者是贾俊平、何晓群、金勇进。
中文名统计学(第六版)作者贾俊平、何晓群、金勇进出版社中国人民大学出版社出版时间2015年1月定价39.9 元开本16 开装帧平装ISBN 9787300203096。
第六版是在第五版的基础上修改而成的。
在广泛吸取读者意见的基础上,对第五版中的部分内容进行了修订。
第六版在结构上与第五版基本相同,但对部分章节进行了重新编写和修订。
其中,第13章进行了重新编写,更新了全部数据,并将季节型序列的预测一节合并到复合型序列的分解预测中。
(完整版)贾俊平统计学[第六版]思考题答案解析.docx
第一章:1、什么是统计学?统计学是一门收集、分析、表述、解释数据的科学和艺术。
2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。
推断统计:研究的是如何利用样本数据来推断总体特征。
3、统计学据可以分成哪几种类型,个有什么特点?按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。
分类数据:只能归于某一类别的,非数字型数据。
顺序数据:只能归于某一有序类别的,非数字型数据。
数值型数据:按数字尺度测量的观察值,结果表现为数值。
按收集方法不同。
分为:观测数据、和实验数据观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域实验数据:在试验中收集到的数据;控制条件;自然科学领域。
按时间不同,分为:截面数据、时间序列数据截面数据:在相同或近似相同的时间点上收集的数据。
时间序列数据:在不同时间收集的数据。
4、举例说明总体、样本、参数、统计量、变量这几个概念。
总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。
参数:用来描述总体特征的概括性数字度量。
(平均数、标准差、比例等)统计量:用来描述样本特征的概括性数字度量。
(平均数、标准差、比例等)变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。
(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
)5、变量可以分为哪几类?分类变量:说明事物类别;取值是分类数据。
顺序变量:说明事物有序类别;取值是顺序数据数值型变量:说明事物数字特征;取值是数值型数据。
变量也可以分为:随机变量和非随机变量;经验变量和理论变量6、举例说明离散型变量和连续型变量。
统计学第六版贾俊平
精品教材
统计学
拟合优度检验
(例题分析)
H0: 1= 2= 3= 4 H1: 1234 不全相等 = 0.1 df = (2-1)(4-1)= 3 临界值(s):
=0.1
0 3.0319 6.215 c2
9 - 27
统计量:
r
c2
c (fij eij)2 3.0319
i1 j1
eij
结论:
可以认为广告后各公司产品
0
5.99 8.18 c
市场占有率发生显著变化
9 - 29
精品教材
统计学
拟合优度检验
(例题分析—用P值检验)
第1步:将观察值输入一列,将期望值输入一列 第2步:选择“函数”选项 第3步:在函数分类中选“统计”,在函数名中选
“CHITEST”,点击“确定” 第4步:在对话框“Actual_range”输入观察数据区域
的百分比,称为百分比分布
行百分比:行的每一个观察频数除以相应的行 合计数(fij / ri)
列百分比:列的每一个观察频数除以相应的列 合计数( fij / cj )
总百分比:每一个观察值除以观察值的总个数( fij / n )
9 - 15
精品教材
统计学
百分比分布
(图示)
行百分比
列百分比
总百分比
0.3000
e
36 0.9730 3.0319
合计:3.0319
精品教材
统计学
拟合优度检验
9 - 24
精品教材
统计学
品质数据的假设检验
品质数据
比例检验
一个总体 两个以上总体
Z 检验 Z 检验 c 检验
统计学(第六版)贾俊平课后习题答案
第一章导论1.1.1(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。
1.3(1)总体是所有IT从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4(1)总体是所有在网上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在网上购物者的月平均花费。
(4)参数(5)推断统计方法。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。
使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手资料时,要注明数据来源。
2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试。
3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。
2024版统计学完整(贾俊平)人大课件ppt课件
统计学完整(贾俊平)人大课件ppt课件•引言•数据收集与整理•描述性统计分析目录•概率论基础•推断性统计分析•方差分析与回归分析•时间序列分析与预测•统计决策与风险管理目录•总结与展望01引言统计学是一门研究如何收集、整理、分析和解释数据的科学。
统计学的定义统计学的历史统计学的分支统计学的发展经历了古典统计学、近代统计学和现代统计学三个阶段。
统计学可以分为描述统计学和推断统计学两大分支。
030201统计学概述社会科学医学与健康工程与技术商业与经济统计学应用领域01020304在社会科学领域,统计学被广泛应用于调查研究、民意测验、市场分析等方面。
在医学和健康领域,统计学被用于临床试验、流行病学研究、健康风险评估等方面。
在工程和技术领域,统计学被用于质量控制、可靠性分析、信号处理等方面。
在商业和经济领域,统计学被用于市场分析、财务分析、经济预测等方面。
通过学习,学生应掌握统计学的基本概念和方法,包括数据收集、整理、描述和分析等方面的内容。
掌握统计学基本概念和方法具备数据处理和分析能力了解统计学的应用领域培养批判性思维学生应具备独立处理和分析数据的能力,能够运用适当的统计方法进行数据分析和解释。
学生应了解统计学的应用领域,能够运用所学知识解决实际问题。
学生应培养批判性思维,能够对统计结果进行合理的解释和评估。
学习目标与要求02数据收集与整理数据来源及类型数据来源包括原始数据和二手数据,原始数据是通过直接调查、实验或观察获得的数据;二手数据则是已经经过他人收集、整理和处理过的数据。
数据类型包括定性数据和定量数据,定性数据是描述性的、非数值的,如文字、图像等;定量数据则是可以用数值表示的,如年龄、收入等。
此外,还可以根据数据的测量尺度将其分为名义型数据、顺序型数据、间隔型数据和比率型数据。
调查法实验法观察法大数据收集数据收集方法通过问卷、访谈、电话调查等方式收集数据,可以获取大量的、详细的信息。
直接观察研究对象的行为、状态等,记录相关数据,适用于无法控制或干预的情况。
统计学第六版贾俊平第6章
统计学
第六版
2)分布
(图示)
选择容量为n 的 不同容量样本的抽样分布
n=1 n=4 n=10
总体
简单随机样本
计算样本方差S2
计算卡方值
n=20
2 = (n-1)S2/σ2
计算出所有的
2
2值
6 - 31
统计学
第六版
6.3 样本统计量的抽样分布
(两个总体参数推断时)
一. 两个样本均值之差的抽样分布 二. 两个样本比例之差的抽样分布 三. 两个样本方差比的抽样分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 17
x
X
统计学
第六版
中心极限定理
(central limit theorem)
X
的分 布趋 于正 态分 布的 过程
6 - 18
统计学
第六版
抽样分布与总体分布的关系
总体分布
(一个总体参数推断时)
一. 样本均值的抽样分布 二. 样本比例的抽样分布 三. 抽样方差的抽样分布
6-9
统计学
第六版
样本均值的抽样分布
6 - 10
统计学
第六版
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概 率分布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
6 - 11
3. 两个样本方差比的抽样分布,服从分子自由度 为(n1-1),分母自由度为(n2-1) F分布,即
S12 ~ F ( n1 1, n 2 1) 2 S1
统计学(第六版)贾俊平 公式整理
E ( X ) x1 p1 x 2 p 2 x n p n xi pi
2 D( X ) [ xi E ( X )]2 pi
PX x C p x q n x E ( X ) np E ( X ) npq
x n i 1
P( X )
n n
( z 2 ) 2 2 E2 ( z 2 ) 2 (1 ) E2
假设检验
名称 总体均值检验的统计量(正态总体, 已知) z 总体均值检验的统计量( 未知,大样本) 公式
x 0
z
/ n x 0
s/ n x 0 p 0
总体均值检验的统计量(正态总体, 未知, t 小样本) s/ n 总体比例检验的统计量
z
0 (1 0 )
n (n 1) s 2
总体方差检验的统计量 两个总体均值之差检验的统计量( 1 , 2 已 知)
2 2
2
z
02
12
n1
2 2
( x1 x2 ) ( 1 2 ) n2
两个总体均值之差检验的统计量( 1 , 2 未 知但相等,小样本)
x e
x!
E ( X ) xf ( x)d ( x) D ( X ) [ x E ( X ) ]2 f ( x ) d ( x ) 2
2 ( x )2 1 f ( x) e 2 2 1
标准正态分布的概率密度函数
1 x2 ( x) e 2
n 个两两互斥事件 A1 , A2 ,… An 之和
的概率 事件 A 与其逆事件 A 之和的概率 两个任意事件之和的概率 概率的乘法公式 两个独立事件之积的概率
统计学第六版贾俊平12章多元线性回归
二元回归方程的直观解释
二元线性回归模型
回归面
y
y b0 b1x1 b2x2
(观察到的y)
} b0
i
x2
(x1,x2)
x1
E( y) b0 b1x1 b2x2
估计的多元回归方程
估计的多元回归的方程
(estimated multiple regression equation)
12.1 多元线性回归模型
一 多元回归模型与回归方程 二 估计的多元回归方程 三 参数的最小二乘估计
多元回归模型与回归方程
多元回归模型
(multiple regression model)
1. 一个因变量与两个及两个以上自变量的回归
2. 描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xp 和误差项 的方程,称为多元回归模型
2. 如果出现下列情况,暗示存在多重共线性
模型中各对自变量之间显著相关。 当模型的线性关系检验(F检验)显著时,几乎所有回
归系数的t检验却不显著 回归系数的正负号与其的相反。
Excel 输出结果的分析
多重共线性
(例题分析)
【例】判别各自变量之间是否存在多重共线性
贷款余额、应收贷款、贷款项目、固定资产投资额之间的相关矩阵
1. 用样本统计量 bˆ0 , bˆ1 , bˆ2 , , bˆ p 估计回归方 程中的 参数 b0 , b1 , b2 , , b p 时得到的方程
2. 由最小二乘法求得 3. 一般形式为
yˆ bˆ0 bˆ1x1 bˆ2x2 bˆpxp
▪ bˆ0 , bˆ1 , bˆ2 , , bˆ p是 b0 , b1 , b2 , , b p
统计学第六版贾俊平第7章无水印
1. 估计量:用于估计总体参数的随机变量
2. 如样本均值,样本比例、样本方差等
3. 例如: 样本均值就是总体均值 的一个估
计量
ˆ
4. 参数用 表示,估计量用 表示
5. 估计值:估计参数时计算出来的统计量的 详细值
6. 假如样本均值 计值
x =80,则80就是二点战估中计的的估
点估计与区间估计
参数估计的方法
P(1 P)
n 3. 总体比例 在1- 置信程度下的置信区间为
P z 2
(1 )
n
或
P
z
2
P(1- P) ( 未知时)
n
总体比例的区间估计
(例题分析)
【例】某城市想 要估计下岗职工 中女性所占的比 例,随机抽取了 100个下岗职工 ,其中65人为女 性职工。试以 95%的置信程度 估计该城市下岗 职工中女性比例 的置信区间
S1=5.8
x2 78
S2=57.2
两个总体均值之差的估计
(例题分析)
解: 两个总体均值之差在1-
为 (x1 x2 ) z 2
s12
s
2 2
3.
为是总体参数未在区间内的比例
4. 常用的置信程度值有 99%, 95%, 90%
5. 相应的 为,,
置信区间
(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称 为置信区间
2. 统计学家在某种程度上确信这个区间会包含真 正的总体参数,所以给它取名为置信区间
3. 用一个详细的样本所构造的区间是一个特定的 区间,我们无法知道这个样本所产生的区间是 否包含总体参数的真值
(例题分析)
【例】一家保险公司搜集到由36投保个人组成的随 机样本,得到每个投保人的年龄(周岁)数据如下表。 试建立投保人年龄90%的置信区间
贾俊平《统计学》考研真题(含复试)与典型习题详解(第6版)
目录分析
1.2课后习题详解
1.1复习笔记
1.3典型习题详解
2.2课后习题详解
2.1复习笔记
2.3典型习题详解
3.2课后习题详解
3.1复习笔记
3.3典型习题详解
4.2课后习题详解
4.1复习笔记
4.3典型习题详解
5.2课后习题详解
5.1复习笔记
5.3典型习题详解
6.2课后习题详解
6.1复习笔记
12.1复习笔记
12.3典型习题详解
13.2课后习题详解
13.1复习笔记
13.3典型习题详解
14.2课后习题详解
14.1复习笔记
14.3典型习题详解
作者介绍
谢谢观看
6.3典型习题详解
7.2课后习题详解
7.1复习笔记
7.3典型习题详解
8.2课后习题详解
8.1复习笔记
8.3典型习题详解
9.2课后习题详解
9.1复习笔记
9.3典型习题详解
10.2课后习题详解
10.1复习笔记
10.3典型习题详解
11.2课后习题详解
11.1复习笔记
11.3典型习题详解
12.2课后习题详解
精彩摘录
统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。 参数是用来描述总体特征的概括性数字度量 不论如何偏斜,中位数总是在众数与算术平均数之间。经验表明,在适度偏斜的情况下,众数与中位数的距 离约为中位数与算术平均数距离的2倍。 概率抽样最主要的优点是可以依据调查结果,计算估计量误差,从而得到对总体目标量进行推断的可靠程度。 从另一个方面讲,也可以按照要求的精确度,计算必要的样本单位数目。 统计推断的三个中心内容:抽样分布、参数估计和假设检验。 统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数 样本方差:样本数据个数减1后除离差平方和。其中样本数据个数减1,即n-1称为自由度 几何平均数主要用于计算比率的平均 控制抽样误差的主要方法是改变样本量,要求的抽样误差越小,所需要的样本量就越大。 概率抽样(随机抽样):指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
统计学第六版贾俊平第2章无水印ppt课件
3. 需要包含所有低阶段抽样单位的抽样框;同时由于 实行了再抽样,使调查单位在更广泛的范围内展开
4. 在大规模的抽样调查中,经常被采用的方法
非概率抽样
(non-probability sampling)
1. 相对于概率抽样而言 2. 抽取样本时不是依据随机原则,而是根据研
如交通流量的调查
各调查方法的比较
调查时间 调查费用 问卷难度 有形辅助物的使用 调查过程控制 调查员作用的发挥 回答率
自填式
慢 低 要求容易 中等利用 简单 无法发挥 最低
面访式
中等 高 可以复杂 充分利用 复杂 充分发挥 较高
电话式
快捷 低 要求容易 无法利用 容易 一般发挥 一般
2.3 实验数据
均性差异 3. 影响抽样误差的大小的因素
样本量的大小 总体的变异性
误差的控制
1. 抽样误差可计算和控制 2. 非抽样误差的控制
调查员的挑选 调查员的培训 督导员的调查专业水平 调查过程控制
调查结果进行检验、评估 现场调查人员进行奖惩的制度
统计数据的质量要求
1. 精 度:最低的抽样误差或随机误差 2. 准 确 性:最小的非抽样误差或偏差 3. 关 联 性:满足用户决策、管理和研究的需要 4. 及 时 性:在最短的时间里取得并公布数据 5. 一 致 性:保持时间序列的可比性 6. 最低成本:以最经济的方式取得数据
面访式问卷调查
1. 调查员与被调查者面对面提问、被调查 者回答的一种调查方式
2. 优点
可提高调查的回答率 可提高调查数据的质量 能调节数据搜集所花费的时间
3. 弱点
调查的成本较高 调查过程的质量控制有一定难度
统计学第六版贾俊平第3章高等教学
数据分组
3 - 32
精品教材
统计学
分组方法
分组方法
单变量值分组
3 - 33
组距分组 等距分组 异距分组
精品教材
统计学
单变量值分组
(要点)
1. 将一个变量值作为一组
2. 适合于离散变量
☺
☺ 3. 适合于变量值较少的情况
☺
☺
3 - 34
精品教材
统计学
组距分组
(要点)
1. 将变量值的一个区间作为一组 2. 适合于连续变量
甲城市
回答类别
户数 百分比 (户) (%)
向上累积
户数 百分比 (户) (%)
向下累积
户数 百分比 (户) (%)
非常不满意 24
8
24
8.0 300 100.0
不满意
108 36 132 44.0 276 92
一般
93 31 225 75.0 168 56
满意
45
15 270 90.0 75
25
非常满意 30
3 - 43
精品教材
统计学
数值型数据的图示
分组数据—直方图和折线图
3 - 44
Excel
精品教材
统计学
分组数据—直方图
(histogram)
1. 用矩形的宽度和高度来表示频数分布的图
形,实际上是用矩形的面积来表示各组的
频数分布
2. 在直角坐标中,用横轴表示数据分组,纵 轴表示频数或频率,各组与相应的频数就 形成了一个矩形,即直方图
(使用开口组)
3 - 42
精品教材
统计学
组距分组与不等距分组
(在表现频数分布上的差异)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6 -3
统计学(第6版)
6. 1 统计量
6. 1 统计量
6.1.1 统计量的概念
统计量是样本的函数,它不依赖于任何未知参 数; 根据不同的研究目的,可构造不同的统计量; 利用构造的统计量,用样本性质推断总体的性 质; 统计量是统计推断的基础,在统计学中占据着 非常重要的地位。
6 -5
统计学(第6版)
6 - 17
n=1
n=4 n=10
当自由度增加时, 卡方分布的概率 密度曲线趋于对
n=20
称。当n趋于无
穷大时,卡方分
布的极限分布就
2 是正态分布。
不同容量样本的卡方分布
统计学(第6版)
6.3 由正态分布得到的几个重要分布
2分 布 的 性 质 1 . 数学期望为:2E)( n 2 . 方差为:D2() 2 n 3 .2分布的可加性,即12若~ 2( n 1 ),22 ~ 2( n 2 ) , 且独立,则
(1)抽检的100个元件中有3个不合格; (2)抽检的100个元件中前3个不合格;
100
在产品检验中,二项分布的统计量T X i是不合格
品率p的充分统计量。
i 1
6 - 11
统计学(第6版)
6. 2 关于分布的几个概念
6. 2 关于分布的几个概念
6.2.1 抽样分布
近代统计学的创始人之一,英国统计学家费希尔曾把 抽样分布、参数估计和假设检验看作统计推断的三个 中心内容。
6.2.2 渐近分布
当n无限增大时,统计量T(X1,X2,…Xn)的极限 分布常称为统计量的渐近分布; 第4节中的中心极限定理揭示的就是样本均值的 渐近分布; 不少重要的统计方法就是基于渐近分布提出的。
6 - 14
统计学(第6版)
6. 2 关于分布的几个概念
6.2.3 随机模拟获得的近似分布
1.背景
第6章 统计量及其抽样分布
第6章 统计量及其抽样分布
本章将较系统地介绍统计量的概念,以正态 分布为基础导出常用的几个重要分布,并给出 一些常用统计量的抽样分布。
6 -2
统计学(第6版)
第6章 统计量及其抽样分布
6.1 统计量 6.2 关于分布的几个概念 6.3 由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理 6.5 样本比例的分布 6.6 两个样本均值之差的分布 6.7 关于样本方差的分布
6. 1 统计量
❖定义6.1 设X1,X2,…Xn是从总体中抽取的容 量为n的一个样本,如果由此样本构造一个函数 T(X1,X2,…Xn),不依赖于任何未知参数,则称 函数 T(X1,X2,…Xn)是一个统计量。
❖对于T(X1,X2,…Xn), 也称样本统计量。当获得 样本的一组具体观测值x1,x2,…xn时,代入T, 就是一个具体的统计量值T(x1,x2,…xn) 。
12 22 ~ 2( n 1n 2 )
6 - 18
统计学(第6版)
6.3 由正态分布得到的几个重要分布
6. 3. 2 t分布
定义6. 4 设随机变量X~N(0,1), Y~ 2 (n),且X与Y独立,则
t X Y /n
(6. 2)
其分布称为t分布,记为t(n), 其中n为自由度。
6 - 19
统计学(第6版)
6.3 由正态分布得到的几个重要分布
t分布的密度函数是 一个偶函数,因此 图形是关于t 0对 称的.
当n充分大时, 其图形 类似于标准正态变量 概率密度的图形.
所以当n足 ,t够 分大 布时 近似 1于 )分; N布 (0,
但对于n 较 t,分 小布 的与分 N布 (0相 ,1差 ) 很
6 - 20
6 -9
R(n) = X(n)- X(1)称为样本极差 中位数、分位数、四分位数都是次序统计量。
统计学(第6版)
6. 1 统计量
6.1.4 充分统计量 在统计学中,假如一个统计量能把含在样本中有关总体的 信息一点都不损失地提取出来,则对以后的统计推断质量 具有重要意义。 在统计量加工过程中一点信息都不损失的统计量通常称为 充分统计量。 因子分解定理是判别充分统计量的方法,由奈曼和哈尔姆 斯在20世纪40年代提出的。
n i1
Xi
Sx2n11in1(Xi X)2
Y
1 m
m
Yi
i1
Sy2 m11im 1(Yi Y)2
Sxy2(n1)nS x2 m( m21)Sy2
6 - 23
(XY)(12) mn ~t(nm 2)(6. 4)
Sxy
m n
统计学(第6版)
6.3 由正态分布得到的几个重要分布
证明:
X
1 n
【例】设一个总体,含有4个元素(个体),即总体 单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、 X4=4 。总体的均值、方差及分布如下:
总体的均值和方差:
N
Xi
i1
2.5
N
N
(Xi )2
2 i1
1.25
N
6 - 28
统计学(第6版)
6.4 样本均值的分布与中心极限定理
现从总体中抽取n=2的简单随机样本,在重复 抽样条件下,共有42=16个样本。所有样本的结果 如下表
由度为m和n的 2 分布
Y~2(m ) Z~2(n )
则称
X
Y/m nY Z / nm Z
(6. 5)
X服从第一自由度为m,第二自由度为n的F分布,记为 F(m,n),简记为X~F(m,n) 。
6 - 25
统计学(第6版)
6.3 由正态分布得到的几个重要分布
F分布的性质:
1.若X ~ F(m, n)分布,则数学期望 和方差为
~ χ2(n1)
Xμ
σ/ n
n(Xμ)~ t(n1)
(n1)S2 σ2
1 n1
s
统计学(第6版)
6.3 由正态分布得到的几个重要分布
2.设X和Y是两个相互独立的总体,X~N(μ1,σ2), Y~N(μ2,σ2),X1,X2,…,Xn是来自X的样本,Y1,
Y2, …,Ym是来自Y的样本,记
X
1 n
n
X i,Y
i1
1 m
m
Yi
i1
E(X Y ) 1 2
2 2 D (X Y ) D (X ) D (Y )
nm
X
Y
~
N
(1
2,
2 n
2) m
( X Y ) ( 1 2 ) ~ N (0, 1) 1 1 nm
S x 2
1 n 1
n
(X i
i1
X )2,
S y2
1 m 1
❖所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
❖1,1
❖1,2
❖1,3
❖1,4
2
❖2,1
❖2,2
❖2,3
❖2,4
3
❖3,1
❖3,2
❖3,3
❖3,4
4
❖4,1
❖4,2
❖4,3
❖4,4
6 - 29
统计学(第6版)
6.4 样本均值的分布与中心极限定理
计算出各样本的均值,如下表。
6 - 10
统计学(第6版)
6. 1 统计量
充分统计量(算例)
【例6.2】某电子元件厂欲了解其产品的不合格率p,质 检员抽检了100个电子元件,检查结果是,除了前3个是 不合格品(记为X1=1, X2=1, X3=1)外,其他都是合格 品(记为Xi=0, i=4,5,…,100)。当企业领导问及抽检结 果时,质检员给出如下回答:
6 - 15
统计学(第6版)
6.3 由正态分布得到的几个 重要分布
6.3 由正态分布得到的几个重要分布
6. 3. 1 2 分布
定义6.3 设随机变量X1,X2,…Xn相互独立, 且Xi (i=1,2,…,n)
n
服从标准正态分布N(0,1),则它们的平方和
X
2 i
服从自由度
为n的 2 分布。
i1
6. 1 统计量
6. 1. 3 次序统计量
定义6.2 设(X1,X2,…Xn)是从总体X中抽取的一个样 本,X(i)称为第i个次序统计量,它是样本(X1,X2,…Xn) 满足如下条件的函数: 每当样本得到一组观测值x1, x2,…,xn时,其由小到大的排序x(1)≤ x(2)≤ …≤x(i) ≤ … ≤ x(n) 中,第i个值x(i)就作为次序统计量X(i)的观测值, X(1), X(2) …X(n)称为次序统计量。其中X(1)和X(n)分别 为最小和最大次序统计量 。
1)S x 2 2
(m
1)S y 2 2
nm
S xy
mn
(n m 2)
( X Y ) ( 1 2 ) mn ~ t(n m 2)
S xy
mn
6 - 24
(XY)(12) mn ~t(nm 2)
Sxy
m n
统计学(第6版)
6.3 由正态分布得到的几个重要分布
6. 3. 3 F分布 定义6.5 设随机变量Y与Z相互独立,且Y与Z分别服从自
2.思想
❖ 设有一个统计量T(X1,X2,…Xn),其中n为样本容量, 求统计量T的分布函数F(n)(t);
❖ 可连续作一系列类似试验,每次试验都是从总体中抽 取容量为n的样本,然后计算其统计量的值;
❖ 当这种试验进行了N次时,就得到统计量T的N个观测 值:T1,T2,…,TN;
❖ 根据这N个观测值可做其经验分布函数FN(n)(t)的一个 很好的近似。
6 -6
统计学(第6版)