统计学第六版贾俊平

合集下载

统计学 贾俊平 第六版

统计学 贾俊平 第六版

《统计学(第六版)》是2015年1月中国人民大学出版社出版的图书,作者是贾俊平、何晓群、金勇进。

中文名统计学(第六版)作者贾俊平、何晓群、金勇进出版社中国人民大学出版社出版时间2015年1月定价39.9 元开本16 开装帧平装ISBN 9787300203096。

第六版是在第五版的基础上修改而成的。

在广泛吸取读者意见的基础上,对第五版中的部分内容进行了修订。

第六版在结构上与第五版基本相同,但对部分章节进行了重新编写和修订。

其中,第13章进行了重新编写,更新了全部数据,并将季节型序列的预测一节合并到复合型序列的分解预测中。

(完整版)贾俊平统计学[第六版]思考题答案解析.docx

(完整版)贾俊平统计学[第六版]思考题答案解析.docx

第一章:1、什么是统计学?统计学是一门收集、分析、表述、解释数据的科学和艺术。

2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。

推断统计:研究的是如何利用样本数据来推断总体特征。

3、统计学据可以分成哪几种类型,个有什么特点?按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。

分类数据:只能归于某一类别的,非数字型数据。

顺序数据:只能归于某一有序类别的,非数字型数据。

数值型数据:按数字尺度测量的观察值,结果表现为数值。

按收集方法不同。

分为:观测数据、和实验数据观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域实验数据:在试验中收集到的数据;控制条件;自然科学领域。

按时间不同,分为:截面数据、时间序列数据截面数据:在相同或近似相同的时间点上收集的数据。

时间序列数据:在不同时间收集的数据。

4、举例说明总体、样本、参数、统计量、变量这几个概念。

总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。

参数:用来描述总体特征的概括性数字度量。

(平均数、标准差、比例等)统计量:用来描述样本特征的概括性数字度量。

(平均数、标准差、比例等)变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。

(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

)5、变量可以分为哪几类?分类变量:说明事物类别;取值是分类数据。

顺序变量:说明事物有序类别;取值是顺序数据数值型变量:说明事物数字特征;取值是数值型数据。

变量也可以分为:随机变量和非随机变量;经验变量和理论变量6、举例说明离散型变量和连续型变量。

统计学第六版贾俊平

统计学第六版贾俊平
9 - 26
精品教材
统计学
拟合优度检验
(例题分析)
H0: 1= 2= 3= 4 H1: 1234 不全相等 = 0.1 df = (2-1)(4-1)= 3 临界值(s):
=0.1
0 3.0319 6.215 c2
9 - 27
统计量:
r
c2
c (fij eij)2 3.0319
i1 j1
eij
结论:
可以认为广告后各公司产品
0
5.99 8.18 c
市场占有率发生显著变化
9 - 29
精品教材
统计学
拟合优度检验
(例题分析—用P值检验)
第1步:将观察值输入一列,将期望值输入一列 第2步:选择“函数”选项 第3步:在函数分类中选“统计”,在函数名中选
“CHITEST”,点击“确定” 第4步:在对话框“Actual_range”输入观察数据区域
的百分比,称为百分比分布
行百分比:行的每一个观察频数除以相应的行 合计数(fij / ri)
列百分比:列的每一个观察频数除以相应的列 合计数( fij / cj )
总百分比:每一个观察值除以观察值的总个数( fij / n )
9 - 15
精品教材
统计学
百分比分布
(图示)
行百分比
列百分比
总百分比
0.3000
e
36 0.9730 3.0319
合计:3.0319
精品教材
统计学
拟合优度检验
9 - 24
精品教材
统计学
品质数据的假设检验
品质数据
比例检验
一个总体 两个以上总体
Z 检验 Z 检验 c 检验

统计学第六版贾俊平 无水印

统计学第六版贾俊平 无水印
Johann Gregor Mendel (孟德尔 )
率各为1/2;投掷一枚骰子出现1~6点的频率 各为1/6 3. 农作物的产量与施肥量之间存在相关关系
统计方法
统计方法
描述统计
推断统计
参数估计
假设检验
描述统计
(descriptive statistics)
1. 内容

? 搜集数据
50
? 整理数据
? 展示数据
25? 描述性分析2. 目的0? 描述数据特征
什么是统计学 ?
? 收集、分析、表述和解释数据的科学
1. 数据搜集:取得数据 2. 数据分析:分析数据 3. 数据表述:图表展示数据 4. 数据解释:结果的说明
statistics 的定义 (不列颠百科全书)
statistics : the science of collecting, analyzing, presenting, and interpreting data.
election forecasting and projection (选举预测和策划 )
engineering (工程)
epidemiology (流行病学 )
finance (金融)
fisheries research (水产渔业研究 )
gambling (赌博)
genetics (遗传学)
geography (地理学)
? 找出数据的基本规律
Q1 Q2 Q3 Q4
x = 30 s2 = 105
推断统计
(inferential statistics)
1. 内容
总体
? 参数估计
? 假设检验
2. 目的
? 对总体特征作出

统计学第六版贾俊平第6章

统计学第六版贾俊平第6章
6 - 30
统计学
第六版
2)分布
(图示)
选择容量为n 的 不同容量样本的抽样分布
n=1 n=4 n=10
总体
简单随机样本


计算样本方差S2
计算卡方值
n=20
2 = (n-1)S2/σ2
计算出所有的
2
2值
6 - 31
统计学
第六版
6.3 样本统计量的抽样分布
(两个总体参数推断时)
一. 两个样本均值之差的抽样分布 二. 两个样本比例之差的抽样分布 三. 两个样本方差比的抽样分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 17
x
X
统计学
第六版
中心极限定理
(central limit theorem)
X
的分 布趋 于正 态分 布的 过程
6 - 18
统计学
第六版
抽样分布与总体分布的关系
总体分布
(一个总体参数推断时)
一. 样本均值的抽样分布 二. 样本比例的抽样分布 三. 抽样方差的抽样分布
6-9
统计学
第六版
样本均值的抽样分布
6 - 10
统计学
第六版
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概 率分布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
6 - 11
3. 两个样本方差比的抽样分布,服从分子自由度 为(n1-1),分母自由度为(n2-1) F分布,即
S12 ~ F ( n1 1, n 2 1) 2 S1

统计学(第六版)贾俊平 公式整理

统计学(第六版)贾俊平 公式整理

E ( X ) x1 p1 x 2 p 2 x n p n xi pi
2 D( X ) [ xi E ( X )]2 pi
PX x C p x q n x E ( X ) np E ( X ) npq
x n i 1
P( X )
n n
( z 2 ) 2 2 E2 ( z 2 ) 2 (1 ) E2
假设检验
名称 总体均值检验的统计量(正态总体, 已知) z 总体均值检验的统计量( 未知,大样本) 公式
x 0
z
/ n x 0
s/ n x 0 p 0
总体均值检验的统计量(正态总体, 未知, t 小样本) s/ n 总体比例检验的统计量
z
0 (1 0 )
n (n 1) s 2
总体方差检验的统计量 两个总体均值之差检验的统计量( 1 , 2 已 知)
2 2
2
z
02
12
n1
2 2
( x1 x2 ) ( 1 2 ) n2
两个总体均值之差检验的统计量( 1 , 2 未 知但相等,小样本)
x e
x!

E ( X ) xf ( x)d ( x) D ( X ) [ x E ( X ) ]2 f ( x ) d ( x ) 2
2 ( x )2 1 f ( x) e 2 2 1
标准正态分布的概率密度函数
1 x2 ( x) e 2
n 个两两互斥事件 A1 , A2 ,… An 之和
的概率 事件 A 与其逆事件 A 之和的概率 两个任意事件之和的概率 概率的乘法公式 两个独立事件之积的概率

统计学(第六版)贾俊平——_课后习题答案

统计学(第六版)贾俊平——_课后习题答案

第一章导论1.1.1(1)数值型变量。

(2)分类变量。

(3)离散型变量。

(4)顺序变量。

(5)分类变量。

1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。

(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。

1.3(1)总体是所有IT从业者的集合。

(2)数值型变量。

(3)分类变量。

(4)截面数据。

1.4(1)总体是所有在网上购物的消费者的集合。

(2)分类变量。

(3)参数是所有在网上购物者的月平均花费。

(4)参数(5)推断统计方法。

第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。

使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。

在引用二手资料时,要注明数据来源。

2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。

概率抽样是指抽样时按一定概率以随机原则抽取样本。

每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。

如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。

它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。

非概率抽样也适合市场调查中的概念测试。

3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。

统计学第六版贾俊平第5章.

统计学第六版贾俊平第5章.
5 - 17
精品教材
统计学
互斥事件及其概率
(例题分析)
解:由于每一枚硬币出现正面或出现反面的概率都
是1/2,当抛掷的次数逐渐增大时,上面的4个简
单事件中每一事件发生的相对频数(概率)将近似
等好于有1一/4枚。硬因币为朝仅上当的H1事T2件或发T1生H2,发而生事时件,H才1会T2
恰 或
T1H2又为互斥事件,两个事件中一个事件发生或
精品教材
统计学
事件的概率
5 - 10
精品教材
统计学
事件的概率
(probability)
1. 事件A的概率是一个介于0和1之间的一个值, 用以度量试验完成时事件A发生的可能性大小, 记为P(A)
2. 当试验的次数很多时,概率P(A)可以由所观察 到的事件A发生次数(频数)的比例来逼近
在相同条件下,重复进行n次试验,事件A 发生了m次,则事件A发生的概率可以写为
5 - 30
精品教材
统计学
条件概率
(例题分析)
解:设 A = 取出的一个为正品 B = 取出的一个为供应商甲供应的配件
(1) P( A) 186 0.93 (2)P(B) 90 0.45
200
200
(3) P( AB)
84 200
0.42
(4)P(A B) P(AB)
P(B)
统计学
条件概率
(conditional probability)
在事件B已经发生的条件下事件A发生的概率,称 为已知事件B时事件A的条件概率,记为P(A|B)

P(A|B)
=
P(AB) P(B)
事件A 事件B
一旦事件B发生

统计学第六版贾俊平12章多元线性回归

统计学第六版贾俊平12章多元线性回归

二元回归方程的直观解释
二元线性回归模型
回归面
y
y b0 b1x1 b2x2
(观察到的y)
} b0
i
x2
(x1,x2)
x1
E( y) b0 b1x1 b2x2
估计的多元回归方程
估计的多元回归的方程
(estimated multiple regression equation)
12.1 多元线性回归模型
一 多元回归模型与回归方程 二 估计的多元回归方程 三 参数的最小二乘估计
多元回归模型与回归方程
多元回归模型
(multiple regression model)
1. 一个因变量与两个及两个以上自变量的回归
2. 描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xp 和误差项 的方程,称为多元回归模型
2. 如果出现下列情况,暗示存在多重共线性
模型中各对自变量之间显著相关。 当模型的线性关系检验(F检验)显著时,几乎所有回
归系数的t检验却不显著 回归系数的正负号与其的相反。
Excel 输出结果的分析
多重共线性
(例题分析)
【例】判别各自变量之间是否存在多重共线性
贷款余额、应收贷款、贷款项目、固定资产投资额之间的相关矩阵
1. 用样本统计量 bˆ0 , bˆ1 , bˆ2 , , bˆ p 估计回归方 程中的 参数 b0 , b1 , b2 , , b p 时得到的方程
2. 由最小二乘法求得 3. 一般形式为
yˆ bˆ0 bˆ1x1 bˆ2x2 bˆpxp
▪ bˆ0 , bˆ1 , bˆ2 , , bˆ p是 b0 , b1 , b2 , , b p

统计学第六版贾俊平第7章无水印

统计学第六版贾俊平第7章无水印

1. 估计量:用于估计总体参数的随机变量
2. 如样本均值,样本比例、样本方差等
3. 例如: 样本均值就是总体均值 的一个估
计量
ˆ
4. 参数用 表示,估计量用 表示
5. 估计值:估计参数时计算出来的统计量的 详细值
6. 假如样本均值 计值
x =80,则80就是二点战估中计的的估
点估计与区间估计
参数估计的方法
P(1 P)
n 3. 总体比例 在1- 置信程度下的置信区间为
P z 2
(1 )
n

P
z
2
P(1- P) ( 未知时)
n
总体比例的区间估计
(例题分析)
【例】某城市想 要估计下岗职工 中女性所占的比 例,随机抽取了 100个下岗职工 ,其中65人为女 性职工。试以 95%的置信程度 估计该城市下岗 职工中女性比例 的置信区间
S1=5.8
x2 78
S2=57.2
两个总体均值之差的估计
(例题分析)
解: 两个总体均值之差在1-
为 (x1 x2 ) z 2
s12
s
2 2
3.
为是总体参数未在区间内的比例
4. 常用的置信程度值有 99%, 95%, 90%
5. 相应的 为,,
置信区间
(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称 为置信区间
2. 统计学家在某种程度上确信这个区间会包含真 正的总体参数,所以给它取名为置信区间
3. 用一个详细的样本所构造的区间是一个特定的 区间,我们无法知道这个样本所产生的区间是 否包含总体参数的真值
(例题分析)
【例】一家保险公司搜集到由36投保个人组成的随 机样本,得到每个投保人的年龄(周岁)数据如下表。 试建立投保人年龄90%的置信区间

统计学第六版贾俊平第2章无水印ppt课件

统计学第六版贾俊平第2章无水印ppt课件
2. 具有整群抽样的优点,保证样本相对集中,节约调 查费用
3. 需要包含所有低阶段抽样单位的抽样框;同时由于 实行了再抽样,使调查单位在更广泛的范围内展开
4. 在大规模的抽样调查中,经常被采用的方法
非概率抽样
(non-probability sampling)
1. 相对于概率抽样而言 2. 抽取样本时不是依据随机原则,而是根据研
如交通流量的调查
各调查方法的比较
调查时间 调查费用 问卷难度 有形辅助物的使用 调查过程控制 调查员作用的发挥 回答率
自填式
慢 低 要求容易 中等利用 简单 无法发挥 最低
面访式
中等 高 可以复杂 充分利用 复杂 充分发挥 较高
电话式
快捷 低 要求容易 无法利用 容易 一般发挥 一般
2.3 实验数据
均性差异 3. 影响抽样误差的大小的因素
样本量的大小 总体的变异性
误差的控制
1. 抽样误差可计算和控制 2. 非抽样误差的控制
调查员的挑选 调查员的培训 督导员的调查专业水平 调查过程控制
调查结果进行检验、评估 现场调查人员进行奖惩的制度
统计数据的质量要求
1. 精 度:最低的抽样误差或随机误差 2. 准 确 性:最小的非抽样误差或偏差 3. 关 联 性:满足用户决策、管理和研究的需要 4. 及 时 性:在最短的时间里取得并公布数据 5. 一 致 性:保持时间序列的可比性 6. 最低成本:以最经济的方式取得数据
面访式问卷调查
1. 调查员与被调查者面对面提问、被调查 者回答的一种调查方式
2. 优点
可提高调查的回答率 可提高调查数据的质量 能调节数据搜集所花费的时间
3. 弱点
调查的成本较高 调查过程的质量控制有一定难度

统计学第六版贾俊平第2章

统计学第六版贾俊平第2章

精品教材
统计学
方便抽样
1. 调查过程中由调查员依据方便的原则,自行 确定入抽样本的单位
调查员在街头、公园、商店等公共场所进行拦 截调查
厂家在出售产品柜台前对路过顾客进行的调查
2. 优点:容易实施,调查的成本低
3. 缺点:样本单位的确定带有随意性,样本无 法代表有明确定义的总体,调查结果不宜推 断总体
3. 弱点
调查的成本较高 调查过程的质量控制有一定难度
2 - 32
精品教材
统计学
电话式问卷调查
1. 通过电话向被调查者实施调查
2. 特点
速度快,能在短时间内完成调 适合于样本单位十分分散的情况
您好! 我是××调 查公司的调
查员…
3. 局限
如果被调查者没有电话,调查将无法实施
访问的时间不能太长
2 - 14
精品教材
简单随机抽样
统计学 (simple random sampling)
1. 从总体N个单位中随机地抽取n个单位作为样本 ,每个单位入抽样本的概率是相等的
2. 最基本的抽样方法,是其它抽样方法的基础
3. 特点
简单、直观,在抽样框完整时,可直接从中抽取样 本
用样本统计量对目标量进行估计比较方便
2. 特点
抽样时只需群的抽样框,可简化工作量
调查的地点相对集中,节省调查费用,方便 调查的实施
缺点是估计的精度较差
2 - 17
精品教材
统计学
系统抽样
(systematic sampling)
1. 将总体中的所有单位(抽样单位)按一定顺 序排列,在规定的范围内随机地抽取一个 单位作为初始单位,然后按事先规定好的 规则确定其它样本单位

统计学第六版贾俊平第3章高等教学

统计学第六版贾俊平第3章高等教学
统计学
数据分组
3 - 32
精品教材
统计学
分组方法
分组方法
单变量值分组
3 - 33
组距分组 等距分组 异距分组
精品教材
统计学
单变量值分组
(要点)
1. 将一个变量值作为一组
2. 适合于离散变量

☺ 3. 适合于变量值较少的情况


3 - 34
精品教材
统计学
组距分组
(要点)
1. 将变量值的一个区间作为一组 2. 适合于连续变量
甲城市
回答类别
户数 百分比 (户) (%)
向上累积
户数 百分比 (户) (%)
向下累积
户数 百分比 (户) (%)
非常不满意 24
8
24
8.0 300 100.0
不满意
108 36 132 44.0 276 92
一般
93 31 225 75.0 168 56
满意
45
15 270 90.0 75
25
非常满意 30
3 - 43
精品教材
统计学
数值型数据的图示
分组数据—直方图和折线图
3 - 44
Excel
精品教材
统计学
分组数据—直方图
(histogram)
1. 用矩形的宽度和高度来表示频数分布的图
形,实际上是用矩形的面积来表示各组的
频数分布
2. 在直角坐标中,用横轴表示数据分组,纵 轴表示频数或频率,各组与相应的频数就 形成了一个矩形,即直方图
(使用开口组)
3 - 42
精品教材
统计学
组距分组与不等距分组
(在表现频数分布上的差异)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

k阶矩 。
(5)v k
1 n
n
(Xi
i1
X)k,
称为样本
k阶中心矩

n
n ( X i X )3
(6) 3
i1
3,
n ( X i X )2 2
i1


3





n
n ( X i X )4
(7) 4
i1 n
3,
[ ( X i X )2 ]2
i1
称 4为样本峰度 。
统计学(第6版)
6. 1 统计量
❖定义6.1 设X1,X2,…Xn是从总体中抽取的容 量为n的一个样本,如果由此样本构造一个函数 T(X1,X2,…Xn),不依赖于任何未知参数,则称 函数 T(X1,X2,…Xn)是一个统计量。
❖对于T(X1,X2,…Xn), 也称样本统计量。当获得 样本的一组具体观测值x1,x2,…xn时,代入T, 就是一个具体的统计量值T(x1,x2,…xn) 。
~ χ2(n1)

σ/ n
n(Xμ)~ t(n1)
(n1)S2 σ2
1 n1
s
统计学(第6版)
6.3 由正态分布得到的几个重要分布
2.设X和Y是两个相互独立的总体,X~N(μ1,σ2), Y~N(μ2,σ2),X1,X2,…,Xn是来自X的样本,Y1,
Y2, …,Ym是来自Y的样本,记
X
1 n
证明:
X
1 n
n i1
Xi
因为Xi服从正态分布,
所以 X
也服从正态分布
E(X)1
n
n i1
EXi
X~N (,2),
n
D(X)n12
n
2
D(Xi)
i1
n
即 X / n~N (0,1)
6 - 22
由S2
1 n1
n i1
(Xi
X)2,
得(n1)S2 σ2
n i1
Xi
σ
X2
(n1)S2 σ2
n
X i,Y
i1
1 m
m
Yi
i1
E(X Y ) 1 2
2 2 D (X Y ) D (X ) D (Y )
nm
X
Y
~
N
(1
2,
2 n
2) m
( X Y ) ( 1 2 ) ~ N (0, 1) 1 1 nm
S x 2
1 n 1
n
(X i
i1
X )2,
S y2
1 m 1
6 - 15
统计学(第6版)
6.3 由正态分布得到的几个 重要分布
6.3 由正态分布得到的几个重要分布
6. 3. 1 2 分布
定义6.3 设随机变量X1,X2,…Xn相互独立, 且Xi (i=1,2,…,n)
n
服从标准正态分布N(0,1),则它们的平方和
X
2 i
服从自由度
为n的 2 分布。
i1
❖所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
❖1,1
❖1,2
❖1,3
❖1,4
2
❖2,1
❖2,2
❖2,3
❖2,4
3
❖3,1
❖3,2
❖3,3
❖3,4
4
❖4,1
❖4,2
❖4,3
❖4,4
6 - 29
统计学(第6版)
6.4 样本均值的分布与中心极限定理
计算出各样本的均值,如下表。
由度为m和n的 2 分布
Y~2(m ) Z~2(n )
则称
X
Y/m nY Z / nm Z
(6. 5)
X服从第一自由度为m,第二自由度为n的F分布,记为 F(m,n),简记为X~F(m,n) 。
6 - 25
统计学(第6版)
6.3 由正态分布得到的几个重要分布
F分布的性质:
1.若X ~ F(m, n)分布,则数学期望 和方差为
(1)抽检的100个元件中有3个不合格; (2)抽检的100个元件中前3个不合格;
100
在产品检验中,二项分布的统计量T X i是不合格
品率p的充分统计量。
i 1
6 - 11
统计学(第6版)
6. 2 关于分布的几个概念
6. 2 关于分布的几个概念
6.2.1 抽样分布
近代统计学的创始人之一,英国统计学家费希尔曾把 抽样分布、参数估计和假设检验看作统计推断的三个 中心内容。
m
xi M 1xi 1.01.51 64.02.5
m
(xi x)2
2 i1 x
M
(1.02.5)2 (4.02.5)2 0.6252
16
n
式中:M为样本数目
结论:1. 样本均值的均值(数学期望)等于总体均值
第6章 统计量及其抽样分布
第6章 统计量及其抽样分布
本章将较系统地介绍统计量的概念,以正态 分布为基础导出常用的几个重要分布,并给出 一些常用统计量的抽样分布。
6 -2
统计学(第6版)
第6章 统计量及其抽样分布
6.1 统计量 6.2 关于分布的几个概念 6.3 由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理 6.5 样本比例的分布 6.6 两个样本均值之差的分布 6.7 关于样本方差的分布
6 -9
R(n) = X(n)- X(1)称为样本极差 中位数、分位数、四分位数都是次序统计量。统计(第6版)6. 1 统计量
6.1.4 充分统计量 在统计学中,假如一个统计量能把含在样本中有关总体的 信息一点都不损失地提取出来,则对以后的统计推断质量 具有重要意义。 在统计量加工过程中一点信息都不损失的统计量通常称为 充分统计量。 因子分解定理是判别充分统计量的方法,由奈曼和哈尔姆 斯在20世纪40年代提出的。
6 -3
统计学(第6版)
6. 1 统计量
6. 1 统计量
6.1.1 统计量的概念
统计量是样本的函数,它不依赖于任何未知参 数; 根据不同的研究目的,可构造不同的统计量; 利用构造的统计量,用样本性质推断总体的性 质; 统计量是统计推断的基础,在统计学中占据着 非常重要的地位。
6 -5
统计学(第6版)
定义:在总体X的分布类型已知时,若对任一自然数n,
都能导出统计量T(X1,X2, …,Xn)的分布的数学表达式, 这种分布称为精确的抽样分布。
精确的抽样分布大多是在正态总体的情况下得到的。 在正态总体条件下主要有 χ 2分布、t分布和F分布,常 称为统计的三大分布。
6 - 13
统计学(第6版)
6. 2 关于分布的几个概念
6.3 由正态分布得到的几个重要分布
t分布的密度函数是 一个偶函数,因此 图形是关于t 0对 称的.
当n充分大时, 其图形 类似于标准正态变量 概率密度的图形.
所以当n足 ,t够 分大 布时 近似 1于 )分; N布 (0,
但对于n 较 t,分 小布 的与分 N布 (0相 ,1差 ) 很
6 - 20
第一个 观察值
❖1 ❖2 ❖3 ❖4
6 - 30
16个样本的均值(x) 第二个观察值
❖1
❖2
❖3
❖1.0
❖1.5
❖2.0
❖1.5
❖2.0
❖2.5
❖2.0
❖2.5
❖3.0
❖2.5
❖3.0
❖3.5
❖4 ❖2.5 ❖3.0 ❖3.5 ❖4.0
统计学(第6版)
6.4 样本均值的分布与中心极限定理
所有样本均值的均值和方差
参数。
6 -7
统计学(第6版)
6 -8
6. 1 统计量
6.2.2 常用统计量(当n充分大时)
(1) X
1 n
n i1
X i是样本的均值

( 2 )S 2 1 n
n
(X i X )2 是样本方差
i1

(3)V S 是样本的离散系数 。 X
(4 )m k
1 n
n
X
k,
i
i1
称 m k为样本
统计学(第6版)
6.3 由正态分布得到的几个重要分布
1.设X1,X2,…Xn是来自正态分布N(μ,σ2)的一个样本,
X
1 n
n i1
Xi
S2n11in1(Xi X)2

n ( X ) ~ t(n-1)
(6. 3)
S
称为服从自由度为(n-1)的t分布。
6 - 21
统计学(第6版)
6.3 由正态分布得到的几个重要分布
6. 1 统计量
6. 1. 3 次序统计量
定义6.2 设(X1,X2,…Xn)是从总体X中抽取的一个样 本,X(i)称为第i个次序统计量,它是样本(X1,X2,…Xn) 满足如下条件的函数: 每当样本得到一组观测值x1, x2,…,xn时,其由小到大的排序x(1)≤ x(2)≤ …≤x(i) ≤ … ≤ x(n) 中,第i个值x(i)就作为次序统计量X(i)的观测值, X(1), X(2) …X(n)称为次序统计量。其中X(1)和X(n)分别 为最小和最大次序统计量 。
6 -6
统计学(第6版)
6. 1 统计量
【例6. 1】设X1, X2, , Xn是从总体X中抽取的个 一样本,则
X
1 n
n i1
Xi
S2
1 n 1
n
(Xi
i1
X)2
n
都是统计量,而 [(Xi E(X)2],[(Xi E(X)]/ D(X都) i1
相关文档
最新文档