统计学(第六版)贾俊平 公式整理
统计学第六版贾俊平第1章无水印

本章小节
1. 统计学与统计规律 2. 统计的应用领域 3. 统计数据的类型 4. 统计中的几个基本概念
Copyright 1994-2000 Encyclopaedia Britannica, Inc.
(不列颠百科全书)
统计研究的过程
收集数据 (取得数据)
实际问题
解释数据 (结果说明)
整理数据
(处理数据 )
分析数据
(研究数据 )
统计规律
(一些例子)
1. 正常条件下新生婴儿的性别比为107:100 2. 投掷一枚均匀的硬币,出现正面和反面的频
1. 观测的数据(observational data)
通过调查或观测而收集到的数据 在没有对事物人为控制的条件下而得到的 有关社会经济现象的统计数据几乎都是观测数据
2. 试验的数据(experimental data)
在试验中控制试验对象而收集到的数据 比如,对一种新药疗效的试验,对一种新的农作物
archaeology (考古学)
auditing (审计学)
crystallography (晶体学)
demography (人口统计学)
dentistry (牙医学)
ecology (生态学)
econometrics (经济计量学)
education (教育学)
election forecasting and projection (选举预测和策划)
统计的应用领域
hydrology (水文学)
Industry (工业)
linguistics (语言学)
literature (文学)
manpower planning (劳动力计划)
management science (管理科学)
统计学第六版贾俊平第12章

2. 求解各回归参数的标准方程如下
12 - 13
Q
b
0
b0 bˆ0
0
Q
b
i
bi bˆi
0
(i 1,2,, p)
统计学
第六版
参数的最小二乘法
(例题分析)
【例】一家大型商业银行在多个地区设有分行,
为弄清楚不良贷款形成的原因,抽取了该银行 所属的25家分行2002年的有关业务数据。试建 立不良贷款(y)与贷款余额(x1)、累计应收贷款 (x2)、贷款项目个数(x3)和固定资产投资额(x4)的 线性回归方程,并解释各回归系数的含义
4. 作出决策:若F>F ,拒绝H0
统计学
第六版
多元回归模型
(基本假定)
1. 误差项ε是一个期望值为0的随机变量,即
E()=0
2. 对于自变量x1,x2,…,xp的所有值,的
方差2都相同
3. 误差项ε是一个服从正态分布的随机变量, 即ε~N(0,2),且相互独立
12 - 7
统计学
多元回归方程
第六版 (multiple regression equation)
第六版
学习目标
1. 回归模型、回归方程、估计的回归方程 2. 回归方程的拟合优度 3. 回归方程的显著性检验 4. 多重共线性问题及其处理 5. 利用回归方程进行估计和预测 6. 虚拟自变量的回归问题 7. 用 Excel 进行回归分析
12 - 3
统计学
第六版
12.1 多元线性回归模型
一. 多元回归模型与回归方程 二. 估计的多元回归方程 三. 参数的最小二乘估计
如果不显著,因变量与自变量之间不存在线性 关系
统计学第六版贾俊平

精品教材
统计学
拟合优度检验
(例题分析)
H0: 1= 2= 3= 4 H1: 1234 不全相等 = 0.1 df = (2-1)(4-1)= 3 临界值(s):
=0.1
0 3.0319 6.215 c2
9 - 27
统计量:
r
c2
c (fij eij)2 3.0319
i1 j1
eij
结论:
可以认为广告后各公司产品
0
5.99 8.18 c
市场占有率发生显著变化
9 - 29
精品教材
统计学
拟合优度检验
(例题分析—用P值检验)
第1步:将观察值输入一列,将期望值输入一列 第2步:选择“函数”选项 第3步:在函数分类中选“统计”,在函数名中选
“CHITEST”,点击“确定” 第4步:在对话框“Actual_range”输入观察数据区域
的百分比,称为百分比分布
行百分比:行的每一个观察频数除以相应的行 合计数(fij / ri)
列百分比:列的每一个观察频数除以相应的列 合计数( fij / cj )
总百分比:每一个观察值除以观察值的总个数( fij / n )
9 - 15
精品教材
统计学
百分比分布
(图示)
行百分比
列百分比
总百分比
0.3000
e
36 0.9730 3.0319
合计:3.0319
精品教材
统计学
拟合优度检验
9 - 24
精品教材
统计学
品质数据的假设检验
品质数据
比例检验
一个总体 两个以上总体
Z 检验 Z 检验 c 检验
统计学贾俊平重要公式

方差未知 :Z = X − μ S/ n
38.小 样 本 总 体 均 值 的 检 验 统 计 量 : t = X − μ , df = n − 1
S/ n
39.总 体 比 率 检 验 统 计 量 : Z =
p) − p0
p0 (1 − p0 )
n
40.总 体 均 值 的 单 侧 检 验 中 所 需 样 本 容 量 :
32.估计μ时的抽样误差: X − μ
E(X ) = μ,
33.总体均值的区间估计
有限总体时σ = X
N −n⎛ σ ⎞ N −1 ⎜⎝ n ⎟⎠
无限总体时σ = σ 31.比例P)的数学X 期望n和标准差 : E( p)) = p,
(1)大样本且方差已知: X ± Zα 2
σ, n
(2)大样本且方差未知: X ± Zα 2
X
)2
=
n
∑ i=1
X
2 i
−
∑ ⎛ n
⎜⎝ i = 1 X n
⎞2 i ⎟⎠
,
L XY
=
( n
∑ Xi− i=1
X
) (Y i − Y ) =
n
∑ i=1
X iY i −
∑ ⎛ n
⎜⎝ i = 1
∑ ⎞ ⎛ n
⎞
X i ⎟⎠ ⎜⎝ i = 1 Y i ⎟⎠ ,
n
L YY=Βιβλιοθήκη ( ) n∑2
Yi − Y
=
i=1
n
∑ Y i2 − i=1
∑ ⎛ n
⎞2
⎜⎝ i = 1 Y i ⎟⎠
,
n
n
n
∑ Xi
∑ Yi
X = i=1
统计学-贾俊平-考研-知识点总结

统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计.(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。
内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。
(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。
研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。
其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。
(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据.(1)分类数据是只能归于某一类别的非数字型数据。
它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的.(2)顺序数量是只能归于某一有序类别的非数字型数据。
也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的.(3)数值型数据是按数字尺度测量的观察值。
其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。
总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。
三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。
通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。
统计学原理贾俊平期末考试重点

统计学期末(单选、10个填空、5个判断、三个计算、一道论述)第一章导论1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
分析数据:分为描述统计方法和推断统计方法两种方法。
描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计:是研究如何利用样本数据来推断总体特征的统计方法。
推断统计内容包含参数估计和假设检验2、统计数据的类型:(1)按照采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据与数值型数据。
注意:分类数据和顺序数据都是表现事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此可以通称为定性数据或品质数据(qualitative data)。
数值型数据说明的是现象的数量特征,通常用数值来表现,因此可以统称为定量数据或数量数据(quantitative data)。
(2)按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。
(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据、时间序列数据(和面板数据 panal data)。
3、抽样独立性问题:总体区分为有限总体和无限总体,目的是为了判别在抽样中每次抽取是否独立(类似抽小球是否放回的问题)。
在统计推断中,通常是针对无限总体的,因而通常把总体看做随机变量(random variable)。
统计上的总体通常是一组观测数据,而不是一群人或者一些物品的简单集合。
4、统计指标按其所反映的数量特点和作用不同,分为数量指标、质量指标。
样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。
抽样的目的是根据样本提供的信息推断总体的特征。
5、总体参数(parameter)是用来描述总体特征的概括性数字度量,是研究者想要了解的某种特征值。
样本统计量(statistic)是用来描述样本特征的概括性数字度量,是根据样本数量计算出来的一个量。
贾俊平统计学(第六版)思考题答案解析

第一章:1、什么是统计学?统计学是一门收集、分析、表述、解释数据的科学和艺术。
2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。
推断统计:研究的是如何利用样本数据来推断总体特征。
3、统计学据可以分成哪几种类型,个有什么特点?按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。
分类数据:只能归于某一类别的,非数字型数据。
顺序数据:只能归于某一有序类别的,非数字型数据。
数值型数据:按数字尺度测量的观察值,结果表现为数值。
按收集方法不同。
分为:观测数据、和实验数据观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域实验数据:在试验中收集到的数据;控制条件;自然科学领域。
按时间不同,分为:截面数据、时间序列数据截面数据:在相同或近似相同的时间点上收集的数据。
时间序列数据:在不同时间收集的数据。
4、举例说明总体、样本、参数、统计量、变量这几个概念.总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合.参数:用来描述总体特征的概括性数字度量。
(平均数、标准差、比例等)统计量:用来描述样本特征的概括性数字度量。
(平均数、标准差、比例等)变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。
(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
)5、变量可以分为哪几类?分类变量:说明事物类别;取值是分类数据.顺序变量:说明事物有序类别;取值是顺序数据数值型变量:说明事物数字特征;取值是数值型数据。
变量也可以分为:随机变量和非随机变量;经验变量和理论变量6、举例说明离散型变量和连续型变量。
统计学第六版贾俊平第6章

统计学
第六版
2)分布
(图示)
选择容量为n 的 不同容量样本的抽样分布
n=1 n=4 n=10
总体
简单随机样本
计算样本方差S2
计算卡方值
n=20
2 = (n-1)S2/σ2
计算出所有的
2
2值
6 - 31
统计学
第六版
6.3 样本统计量的抽样分布
(两个总体参数推断时)
一. 两个样本均值之差的抽样分布 二. 两个样本比例之差的抽样分布 三. 两个样本方差比的抽样分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
6 - 17
x
X
统计学
第六版
中心极限定理
(central limit theorem)
X
的分 布趋 于正 态分 布的 过程
6 - 18
统计学
第六版
抽样分布与总体分布的关系
总体分布
(一个总体参数推断时)
一. 样本均值的抽样分布 二. 样本比例的抽样分布 三. 抽样方差的抽样分布
6-9
统计学
第六版
样本均值的抽样分布
6 - 10
统计学
第六版
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概 率分布
2. 一种理论概率分布 3. 进行推断总体总体均值的理论基础
6 - 11
3. 两个样本方差比的抽样分布,服从分子自由度 为(n1-1),分母自由度为(n2-1) F分布,即
S12 ~ F ( n1 1, n 2 1) 2 S1
统计学第六版贾俊平第5章.

精品教材
统计学
互斥事件及其概率
(例题分析)
解:由于每一枚硬币出现正面或出现反面的概率都
是1/2,当抛掷的次数逐渐增大时,上面的4个简
单事件中每一事件发生的相对频数(概率)将近似
等好于有1一/4枚。硬因币为朝仅上当的H1事T2件或发T1生H2,发而生事时件,H才1会T2
恰 或
T1H2又为互斥事件,两个事件中一个事件发生或
精品教材
统计学
事件的概率
5 - 10
精品教材
统计学
事件的概率
(probability)
1. 事件A的概率是一个介于0和1之间的一个值, 用以度量试验完成时事件A发生的可能性大小, 记为P(A)
2. 当试验的次数很多时,概率P(A)可以由所观察 到的事件A发生次数(频数)的比例来逼近
在相同条件下,重复进行n次试验,事件A 发生了m次,则事件A发生的概率可以写为
5 - 30
精品教材
统计学
条件概率
(例题分析)
解:设 A = 取出的一个为正品 B = 取出的一个为供应商甲供应的配件
(1) P( A) 186 0.93 (2)P(B) 90 0.45
200
200
(3) P( AB)
84 200
0.42
(4)P(A B) P(AB)
P(B)
统计学
条件概率
(conditional probability)
在事件B已经发生的条件下事件A发生的概率,称 为已知事件B时事件A的条件概率,记为P(A|B)
P(A|B)
=
P(AB) P(B)
事件A 事件B
一旦事件B发生
统计学第六版贾俊平12章多元线性回归

二元回归方程的直观解释
二元线性回归模型
回归面
y
y b0 b1x1 b2x2
(观察到的y)
} b0
i
x2
(x1,x2)
x1
E( y) b0 b1x1 b2x2
估计的多元回归方程
估计的多元回归的方程
(estimated multiple regression equation)
12.1 多元线性回归模型
一 多元回归模型与回归方程 二 估计的多元回归方程 三 参数的最小二乘估计
多元回归模型与回归方程
多元回归模型
(multiple regression model)
1. 一个因变量与两个及两个以上自变量的回归
2. 描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xp 和误差项 的方程,称为多元回归模型
2. 如果出现下列情况,暗示存在多重共线性
模型中各对自变量之间显著相关。 当模型的线性关系检验(F检验)显著时,几乎所有回
归系数的t检验却不显著 回归系数的正负号与其的相反。
Excel 输出结果的分析
多重共线性
(例题分析)
【例】判别各自变量之间是否存在多重共线性
贷款余额、应收贷款、贷款项目、固定资产投资额之间的相关矩阵
1. 用样本统计量 bˆ0 , bˆ1 , bˆ2 , , bˆ p 估计回归方 程中的 参数 b0 , b1 , b2 , , b p 时得到的方程
2. 由最小二乘法求得 3. 一般形式为
yˆ bˆ0 bˆ1x1 bˆ2x2 bˆpxp
▪ bˆ0 , bˆ1 , bˆ2 , , bˆ p是 b0 , b1 , b2 , , b p
统计学第六版贾俊平第7章无水印

1. 估计量:用于估计总体参数的随机变量
2. 如样本均值,样本比例、样本方差等
3. 例如: 样本均值就是总体均值 的一个估
计量
ˆ
4. 参数用 表示,估计量用 表示
5. 估计值:估计参数时计算出来的统计量的 详细值
6. 假如样本均值 计值
x =80,则80就是二点战估中计的的估
点估计与区间估计
参数估计的方法
P(1 P)
n 3. 总体比例 在1- 置信程度下的置信区间为
P z 2
(1 )
n
或
P
z
2
P(1- P) ( 未知时)
n
总体比例的区间估计
(例题分析)
【例】某城市想 要估计下岗职工 中女性所占的比 例,随机抽取了 100个下岗职工 ,其中65人为女 性职工。试以 95%的置信程度 估计该城市下岗 职工中女性比例 的置信区间
S1=5.8
x2 78
S2=57.2
两个总体均值之差的估计
(例题分析)
解: 两个总体均值之差在1-
为 (x1 x2 ) z 2
s12
s
2 2
3.
为是总体参数未在区间内的比例
4. 常用的置信程度值有 99%, 95%, 90%
5. 相应的 为,,
置信区间
(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称 为置信区间
2. 统计学家在某种程度上确信这个区间会包含真 正的总体参数,所以给它取名为置信区间
3. 用一个详细的样本所构造的区间是一个特定的 区间,我们无法知道这个样本所产生的区间是 否包含总体参数的真值
(例题分析)
【例】一家保险公司搜集到由36投保个人组成的随 机样本,得到每个投保人的年龄(周岁)数据如下表。 试建立投保人年龄90%的置信区间
贾俊平-统计学-总结

第一章导论概念:统计学:收集、处理、分析、解释数据井从数据中得出结论的科学。
统计的分类:描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法。
推断统计:是研究如何利用样木数据进行推断总体特征。
数据:1.分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述。
例如,人口按性别分为男、女两类2.顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3.数值型数据对事物的精确测度,结果表现为具体的数值。
例如:身高为175cm,190cm,200cm 参数:描述总体特征。
有总体均值(μ)、标准差()总体比例(T)统计量:描述样本特征,样本标准差(s),样木比例(p)第二章 数据的搜集1. 数据来源包括直接来源(一手数据)和间接来源(二手数据)2. 抽样方式包括概率抽样与非概率抽样3. 概率抽样:也称随机抽样。
按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中。
4.5.抽样误差:是由抽样的随机性引起的样本结果与总体真值之间的误差。
抽样误差并不是针对某个样本的检测结果与总体真是结果的差异而言,抽样误差描述的是所有样本可能的结果与总体真值之间的平均差异。
统计数据的分类按计量层次分类的数据顺序的数据数值型数据 按时间状况截 面 的 数 据时序的数据按收集方法 观察的数据 实验的数据6.抽样误差的大小与样本量的大小和总体的变异程度有关。
第三章数据的图表展示计算机实训内容,要求:1.数据筛选,自动筛选2.高级筛选,3.数据排序4.分类汇总-利用数据透视表5.对比条形图6.环形图7.累计频数图8.散点图9.雷达图等等频数分布图两种方法:工具-数据分析-直方图数值型和顺序数据数据-数据透视表数据透视表第四章数据的概括性度量集中趋势:算数平均数:几何平均数:指n个观察值连乘积的n次方根,计算平均发展速度时复利下的平均年利率,最常用的一种计算公式为,几何平均数≤算术平均数。
统计学(第六版)贾俊平-课后习题答案

第一章导论1.1.1(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。
1.3(1)总体是所有IT从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4(1)总体是所有在网上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在网上购物者的月平均花费。
(4)参数(5)推断统计方法。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。
使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手资料时,要注明数据来源。
2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试。
3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。
统计学贾俊平重要公式

− 1 e 2π σ
μ xe− μ
λ xe−λ
( x − μ )2
2σ 2
x−μ
σ
32.估计μ时的抽样误差 : X − μ 33.总体均值的区间估计 (1)大样本且方差已知 : X ± Zα 2 (2)大样本且方差未知 : X ± Zα 2
=
∑
k
(
i=1
fi − ei ei
)
2
,df = k − 1
5 1 .独 立 假 设 条 件 下 列 联 表 的 期 望 频 数 : R Ti × C T j 第 i行 之 和 × 第 j列 之 和 e ij = = 样 本 容 量 n 独 立 性 检 验 统 计 量 :
χ
2
=
∑ ∑
i j
(f
ij
− e ij e ij
38.小 样 本 总 体 均 值 的 检 验 统 计 量 : t = 39.总 体 比 率 检 验 统 计 量 : Z =
) p − p0 p 0 (1 − p 0 ) n
40.总 体 均 值 的 单 侧 检 验 中 所 需 样 本 容 量 :
(Z n=
α
− Zβ
)
2
σ
2
2
( μ 0 − μ1 )
, 用 Zα 2代 替 Zα即 为 双 侧 检 验 的 公 式
) 无限总体时σ P =
34.估计μ时所需的样本容量 : n =
2 Zα 2σ 2
Δ2
) ) p (1 − p ) 2 n ) ) 2 Z α 2 ⋅ p (1 − p ) 36. p的 区 间 估 计 时 所 需 的 样 本 容 量 n = Δ2 37.大 样 本 总 体 均 值 的 检 验 统 计 量 : ) 35.总 体 比 率 P的 区 间 估 计 p ± Z α 方差已知 : Z = 方差未知 : Z = X −μ , σ / n X −μ S/ n X −μ , df = n − 1 S/ n
统计学第六版贾俊平第3章高等教学

数据分组
3 - 32
精品教材
统计学
分组方法
分组方法
单变量值分组
3 - 33
组距分组 等距分组 异距分组
精品教材
统计学
单变量值分组
(要点)
1. 将一个变量值作为一组
2. 适合于离散变量
☺
☺ 3. 适合于变量值较少的情况
☺
☺
3 - 34
精品教材
统计学
组距分组
(要点)
1. 将变量值的一个区间作为一组 2. 适合于连续变量
甲城市
回答类别
户数 百分比 (户) (%)
向上累积
户数 百分比 (户) (%)
向下累积
户数 百分比 (户) (%)
非常不满意 24
8
24
8.0 300 100.0
不满意
108 36 132 44.0 276 92
一般
93 31 225 75.0 168 56
满意
45
15 270 90.0 75
25
非常满意 30
3 - 43
精品教材
统计学
数值型数据的图示
分组数据—直方图和折线图
3 - 44
Excel
精品教材
统计学
分组数据—直方图
(histogram)
1. 用矩形的宽度和高度来表示频数分布的图
形,实际上是用矩形的面积来表示各组的
频数分布
2. 在直角坐标中,用横轴表示数据分组,纵 轴表示频数或频率,各组与相应的频数就 形成了一个矩形,即直方图
(使用开口组)
3 - 42
精品教材
统计学
组距分组与不等距分组
(在表现频数分布上的差异)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E ( X ) x1 p1 x 2 p 2 x n p n xi pi
2 D( X ) [ xi E ( X )]2 pi
PX x C p x q n x E ( X ) np E ( X ) npq
x n i 1
P( X )
n n
( z 2 ) 2 2 E2 ( z 2 ) 2 (1 ) E2
假设检验
名称 总体均值检验的统计量(正态总体, 已知) z 总体均值检验的统计量( 未知,大样本) 公式
x 0
z
/ n x 0
s/ n x 0 p 0
总体均值检验的统计量(正态总体, 未知, t 小样本) s/ n 总体比例检验的统计量
z
0 (1 0 )
n (n 1) s 2
总体方差检验的统计量 两个总体均值之差检验的统计量( 1 , 2 已 知)
2 2
2
z
02
12
n1
2 2
( x1 x2 ) ( 1 2 ) n2
两个总体均值之差检验的统计量( 1 , 2 未 知但相等,小样本)
x e
x!
E ( X ) xf ( x)d ( x) D ( X ) [ x E ( X ) ]2 f ( x ) d ( x ) 2
2 ( x )2 1 f ( x) e 2 2 1
标准正态分布的概率密度函数
1 x2 ( x) e 2
n 个两两互斥事件 A1 , A2 ,… An 之和
的概率 事件 A 与其逆事件 A 之和的概率 两个任意事件之和的概率 概率的乘法公式 两个独立事件之积的概率
P ( A1 A2 An ) P ( A1 ) P ( A2 ) P(An ) P ( A) P( A ) 1 P ( A B ) P ( A) P ( B ) P ( A B ) P ( AB) P ( B ) P ( A B ) P ( AB) P ( A) P ( B ) P ( A1 A2 An ) P ( A1 ) P ( A2 ) P ( An ) P ( B ) P ( Ai ) P ( B Ai )
( n 1) ( n 2) ( n 3) s4 K
ns3
分组数据的峰态系数
(M
i 1
k
i
x)4 fi
ns 4
3
概率与概率分布
名称 公式
概率的古典定义
概率的统计定义 两个互斥事件之和的概率
事件 A所包含的基本事件个数 P ( A) 样本空间所包含的基本 事件个数 m n m P ( A) p n P ( A B ) P ( A) P ( B )
多元回归估计标准误差 一元回归线性关系检验的统计量 多元回归线性关系检验的统计量
一元回归系数检验的统计的统计量
SSE MSE n k 1 n k 1 SSR / 1 MSR F ~ F (1, n 2) SSE /(n 2) MSE SSR / k F ~ F (k , n k 1) SSE /(n k 1) ˆ t 1 sˆ
0 1
ˆ y ˆx 0 1 y 0 1 x1 2 x2 k xk ˆ ˆ x ˆ x ˆ x ˆ y 0 1 1 2 2 k k ˆ 1 n xi y i xi y i
i 1 i 1 i 1 n 2 i n 2 n n n
回归方程的斜率(回归系数)
判定系数
n x xi i 1 i 1 ˆi y )2 SSR ( y R2 SST ( yi y ) 2
一元回归估计标准误差
se se
(y (y
i
ˆi )2 y ˆi )2 y
n2
i
SSE MSE n2
均值之差的置信区间:独立小
2 12 和 2 样本, 未知且不相等, ( x1 x2 ) t 2 ( ) 1 2 n1 n2 两个样本的容量不相等
s2
s2
均值之差的置信区间:匹配大 样本 均值之差的置信区间:匹配小 样本
d z 2
d
n sd n
2
d t 2 (n 1)
两个样本比例之差检验的统计量 (检验两个总 体比例相等的假设)
z
( p1 p2 ) 1 1 p (1 p )( ) n1 n2 ( p1 p2 ) ( 1 2 ) p1 (1 p1 ) p2 (1 p2 ) n1 n2 s12 12 2 2 s2 2
1
多元回归系数检验的统计的统计量
ti
ˆ
i
i
sˆ
~ t (n k 1)
y 的平均值的置信区间
ˆ 0 t 2 s e y
(x x)2 1 n 0 n ( xi x ) 2
i 1
y 的个别值的预测区间
残差 标准化残差 修正的多重判定系数
( x0 x ) 2 1 ˆ 0 t 2 se 1 n y n ( xi x ) 2
2
n s n s n
总体均值的置信区间 ( 未知, x z 大样本) 一个总体 参数的区 间估计 总体均值的置信区间(正态总 体, 未知,小样本) 总体比例的置信区间
x t 2 p z 2
总体方差的置信区间 均值之差的置信区间:独立大 样本, 1 和 2 已知
2 2
多重比较的 LSD
相关与线性回归分析
名称 相关系数
r
t r
2 n x2 ( x) n y2 ( y)2
n xy x y
公式
相关系数检验的统计量 一元线性回归模型 估计的一元线性回归模型 一元线性回归方程的截距 多元线性回归模型 估计的多元线性回归模型
n2 ~ t (n 2) 1 r2 y 0 1 x ˆ ˆx ˆ y
两个样本均值之差抽样分布的期望值 两个样本均值之差抽样分布的方差
E( X ) D( X )
2
n E ( X 1 X 2 ) 1 2 D( X 1 X 2 )
12
n1
12
n2
参数估计
名称 总体均值的置信区间(正态总 体, 已知) 公式
x z 2
两个总体比例之差的区间估计 (p1 p2 ) z 两个总体方差比的置信区间
p1 (1 p1 ) p2 (1 p2 ) n1 n2
2 s12 s2 2 s2 s2 12 1 2 F 2 2 F1 2
估计总体均值时的样本容量 样本量的 确定 估计总体比例时的样本容量
i
x
n x fi
加权平均差
Md
M
i 1 n
n
简单样本方差
s2
(x
i 1 n
i
x)2
n 1
简单样本标准方差
s
k
(x
i 1
i
x)2
n 1
加权样本方差
s2
(M
i 1
i
x)2 fi
n 1
加权样本标准差
s
(M
i 1
k
i
x)2 fi
n 1
均值之差的置信区间:独立小 样本,
2 1 和
2 2 已知
( x1 x2 ) t 2 (n1 n2 2) s 2 p
1 1 n1 n2
均值之差的置信区间:独立小 样本, 1 和 2 未知但相等
2 2
两个总体 参数的区 间估计
2 s12 s2 ( x1 x2 ) t 2 (n1 n2 2) n1 n2
两个样本比例之差检验的统计量 (检验两个总 体比例之差不为零的假设)
z
两个样本方差比检验的统计量
F
列联分析
名称 公式
2 统计量 统计量
列联相关系数
2
( f0 fe ) fe
2
2 n
c
2 2 n
2
n min[( R 1), (C 1)]
相关系数
标准分数 离散系数 未分组数据的偏态系数
zi
xi x s s vs x
3
SK
n xi x (n 1)(n 2) s
分组数据的偏态系数
SK K
M i
1
k
i
x fi
3 2
未分组数据的峰态系数
n(n 1) (xi x )4 3 (xi x )2 (n 1)
i 1
ˆi ei yi y zei ˆi ei yi y se se n 1 n k 1
2 R称 环比增长率 公式
定基增长率
Yi 1 Yi 1 Y Y0 Yi Gi i 1 Y0 Y0 Gi
G n Y Y Y1 Y2 n 1 n n 1 Y0 Y1 Yn1 Y0
GA ( Yi m n ) 1 Yi 1
n i 1 i
平均增长率
年度化增长率
平均预测误差
ME
(Y
Fi )
平均绝对预测误差
MAD
n Yi Fi n
n i
均方预测误差
方差分析
名称 组间方差 组内方差 方差分析的检验统计量 关系强度的测量 公式
组间平方和 SSA 自由度 k 1 组内平方和 SSE MSE 自由度 nk MSA F ~ F ( k 1, n k ) MSE SSA(组间SS ) R2 SST (总SS ) MSA LSD t 2 MSE ( 1 1 ) ni n j