第1章统计学基础知识解剖
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(x11 x12 ... x1T ) (x21 x22 ... x2T ) ... (xT1 xT 2 ... xTT )
T
TT
(xi1 xi2 ... xiT )
xij
i 1
i 1 j 1
(5) 两组观测值相应求和的双重累加和等于 它们各自双重累加和的和。
TT
TT
百度文库
TT
直方图用横轴表示观测值,并把横轴 分成若干个区间(每个区间的宽度称作 组距);用纵轴表示落在相应区间内的 观测值频数(个数)或频率,并用矩形 (长条形)表示组频数或组频率的图形。
12
例1:20个新生儿体重值(克)数据见表。画20 个新生儿体重值的频数(频率)直方图。
13
首先把这20个新生儿体重值按从小到大顺 序排列,知最小值是2440克,最大值是 3860克。把观测值的取值范围分成5组, 如2400-2700、2700-3000、3000- 3300、 3300-3600、3600-3900。记录 这20个观测值分别落在这5个组内的频数 (个数),结果分别是2, 3, 8, 5, 2。用每组 频数除以总数20,得组频率值分别是0.10、 0.15、0.40、0.25、0.10。用上面的结果 制成频数(频率)分布表。
(xij yij )
xij
yij
i 1 j 1
i 1 j 1
i 1 j 1
10
累计求和算子的运算规则
(6) 两组不同单下标观测值积的双重累 计求和等于它们各自累计求和的乘积。
TT
T
T
xi y j xi • y j
i 1 j 1
i 1
j 1
11
2、直方图
直方图分频数直方图和频率直方图两 类。
样本容量:样本中所含个体的个数称 样本容量,样本{x1,x2,…,xn}中的下标n 表示样本容量。
6
比如某银行分理处共有20486个活期存 款储户。如果要研究这20486个储户在 某个时点的存款额,那么这20486个存 款额就是一个总体,存款额的总体容 量是20486,而每一个存款额是一个个 体。比如从中随机抽取20个存款额数 据,则这20个存款额数据构成一个随 机样本。样本容量是20。
在Eviews中画一组数据的折线图,点 Quick-Graph,输入要显示折线图的变量名, 选择折线图即可。或在命令窗口plot
18
4、散点图
散点图:用两个变量的成对观测值画 出的观测点图。
通过散点图可以分析两个变量之间是 否存在某种关系。如果存在关系,那 么这种关系是线性的,还是非线性的, 也可以通过散点图进行初步观察。
的倍数。 T
T
kxi k xi
i 1
i 1
(2) 两组观测值相应求和(或差)的累加和等
于它们分别求累加和后再相加(或相减)。
T
T
T
(xi yi ) xi yi
i 1
i 1
i 1
(3) T个常数k求和等于该常数k与T的乘积。
T
k kT
i 1
9
累计求和算子的运算规则
(4) 用双下标表示的T×T个观测值的累加和 可以用双重累加和符号表示为:
7
特征数:用于描述一组数据(总体或样 本)的数量特征的数值称作特征数。平 均数、中位数、方差等都是一组数据 的特征数。
累计求和算子:对于T个观测值 {x1,x2,…,xT},累计求和可以简化地表 示为:
T
x1 x2 ... xT xi i 1
8
累计求和算子的运算规则
(1) 观测值倍数的累加和等于观测值累加和
19
20
5、算术平均数
平均数、中位数都是描述一组数据集中位 置的特征数。
对于不分组数据,均值和算术平均数分别 定义如下:
均值:一组数据,如果是总体,用
{x1,x2,…,xN}表示,容量为N,则均值μ定
义为:
x1 x2 ... xN N
1 N
N
xi
i 1
21
算术平均数:一组数据,如果是样本,
14
15
16
注意: (1) 频数、频率直方图展示的分布特征是一样的,
只不过前者纵轴表示频数,后者纵轴表示频率。
(2) 当观测值正巧等于组边界值时,注意不要在相 邻两组重复记录。记录组频数的规则是组下限值 包括在本组内,组上限值不包括在本组内。
(3) 同样一组数据由于分组数不同,所画频数(频 率)直方图的特征会不一样。实际中应该选择一个 最合适的分组数,以便充分展示数据的分布特征。 一般分组数在5-15之间。
4
1、基本概念与累计求和算子运算规则 总体:研究对象的全体称为总体。常
用{x1,x2,…,xN}、{y1,y2,…,yN}等表示。 个体:组成总体的每个基本单位称为
个体。常用xi或yi等表示。
5
总体容量:总体中所含个体的个数。 总体{x1,x2,…,xN}中的N表示总体容量。
样本:总体中抽出若干个体组成的集 体称为样本。常用{x1,x2,…,xn} 、 {y1,y2,…,yn}等表示。
3
数据的特征数可分为4大类,即描述集中位 置的特征数、分散程度的特征数、分布状 况的特征数和两变量线性相关的特征数。
主要介绍10个特征数,分别是算术平均数、 几何平均数、中位数、极差、方差、标准 差、偏度、峰度、协方差和相关系数。
在介绍特征数之前,先给出求和算子和画 图的概念。
本章所说的一组数据如果不作特别说明, 则既可以指一个总体,也可以指一个样本。
第1章 统计学基础知识
计量经济学
1
本章内容
第1节 数据的特征数 第2节 总体特征数的点估计与区间估计 第3节 相关分析
2
第1节 数据的特征数
1、基本概念与累计求和算子的运算规则 2、直方图 3、折线图 4、散点图 5、算术平均数 6、几何平均数 7、中位数 8、极差 9、方差 10、标准差 11、偏度 12、峰度 13、协方差
(4) 画直方图的EViews步骤是,打开单数据组窗 口,点击View/descriptive Statistics & Tests/Histogram and Stats功能。
17
3、折线图
折线图:把观测点按序号或时间顺序用直 线连接起来的图形。
对于截面数据,横轴表示观测值的序号, 纵轴表示观测值。对于时间序列数据,横 轴表示时间,纵轴表示观测值。时间序列 折线图也称时间序列图。