金融统计与分析--复习提纲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《金融统计与分析》复习提纲
一、单选 20个
二、多选 10个
三、判断 10
四、名词解释 15
五、简答 25
六、分析 1道20分
第一章绪论
四类实验的区别
1验证型实验:是指实验者针对已知的理论结论而进行的验证实验,是在知晓实验结果的前提下进行的实验,目的是检验理论推演的结论,巩固和加强有关知识内容,培养实验操作能力,是一种重复性实验。
2设计型实验:指给定实验目的要求和实验条件,由实验者自行设计实验方案并加以实现的实验,是结合课程教学或独立于课程教学而进行的一种探索性实验。不但要求实验者综合多科知识和多种实验原理来设计实验方案,还要求实验者能运用已有知识去发现分析和解决问题。
3创新型实验:是在不知晓实验结果的前提下,实验者通过实验,探索和分析等实验方法获得对研究对象的性质,规律的认识。发现新结论是创新型实验的主要目标。具有探究性的特点,基于已有的理论或实践基础,在对前提条件进行修订,研究方法进行改进等变化的过程中,才能有所创新。
4综合型实验:是指实验内容涉及本课程的综合知识或者与本课程相关的课程知识的实验。综合型实验内容必须满足以下条件之一:涉及本学科的多个知识点;涉及多门学科的知识点;多项实验手段的综合。
第二章金融数据挖掘与统计分析
基本概念:
GDDS与SDDS
SDDS是数据公布特殊标准(Special Data Dissemination Standard)的英文缩写,适用于已经参与国际金融市场的大多数工业化国家和一些新兴市场经济国家,1996年3月公布。将国民经济活动划分为实际部门,财政部门,金融部门和国外部门,人口数据只作为鼓励公布的数据,以附表的形式发布。
GDDS是数据公布通用系统(General Data Dissemination System)的英文缩写,适用于尚未达到SDDS要求的国家,大部分为发展中国家,1997年12月公布。将国民经济活动划分为实际部门,财政部门,金融部门和国外部门和社会人口部门。
SDDS与GDDS的区别
1适用国家不同
2宏观部门划分不同:GDDS有社会人口部门
3发布数据差异:综合统计框架,跟踪性数据种类,与部门相关的统计指标,社会人口数据
4鼓励公布的指标
5“视相关程度”而定的指标
6数据公布的及时性与频率
金融数据挖掘
指金融行为的选择者从大量的、不完全的、存在噪声的、模糊的、随机生成的金融数据中,搜索、发现、提取隐含在数据内部的、尚未被他人所知的、对决策具有潜在价值的信息或知识的过程。
因子分析
是将多个实测变量转换为少数几个不相关的综合指标的多元统计方法,目的是定义数据矩阵的基本结构。
主成分分析
也称主分量分析,是一种降维的统计分析方法,借助一个正交变换,将其分量相关的原随机向量转化为其分量不相关的新随机向量。
重点关注:
金融数据公布系统
中国的数据公布系统
我国于2002年4月15日正式加入了GDDS
国家统计局负责统计核算和公布国民经济实际部门的指标和数据
财政部负责统计并公布财政部门的指标和数据
中国人民银行负责统计并公布金融部门的指标和数据
国家外汇管理局、海关总署负责统计和公布国外部门的指标和数据
(因为金融数据公布系统在书上的讲解是分为SDDS和GDDS与中国数据公布系统两部分,而前面已经考察了前者,建议大家看看中国的吧。)
金融数据挖掘主要任务
1关联分析:变量之间的数值存在的规律性
2聚类:将数据库中的数据按照一定的规则划分为一系列有意义的子集的过程 3分类:找出一个类别的内涵或特征,能够代表该类数据的整体信息 4估计:数据挖掘中确定一个未知输出属性的值
5预测:利用历史数据发现未来输出结果的过程
6异常检测:对数据中存在异常情况加以发现、甄别的过程,找出观察数据与参照标准之间的差异,更好地为模型预测分析服务
7发现时序模式:在时间序列中找到重复发生概率比较高的模式,强调时间的影响
金融数据挖掘的统计技术方法
1.描述统计分析
集中趋势分析:平均数、中位数、众数
离中趋势分析:极差、标准差、方差、最大值、最小值、偏度、峰度、偏度系数、峰度系数
统计图形分析:直方图、茎叶图、箱线图等对观察数据进行直观描述
2.相关分析: 相关表 相关图 相关系数
3.差异分析
从样本统计量的值得出差异,来确定总体参数之间是否存在差异
4.回归分析: 简单线性回归 多元回归 虚拟变量
5.聚类分析
通过分析事物的内在特点和规律,根据相似性原则对事物进行分组
适用于没有先验知识的分类,如没有理论指引,没有国际标准、国内标准或行业标准
6.判别分析
在已知的分类下,遇到有新的样本时,利用已经选定的判别标准,判定如何将新样本放置于哪个族群中。它是一种预测导向型的统计方法,用以事后分析。
7.时间序列分析
平稳随机序列的统计分析,在理论上的发展比较成熟,是时间序列分析的基础。 谱分析也称频域分析,因为一个时间序列可看成各种周期扰动的叠加,频域分析就是确定各周期的振动能量的分配
金融数据的描述性统计分析
(1)集中趋势的测量 算术平均数:
调和平均数:
几何平均数:
众数:一组数据中出现次数最多的变量数值,一组数据可以有多个众数,也可以∑==n i i x n X 11∑==n i i
x n H 11n n n x x x x x G ∏=⋅⋅⋅⋅=Λ321