一种基于SVM的企业财务状况分析模型

合集下载

基于遗传算法和熵的缩减记忆式LS-SVM财务困境预测模型研究

基于遗传算法和熵的缩减记忆式LS-SVM财务困境预测模型研究
a d a v nc s am e oy- e c d tp fprdit n mo e fL -VM i h i a e n g n tc ag rt m n n・ n d a e m r -r du e y e o e c i d lo S- o S wh c sb s d o e ei lo ih a d i -
关 键 词 : 传 算 法 ; 息熵 ; 小 二 乘支 持 向量 机 ; 减 记 忆 算 法 ; 务 困 境 预 测 遗 信 最 缩 财
中 图 分 类 号 :2 1 F 0 文 章 标 识 码 : A 文 章 编 号 :0 7 3 2 ( 0 0) 5 0 7 — 7 1 0 —2 1 2 1 0 — 0 1 0
第 1 9卷 第 5期
21 0 0年 1 ERAT1 0NS RES EARCH AND ANAGEM ENT CI M S ENCE
Ve . 9. . 1 1 No 5
Oc . 0l t2 0
基 于遗传算法和熵 的缩减 记忆式 L —V SS M财务困境预测模型研究
赵冠华
( 东财 政 学 院 会 计学 院 , 山 山东 济南 20 1 ) 50 4

要 : 了提 高财 务 困境 预 测 的 正 确 率 , 少模 型 的 训练 样 本 数 和 训 练 时 间 , 传 统 支 持 向量 机 ( V 预测 模 为 减 在 S M) 型 的基 础 上 , 遗 传 算 法 、 息 熵 和缩 减 记 忆 算 法 应 用 于 最 小 二 乘 支 持 向量 机 ( SS M) 提 出 了一 种 基 于 遗 传 将 信 L —V , 算 法 和 信 息 熵 的 缩 减 记 忆 式最 小二 乘 支 持 向量 机 预 测 模 型 。并 独 立 推 导 出 了适 合 财 务 困境 预 测 这 一 离 散 序 列

基于PSO和SVM的上市公司财务危机预警模型

基于PSO和SVM的上市公司财务危机预警模型

( i e st fS in e a d Te h o o y o h n He e , i a Un v r iy o ce c n c n l g f C i a, f i Ch n )
Absr c t a t:Fi n ilc ii r n d li o s d b o b n to o fe r il wa m na ca rss wa ni g mo e s pr po e y c m i a i n ofm diid pa tc e s r o i ia i n wih up or e t r ma hi . Ta i he c o e i t d o p nis a a a t e mod l ptm z to t s p t v c o c ne k ng t h us d ls e c m a e ’d t s h e s m p e,a t s sgi e o c mpa e t e p op s d m e ho t he pr s n a l e t i v n t o r h r o e t d wih t e e t PCA— SVM de .Th e t mo 1 e t s r s t lus r t he r a o b lt nd s e i rt ft r o e e h d. e uls i l ta e t e s na iiy a up ro iy o he p op s d m t o Ke y wor ds:fna ca rss wa ni g;ls e o p ny;pa tc es r o i ia i i n ilc ii r n it d c m a r il wa m ptm z ton;s pp tv c or u or e t
ma hD c ie
随 着 全 球 化 的 深 入 和 竞 争 的 加 剧 , 业 发 企 生财 务危机甚至破 产清算 的现 象越来越 多 , 因

基于SVM的中小企业财务预警模型探讨

基于SVM的中小企业财务预警模型探讨
整个 国家 的经 济 繁荣 和社 会 稳 定 。然 而 . 据 一份 调 查 统计 : 0 8 % 的 中小企 业 在 开业 的 五年 内倒 闭。 从 财务 角度来 看 . 有两 个 突 出 表现 : 是企 业盈 利 能 力的 不断 下 降 . 直 至 亏 损经 营 ; 一 二是 资 金短 缺 . 偿债 能 力降 低 。 因此 . 有 必要 通过 企 业财 务 危机 预 警来 预测 和 及 时发 现 企 业 经 营 情 况 和 财 务 状 况 的 变 化 。 企业财务预警 . 是经 过对 企 业 财 务 报 表 及 相 关 经 营 数据 的分
, I ・
评 价模 型 、神 经 网络 模 型 等 上述 模 型 在 应 用 时均 须 依 赖 大 量 的 历 史 样本 . 其 中统 计 模 型 以数 据 服从 多元 正 态 分布 为假 设前 提 . 综 合模 糊 评 价 模 型 以必 要 的 专 家经 验 为依 据 . 经 网 络 模 型 在 目 神 前仍 缺 乏 统 一 的数 学理 论 . 确 定 网络 结 构 .提 高 算 法 的解 释 性 在 解决 过 学 习和 欠 学 习 以及 局部 极 小 点等 问题 上也 难 以 突破 。 本 文 效解 决 传 统 模 型存 在 的 小 样本 .高 维 数 .非线 性 和 局 部 极 小点 等 问题 . 而 提 高 财 务危 机 预 警 的决 策 效 率 和效 果。 从


满足条件 ( 】 f 且使 1 21 。 / 1 l 最小的分类面就叫做最优分类面 l W



最 优 分 类 面
利 用 L gag 优 化方 法可 以把 上述最 优分 类面 问题转 化为其 对 arne 析 .通 过 设 置 并 观察 一 些 敏 感 性 预 警 指 标 的 变 化 . 企 业 可 能 或 对 偶 问题 .这 是 一 个 不等 式 约 束 下 二次 函数 寻优 的 问题 .存 在 唯一 将 要 面 临 的财 务 危 机 实施 的实 时监 控和 预 测 警报 。 当 前被 广泛 研 解 。容 易证 明 .解 中将 只 有一 部分 ( 常是 少部分 ) 【 不 为零 .对 通 o 究并 应 用 的财 务 危 机 预 警模 型 概括 起 来 主 要 有统 计 模 型 和 人 工 智 应 的 样 本 就 是 支 持 向 量 。 解 上 述 问题 后 得到 的最 优 分 类 函数 是 能 模 型 两 大 类 。统 计 模 型包 括 z 评 分模 型 多 元判 别分 析 模 型 . fx =g (术 )b)= g ∑ l 五・ ) b () sn(w x + sn( ・( x+ ) i f) 2 L gsi o it c回归模型 及主成 分分 析模 型等 . 人工 智能模 型包 括综 合模糊

基于PSO-SVM的多分类财务预警模型

基于PSO-SVM的多分类财务预警模型

1 原 理 与 方 法
1 . 1 支 持 向量机
类算法 , 将其运用到实际问题 中并取得 了良好的 效果 。章智儒 将 S V M 多分类 应用到纹理 图像 分类 中, 证实其分类 效果较传统神经 网络模 型有

支持向量机主要是针对两类分类问题寻找一 个满足分类要求 的最优超平面 , 使得这个分类超 平面在保证分类精度 的同时, 能够使两侧的分类
间隔最 大化 。假 设线 性 可分情 况 下 的训 练样 本集
为( , Y ) , i =1 , 2 , …, f , ∈R , Y∈ { 一1 , +1 } (
定优势。应 伟 提 出 了一种 改进 的支持 向量
机 的多类 文 本分 类方 法 。 目前 国内外 也致力 于 将
Vo 1 . 3 5 No . 2
Apr . 2 01 3
文章 编 号 : 2 0 9 5— 3 8 5 2 ( 2 0 1 3 ) 0 2— 0 2 6 5— 0 5
文献标志码 : A
基于 P S O —S V M 的 多分 类财 务预 警模 型
吴翎 燕 , 韩 华 , 唐 菲
l 1 w l 。因此 , 最优 分类面 问题可 以表示为如下
性, 但均针对财务二分类问题 。
的约束优化问题 J :
收稿 日期 : 2 0 1 2—1 0—0 9 . 作者简介 : 吴翎燕 ( 1 9 9 0 一) , 女, 安徽无为人 , 武汉理工大学理学院硕士研究生. 基金项 目: 国家 自然科学基金资助项 目( 6 0 7 7 3 2 1 0 , 7 1 1 4 0 0 1 5 ) ; 中央高校基本科研业务费专项基金资助项 目( 2 0 1 1 — 1 a - 0 3 4 )

基于SVM的企业绩效综合评价

基于SVM的企业绩效综合评价
维普资讯
2o 0 7年 1 0月
中 国 管 理 信 息 化
Chn a a e n fr to iain iaM n g me t n o mainz t I o
O t, 0 7 c .2 0
Vo .0, . 0 11 No 1
第1 0卷第 1 0期
f1 2.
水 平
煤炭 开采生态衰退值 生 态衰退值 O 排放 生态衰退值 S2 C D排 放生态衰退值 O
未循 环 利 用 固体 废 弃 物生态衰退值
尝试采用一种性能优 良的核方 经元数 目下 。 前馈神经网络能以任意精度逼近任意非线性 易出现过学习现象等问题 , 函数 。 然而在 实际应用 中 , 由于神经 网络存 在 的一 些缺 陷 , 法— — V 方法对企 业绩效 进行评价 , 能较 好地解决小 S M 它 样本 、 非线性 、 高维数 、 局部极小点等实际问题 , 为企业绩 使得神经网络应用到实际经济管理问题的预测与评价中 效 评估提 供 了一种 新方法 。
2 企 业 自我 实现 能力评价体 系
建 立合 理 的评 价指 标体 系是 企业 绩效 评 价模 型建立 的基础 , 体 系的设计是 为 了正 确地 对企业 绩效 进行综 指标
衰退值+0 排放生态衰退值+ 0 sz C D排放生态衰退值 ( 1 2)
( ) 三 指标 体 系汇总表
表 2中 , 工业增 加值 代表 了钢铁 工业 对经 济和社 钢铁 会 的贡献 , 当量生 态增益值 和矿 产 当量 生态 增益值 代表 煤
正 效益 生 态正效益 生态增益值 煤当量生态增益值 钢 铁 工 业 生 态 化 负效益 态负效益 生 矿产 当量生态增益值 铁 矿石 资 源 生态 耗 减 值 生态耗减值 水资 源生态耗减值 煤 当量 生态耗减值 铁 矿石 开 采 生态 衰 退 值

支持向量机在上市公司财务预警模浅析企业筹资风险及其对策陈鹏型中的应用

支持向量机在上市公司财务预警模浅析企业筹资风险及其对策陈鹏型中的应用

支持向量机在上市公司财务预警模浅析企业筹资风险及其对策陈鹏型中的应用【摘要】本文研究的是基于小样本数据的上市公司财务预警模型。

本文使用机器学习方法中的支持向量机(svm)的方法来建立预警模型,针对化工行业的上市公司为例进行财务预测。

本文选取26家化工行业上市公司,建立训练样本与预测样本来确定svm模型的参数以及检验模型的准确性。

通过模型的检验得到svm上市公司财务预警模型有良好的预警作用。

【关键词】机器学习,支持向量机,财务预警,小样本一、背景介绍随着我国市场经济体制的建立与发展,企业在发展的同时也面临着严峻的挑战。

在市场经济条件下,企业经营如有不慎便会陷入危机。

企业的危机,更多的是体现在企业财务上,通过对企业财务的分析和预测,如果能够提前发现问题,做好准备,这样企业在面临激烈的竞争时将更有竞争力。

本文以化工行业为例,结合机器学习模型,对化工业企业财务预警模型进行研究,希望能够为企业财务预警提供一定的参考,以便能够帮助企业更好的适应激烈的竞争。

二、机器学习方法的财务预警模型建立(一)财务预警模型的财务指标选取。

为了比较全面地反映企业的财务状况,根据财务指标选取原则,在参照国内外学者己有的研究成果的基础上,并结合我国化工业上市公司的实际情况,本文选择了财务类和现金流量类指标。

其中,财务类指标包含偿债能力、营运能力、成长能力、盈利能力四个方面;其中,偿债能力指标包括流动比率、速动比率、资产负债率、有形资产负债率,营运能力指标包括应收帐款周转率、存货周转率、流动资产周转率、总资产周转率,成长能力包括总资产增长率、净利润增长率、营业收入增长率,盈利能力指标包括营业利润率、资产报酬率、每股收益,现金流量指标包括现金流量比、债务保障率、主营业务现金比率、每股净资产。

(二)样本的选取。

我国上市公司实行的是“st”制度,本文假定“st”公司就是陷入财务困境的公司。

由于研究的是小样本数据,因而从所有化工也上市公司中选取少量样本,作为研究对象。

基于SVM多分类模型的上市公司财务困境预测

基于SVM多分类模型的上市公司财务困境预测
1 引 言和 文献 综 述
[ 文章编号] 1 6 7 3 — 0 1 9 4 ( 2 0 1 4 ) 0 4 - 0 0 0 2 一 O 4
为 困境 公 司 的样 本
一Leabharlann 近 些 年 来 . 国 内外 的专 家 学者 对 企 业 的 财 务 困境 预测 进 行
般 来 说 ,反 映企 业 财 务 状 况 的 指 标 主要 有 偿 债 能 力 指 标 、
效的。
[ 关键词 ] 财 务 困境 预 测 : S V M 多 分 类模 型 :平 均影 响 值
d o i : 1 0 . 3 9 6 9 / i . i s s n . 1 6 7 3—0 1 9 4 . 2 0 1 4 . 0 4 . 0 0 1
[ 中图分类号]F 2 7 5 . 1 [ 文献标识码 ]A
财务 健 康 公 司 、 财 务 亚健 康 公 司和 财 务 困境 公 司 3类 , 并运用 t - 1 年和 £ 一 2年 的 面板 数 据 , 采 用基 于 平 均 影响 值 的 变量 筛选
方 法构 建 了 S V M 多分 类模 型 。实证 结 果表 明 , 模 型 的预 测 能 力较 好 , 能 够 以较 少 的特 征 变量 实现 较 高的分 类 精度 , 是 切 实有
了大 量 的研 究 . 提 出 了许 多 有 价值 的预 测 方 法 。但 大 多 数 学 者把 盈 利 能 力 指 标 、 营运 能 力 指标 和成 长能 力 指 标 等 。 在 这些 指 标 中 . 研 究 样 本 分 为 困境 公 司和 健 康 公 司 两类 进 行 研 究 .而 公 司 陷入 盈 利 能 力 指 标 是 核 心 . 因为 利 润 是 企 业 生 存 和 发 展 的保 障 . 是 企 财 务 困境 往 往 会 经 历 一 个 逐 步 衰 败 的过 程 .仅 仅 将 公 司分 为 困 业 竞 争 力 的集 中体 现 . 企 业 的盈 利 能 力越 强 . 抵 御 风 险 的 能 力 也 境 公 司和 健 康 公 司 . 往 往 会 忽 略 健 康 公 司 面 临 的一 些 问 题 . 有 些 越 强 。 从 长 远来 看 , 企业 的偿 债 能 力 、 营运 能 力 和 成 长 能 力 最 终 都 公 司虽 然 没 有 戴 帽 , 但是财务状况并不理想 . 有 的 甚 至 亏损 。 因 取 决 于 企 业 的盈 利 能 力 : 另一方面 , 上 市 公 司发 行 证 券 和被 特 别 此. 将 上市公司仅仅分为困境公司和健康公司两类进行研究 . 难 处 理 的 标 准 都是 盈 利 能 力 指 标 我 国规 定 当上 市 公 司 出 现 连续 两 以 判 断 健 康 公 司 财 务 状 况 的好 坏 程 度 及 其 是 否 处 于 财 务 困境 的 个 会 计 年 度 净 利 润均 为 负 值 或 者 最 近 一 个 会 计 年 度 每 股 净 资 产 边缘 . 不 能 给投 资 者 、 公 司 管 理 层 和 债 权 人 等 相关 各 方 提 供 更 为 低 于 股 票 面 值 时 . 则 会 对 该 公 司股 票 交 易 实 行 特 别 处 理 . 即被 宣 布为 S T 。 基 于 以 上原 因 , 本 文 采用 盈 利 能力 指 标 作 为 界 定 财 务 健 A mv Hi n g — L i n g L a u于 1 9 8 7年 在 “ 五 状 态 财 务 困境 预 测 模 康 公 司 和 亚 健康 公 司 的标 准 型” 一 文 中 首 次 将 企 业 财 务 状 况 分 为 5个 状 态 : 财 务 稳 定 阶段 、 2 . 2 样 本 选 取 和数 据 来 源 明确 的 反 映 公 司 未来 财 务 情 况 的 信 息

企业财务预警PCA―SVM模型研究

企业财务预警PCA―SVM模型研究

企业财务预警PCA―SVM模型研究
近年来,由于经济全球化和国际金融市场的变化,企业间的竞争日益激烈,财务风险的管理也被越来越重视。

因此,企业财务预警成为了财务管理中的重要组成部分。

为了更好地预警企业财务风险,本文提出了一种基于主成分分析(PCA)和支持向量机(SVM)的企业财务预警模型。

主成分分析是一种常用的数据降维方法,它可以将高维度数据转换为低维度数据,并保留数据的主要信息。

在本文中,我们采用PCA方法对企业财务数据进行降维处理,以减少模型中的变量数量,提高模型的运行效率和准确率。

支持向量机是一种常用的分类模型,它可以通过将数据映射到高维度空间中,让数据在该空间中线性可分,从而实现分类。

在本文中,我们采用SVM方法对企业财务数据进行分类预警,以判断企业财务风险是否存在。

具体而言,我们将企业财务数据分为两类,即健康类和风险类。

在模型训练阶段,我们将采用PCA方法对财务数据进行降维处理,并将降维后的数据输入到SVM模型中进行训练。

在测试阶段,我们将输入测试数据,通过训练好的SVM模型进行分类预警。

为了验证模型的准确性,我们将采用实际的企业财务数据进行测试。

测试结果显示,本文提出的企业财务预警模型具有高精度和稳定性,能够有效地预警企业财务风险。

综上所述,本文提出了一种基于PCA-SVM的企业财务预警模型,通过对企业财
务数据进行降维和分类处理,有效地预警企业财务风险,提高了企业的风险管理能力。

FA-SVM模型在上市公司财务预警中的应用

FA-SVM模型在上市公司财务预警中的应用

FA-SVM模型在上市公司财务预警中的应用FA-SVM模型是一种将因子分析(FA)和支持向量机(SVM)相结合的预测模型,被广泛应用于上市公司财务预警中。

该模型通过对上市公司的财务指标进行因子分析,提取主要因子,并利用支持向量机进行分类和预测,从而对上市公司的财务健康状况进行预警。

FA-SVM模型的应用主要包括以下几个方面:1.财务指标选取:FA-SVM模型从上市公司的财务报表中选取一系列重要的财务指标作为模型的输入变量,如资产负债率、流动比率、营业收入增长率等。

这些指标既包括公司的静态财务状况,也包括公司的动态经营能力,能够综合反映公司的经营状况和风险水平。

2.因子分析:FA-SVM模型通过因子分析技术对选取的财务指标进行降维处理,提取出主要因子。

通过对财务指标间的相关性进行分析,可以找到影响上市公司财务状况的关键因素,减少模型的输入维度,提高模型的预测精度。

3.SVM分类和预测:FA-SVM模型利用支持向量机技术进行分类和预测。

将训练集中的已知财务状况的样本输入到SVM模型中进行训练,得到一个分类器。

然后将未知财务状况的样本输入到分类器中进行预测,根据预测结果对上市公司的财务状况进行预警。

4.模型评估和优化:FA-SVM模型在应用过程中需要进行模型的评估和优化。

通过比较预测结果与实际财务状况的差异,可以对模型的准确度进行评估,并进行相应的调整和优化。

常用的模型评估指标包括准确率、召回率、F1值等。

1.综合性:FA-SVM模型能够综合考虑上市公司财务报表中的各个指标,从而全面了解公司的财务状况。

相比于单一指标的模型,FA-SVM模型能够提供更全面、更准确的财务预警结果。

3.高效性:FA-SVM模型利用支持向量机技术进行分类和预测,具有较高的计算效率和预测准确度。

支持向量机是一种非常强大的分类器,能够处理高维数据,泛化能力强,适用于各种类型的数据。

1.数据质量:FA-SVM模型需要大量的财务数据作为输入,而财务数据的质量对模型的准确度有很大影响。

FA-SVM模型在上市公司财务预警中的应用

FA-SVM模型在上市公司财务预警中的应用

FA-SVM模型在上市公司财务预警中的应用随着我国经济不断发展,上市公司作为经济的重要组成部分,其财务预警问题也成为了日益关注的焦点。

财务预警是指通过对公司财务指标的分析,提前发现可能存在的财务风险,从而及时采取措施来避免潜在的经济损失。

在财务预警领域,机器学习技术引入为预警模型赋予了新的方法和工具,其中FA-SVM模型因其高准确性和有效性而备受关注。

本文将重点探讨FA-SVM模型在上市公司财务预警中的应用,并分析其优势和局限性。

一、FA-SVM模型概述FA-SVM模型是一种结合了因子分析(Factor Analysis)和支持向量机(Support Vector Machine)的预测模型。

因子分析是一种多变量统计技术,通过将变量进行线性组合,提取出影响变量变化的共同因素,从而降低变量之间的相关性;支持向量机是一种基于统计学习理论的分类算法,通过将数据映射到高维空间,找到最优的超平面来实现分类。

FA-SVM模型将因子分析提取的共同因素作为支持向量机的输入,从而提高了模型的预测准确性和鲁棒性。

1. 数据准备在应用FA-SVM模型进行财务预警时,首先需要准备上市公司的财务数据作为模型的输入。

这些数据包括资产负债表、利润表、现金流量表等财务指标,其中包括资产总额、负债总额、营业收入、净利润、经营性现金流量净额等。

还需要获取公司的行业信息、市场环境等外部因素,以便在模型中进行综合分析。

2. 因子分析利用因子分析技术对准备好的财务数据进行分析,提取影响公司财务状况的共同因素。

因子分析可以帮助去除变量之间的相关性,减少数据维度,提高后续支持向量机的训练效率。

通过因子分析,可以得到表征公司财务状况的主要因素,如盈利能力、偿债能力、经营效率等。

3. 支持向量机训练将因子分析得到的共同因素作为支持向量机的输入,进行模型的训练。

在训练过程中,需要设置合适的核函数、正则化参数等,以寻找最佳的超平面来实现财务预警分类。

金融风险分析中的机器学习模型研究

金融风险分析中的机器学习模型研究

金融风险分析中的机器学习模型研究一、引言金融风险是指金融市场的变化和不确定性可能对投资者产生的财务损失。

随着金融市场的不断发展,金融交易变得更加复杂,风险也随之不断增加,传统的统计方法已经不能完全满足风险分析的需要。

机器学习在金融风险分析中的应用,已经成为一个热门话题。

本文将讨论机器学习模型在金融风险分析中的应用,并深入探讨两种机器学习模型:支持向量机和神经网络。

二、机器学习模型支持向量机(Support Vector Machine,SVM)是一种用于分类和回归分析的机器学习模型。

SVM是建立在统计学习理论基础上的一种新型机器学习方法。

它的基本思想是通过寻找最优的超平面来进行分类。

另一个流行的机器学习模型是神经网络(Neural Network),它是一种模仿人类大脑神经元之间互相作用的数学模型。

神经网络由一组互相连接的节点组成,每个节点都代表一个算法模型。

三、机器学习模型在金融风险分析中的应用(一)SVM在金融风险识别中的应用将SVM应用于金融风险识别,可以帮助交易员或者投资者更好地理解市场趋势和价格变化。

在金融市场中,SVM可以用于预测股票市场和货币市场的价格趋势。

SVM还可以被运用于推广策略和交易市场的营销方法。

在实际应用中,SVM非常有效,得到了广泛的应用。

(二)神经网络在金融风险承担方面的应用神经网络在风险承担方面的应用,主要包括以下几个方面:1.股票价格预测通过神经网络模型来预测股票市场价格的变化,可以帮助交易员和投资者更好地掌握市场趋势,为他们在交易过程中做出更好的投资决策提供参考。

2.信贷风险评估信贷风险评估是金融风险中的一个重要方面,它对银行业务的稳健和可持续发展起到至关重要的作用。

通过分析大量的数据,神经网络模型可以帮助银行评估信贷风险,以减少不良贷款,并提高信贷业务的盈利能力。

3.行为模式识别在金融市场中,投资者的投资行为模式会直接影响市场价格的波动。

通过神经网络模型的识别,可以发现投资者在市场上的行为模式并对其进行分析。

支持向量机在金融分析中的应用

支持向量机在金融分析中的应用

支持向量机在金融分析中的应用一、概述支持向量机(Support Vector Machine,简称SVM)是一种基于统计学习理论的二类分类模型,由于其具有良好的分类性能、较好的鲁棒性和泛化能力,在金融分析领域得到了广泛的应用。

二、SVM的原理SVM是一种基于最大间隔分类准则的模型,其基本思想是找到一个超平面,使得不同类别的样本距离该超平面的距离最大。

这个距离也就是所谓的“间隔”,而最大间隔分类准则就是在所有可能的超平面中,选择间隔最大的超平面作为最优超平面。

在SVM 中,样本点作为超平面的支持向量点起到了至关重要的作用。

三、SVM在金融分析中的应用1.股票价格预测SVM可以通过学习历史股票价格等数据,来预测未来股票价格的涨跌情况。

通过构建一个二分类模型,将涨(或跌)作为一个类别,而不涨(或不跌)作为另一个类别,SVM可以通过对不同的因素进行分析,包括股票历史价格、交易量等,来预测未来的股票价格。

2.信用风险评估SVM可以通过学习客户的历史信用记录、收入情况、负债水平等信息,将客户分为可信和不可信两个类别。

这样可以通过建立一个分类模型,来评估借款人的信用风险,从而帮助金融机构做出更好的贷款决策。

3.欺诈检测SVM可以通过分析客户的交易历史,来判断是否存在欺诈行为。

例如,在银行卡的交易数据中,可以通过分析不同交易商户、交易金额等因素,来判断是否存在异常交易行为,从而及时发现潜在的欺诈风险。

4.数字货币价格预测SVM可以通过分析数字货币的历史价格、交易量等因素,来预测数字货币的未来价格走势。

这样可以帮助投资者做出更好的投资决策,也可以帮助数字货币平台制定更有效的市场策略。

四、SVM的优点和局限1.优点SVM具有较好的泛化能力,且能够处理高维度的数据,具有较好的分类性能和鲁棒性。

SVM采用间隔最大化的方法进行分类,从而提高了分类的精度。

2.局限SVM需要依赖超平面来进行分类,对于非线性的数据,需要进行特殊的处理。

基于支持向量机的上市公司财务预警模型研究的开题报告

基于支持向量机的上市公司财务预警模型研究的开题报告

基于支持向量机的上市公司财务预警模型研究的开题报告一、选题背景及意义随着经济全球化、金融市场日趋复杂化,上市公司财务风险日益加剧引起社会各界广泛关注。

对此,建立科学有效的财务预警模型具有重要的现实意义和理论价值。

本文基于支持向量机(support vector machine,SVM)算法,探索一种新的上市公司财务预警模型,旨在提高财务风险预测的准确性和有效性,为公司和投资者提供更好的决策支持。

二、研究目的和内容1. 研究现有的财务预警模型及其缺点。

以传统的Logistic回归模型为例,介绍其模型原理和应用范围,并指出其预测能力有限的缺点,为后续的研究提供参考。

2. 探究支持向量机算法的原理和特点。

介绍SVM算法的基本原理、优点和缺点,以及其在分类、回归和聚类等领域的应用情况,并剖析其在财务预警领域中的优势。

3. 建立基于SVM算法的上市公司财务预警模型。

以某A股上市公司的财务数据为例,利用SVM算法建立支持向量机模型,并运用交叉验证评估模型的准确性和稳定性。

将模型分析的结果与传统的Logistic回归模型进行对比研究,检验SVM算法在财务风险预测中的实际应用效果。

4. 进行实证分析和讨论,并提出改进意见。

针对模型预测结果的优点和不足,结合实际情况,提出相应的改进意见,并对基于支持向量机的财务预警模型进行总结。

三、研究方法本文采用的主要研究方法为实证研究和案例分析。

首先,通过对现有财务预警模型及其缺点的分析,深入探究SVM算法的优势和特点,为后续的模型建立打下基础。

其次,以某A股上市公司的财务数据为数据来源,通过数据预处理和特征选取等步骤,建立基于SVM算法的财务预警模型,并进行稳定性检验和准确性评估。

最后,以实证分析和数据对比的方式,评估基于支持向量机的财务预警模型的优越性和适用性,提出相应的改进意见。

四、预期结果和贡献预计本研究将为上市公司财务风险预测提供一种新的理论视角和实践方法,提高预警模型在实际应用中的准确性和有效性。

基于SVM的寿险公司财务预警研究

基于SVM的寿险公司财务预警研究

基于SVM的寿险公司财务预警研究选取我国寿险公司2009年~2010年的64家公司混合非平衡面板数据作为训练样本,2011年35家寿险公司数据为测试样本,采用支持向量机(svm)算法从资金充足性、资产质量、盈利能力、成长能力四个方面对寿险公司财务预警进行研究。

实证表明,此模型在我国保险业现有样本容量小、有效数据少的情况下,财务预警比bp神经网络更加有效,有着良好的运用前景。

svm 财务预警面板数据一、研究背景寿险由于承担长期保险责任,面临的财务风险远高于一般企业,对财务风险预警的需求也较一般企业更为迫切。

目前,使用最为广泛的动态财务预警模型为人工神经网络(bp)方法及其相关衍生方法,如back(1996)、zhang、yang (1999)和pendharkar等。

但是人工神经网络方法作为一种基于经验风险最小化的启发式机器学习技术,有易陷入局部极小点,训练效果无法保证、网络泛化能力较差、缺乏有理论依据的严格设计程序、样本要求较大等缺陷。

而由vapnik领导的贝尔实验室研究小组开发的支持向量机(svm)机器学习技术采用结构风险最小化准则,同时优化了经验风险和置信风险,克服了经验风险最小化原则的缺点,保证了模型的拟合精度和泛化能力。

与传统的学习方法(bp)相比,svm不存在局部极小问题,隐层节点数的选择等问题。

而且其解除具有稳健性、全局唯一性及稀疏性,避免了神经网络中可能有多个局部优化解的问题。

shin(2005)、chen等(2006)就采用svm方法对银行破产风险进行预测,证明了svms的预测效果和准确率远远高于bp神经网络模型。

考虑到我国保险业各公司统计资料的严重缺失、统计标准不统一制约了统计方法在国内保险的运用,本文尝试建立了基于svm的寿险公司财务预警模型,并以实证研究证明:svm方法应用到寿险公司财务预警中,学习精度高,预测精度高于传统的学习方法;能处理我国保险业样本容量小、有效数据不足的情况。

一种基于SVM的企业财务状况分析模型

一种基于SVM的企业财务状况分析模型

破产 的边缘 : 如果 z值在 a b之间, - 则表明企业 的财务及经营
极 不稳定 , 称 为“ 色地 带 ” 被 灰 。

维普资讯
At n认 为 ,根 据 上 述 公 式 计 算 的 Z值 。如 果 Z小 于 l ma 1 3 即 a 1 3时 , . 。 =. 2 2 风险 很大 ; Z大于 29 即 b 29时 , , = 风险 较 小 。根 据 Z 分 成 的三个 区间 。 将 企业 信用 等 级评 为好 、 、 值 可 中 差 三 个等级 , 是 Z 数模 型用 于 信用 评级 的原 理 。对 于 不 这就 分 同Z 分数 模 型 。 据 实践 中的 经验 将 Z值分 为不 同 区 间 。 根 可产 生 更 多基 于 Z 数模 型 的信用模 型 。 分 At n在 前面 的基 础 上 又建 立 了第 二 代 模 型 。 为 Z — l ma 称 E T A信 用风 险模 型 。 的 变量 主 要有 7个 。 资产 报 酬率 、 新 即 收入 的稳 定 性 、 息 倍 数 、 利 负债 比率 、 动 比率 、 本化 比率 、 模 流 资 规 等 。 此基 础 上基 于 不 同的 考虑 和 侧重 点 , 在 出现 了更 多形 式 的
() 1
式 中 : xY = 巾( ) 巾( )是 满 足 M re 条 件 的核 函 K( ,) [ X ・ Y】 ec r 数 , 以证 明 。 可 上式 中只 有一 部 分 a不 为 0 对应 的样 本 X 就是 . , .
三、 z分数模 型 方法 率先 将 多元 判 别分 析法 应 用 于财 务危 机 、 司破 产 及 违约 公 风 险分 析 的开 拓 者 是 美 国 的 爱 德 华 - 尔 特 曼 博 士 。他 早 在 阿 1 6 年 发 现 Z值 能有 效识 别 公 司 的信 用 级 别 ,从 而开 发出 Z 98 分数 信 用评级 模型 , 立 了著 名 的 5变量 Z s oe 建 — c r。

基于GA-SVM的上市公司财务评价模型研究

基于GA-SVM的上市公司财务评价模型研究

第 2期
李云飞 等
基 于 G S M 的 上 市 公 司 财 务 评 价 模 型研 究 A・V
15 8
1 原 理 与方 法
11 支 持 向量机 . 支持 向量机是 数据挖掘 中的一项 新技术 , 是借
sn 0 为符 号 函数 。在 样 本严格 线 性可 分 的情况 g 下 ,可 按照式 ()~ ()过 程处理 ;然而在 样本不 1 5
化原则基础上 的, 它是将实 际问题通 过非线性变换
有效性依 赖于严格 的假 设条 件 , 导致其有效性和 适 用性受 到极大的 限制 , 可见早 期的研究方法是有 局
转换到高维 的特 征空 间, 在高维 空间中利用线性分 类 完成低维空 间中的非线性分类任 务 , 这一特殊 的 性质 能够保证学 习机器具有较好 的泛化能力 , 同时
差 ;3 )神经 网络 的结 构设计没有 固定 的模式 ,取 决于 设计 者的先验知识和经 验 , 缺乏一种有理 论依
并进 行事 前预 测预报 的财务评 价 系统 。从 实践上 看 , 务危机是企业危机 最综合最显 著的表 现 ,随 财 着我 国证券 市场 机制和企业破产 制度的完善 , 财务 危机 的存在 时刻 威胁着企业 的生存 和长期发展 。 如 果 出现大量企业 同时陷入财务危机 的状况 时, 将有 可能 引发大规模 的金融危机 。因此 , 如何 有效地对
文 献标 识 码 :A
D :1 .9 9js n1 0 —9 X.0 1 20 8 OI 03 6 /i .0 77 1 2 1 . .1 .s 0
0 引言
企 业财 务评 价系 统就 是通 过对 财 务指标 的挖
掘 ,选 择有代 表性 的财 务指 标并研 判其 变 化和趋 势, 而对企业可 能或将要面 临的财 务状况进行评价

FA-SVM模型在上市公司财务预警中的应用

FA-SVM模型在上市公司财务预警中的应用

FA-SVM模型在上市公司财务预警中的应用FA-SVM模型是基于因子分析和支持向量机(SVM)的模型,可以综合利用财务数据和宏观经济数据,对上市公司的财务状况进行全面的评估和预警。

本文将从FA-SVM模型的原理和特点、在财务预警中的应用效果以及存在的问题和展望等方面进行阐述。

一、FA-SVM模型的原理和特点FA-SVM模型是将因子分析和支持向量机相结合而成的,其原理主要分为两个步骤。

利用因子分析方法提取出影响上市公司财务状况的关键因子,比如财务杠杆、盈利水平、经营效益等。

然后,将提取的因子作为输入数据,建立SVM模型,通过学习已有的财务危机案例,进行训练和预测。

(1)综合利用多种数据:FA-SVM模型既可以综合利用财务数据,又可以结合宏观经济数据,对公司的财务状况进行全面的评估。

这样一来,预警结果更加可靠,不仅能够捕捉到会计数据的变化,还能够反映经济环境的变化。

(2)高准确度:相比传统的财务预警模型,FA-SVM模型在预测准确度上表现更加突出。

因为它可以通过大量的数据进行训练,从而找出更加准确的财务预警的规律性。

(3)灵活性:FA-SVM模型的建模过程比较灵活,适应不同类型的上市公司和不同经济环境的变化。

可以根据具体的情况进行合理的数据选择和模型构建,提高了模型的适用性。

2.1 提高了财务预警的精准度FA-SVM模型的提出,在一定程度上提高了财务预警的精准度。

传统的财务预警模型主要依赖会计数据,难以反映公司在宏观经济环境下的真实情况。

而FA-SVM模型可以综合利用多种数据,反映了公司的全面情况,使财务预警更加精准。

随着经济环境和市场情况的不断变化,财务预警的及时性显得尤为重要。

FA-SVM模型可以通过实时的数据输入,进行实时的预警分析,使得预警结果更加及时,为公司的经营决策提供了重要的参考依据。

FA-SVM模型的建模过程更加科学和严谨,可以通过大量的案例进行学习和训练,找出财务预警的规律性。

这就使得财务预警的准确性得到了大幅提升,为公司避免财务风险提供了有力的保障。

基于SVM-LightGBM算法的上市公司财务数据异常识别模型

基于SVM-LightGBM算法的上市公司财务数据异常识别模型

第41卷第5期2023年10月沈阳师范大学学报(自然科学版)J o u r n a l o f S h e n y a n g N o r m a lU n i v e r s i t y(N a t u r a l S c i e n c eE d i t i o n)V o l.41N o.5O c t.2023文章编号:16735862(2023)05046405基于S V M-L i g h t G B M算法的上市公司财务数据异常识别模型邵永运,张立莹(沈阳师范大学软件学院,沈阳110034)摘要:上市公司是否依法准确披露财务数据对资本市场的稳定发展有重要影响㊂建立财务数据异常识别模型,对规范财务数据报表和避免财务数据造假具有十分重要的意义㊂运用机器学习相关技术,将上市公司财务报表数据按照行业予以划分并使用特征工程完成各行业财务异常指标的选取,然后使用支持向量机算法和轻量级梯度提升算法,建立双层财务数据异常识别的混合模型,对2667家上市公司财务数据进行了实证研究㊂结果表明,在财务异常识别方面,与其他模型相比,该模型的准确率等指标均有较大提高㊂关键词:财务造假;机器学习;支持向量机算法;轻量级梯度提升算法中图分类号:T P181;F275;F832文献标志码:Ad o i:10.3969/j.i s s n.16735862.2023.05.015F i n a n c i a ld a t aa n o m a l y r e c o g n i t i o n m o d e lo f l i s t e dc o m p a n i e sb a s e do nS V M-L i g h t G B MS HA OY o n g y u n,Z HA N GL i y i n g(S o f t w a r eC o l l e g e,S h e n y a n g N o r m a lU n i v e r s i t y,S h e n y a n g110034,C h i n a)A b s t r a c t:W h e t h e r l i s t e dc o m p a n i e sd i s c l o s e f i n a n c i a ld a t aa c c u r a t e l y a c c o r d i n g t ol a w p l a y sa ni m p o r t a n t r o l ei nt h es t a b l ed e v e l o p m e n to ft h ec a p i t a l m a r k e t.H o w t o m i n ea n di d e n t i f y t h ea b n o r m a lr i s k o f f i n a n c i a l d a t a f r o m t h e f i n a n c i a l d a t a r e p o r t a n d e s t a b l i s h t h e a b n o r m a li d e n t i f i c a t i o nm o d e l o f f i n a n c i a l d a t a a r e o f g r e a t s i g n i f i c a n c e t o s t a n d a r d i z e t h e f i n a n c i a l d a t a r e p o r ta n da v o i d t h e f r a u d o f f i n a n c i a l d a t a.B y u s i n g m a c h i n e l e a r n i n g t e c h n o l o g y,t h e f i n a n c i a l s t a t e m e n td a t ao fl i s te d c o m p a n i e sa r e d i v i d e d a c c o r d i n g t oi n d u s t r y a n df e a t u r ee ng i n e e r i n g i s u s e dt oc o m p l e t et h es e l e c t i o n o ff i n a n c i a la n o m a l y i nd i c a t o r si ne a c hi n d u s t r y.T h e n,s u p p o r tv e c t o rm a c h i n e a n d l i g h t g r a d i e n tb o o s t i n g m a c h i n ea r eu s e dt oe s t a b l i s had u a l-l a y e rh y b r i d m o d e l f o ra n o m a l y i d e n t i f i c a t i o no f f i n a n c i a l d a t a,a n de m p i r i c a l r e s e a r c h i s c o n d u c t e do n t h e f i n a n c i a l d a t a o f2667l i s t e d c o m p a n i e s.T h e r e s u l t s s h o wt h a t c o m p a r e dw i t ho t h e rm o d e l s,t h e a c c u r a c y a n do t h e ri n d i c a t o r s o f t h i sm o d e l a r e g r e a t l y i m p r o v e d.K e y w o r d s:f i n a n c i a l f r a u d;m a c h i n e l e a r n i n g;s u p p o r t v e c t o r m a c h i n e;l i g h t g r a d i e n tb o o s t i n g m ac h i n e随着国内经济的高速发展,国内上市公司数量稳步上升㊂从1991年初到2021年底,国内A股上市公司的数量从13家飞速增长至4682家[1]㊂国内上市公司的数量虽不及企业总数的万分之一,但截至2021年末,上市公司总市值占国内总市值的84.40%,总市值规模稳居世界第二[2]㊂由此可见,上市收稿日期:20221209基金项目:辽宁省社会科学规划基金资助项目(L16WT B022)㊂作者简介:邵永运(1971 ),男,辽宁大连人,沈阳师范大学教授,博士㊂公司是国家实体经济发展的主要力量㊂然而,少数上市公司却采取财务造假等不正当手段来谋求资本市场所带来的高获利回报,对资本市场和投资者产生伤害的同时扰乱了金融市场的秩序㊂财务造假是指企业违反国家法律㊁法规,对内部账务状况运用不合规的欺诈手段进行伪造和隐瞒,以掩盖企业真实的运营状况[3]㊂财务造假的发生必然伴随着财务数据异常,对财务报表进行人工核实的传统手段费时费力,难以精准识别异常数据㊂随着大数据技术的不断发展,通过机器学习算法,建立科学有效㊁精准识别的财务数据异常识别模型对企业的财务造假行为进行判别具有重要价值㊂1 模型建立与模型重构1.1 支持向量机算法支持向量机(s u p po r t v e c t o rm a c h i n e ,S VM )算法的基本思想是在当前的数据分布中找到一个超平面来达到数据分类的目的,这个超平面要使分类误差尽量小,特别是减少未知数据集的泛化误差㊂故S VM 算法的分类原理就是找出边际最大的决策边界,也就是让损失函数取得最小值[4]㊂因此,损失函数表达式包括需要进行最小化处理的函数及求解后需要满足的约束条件2个部分㊂可以使用拉格朗日乘数将损失函数改写为考虑约束条件的形式,于是,对任意样本(x i ,y i),都有L (ω,b ,a )=12ω2-ðni =1αi (y i (ωx i +b )-1),αi ȡ0(1)此处:ω为参数向量;x 为特征向量;b 为超平面与原点之间距离的截距㊂训练样本x i 通过函数ϕ映射到高维空间,最终得到如下超平面的判定函数[5],其中s i g n (h )是在h >0时返回1,h <0时返回-1的符号函数㊂于是有f (x )=s ig n ðni =1αi y i (ϕ(x )㊃ϕ(x i ))+()b (2) 非线性训练样本具有线性不可分的性质,对这种样本往往需要将原始的数据空间向高维数据空间进行映射,从而使数据变得可分㊂为解决这一问题,可以利用S VM 算法引入核函数进行处理㊂核函数使用数据原始空间中的向量计算来表示升维后空间中的点积结果,即通过引入核函数将基于内积运算的线性算法非线性化[6]㊂样本(x i ,x j )映射到高维特征空间的内积为ϕ(x i )Tϕ(x j ),此时可以通过核函数计算不同的内积㊂不同的核函数可以解决不同数据分布下寻找超平面及决策边界的问题㊂在S VM算法中,核函数的选择由参数k e r n e l 控制[7]㊂k e r n e l 参数的取值与表达式见表1㊂表1 核函数参数释义T a b l e1 D e f i n i t i o no f k e r n e l f u n c t i o n p a r a m e t e r s可选核函数核函数含义适用范围核函数表达式l i n e a r 线性核线性K (x ,y )=x T y =x ㊃y p o l y多项式核偏线性K (x ,y )=(γ(x ㊃y )+r )dr b f 高斯径向基偏非线性K (x ,y )=e -γ|x -y2,γ>0s i gm o i d 双面正切核非线性K (x ,y )=t a n h (γ(x ㊃y )+r ) S VM 算法计算的核函数可以进行非线性指标处理,泛化能力较强㊂但也正由于这点,S VM 算法对非线性数据没有通用的解决方案,在计算时间和内存需求方面需要通过选择核函数进行优化[8]㊂1.2 L i gh t G B M 算法轻量级梯度提升(l i g h t g r a d i e n tb o o s t i n g m a c h i n e ,L i gh t G B M )算法与极速梯度提升(e x t r e m e g r a d i e n t b o o s t i n g ,X G B o o s t )算法是基于梯度提升决策树(g r a d i e n tb o o s t i n g de c i s i o nt r e e ,G B D T )算法衍生出的算法模型㊂L i g h t G B M 算法可以看作X G B o o s t 算法的改进版本,该算法使用部分样本计算信息增益的同时使用内置的特征降维技术降低计算每次信息增益的成本㊂L i g h t B GM 算法使用在当前叶子节点中找出分裂增益最大的叶子结点进行分裂的l e af -w i s e 生长策略,在相同的分裂次数条件下提供了更好的精度[9]㊂同时,影响X G B o o s t 算法寻找最优分割点复杂度的原因为分裂点㊁样本与特征数量过多㊂为解决这些问题,L i gh t G B M 算法在X G B o o s t 算法基础上引入直方图算法㊁基于梯度的单边采样(g r a d i e n t -b a s e do n e -s i d e s a m p l i n g ,G O S S )算法及互斥特征捆绑(e x c l u s i v e f e a t u r e b u n d l i n g ,E F B )564第5期 邵永运,等:基于S VM -L i g h t G B M 算法的上市公司财务数据异常识别模型664沈阳师范大学学报(自然科学版)第41卷算法[10]㊂L i g h t G B M模型的算法流程如图1所示㊂图1L i g h t G B M算法流程F i g.1A l g o r i t h m p r o c e s s o f L i g h tG B ML i g h t G B M算法将损失函数当前负梯度的值当作残差的近似值,利用该值逐步拟合出回归树[11],然后依次递进,在决策过程中生成下一棵树,最后将运行结果按照权重加权求和得出最终结果㊂L i g h t G B M算法模型每次迭代都是根据上一次的结果进行权重的调整,这导致误差变得越来越小的同时偏差也在降低,因而对数据噪声较为敏感㊂1.3S V M-L i g h t G B M模型的建立目前,财务数据异常识别往往基于全行业数据使用单一算法进行建模识别,识别的结果难以表明不同行业财务数据上的差异㊂事实上,通过对财务数据的分析不难得出,不同行业财务数据异常在不同指标的敏感性表现上存在明显不同,从而导致模型效果无法进一步精进㊂因此,有必要建立将财务数据进行分行业处理的财务数据异常识别混合模型㊂对来源数据按照行业分类分析发现,制造业㊁信息技术服务业与批发和零售业历年财务造假次数分别为91,19和14次,其余行业(以下统称为其他行业)的财务造假次数均低于10次㊂通过特征选择提取出以上4个行业的财务异常特征,并基于全行业财务数据提取出全行业共通异常特征用于模型构建㊂财务数据异常识别模型构建的具体过程为使用各行业的财务异常指标分别利用随机森林(r a n d o m f o r e s t,R F)算法㊁S VM算法和逻辑回归(l o g i s t i c r e g r e s s i o n,L R)算法选取各个行业最适合的模型进行调参处理,以此构建出模型的第1层㊂由于第1层仅输出概率值,对总体数据量来说特征数量过少,容易造成模型泛化能力不足,降低了模型结果的准确性与真实性,故将第1层的输出与全行业共通的异常财务指标体系进行拼接作为模型第2层的输入㊂在第2层使用L i g h t G B M算法再次进行财务异常识别㊂L i g h t G B M集成算法相较于以往集成算法运行时占用内存空间更小㊁运行速度更快,并且暂时未在财务数据异常的侦查方面大规模使用,具有很好的应用前景㊂财务数据异常识别模型流程如图2所示㊂图2S V M-L G B M财务异常识别模型流程F i g.2F i n a n c i a l a n o m a l y i d e n t i f i c a t i o nm o d e l p r o c e s s o f S V M-LG B M2 实证分析2.1 数据处理本文数据来源于第九届 泰迪杯 数据挖掘挑战赛A 题的上市公司财务数据㊂该数据文件包含2667家上市公司近6年来的22213条数据,数据字段共363个㊂通过数据预处理方法[12]得到用于分析的数据,包括252个财务特征和1个用来区分是否发生财务造假的特征标签㊂2.2 特征选择使用F i l t e r 过滤法与E m b e d d e d 嵌入法对各行业进行特征选择,按照特征对结果的贡献程度降序输出,最终分别选取各行业指标重要性排名前20的特征及全行业前10的特征㊂全行业财务异常指标选择结果及相关名词释义见表2㊂表2 最终特征选择结果T a b l e2 F i n a l f e a t u r es e l e c t i o n r e s u l t特 征 名 称特征中文名称特 征 释 义C I P在建工程企业资产的尚未完工的工程支出I N V E N T O R I E S存货企业在日常活动中持有以备出售的产品O T H _C A其他流动资产除货币资金等流动资产以外的流动资产R E T A I N E D _E A R N I N G S 未分配利润企业留到以后年度分配或待分配的利润C A S H _C _E Q U I V货币资金企业拥有的以货币形式存在的资产C _P A I D _D I V _P R O F _I N T分配股利㊁利润或偿付利息支付的现金分配股利或利润产生的现金流量I N V E S T _R E A L _E S T A T E 投资性房地产为赚取租金或资本升值的房地产L T _E Q U I T Y _I N V E S T 长期股权投资通过投资取得被投资单位的股份T _E Q U I T Y _A T T R _P 归属于母公司所有者权益合计所有者权益中归属于母公司的部分O T H _P A Y A B L E其他应付款与主营业务没有直接款项2.3 模型验证本文针对各行业特征数据,比较各行业在不同模型上的准确率㊁召回率与受试者特征曲线(r e c e i v e ro p e r a t i n g ch a r a c t e r i s t i c c u r v e ,R O C )下方的面积(a r e a u n d e r t h e c u r v e o fR O C ,A U C )发现,S VM 算法在各行业的不同指标上均表现良好㊂由于行业指标数据不同,S VM 算法在不同行业有不同的参数取值㊂其中:参数核函数K e r n e l 表示数据分布的差异;参数C 代表S VM 算法的惩罚系数,即调节间隔大小和分类准确度的权重,也可以理解为对误差的容忍度;参数g a mm a 决定了数据映射到新特征空间的分布㊂最终各个行业的模型选择与模型参数调节情况见表3㊂表3 各行业参数选择结果T a b l e3 S e l e c t i o n r e s u l t s o f pa r a m e t e r s f o r v a r i o u s i n d u s t r i e s 行业名称核函数K e r n e l参数C 参数g a mm a准确率制造业r b f 3.20.400.888信息软件技术业r b f 3.00.020.858批发和零售业l i n e a r3.30.880其他行业r b f4.01.500.884为进一步提升模型总体识别水平,将模型第1层的输出与全行业财务数据异常指标拼接作为第2层模型L i g h t G B M 的输入㊂L i g h t G B M 模型涉及参数较多,主要通过学习率(l e a r n i n g _r a t e )㊁B o o s t i n g 的迭代次数(n _e s t i m a t o r s )㊁决策树最大深度(m a x _d e pt h )㊁叶子结点数量(n u m _l e a v e s )等参数控制模型最终水平[13]㊂构建L i gh t G B M 模型时,考虑到模型的稳定性与限制过拟合,使用网格搜索进行模型参数的限制与调整㊂最终模型的参数设置为l e a r n i n g _r a t e =0.03,n _e s t i m a t o r s =160,m a x _d e pt h =6,n u m _l e a v e s 764第5期 邵永运,等:基于S VM -L i g h t G B M 算法的上市公司财务数据异常识别模型图3 模型的R O C 曲线F i g.3 R O Cc u r v eo f t h em o d e l =22㊂R O C 曲线纵坐标代表真正率,横坐标代表假正率,曲线越接近左上角说明模型分类效果越好㊂A U C 值是R O C 曲线的量化反映形式,表示模型的识别能力㊂模型最终的R O C 曲线如图3所示㊂由图3可知,R O C 曲线为凸曲线,A U C 取值为0.9807,说明模型性能优秀㊂R F 算法㊁L R 算法㊁S VM 算法与本文构建的S VM -L i g h t G B M 模型在分类数据上的准确率㊁召回率㊁F 1值与A U C 面积值的比对结果见表4㊂由表4可知,与R F 算法㊁L R 算法和S VM 算法相比较,S VM -L i gh t G B M 模型总体得分较好㊂财务数据异常的识别核心就是识别样本中的异常少数类,而在表示捕捉少数类的指标召回率上,该模型取得了0.954的分值,表明模型对财务数据异常的捕捉能力优秀㊂表4 各算法结果对比T a b l e4 C o m p a r i s o no f a l go r i t h mr e s u l t s 模型名称准确率召回率F 1A U C 值R F 算法0.8970.6830.8110.890L R 算法0.7270.7670.7380.770S VM 算法0.9010.8940.8860.884S VM -L i gh t G B M 算法0.9120.9540.9230.9803 结 语本文对不同行业及全行业的财务异常指标进行选取,使用不同的机器学习算法进行计算,选定S VM 算法与L i gh t G B M 模型分别作为财务数据异常识别的第1层和第2层模型㊂结果显示,S VM -L i gh t G B M 模型在上市公司财务异常的分类识别上表现优秀,验证了二层模型的可行性㊂模型的选择很大程度决定了最终结果的输出,可以考虑在第1层模型中使用更加复杂的模型㊂参考文献:[1]‘中国经济周刊“采制中心.2021年上市公司总营收占G D P 总额一半以上[J ].中国经济周刊,2022(9):7.[2]李乔宇.A 股2021年成绩单:4669家上市公司营收撑起G D P 半边天 [N ].证券日报,20220505(A 01).[3]彭润亚,王哲.剖析财务造假的手段及防范措施[J ].农村经济与科技,2017,28(14):104.[4]陈翠艳.A 股上市公司财务造假问题研究[D ].郑州:郑州大学,2021.[5]王兴玲,李占斌.基于网格搜索的支持向量机核函数参数的确定[J ].中国海洋大学学报(自然科学版),2005,35(5):859862.[6]王国胜.支持向量机的理论与算法研究[D ].北京:北京邮电大学,2007.[7]R E D D Y RR ,R AMA D E V IY ,S U N I T HA K V N.A n o m a l y d e t e c t i o nu s i n g fe a t u r e s e l e c t i o na n dS VM k e r n e l t r i c k [J ].I J C A ,2015,129(4):3135.[8]S I N G H K R ,N E E T HU K P ,MA D HU R E K A A K ,e ta l .P a r a l l e lS VM m o d e lf o r f o r e s t f i r e p r e d i c t i o n [J ].S o f tC o m p u tL e t t ,2021,3:100014.[9]王华勇,杨超,唐华.基于L i g h t G B M 改进的G BD T 短期负荷预测研究[J ].自动化仪表,2018,39(9):7678,82.[10]卢锦玲,郭鲁豫,张梦雪,等.基于MG S -L G B M 算法的电力系统暂态稳定评估[J ].电力科学与工程,2020,36(3):5260.[11]王思宇,陈建平.基于L i g h t G B M 算法的信用风险评估模型研究[J ].软件导刊,2019,18(10):1922.[12]仲姝锜.基于机器学习的数据预处理框架研究[D ].西安:西安工业大学,2021.[13]Z HA N GC ,L E IXJ ,L I UL .P r e d i c t i n g m e t a b o l i t e -d i s e a s e a s s o c i a t i o n s b a s e do nL i g h t G B M m o d e l [J ].F r o n tG e n e t ,2021,12:660275.864沈阳师范大学学报(自然科学版) 第41卷。

基于改进SVM模型的财务信息共享研究

基于改进SVM模型的财务信息共享研究

基于改进SVM模型的财务信息共享研究
林海巍;李荣
【期刊名称】《现代科学仪器》
【年(卷),期】2022(39)3
【摘要】针对财务信息正常与不正常样本数据集不平衡的问题,研究提出一种基于改进SVM的财务信息预警共享模型。

首先,采用相关性检验法对财务信息初始特征进行检验,并确定了财务信息的重要特征;然后,采用改进的SVM算法构建了财务信息预警共享模型;最后,通过仿真实验验证了算法的可行性和有效性。

结果表明,本研究提出的基于改进SVM算法的财务信息预警共享模型,对训练集样本分类正确率从91.46%,对测试集样本分类正确率为87.83%,相较于标准SVM算法和基于人工合成模型,本研究算法具有一定的优越性,可对财务信息进行准确分类。

【总页数】5页(P219-223)
【作者】林海巍;李荣
【作者单位】首都医科大学附属北京世纪坛医院;北京亿寻科技有限公司
【正文语种】中文
【中图分类】F234.4
【相关文献】
1.基于SID改进模型的信息安全数据资源共享研究
2.基于ODR-ADASYN-SVM 模型的高新技术企业财务危机预警研究
3.基于改进的PSO算法LS—SVM模型的短期电力负荷预测模型的研究
4.探究基于财务共享服务模式的企业管理会计信息
化改进策略5.管理层语调视角下的上市公司财务风险预警——基于FA-SVM模型的研究
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一种基于SVM的企业财务状况分析模型【摘要】在分析企业的财务失败情况时,本文在最优特征子集的基础上提出基于支持向量机的SVM-Z分数模型,并通过实验表明SVM-Z分数模型能够在一定程度上反映财务的状况,具有Z分数模型的一些优点。

一、引言由于Z值的大小与其信用级别具有很强的相关性,Z 值能有效识别公司的信用级别。

随着Z分数模型的商业化,广泛运用于企业信用风险的分析和评级。

各国的金融机构都纷纷开发了各自的Z值多元判别模型,基于不同考虑和侧重点,使用不同财务指标作为判别公式的变量,新的Z分数判别公式层出不穷。

如何找到更有代表性的财务指标、更准确地反映企业财务状况,是众多金融界学者的研究方向之一。

本文从特征选择的角度,在这方面作了尝试,并根据SVM 在用于股票分类中的特点,提出了svm-Z分数模型,通过实验验证svm-Z和Z 一样具有反映财务状况好坏以及趋势的能力。

二、SVM理论概述SVM方法是从线性可分情况下的最优分类面发展而来的,所谓最优分类面就是要求分类而且不但能将两类样本正确分开,并可使分类间隔最大。

假定训练数据:可以被一个最优分类超平面三、Z分数模型方法率先将多元判别分析法应用于财务危机、公司破产及违约风险分析的开拓者是美国的爱德华·阿尔特曼博士。

他早在1968年发现Z值能有效识别公司的信用级别,从而开发出Z分数信用评级模型,建立了著名的5变量Z-score。

近年来,在有关信用评级模型的研究方面,国内的一些学者在多元判别模型领域做了大量的研究,取得了很多成果,为我国信用评级模型的最终建立和完善奠定了基础。

信用评分法的基本思想是,财务指标反映了企业的信用状况,通过对企业主要财务指标的分析和模拟,可以预测企业破产的可能性,从而预测企业的信用风险。

比较著名的是Altman的Z分数模型。

其中根据主要适用于上市公司、非上市公司、非制造企业分别有三个类似公式,下面仅列出一个。

Z=6.56X1+3.26X2+6.72X3+1.05X4(2)X1=(流动资产-流动负债)/资产总额X2=未分配利润/资产总额X3=(利润总额+折旧+摊销+利息支出)/资产总额X4=所有者权益/负债总额根据公式(2)得到的Z值越低,表示企业越可能发生破产,面临的风险越大。

相反,Z值越大,表示企业的财务状况、经营状况良好,发生破产的可能性越小。

各行业可以通过Z值来确定本行业的财务状况;如果Z值小于a时,则表明企业正处于破产的边缘;如果Z值在a-b之间,则表明企业的财务及经营极不稳定,被称为“灰色地带”。

Altman认为,根据上述公式计算的Z值,如果Z小于1.23,即a=1.23时,风险很大;Z大于2.9,即b=2.9时,风险较小。

根据z值分成的三个区间,可将企业信用等级评为好、中、差三个等级,这就是z分数模型用于信用评级的原理。

对于不同z分数模型,根据实践中的经验将z值分为不同区间,可产生更多基于z分数模型的信用模型。

Altman在前面的基础上又建立了第二代模型,称为ZETA信用风险模型。

新的变量主要有7个,即资产报酬率、收入的稳定性、利息倍数、负债比率、流动比率、资本化比率、规模等。

在此基础上基于不同的考虑和侧重点,出现了更多形式的Z值模型。

根据在金融领域考虑的侧重点不同,新的公式层出不穷,在特定情况下均有较好的效果,可以看出:多元判别分析法就是从若干表明观测对象特征的变量值中筛选出能提供较多信息的变量并建立判别方程,使推导出的判别方程对观测样本分类时的错判率最小,其判别方程具有如下形式:提出新的z分数模型的目的就是为了找到尽可能少的财务指标X1,X2…XN,并确定对应的系数,使其对观测样本具有最小的错判率。

四、特征选择本文拟从特征选择的角度,不考虑金融领域的专业知识,找出最适合样本集的特征即财务指标。

采用常见Z分数模型的特征作为原始的特征集,如表1所示。

训练集和预测集分别选择2000年和2001年沪深股市的年报数据,数据集根据是否为ST股票分为两类,0(ST股票)和1(非ST股票),特征选择算法采用基于线性最小二乘拟合判别函数的特征选择算法的方法。

它的优点在于利用了SVM参数表达的线性关系,可以方便地利用线性最小二乘算法拟合判别函数,并对各特征值的重要性进行估计,避免了求解各候选特征子集对应的SVM预测函数导致的大量二次规划问题。

特征选择后表明,保留6个特征,即第1、2、3、5、6、8个特征时具有最低的误分率5.188%。

说明通过特征选择,找到了对于特定的数据集,用SVM预测时误分率最小的特征子集,将训练集的最优特征子集重新用SVM进行训练,得到用于下一步实验的预测公式。

显然预测结果依赖于从训练数据集中得到的支持向量,拉格朗日系数ai、系数b和选择的预测数据集。

五、svm-Z模型当g(x)>0时,f(x)=sign[g(x)] 的输出为1,表明对应的个股非ST股票,具有较好的财务状况,当g(x)≤0时,SVM将其归为财务状况较差的一类。

在分类精度较高的情况下,g(x)的正负能够间接地反映公司财务状况的好坏。

另外,当g(x)=0.01和3时虽然SVM均将其归为一类,但显然前者极不稳定,当某个变量发生微小变化时,g(x)就可能成为负值,被分到财务状况较差的一类。

所以很容易联想到:g(x)越大,财务状况越好,越容易被分到财务非失败组;而g(x)越小,财务状况越差,越容易被分到财务失败组。

也就是说不但g(x)的正负可以反映公司财务状况的好坏,而且其大小也可以反映公司财务状况的相对好坏。

另外,如果该假设成立的话,g(x)还有如下优点:f(x)只能输出0和1,而g(x)的输出为任意实数,可以揭示出二个相似样本集的微弱差别,在线性最小二乘算法拟合判别函数中,基于类似考虑,将作为判别函数,用来判断候选特征子集的预测误差,而不是选择和误分率的方法来进行特征选择,由于对g(x)假设的性质非常类似Z分数模型中的Z分数值:输出为实数,其正负值和大小可以反映公司财务状况的相对好坏,所以用svm-Z代替g(x),使该变量名字与它的性质相符合,故公式(5)变为:六、实验仿真为了验证个股的svm-Z值与该股的财务状况具有一定相关性,选择两组样本集A、B,财务变量选择找到的最优特征子集。

样本集A:从沪深股市中随机挑选8支个股,财务数据取自从2001年到2004年的中报和年报。

特点:由于各种原因财务数据持续恶化,在2001-2004年期间从非ST股转为ST股。

样本集B:从沪深股市中随机挑选8支个股,财务数据取自从2001年到2004年的中报和年报。

特点:由于财务数据持续好转,在2001-2004年期间从ST股转为非ST股。

根据前面实验的预测公式(6),求出样本集A、B的svm-Z值,列入下表,为了使图形简洁,在表中只列出每年年末的svm-Z值,在文中需要详细分析的地方再加上年中的svm-Z值。

由于股市年末数据是个股一年财务情况的汇总,证券分析人员常将年末财务数据作为重要的参考资料,故舍去年中Z值不失一般性。

为了使图示简洁明了,仅在趋势图中列出前六只个股的示意图,余下的二只均具有类似图中的趋势。

图1中显示在财务状况出现恶化的样本集A,各个样本的svm-Z值均出现不同程度的下降,9支股票中有8只个股的svm-Z值最后均下降到0轴以下,成为负值,能够被正确分类,表明svm-Z值可以反映公司财务状况的恶化情况。

剩下一只个股600737直到2004年2007月26日成为ST股票,其svm-Z值仍大于0,属于误分样本。

Svm-Z值的正负可以反映公司财务状况的好坏,当公司财务状况正常时,根据前面对SVM理论阐述,以及训练集的特性,svm-Z值应为正值;反之,当公司财务状况异常或恶化成为ST股时,svm-Z值应为负值。

财务状况的变化包括公司财务状况由正常转为失败,或由失败转为正常。

此处简要统计一下svm-Z值提前指示出财务状况变化的能力。

通过前面的实验可知,svm-Z值的变化和财务状况的变化有相关性,但是否个股在ST和非ST状态之间变化时,对应的svm-Z值恰好穿过0轴成为正值或负值呢?根据svm理论和公式(5)的结构,应该说svm-Z值的正负临界值准时指示个股状态的转变正是svm-Z值提出的初衷之一。

通过对样本A、B 的统计如下:通过表2发现,svm-Z值对个股财务状况具有一定的预测能力。

比如样本集A中有5只股票在成为ST股时,对应的svm-Z值己提前一年左右进入0轴以下,发出示警信号,具有一定的预测作用,在股市实践中可以作为投资的参考;有3只股票准时指示出财务状况的变化;有1只股票属于误分在成为ST股时,其svm-Z值仍为正值。

七、结论Svm-Z分数模型在一定程度上能够反映甚至提前指示出公司的财务状况变化情况。

通过实验表明,当财务状况好转时,svm-Z值上升,当财务状况保持较好水平时,svm-Z值持续维持在较高的值,反之亦然。

可以在此基础上,作为证券投资的依据,选择未来svm-Z值最有可能上升的个股,进而转化为预测svm-Z值的研究,或排除未来svm-Z可能下降的个股以降低投资风险。

虽然有上述优点,但由于svm-Z和x是非线性关系,svm-Z模型不能简单地代替Z分数模型进行信用评级。

另外,svm-Z模型训练过程是解决一个耗时的二次规划问题,当训练样本较大时将占用更多的时间。

影响svm应用的一个主要原因就是训练时间过长,当样本数目很大时,存储该函数矩阵需要大量内存。

同时,svm在二次型寻优过程中要进行大量矩阵运算,使得算法收敛速度慢,svm方法的训练速度是限制它的广泛应用的主要原因,这也是影响svm-Z模型应用的另一个因素。

本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。

相关文档
最新文档