数据挖掘在江苏省中小企业融资途径选择中的应用

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据挖掘在江苏省中小企业融资途径选择中的应用

摘要:本文以江苏省中小企业为研究对象,调查其成功融资的融资途径,样本

涉及江苏省的南京、常州、南通、连云港、盐城、淮安等多个城市的中小企业。

在对大量调查数据进行分析处理的基础上,运用数据挖掘中的Apriori算法,找出

不同融资途径间的关联规则,从而为政府部门以及中小企业的相关决策提供支持。关键词:企业融资关联分析 Apriori算法

1 背景介绍

在我国,中小企业是国民经济最活跃的主体,被称为中国经济的生力军。在

江苏省,中小企业的重要性则更为突出。江苏省中小企业在拉动GDP,推动社会

经济发展,促进就业等繁忙都作出了巨大的贡献。然而,中小企业在发展过程中

却面临着各种困难,在面临人民币升值,金融危机等一系列问题下的中小企业生

存更是艰辛。其中首要的瓶颈便是融资问题。在我国,按照现有的有关贷款通则

以及相关规定,对中小企业的贷款问题限制的比较严格。本文选取了37个成功

融资的中小企业,采用数据挖掘中的Apriori算法,对这些中小企业融资途径进行

关联分析,找到合适的融资途径组合。

2 关联规则及Apriori算法

2.1 关联规则

关联规则挖掘用于寻找给定数据集中数据项之间的有趣的关联或相关关系。

关联规则揭示了数据项间的未知的依赖关系,根据所挖掘的关联关系,可以从一

个数据对象的信息来推断另一个数据对象的信息。关联规则的挖掘通过规则的支

持度和置信度进行度量,这两种度量反映了所发现规则的有用性和确定性。

定义1:设D是事务集,A,B为项集,且有规则A=>B。如果D中,包含A·B事务所占比例为s%,称A=>B有支持度s。

定义2:设D是事务集,A,B为项集,且有规则A=>B。如果D中,c%的事

务包含A的同时也包含B,则称A=>B有置信度c。

定义3:设D是事务集,A,B为项集,若A=>B满足置信度c和支持度s,

则称A=>B为关联规则。

定义4:对关联规则A=>B,若同时满足最小支持度阀值和最小置信度阀值,则称其为强规则。

关联规则挖掘的过程分为两个步骤。第一步,发现所有的大项目集,即支持

度大于给定最小支持度阀值的项集;第二步,从大的项集中产生关联规则。

2.2 Apriori算法

对于Ck中的任一项集c,若c得任一k-1子集在Lk-1中不存在,则将c从Ck

中删除。算法的下一步是对数据库进行检索,得到Ck中的项集的支持度,与最

小支持度进行比较,从而得到Lk。它由Ck中的一部分项集组成,条件是它们的

支持度不小于最小支持度。

3 Apriori算法在中小企业融资途径选择中的应用

由于证券市场门槛高,创业投资体制不健全,公司债发行的准入障碍,中小

企业难以通过资本市场公开筹集资金,因此造成了中小企业融资渠道过于狭窄的

现状。一般说来,中小企业融资有以下几种方式:①银行贷款;②信用社贷款;

③担保机构贷款:④内部职工集资;⑤民间借款;⑥拖欠贷款;⑦亲朋借款;

⑧租赁

本文以江苏省中小企业为研究对象开展调查,样本涉及江苏省的南京、常州、

南通、连云港、盐城、淮安等多个城市的中小企业。在对大量调查数据进行分析

处理后,选择37个成功融资的中小企业作为原始事务集,并将融资渠道分为8

种,作为8种项集

首先扫描数据库,识别所有单个项(1-项集)和它们的支持度,建立候选1-

项集C1

假定最小支持度(min_sup)s=10%(至少在3个事务中),选择1-项集的支

持度大于或等于(min_sup)s的项,建立频繁1-项集,并记作L1

假定最小支持度为至少在2个事务中,选择2-项集的支持度大于或等于

(min_sup)s的项,建立频繁2-项集,并记作L2

重复以上过程,建立候选3-项集C3和频繁3-项集L3

这时,由于C4为空集,停止Apriori算法。频繁项集为L=L1∪L2∪L3。

若企业融资的途径多于一种,则通过以上频繁项集可以推导出强规则,即最

佳融资途径组合。

考虑频繁3-项集{1,2,3},由于这三种途径频繁地一起使用,我们可以从这

个3-项集推导出一些规则。

首先,得到非空真子集:{1},{2},{3},{1,2},{1,3},{2,3}。

然后,对于每个子集,形成如下规则,并计算置信度:

R1∶{1}→{2,3}, 2/26=1/13

R2∶{2}→{1,3}, 2/11

R3∶{3}→{1,2}, 2/4=1/2

R4∶{1,2}→{3}, 2/7

R5∶{1,3}→{2}, 2/3

R6∶{2,3}→{1}, 2/3

令min_conf为50%,选取R3、R5、R6为强规则。

用相同的方法计算频繁2-项集,还可以得到以下四个强规则:

4 挖掘结果分析

从Apriori算法计算后得到的挖掘结果显示以下规则:

规则一:江苏省中小企业在融资时若只选择一种融资方式,则向银行贷款或

者向信用社贷款是最有可能成功的融资途径。

规则二:如果中小企业选择两种融资途径,则有七种融资组合具有较高的成

功率,即{银行贷款,信用社贷款},{银行贷款,担保机构贷款},{银行贷款,内

部职工集资},{银行贷款,拖欠贷款},{银行贷款,亲朋借款},{信用社贷款,担

保机构贷款},{民间借款,亲朋借款}。

规则三:如果中小企业选择两种以上的融资途径来保证借贷的成功率,则只

有一种融资组合具有较高的成功率,即{银行贷款,信用社贷款,担保机构贷款}。

规则四:如果中小企业希望通过信用社贷款,则同时再向银行借款,成功的

可能性比仅仅选择信用社贷款更大。如果希望通过担保机构借到资金,则同时再

向银行或信用社进行借贷,这样的成功几率更高。

规则五:对于成功借贷的中小企业来说,民间借款和向亲朋借款通常是同时

进行的。即如果企业已经选择了民间借款这种途径,则再向亲朋借款的可能性非

常大。同样的,如果企业选择了向亲朋借款,则很有可能会寻找其他的民间借款

途径。

规则六:企业如果希望仅仅通过担保机构贷款,而不选择其他的途径,这样

的风险是相当大的。如果同时再向银行以及信用社进行借款,将会大大降低风险,

相关文档
最新文档