数据挖掘在江苏省中小企业融资途径选择中的应用
来源:网络 时间:2017-07-01 00:40:00
摘要:本文以江苏省中小企业为研究对象,调查其成功融资的融资途径,样本涉及江苏省的南京、常州、南通、连云港、盐城、淮安等多个城市的中小企业。在对大量调查数据进行分析处理的基础上,运用数据挖掘中的Apriori算法,找出不同融资途径间的关联规则,从而为政府部门以及中小企业的相关决策提供支持。
关键词:企业融资 关联分析 Apriori算法
1 背景介绍
在我国,中小企业是国民经济最活跃的主体,被称为中国经济的生力军。在江苏省,中小企业的重要性则更为突出。江苏省中小企业在拉动GDP,推动社会经济发展,促进就业等繁忙都作出了巨大的贡献。然而,中小企业在发展过程中却面临着各种困难,在面临人民币升值,金融危机等一系列问题下的中小企业生存更是艰辛。其中首要的瓶颈便是融资问题。在我国,按照现有的有关贷款通则以及相关规定,对中小企业的贷款问题限制的比较严格。本文选取了37个成功融资的中小企业,采用数据挖掘中的Apriori算法,对这些中小企业融资途径进行关联分析,找到合适的融资途径组合。
2 关联规则及Apriori算法
2.1 关联规则
关联规则挖掘用于寻找给定数据集中数据项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系,根据所挖掘的关联关系,可以从一个数据对象的信息来推断另一个数据对象的信息。关联规则的挖掘通过规则的支持度和置信度进行度量,这两种度量反映了所发现规则的有用性和确定性。
定义1:设D是事务集,A,B为项集,且有规则A=>B。如果D中,包含A·B事务所占比例为s%,称A=>B有支持度s。
定义2:设D是事务集,A,B为项集,且有规则A=>B。如果D中,c%的事务包含A的同时也包含B,则称A=>B有置信度c。
定义3:设D是事务集,A,B为项集,若A=>B满足置信度c和支持度s,则称A=>B为关联规则。
定义4:对关联规则A=>B,若同时满足最小支持度阀值和最小置信度阀值,则称其为强规则。
关联规则挖掘的过程分为两个步骤。第一步,发现所有的大项目集,即支持度大于给定最小支持度阀值的项集;第二步,从大的项集中产生关联规则。
2.2 Apriori算法
对于Ck中的任一项集c,若c得任一k-1子集在Lk-1中不存在,则将c从Ck中删除。算法的下一步是对数据库进行检索,得到Ck中的项集的支持度,与最小支持度进行比较,从而得到Lk。它由Ck中的一部分项集组成,条件是它们的支持度不小于最小支持度。
3 Apriori算法在中小企业融资途径选择中的应用
由于证券市场门槛高,创业投资体制不健全,公司债发行的准入障碍,中小企业难以通过资本市场公开筹集资金,因此造成了中小企业融资渠道过于狭窄的现状。一般说来,中小企业融资有以下几种方式:①银行贷款;②信用社贷款;③担保机构贷款:④内部职工集资;⑤民间借款;⑥拖欠贷款;⑦亲朋借款;⑧租赁
本文以江苏省中小企业为研究对象开展调查,样本涉及江苏省的南京、常州、南通、连云港、盐城、淮安等多个城市的中小企业。在对大量调查数据进行分析处理后,选择37个成功融资的中小企业作为原始事务集,并将融资渠道分为8种,作为8种项集
首先扫描数据库,识别所有单个项(1-项集)和它们的支持度,建立候选1-项集C1
假定最小支持度(min_sup)s=10%(至少在3个事务中),选择1-项集的支持度大于或等于(min_sup)s的项,建立频繁1-项集,并记作L1
假定最小支持度为至少在2个事务中,选择2-项集的支持度大于或等于(min_sup)s的项,建立频繁2-项集,并记作L2
重复以上过程,建立候选3-项集C3和频繁3-项集L3
这时,由于C4为空集,停止Apriori算法。频繁项集为L=L1∪L2∪L3。
若企业融资的途径多于一种,则通过以上频繁项集可以推导出强规则,即最佳融资途径组合。
考虑频繁3-项集{1,2,3},由于这三种途径频繁地一起使用,我们可以从这个3-项集推导出一些规则。
首先,得到非空真子集:{1},{2},{3},{1,2},{1,3},{2,3}。
然后,对于每个子集,形成如下规则,并计算置信度:
R1∶{1}→{2,3}, 2/26=1/13
R2∶{2}→{1,3}, 2/11
R3∶{3}→{1,2}, 2/4=1/2
R4∶{1,2}→{3}, 2/7
R5∶{1,3}→{2}, 2/3
R6∶{2,3}→{1}, 2/3
令min_conf为50%,选取R3、R5、R6为强规则。
用相同的方法计算频繁2-项集,还可以得到以下四个强规则: 4 挖掘结果分析
从Apriori算法计算后得到的挖掘结果显示以下规则:
规则一:江苏省中小企业在融资时若只选择一种融资方式,则向银行贷款或者向信用社贷款是最有可能成功的融资途径。
规则二:如果中小企业选择两种融资途径,则有七种融资组合具有较高的成功率,即{银行贷款,信用社贷款},{银行贷款,担保机构贷款},{银行贷款,内部职工集资},{银行贷款,拖欠贷款},{银行贷款,亲朋借款},{信用社贷款,担保机构贷款},{民间借款,亲朋借款}。
规则三:如果中小企业选择两种以上的融资途径来保证借贷的成功率,则只有一种融资组合具有较高的成功率,即{银行贷款,信用社贷款,担保机构贷款}。
规则四:如果中小企业希望通过信用社贷款,则同时再向银行借款,成功的可能性比仅仅选择信用社贷款更大。如果希望通过担保机构借到资金,则同时再向银行或信用社进行借贷,这样的成功几率更高。
规则五:对于成功借贷的中小企业来说,民间借款和向亲朋借款通常是同时进行的。即如果企业已经选择了民间借款这种途径,则再向亲朋借款的可能性非常大。同样的,如果企业选择了向亲朋借款,则很有可能会寻找其他的民间借款途径。
规则六:企业如果希望仅仅通过担保机构贷款,而不选择其他的途径,这样的风险是相当大的。如果同时再向银行以及信用社进行借款,将会大大降低风险,提高借贷的成功率。
通过对关联规则的分析,可以清楚地看到,如果中小企业希望成功地从社会融资,融资途径的选择非常重要。通过对八种不同的融资途径的分析,发现像银行贷款成功的可能性最高。但是,由于贷款交易和监控成本高等原因,银行不愿对中小企业放贷。同时,中小企业因资信等级低,缺乏抵押资产,融资成本高等原因,难以得到银行资金支持。因此,中小企业必须考虑两种及两种以上的融资途径。从Apriori算法计算后得到的挖掘结果显示,{银行贷款,信用社贷款},{银行贷款,担保机构贷款},{银行贷款,内部职工集资},{银行贷款,拖欠贷款},{银行贷款,亲朋借款},{信用社贷款,担保机构贷款},{民间借款,亲朋借款}以及{银行贷款,信用社贷款,担保机构贷款}是常见的融资途径组合。其中,{信用社贷款,担保机构贷款},{银行贷款,信用社贷款}成功的可能性最高。并且,仅仅通过担保机构贷款得成功率很低,但如果与向银行和信用社贷款相结合,将会大大提高成功率。
由于中小企业的融资渠道过于集中于商业银行,获得资金来源的渠道过于单一,所以通过本文数据挖掘的结论,一些中小企业可以改变原有的融资方式,寻找其他的途径。
在中小企业融资途径中应用数据挖掘具有决策指导意义,它可以分析企业的融资趋势,挖掘潜在途径,提高企业融资的成功率。
参考文献:
[1]焦李成,刘芳等.智能数据挖掘与知识发现.西安电子科技大学出版社,2006:431~433.
[2]K.P.Soman Diwakar V.Ajay. 数据挖掘基础教程.北京:机械工业出版社,2009:120~127.
[3]朱德利1SQL Server 2005 数据挖掘与商业智能完全解决方案[M].北京:电子工业出版社,2007:367~3681.
关键词:企业融资 关联分析 Apriori算法
1 背景介绍
在我国,中小企业是国民经济最活跃的主体,被称为中国经济的生力军。在江苏省,中小企业的重要性则更为突出。江苏省中小企业在拉动GDP,推动社会经济发展,促进就业等繁忙都作出了巨大的贡献。然而,中小企业在发展过程中却面临着各种困难,在面临人民币升值,金融危机等一系列问题下的中小企业生存更是艰辛。其中首要的瓶颈便是融资问题。在我国,按照现有的有关贷款通则以及相关规定,对中小企业的贷款问题限制的比较严格。本文选取了37个成功融资的中小企业,采用数据挖掘中的Apriori算法,对这些中小企业融资途径进行关联分析,找到合适的融资途径组合。
2 关联规则及Apriori算法
2.1 关联规则
关联规则挖掘用于寻找给定数据集中数据项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系,根据所挖掘的关联关系,可以从一个数据对象的信息来推断另一个数据对象的信息。关联规则的挖掘通过规则的支持度和置信度进行度量,这两种度量反映了所发现规则的有用性和确定性。
定义1:设D是事务集,A,B为项集,且有规则A=>B。如果D中,包含A·B事务所占比例为s%,称A=>B有支持度s。
定义2:设D是事务集,A,B为项集,且有规则A=>B。如果D中,c%的事务包含A的同时也包含B,则称A=>B有置信度c。
定义3:设D是事务集,A,B为项集,若A=>B满足置信度c和支持度s,则称A=>B为关联规则。
定义4:对关联规则A=>B,若同时满足最小支持度阀值和最小置信度阀值,则称其为强规则。
关联规则挖掘的过程分为两个步骤。第一步,发现所有的大项目集,即支持度大于给定最小支持度阀值的项集;第二步,从大的项集中产生关联规则。
2.2 Apriori算法
对于Ck中的任一项集c,若c得任一k-1子集在Lk-1中不存在,则将c从Ck中删除。算法的下一步是对数据库进行检索,得到Ck中的项集的支持度,与最小支持度进行比较,从而得到Lk。它由Ck中的一部分项集组成,条件是它们的支持度不小于最小支持度。
3 Apriori算法在中小企业融资途径选择中的应用
由于证券市场门槛高,创业投资体制不健全,公司债发行的准入障碍,中小企业难以通过资本市场公开筹集资金,因此造成了中小企业融资渠道过于狭窄的现状。一般说来,中小企业融资有以下几种方式:①银行贷款;②信用社贷款;③担保机构贷款:④内部职工集资;⑤民间借款;⑥拖欠贷款;⑦亲朋借款;⑧租赁
本文以江苏省中小企业为研究对象开展调查,样本涉及江苏省的南京、常州、南通、连云港、盐城、淮安等多个城市的中小企业。在对大量调查数据进行分析处理后,选择37个成功融资的中小企业作为原始事务集,并将融资渠道分为8种,作为8种项集
首先扫描数据库,识别所有单个项(1-项集)和它们的支持度,建立候选1-项集C1
假定最小支持度(min_sup)s=10%(至少在3个事务中),选择1-项集的支持度大于或等于(min_sup)s的项,建立频繁1-项集,并记作L1
假定最小支持度为至少在2个事务中,选择2-项集的支持度大于或等于(min_sup)s的项,建立频繁2-项集,并记作L2
重复以上过程,建立候选3-项集C3和频繁3-项集L3
这时,由于C4为空集,停止Apriori算法。频繁项集为L=L1∪L2∪L3。
若企业融资的途径多于一种,则通过以上频繁项集可以推导出强规则,即最佳融资途径组合。
考虑频繁3-项集{1,2,3},由于这三种途径频繁地一起使用,我们可以从这个3-项集推导出一些规则。
首先,得到非空真子集:{1},{2},{3},{1,2},{1,3},{2,3}。
然后,对于每个子集,形成如下规则,并计算置信度:
R1∶{1}→{2,3}, 2/26=1/13
R2∶{2}→{1,3}, 2/11
R3∶{3}→{1,2}, 2/4=1/2
R4∶{1,2}→{3}, 2/7
R5∶{1,3}→{2}, 2/3
R6∶{2,3}→{1}, 2/3
令min_conf为50%,选取R3、R5、R6为强规则。
用相同的方法计算频繁2-项集,还可以得到以下四个强规则: 4 挖掘结果分析
从Apriori算法计算后得到的挖掘结果显示以下规则:
规则一:江苏省中小企业在融资时若只选择一种融资方式,则向银行贷款或者向信用社贷款是最有可能成功的融资途径。
规则二:如果中小企业选择两种融资途径,则有七种融资组合具有较高的成功率,即{银行贷款,信用社贷款},{银行贷款,担保机构贷款},{银行贷款,内部职工集资},{银行贷款,拖欠贷款},{银行贷款,亲朋借款},{信用社贷款,担保机构贷款},{民间借款,亲朋借款}。
规则三:如果中小企业选择两种以上的融资途径来保证借贷的成功率,则只有一种融资组合具有较高的成功率,即{银行贷款,信用社贷款,担保机构贷款}。
规则四:如果中小企业希望通过信用社贷款,则同时再向银行借款,成功的可能性比仅仅选择信用社贷款更大。如果希望通过担保机构借到资金,则同时再向银行或信用社进行借贷,这样的成功几率更高。
规则五:对于成功借贷的中小企业来说,民间借款和向亲朋借款通常是同时进行的。即如果企业已经选择了民间借款这种途径,则再向亲朋借款的可能性非常大。同样的,如果企业选择了向亲朋借款,则很有可能会寻找其他的民间借款途径。
规则六:企业如果希望仅仅通过担保机构贷款,而不选择其他的途径,这样的风险是相当大的。如果同时再向银行以及信用社进行借款,将会大大降低风险,提高借贷的成功率。
通过对关联规则的分析,可以清楚地看到,如果中小企业希望成功地从社会融资,融资途径的选择非常重要。通过对八种不同的融资途径的分析,发现像银行贷款成功的可能性最高。但是,由于贷款交易和监控成本高等原因,银行不愿对中小企业放贷。同时,中小企业因资信等级低,缺乏抵押资产,融资成本高等原因,难以得到银行资金支持。因此,中小企业必须考虑两种及两种以上的融资途径。从Apriori算法计算后得到的挖掘结果显示,{银行贷款,信用社贷款},{银行贷款,担保机构贷款},{银行贷款,内部职工集资},{银行贷款,拖欠贷款},{银行贷款,亲朋借款},{信用社贷款,担保机构贷款},{民间借款,亲朋借款}以及{银行贷款,信用社贷款,担保机构贷款}是常见的融资途径组合。其中,{信用社贷款,担保机构贷款},{银行贷款,信用社贷款}成功的可能性最高。并且,仅仅通过担保机构贷款得成功率很低,但如果与向银行和信用社贷款相结合,将会大大提高成功率。
由于中小企业的融资渠道过于集中于商业银行,获得资金来源的渠道过于单一,所以通过本文数据挖掘的结论,一些中小企业可以改变原有的融资方式,寻找其他的途径。
在中小企业融资途径中应用数据挖掘具有决策指导意义,它可以分析企业的融资趋势,挖掘潜在途径,提高企业融资的成功率。
参考文献:
[1]焦李成,刘芳等.智能数据挖掘与知识发现.西安电子科技大学出版社,2006:431~433.
[2]K.P.Soman Diwakar V.Ajay. 数据挖掘基础教程.北京:机械工业出版社,2009:120~127.
[3]朱德利1SQL Server 2005 数据挖掘与商业智能完全解决方案[M].北京:电子工业出版社,2007:367~3681.
相关论文
最新论文
热点论文
- [中等教育] 职专政治教育中的德育渗透
- 帮助学生树立正确的价值观和人生观,提升学生的个人品德与思想素质,是职专政治教育的主要目标与根本目的。但受限于传统政治教育的教学 [全文]
- [中国哲学] 传递“中国梦”正能量是记者的神圣使命
- 摘要:中国梦是中华民族伟大复兴的梦,是当今中华民族前进的动力,是当前中国最具影响力、最具感染力、最具普遍性的正能量。记者作为以 [全文]
- [财务控制] 论企业集团财务控制的对策
- 摘 要:市场经济飞速发展促使企业集团组织形式发生非常大的变化,那么企业集团需要有效利用自身发展优势,促进现代化经济发展。 改革逐渐 [全文]
- [财务控制] 中小企业的财务控制问题分析
- 摘 要:随着市场经济体制不断完善,我国中小企业进入快速发展阶段,其在国民经济发展中的作用被不断凸显出来。本文中笔者以中小企业财务管 [全文]
- [职业教育] 分析音乐课堂中的情感互动及学生体验
- 【摘要】针对音乐课堂中的情感互动及学生体验进行分析,基于学生的实际音乐学习需求、音乐学习目标等予以教学设计,以期能够不断提升音 [全文]
- [市场营销] 新时期下市场营销的演变趋势分析
- 摘要:随着全球经济互相影响,新市场格局的形成让新时期环境里市场营销不断发生变革。而本文主要是对当今市场新形势进行一个分析,找出对市 [全文]
- [国际贸易] 国际贸易融资创新及风险控制
- [摘 要] 国际贸易企业融资风险的主要表现有两种:一是国际贸易企业无法以自身的流动资金偿还债务,要通过集资的方式偿还债务本金和利息; [全文]
- [国际贸易] “互联网 +”时代下国际贸易发展策略研究
- 摘 要:随着网络技术和经济全球化的进一步发展,互联网关系到国际贸易领域的方方面面,并以全新的国际贸易形态,将分散在世界各地的市场, [全文]