基于大数据个人征信的SWOT分析
陈小小 北京经济管理职业学院 基金项目:北京经济管理职业学院科研课题(19YBA39) 摘要:随着个人征信场景应用越来越广泛,大数据企业开始利用互联网技术探索新的征信评估标准,并逐渐寻找到独立于央行征信的新标准。大数据征信作为新生事物,给我们开拓了新思路,但也面对争议和挑战,本文运用SWOT 分析方法对大数据征信进行了分析,并提出发展建议,期待促进大数据征信健康发展。 关键词:大数据;征信;SWOT 一、大数据征信概述 大数据征信,就是将大数据技术应用到征信活动中,利用IT技术优势、风险控制模型等,将个人在不同信贷机构、消费场景、社会活动留痕的海量数据整合起来,经过数据清洗、分析、校验等一系列挖掘分析流程后,加工融合成评估分数,用于预测还款人的还款能力、还款意愿、欺诈风险以及其他评估场景,用于证明一个人或企业信用状况的一种活动。 (一)大数据征信的产生背景 本文认为,在过去的二十多年,伴随着我国经济体制改革,我国企业信贷体系由以大型企业为主要需求群体逐渐转变为中小微企业为贷款主力军,银行等大型金融企业贷款资金供应不足造成“中小微企业贷款融资难困境”,小微企业即使获得贷款资金,也由于竞争压力大、经营管理不善等原因导致贷款难还。另外,由于“信息不对称”和社会信用评价体系不完善,资金供给方无法很好评估小微企业的信贷风险,故采取回避小微企业贷款政策,形成“逆向选择”,小微企业融资难恶性循环。此时,如果有国家政策的支持,且资金方能设计出成本较低且能准确识别小微企业信用的评价体系,再辅以其他风控措施,小微企业贷款便可成为炙手可热的“香饽饽”。2013年3月国务院发布《征信业管理条例》,奠定我国征信法制建设的基石。2015年7月央行等十部门发布《关于促进互联网金融健康发展的指导意见》,提出推动信用基础设施建设,培育互联网金融配套服务体系,鼓励有条件的机构依法申请征信业务许可。同年7月,国务院又印发《促进大数据发展行动纲要》。同年9月,国务院办公厅又印发《关于运用大数据加强对市场主体服务和监管的若干意见》。这些法律、法规、条例及制度的制定无疑为大数据征信发展创造了良好的政策环境,再加上互联网技术给力,企业找到了解决问题的方法和途径,大数据征信便在这种背景下应运而生。 (二)大数据征信的数据来源 大数据征信是在传统征信的基础上,通过互联网技术等手段,获取了涉及电商、第三方机构、行业组织、中介机构等几十种信息,本文总结概括如下(图)。 图 大数据征信数据来源 二、大数据征信的SWOT分析 (一)大数据征信的优势(S) 较传统征信行业,大数据征信体现出5V、应用场景丰富、信用评估深化等优势。 首先,大数据征信具有数据量大(Volume)、种类多(Variety)、速度快(Velocity)、有价值(Value)、准确性(Veracity)的优势。大数据征信一个很主要的数据来源是互联网,互联网覆盖人群广、信息维度广、数据来源广,例如,房屋中介的租售房记录、电商平台消费记录、第三方平台缴费记录、社交平台留痕等多样化信息,不局限于传统征信,有效弥补征信体系的不足。同时,数据从内部交易信息获取或外部数据库接入等方式,成本较低,再加上取得的数据经过动态筛选、实时跟踪、数据清洗与加工,其信用结论更有时效性。其次,应用场景丰富。大数据征信应用场景不再仅用于传统的信贷等经济金融活动,还逐渐延伸到生活领域,例如,芝麻信用,应用于免押出行、免押住宿、信用申卡、信用借还物品、信用租车、共享充电宝等;考拉信用,凭借“考拉信用通行证”可应用于信用卡申请、投资理财、衣食住行等场景。第三,信用评估更深化全面。传统的信用评估体现在对现象的客观描述与反馈,体现的是表征。而大数据利用爬虫技术、机器学习等技术,记录事件发生的全过程,不仅了解对象,还分析对象,掌握对象运作规律,发掘对象内部的结构与特点,深挖信息背后隐藏的巨大价值。例如,就像看到一个人的表情,我们可以推测他的心理活动,进一步推测他的人生阅历、成长环境、家庭背景、生活习惯、社会关系等。 (二)大数据征信的劣势(W) 大数据征信毕竟是新兴事物,发展历史较短,和传统以央行为代表的相对成熟的征信体系相比较,显然存在一些不足。 首先,征信结论的权威性不如央行。大数据征信数据来源主要来自互联网,互联网企业大多采取爬虫技术获取或买入数据或接口获取征信数据,数据的真实准确性都有待考察,权威性远不如央行征信。其次,大数据征信的真实性、数据采取的维度、模型的适用性等不太理想。来自互联网的数据种类虽多、维度虽广、数据量虽大,但真实性却远不如银行等机构的数据。第三,大数据征信技术基础薄弱,专业人才储备不足。相比西方发达国家,我国征信业处于发展初期,且人才一般分为两类,一类是只懂技术不懂业务的IT人才,一类是只懂业务不懂技术的金融人才,且后者大部分是银行跳槽到征信企业,还惯用银行的风控模型,总体上缺乏既懂技术又懂业务的复合人才。 (三)大数据征信的机会(O) 首先,国家层面高度重视征信业发展。上世纪80年代我国政府开始初探信用评级制度,进入21世纪我国征信业得到快速发展,尤其是从2005年到2013年间,接连出台七部指导意见、办法、管理条例,可以说从国家层面得到前所未有的支持力度。其次,消费金融快速兴起,征信需求越来越大。我国经济增长模式由靠投资拉动逐渐转变为靠内需拉动,再衍生到消费金融,消费金融一个很重要的支撑点是征信,传统征信体系显然无法满足当前多元化需求,大数据征信则恰好站在了“风口”。互联网行业黄金十年发展为互联网征信提供了有力技术支撑。我国政府非常重视互联网基础设施投资,在投资的强度方面,增长速度在世界名列前茅。《中国互联网状况》白皮书介绍,1997年至2009年,全国共完成互联网基础设施建设投资达4.3万亿元人民。2018年我国正式启动网络强国建设三年行动,业内预计,未来我国网络基础设施建设投资规模将突破3000亿元。 (四)大数据征信的威胁(T) 首先,隐私保护与信息安全问题。在信息越来越“透明”的时代,企业对数据信息的挖掘能力在提升,大众担心信息泄露的风险加大,甚至在不知情的情况下信息被动变成企业牟利的工具。此外,我国对大数据企业的信息采集范围没有明确的规定,对失信行为的惩罚力度不足,反契约成本低,易导致违法采集、过度采集、滥用数据等问题,不利于行业健康发展。其次,数据挖掘与筛选清洗能力需加强。大数据的核心价值在于数据质量管理和应用,但是目前数据来源良莠不齐,大多企业采取网络爬取或“一网打尽”方式获取,收集到的可能是一堆没有预先计划和结构条理的垃圾,只有极少数企业采取服务接口对接,最终,数据呈现零星碎片状态,构不成有效体系,也难怪业内有“垃圾进、垃圾出”说法。第三,信用评分模型有待验证。信用模型的准确与否直接影响结果的准确性,国内大多模仿了美国的FICO模型,评估维度上五花八门,此外,模型的检验需要周期。以P2P为例,一个信贷周期通常1.5-3年,要摸清客户还款情况,征信机构必须跟踪1.5年以上,如果再反复验证,则周期更长。 三、结论与建议 (一)健全法律法规,制定行业规范和监督机制 由于数据以各种形式分散于各行各业,存在数据反复采集、数据标准或采集口径不统一等问题,容易产生数据采用不当或过度采用,侵犯消费者隐私权、数据所有权等一系列问题,给数据开发企业带来了很大的挑战。健全法律法规,制定行业规范和监督机制,既可以让企业有章可依,又可以监督企业是否违规操作,对企业和个人而言“双赢”,利于推动数据征信业的健康发展。 (二)建立信用信息共享,数据资源适度开放机制 2015年国务院印发《关于印发促进大数据发展行动纲要的通知》,全面推进大数据发展和应用,预计5-10年逐步实现5个目标,并在2017年底基本形成跨部门数据共享共用格局。但是目前的情况是各家企业的信息仍处于相对封闭状态,社会各部门的数据开放很有限。虽然我们知道开放共享资源,适度开放数据有利于解决问题,也有利于得到更准确的信用评级,但由于种种因素的存在,数据孤岛在短期内预计很难改变。 (三)充分利用大数据优势,提高大数据企业对数据处理及建模的能力 海量数据的不断剧增是大数据时代的显著特征,大数据被用于生产和交易的一个重要前提是数据提取、分析和清洗,因此提高大数据企业对数据的处理能力必然使“萃取”后的数据更鲜活、更有实用价值,再辅以恰当的模型,得出的“个人信用评级”则更具有参考性。 参考文献 [1]吴晶妹.2015展望:网络征信发展元年[J].征信,2014(12). [2]龙海明,王志鹏,申泰旭.大数据时代征信业发展趋势探讨[J].金融经济,2014(12). [3]石勇,孟凡.信用评分基本理论及其应用[J].大数据,2017(1). [4]李佳卉.浅谈大数据时代新型征信体系[J].网络金融,2019(4). [5]乔杰,杜海娇.互联网金融时代下征信业发展的路径选择[J].征信,2015,(2). |