基于P2P网络借贷视角的大数据应用
王艳 逯毅 曾知文 安徽财经大学金融学院 基金项目:本文系安徽财经大学大学生创新创业训练计划项目研究成果,项目编号:201510378178 摘要:大数据时代来临时,数据从简单的处理对象转变为一种基础性资源,其运用价值在金融领域得到关注。而P2P网络借贷作为基于互联网的新型金融服务模式,其最大挑战是控制借款者信用风险,因此建立大数据风控系统成为必然趋势。 关键词:大数据;P2P网络借贷;风控系统 随着大数据时代的到来,数据这一简单的处理对象转变成为了一种基础性资源,其巨大的价值在金融领域得到广泛关注。在充分结合大数据的价值的同时,为了满足个人和小微企业的资金需求、发展个人和小微企业信用体系、提高社会闲散资金利用率,P2P网络借贷平台的出现成为了必然。 P2P网络借贷平台是一个基于互联网的金融中介平台,中小企业或者个人通过信征审核后可以在平台上发布借款信息,投资者则可以小额度投资与风险相匹配的收益产品。我国最早的P2P网络借贷平台出现于2006年,其后便进入了漫长的停滞期,到目前为止除了部分影响力较大的宜人贷、人人贷、红岭创投和哈哈贷之外,我国近几年还出现了齐放网、51give网站和Wokai网站等借贷平台。P2P作为基于互联网的新型金融服务模式,其最大挑战是控制借款者信用风险,而在我国P2P平台刚刚起步,除了“中国小额信贷联盟”来主持小额信贷的行为规范以外,没有其他明确的立法,因此必须建立健全完善的风险控制系统。在传统模式下要对大量的网络借款者进行准确的信用评估很难实现,随着现在各种媒体的蓬勃发展,社交软件的应用越来越广泛,这些媒介将人与人之间的关系、个人的爱好、性格在海量大数据的支撑下呈现给了P2P网络借贷平台,在多样且复杂的大数据支撑下却能够有效地避免结论误差,因此大数据在P2P网络借贷方面的应用变得尤为重要。 随着互联网金融的蓬勃发展,对大数据的应用变得更加广泛和新颖,其在征信和产品研发方面的创新表现的尤为明显。其应用流程如下:用户使用PC终端或者移动设备进行交易行为会产生大量的初始数据,首先,通过一定的设备对初始数据进行收集,然后再将收集的数据通过分发中心按照一定的规则进行分发,各个集群服务器会收到这些数据。这些比较零散、随机的、没有相关性的初始数据会被集群服务器被加工成人或者智能人工所能接受的形式,最后,这些数据会被进一步挖掘,形成能被利用的商业模式。于是,在征信方面,P2P网络借贷平台可以通过搜集整理个人的多维信息来评估信用并推算其可能的违约成本。在产品研发方面,则是了解客户需求、实现精准定位,继而在满足客户需求的同时又控制了成本。 (一)信用征信 运用大数据进行信用征信,主要包括个体情况、社交网动态、网购行为三个方面。 1.个体情况分析 个体情况主要包括个人基本信息、教育及技能信息、个人收入及资产信息、个人工作信息、个人关系信息等。P2P网络借贷平台对借款人信用等级的评估可以通过查询公安信息平台公布的居民身份信息、学信网公布的学历信息和借款人提供的非公开信息,也可以通过社交软件提取关系圈信息来判断借款人的身份和还款能力。作为最早对个体状况进行分析的平台——拍拍贷,它对个人信息准确和高效的统计使拍拍贷的交易规模得到迅速的扩张。 2.社交网动态分析 社交网络动态分析是指利用人们常用的社交软件,如知乎、微信、微博等,通过他们在这些社交软件上的各种动态来对他们进行信用评估。由于科学技术的发展,人们对社交软件的依赖程度越来越高,这些都是有效的大数据搜集渠道,所以可以提取社交信息对借款人进行信用评估,使P2P信用评级系统更急完善,进而带动整个网贷行业的发展。 3.网购行为分析 网络购物行为分析是通过分析消费习惯和电子帐户资金流水等资金状况对借款人进行信用评估。自京东商城推出“京东白条”到如今“蚂蚁花吧”的大众追捧,大都是通过分析用户以往的购物行为模式来授予信用额度。积木盒子作为国内首家支持全网商品分期的商家,如果个人产生消费行为,快乐时代平台可以通过消费标的链接其他电商平台,为他们提供在他们信用额度之内的分期付款网购服务。其他没有自己的信息搜集渠道的P2P平台,在对借款人资料进行审核时也要求提供网购凭证或流水单。 (二)产品研发 传统模式下,企业要想获知某一新产品的潜在客户率,必须事前做大量的市场调研活动,这将耗费大量的人力、财力和物力。而在大数据时代,获取客户的偏好与需求要容易的多。那么针对客户的特点设计产品,可以迅速有效地推广产品。在大众式的产品已逐渐不能满足人们的需求时,针对性产品是各个行业日后生产的方向。对于金融行业来说 ,更要针对客户推出适合其经济能力、风险偏向等情况的产品,才有可能实现借款者借款的低成本,投资者贷款的高收益,并有效的避免传统模式下的供不应求和供过于求的不平衡问题。 (三)针对宜人贷案例的具体分析 2014年4月,宜人贷推出“极速模式”借贷产品,可以在10分钟内确定借款者的信用额度。该产品从四方面评估信用状况:个人的身份认证,填写信息的真实程度,还款能力及还款意愿。具体流程如下:该平台在获得用户授权后得到各种信息,然后系统自动解析信息并挖掘信用敏感部分作为审批参数,最后将用户的历史信息和行为与第三方数据核对后完成审批工作。在整个借贷过程中,还会实时地用后端更新的黑名单来帮助识别与不良贷款有关联的客户。数据类型分为权威数据源和辅助数据源,权威数据源包括征信、公安部的数据、工资流水的数据等,辅助数据有信用卡交易流水信息、社交信息、电商信息、资金信息等非结构化数据。不同的数据源里任何的差异,都会出现风险预警。其大数据风控系统可以概括为两方面:一是建立自己的结构系统了解客户特征,依靠稳态信息来源减少数据噪音,获取价值信息。二是做数据挖掘寻找关键数据,以大数定律为基本原理,将数据与个人的信用情况和偿还能力形成关联,并检验其可信度。 P2P网贷公司近几年来飞速发展,数量与规模都迅速扩大。但不可忽略的是,各平台跑路的事件也频繁发生。在利用大数据进行风控以提高企业生存率的同时,我们也必须面对当前应用大数据的困境,探讨违约概率不能准确评估的原因。 (一)金融信用与社会信用的相关性不确定 金融信用与社会信用具有相关性,但其相关性的具体数值则不能被确定。个人信用涉及多方面,包括爱情信用、社交信用、工作信用、金融信用和其他社会信用等。而每个方面不一定与金融信用紧密相关,例如一个人在社交媒体上活跃程度高,在人际中具有较高的朋友信用,但当他所处的社交圈是比较经济能力低的阶层时,那么其偿还能力也不能得到证明。,即个人的日常生活的信用不能完全定位违约风险。样本不同,相关性也不同。而且在收集各维度信息时,网络的虚拟性使数据不一定符合真实状况,这加大了金融信用与社会信用的偏差。 (二)数据开放限制 征信系统的完善程度决定于数据资源的开放度。我国政府层面的征信系统主要由中国人民银行负责,那么民间金融行业能否对接央行征信系统是目前主要挑战。其次行业内如何实现信息共享也是难题之一。大数据征信系统的建立基础在于数据征集的共享性与规范性。若P2P网贷公司只能利用各自的渠道记录数据,无法实现资源共享,那么不同维度、不同时间序列的数据混合应用时,会因规则不统一出现 “噪音”效果,使征信模型失效。由于大数据风控系统主要依赖于实时更新的数据以及对客户的约束力来保证有效性,P2P网贷平台若不满足该前提,则很难将风控与大数据结合起来。实际上,目前金融行业中只有阿里小贷等公司充分利用卖家的交易信息与资金流水等信息快速完成授信额度,这得益于其对数据的完全掌握能力。但对于P2P网贷公司而言,信息来源渠道较为狭隘,那么缺失的数据将难以构成闭环,大数据风控也无从谈起。 参考文献 [1]朱凡,李士华.中国P2P网络借贷主要风险及防范[J].现代商贸工业,2016(4):35-37 [2]梁立华,廖理.“互联网+”推动普惠金融可持续发展[J].清华金融评论,2015(12):51-53 [3]种骥科.征信风控:第三方数据应用[R].T11全球移动大数据峰会,2015.09 [4]陈小林,杜若华,刘永峰.我国互联网金融征信体系建设路径思考[J].征信,2015(1):9-12 [5]刘芸,朱瑞博.互联网金融、小微企业融资与征信体系深化征信[J].征信,2014(2):31-35 [6]张杨.未来的P2P是大数据的P2P[J].华东科技,2014:56-57 |