基于大数据技术的银行业务分析
贺一珉 上海海事大学信息工程学院 摘要:在当下数据化的时代,银行商业模式也在随时代变化,大数据与机器学习技术被广泛运用于其信贷,负债与审计业务中。本文基于信息检索的方式,介绍了大数据技术在商业银的主要应用。具体来说,本文将从大数据与机器学习模型在银行三大常规业务与银行审计方面进行介绍。其中建立合适且准确的用户画像是其中相当重要的一部分,通过选取最适合的机器学习算法来训练高效的机器学习模型以获得准确的用户画像并运用于营销增强、用户洞察、渠道优化、产品创新、运营提升与风险控制等方面。此外还可以建立机器学习模型来预测风险概率使商业银行可以提前防范风险,增加了银行的风险抵抗能力。本文的研究对银行业务未来的发展方向有借鉴意义。 关键词:大数据分析;银行业务;用户画像 一、引言 大数据一般可认为是使用者通过计算机但不使用随机分析法而采用所有数据进行分析处理,在合理的时间内达到获取,管理,分析并处理为使用者需求的数据。当今世界早已进入了信息化,数据化的时代,无论是现实世界还是虚拟世界都表现了大数据在生活中的应用。为了更好的运用大数据及云计算技术,许多企业都建造了数据中心。其中Equinix数据中心拥有全球最先进的技术以及最大的市场份额,其通过大数据与云计算技术的运用,为企业用户提供托管、互联等服务。一方面解决了因主机托管非运营商核心业务而缺乏有效投资的问题,另一方面解决了企业对数据需求的高增长与机房建设成本高昂之间的矛盾。Equinix以数据运维著称,而另一家 Digital Realty Trust以全球领先的超大规模云计算为基本来对大数据进行可靠的分析处理。不光是现实企业钟情于大数据,虚拟产业也展现了大数据可能运用的方面,例如基于超信息化的城市管理系统ctOS。同时银行还面对了一系列由新技术带来的挑战,如何应对风险挑战并更好的服务客户成为了其重要的任务之一[1]。 在信息化的时代,传统的银行商业模式逐渐落伍,所以大量的银行引入了大数据以及云计算技术来改善自身的商业模式。互联网时代信息技术的不断发展,大数据逐渐被大众熟悉和使用,在各行各业都得到广泛应用。当前,大数据技术正在为每个领域带来变革性影响,成为颠覆性创新的原动力和助推器,以势不可挡的趋势在快速发展,商业银行迎来了新的机遇和挑战,对传统经营模式进行改革,积极转型发展,寻求着新的发展模式和发展方向。以互联网和大数据的技术为驱动,探索了公司新一轮业务增长发展模式,深入促进了业务模式的转型,已成为商业银行的共识[2]。在我国经济快速发展的过程中,人们对于银行业务的要求也越来越高,这种现象对银行自身工作能力提出了更高的要求。在这种情况下,我国银行业应不断的发展自身,提高行业的服务能力。随着科学技术的不断发展进步,我国银行业相关人员将大数据应用到银行业中,使用大数据对银行的金融产品进行创新,增加银行的金融产品,为人们进行理财提供更多的金融工具。并且在银行技术人员进行开发金融产品时,可以使用大数据对行业动向进行分析,开发出适合人们投资的金融产品。另外,在银行业发展的过程中,相关人员会使用大数据对银行的服务满意度进行评价,从人们的反应意见中不断的对自身发展及服务进行反思,使银行业在发展的过程中,充分的认识自身的不足,并通过优化服务的方式,不断的提高自身的服务质量,提高人们对银行业服务的满意度,进而促进银行业的发展与进步[3]。 二、负债业务 负债业务是商业银行资金的主要来源业务,一般包括吸收存款,结算资金占用以及主动性借入资金(即同业拆借、向中央银行借款和发行金融债券等),其中最主要的部分是吸引用户的活期存款。从现实角度出发,对负债业务影响最大的是银行用户的质量,因而如何获取并留存高质量的客户成为了银行重要任务之一(即延长银行客户的生命周期)。客户生命周期是指一个客户从银行的潜在客户,到成为银行正式客户,最终结束与银行的客户关系的时间跨度范围。按照客户生命周期理论,客户与商业银行的关系可划分为四个阶段--拓展期、成长期、稳定期以及退出期。银行所做的就是减少客户的拓展期,延长成长期与稳定期并尽最大可能阻止客户与银行合作关系的破裂。银行可以在实践中运用客户生命周期理论,对客户所处合作阶段进行较为准确的判断,只有判断清楚客户所属的阶段,银行才能针对性的做出相适应的选择来提高客户的价值贡献规模及回报率水平以增加银行的收益率。 据调查,几乎所有的银行都对每一位用户进行了画像,即近乎完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析客户行为习惯、消费习惯等重要信息,提供了足够的数据基础,以方便银行吸引客户存款。以民生银行用户画像建设为例,其将客户信息数据结构化处理并加以分析,再根据银行已有的社会调查为不同的客户打上各不相同的标签集。此外,民生银行还通过将用户画像应用于营销增强、用户洞察、渠道优化、产品创新、运营提升与风险控制方面来进行客户分类并向相应客户推送其偏好业务以增加客户留存率以及银行利润。其中标签集由四类标签组成,分别是人口统计学特征,社会群体特征,个人兴趣偏好以及电信业务特征。图1可以极好的阐述何为客户特征,标签以及画像并简单明了的指出了他们之间的关系。 图1 客户画像与标签 银行可以针对不同用户画像的客户采取不同的手段来吸引用户的存款,例如给客户发放小礼品(装饰,米,面,油等);使用积分兑换物品;升级银行卡;让客户认为某银行更加安全可靠或者考虑在合理合法的情况下上浮一定利率等等。传统的用户画像是基于人工线下收集客户信息来制作的,而这种方法往往效率低下并且准确率难以保证。而随着数据量的暴增,传统方法已经难以满足现代银行业务。基于此,大量银行开始引入“大数据+机器学习”的方法来更好的去进行用户画像刻度。其中一个很重要的运用就是预防不法分子对银行客户的网络电信诈骗。阻止网络电信诈骗中最重要的两点,即减少干扰频率(组织用户交易的频率)与识别准确率。在使用机器学习去处理实际问题中最重要的一点是在于适度的训练模型,所以应该利用机器学习技术以海量的行内外数据对模型进行训练,采取有监督、无监督或半监督学习方式,获得客户被骗风险、诈骗类型分类交易反欺诈等模型,并通过选用合适的机器学习算法训练模型来获得所需模型。其中招商银行就建立过类似的机器学习模型,其基于用户画像数据,使用了上万维度的特征向量来描绘的用户消费习惯并通过分析这些特征变量选出可解释性较好的部分组成特征向量集。招商银行的机器学习结构模型如下表1所示。 招商银行选择逻辑回归、随机森林、XGBoost与GBDT 四种常用模型算法来进行机器学习模型的计算,通过分析AUC与KS指标得出了XGBoost算法最适合此表的机器学习模型。最终招商银行希图使用该方法更高效的的拦截并提醒受到网络电信诈骗的银行客户。表2为招商银行四种机器学习模型性能指标数据[1]。 综上所述,机器学习方法在用户画像方面拥有巨大的优势,在大数据风控体系下实现精准的预测。还可凭借金融大数据平台,引入更多机器学习算法,迭代优化机器学习模型,进一步加强机器学习在银行负债业务中的作用。 表1 机器学习模型应用架构 表2 客户被骗风险模型建模架构 三、资产业务 商业银行的资产业务是指将吸收来的资金进行贷款与投资业务,信贷业务是资产业务中重要的一部分。但近年来,受疫情影响,作为金融体系核心的商业银行面临的信贷风险也在逐渐扩大。其中引发信贷风险的原因可以归纳为以下四个:第一,商业银行与借款者信息不对称;第二,贷款的审批效率较低无法适应客户需求;第三,贷后管理成本较高;第四,信贷结构有待完善。面对这样的问题,银行选择了通过分析用户画像数据,建立机器学习模型预测风险概率,从而判断是否批准客户的贷款业务。银行在传统处理信贷数据的方法中,大多数方法都会更倾向于占百分比较大的部分,即那些看起来更加重要的部分,忽略掉仅占一小部分的数据。然而,忽视看似不重要的细节部分会导致评估准确率下降,从而增大了信贷的风险。图2为传统方法中部分关键变量的相关关系矩阵热力图,通过该图可以发现变量与所期待结果间相关系数的绝对值不足7%,这足以表明,传统的数据分析方法并非最优解。 图2 变量间相关系数矩阵热力图 因此在建立所需的机器学习模型之前,需要使用过采样以及欠采样的方法来进行非平衡数据处理。其次,还要通过选择合适的分类模型以提升预测效果,分类模型分为单一分类模型以及组合分类模型。单一分类模型主要包括:K-近邻、决策树、神经网络以及支持向量机等;而组合分类模型为Bagging和Boosting两种。最后则是构建 Logistic 模型计算风险概率,从而根据模型研究结论,完善信用风险评估机制,为银行授信、风险预警和防范违约风险提供理论参考和实践指导。经过调查发现,随机森林法更适用于作为银行机器学习的分类模型。吴金旺和顾洲一利用随机森林算法对平衡后的数据集做重要变量筛选,并使用Logistic模型来预测,其效果显著[4]。周永圣等利用改进后的随机森林算法应用于德国信用数据集,验证了随机森林类模型的可行性和优越性[5]。顾洲一和胡丽娟利用随机森林算法用于商业银行用户信用风险评估,发现Logistic回归具有极高的准确率[6]。其中顾洲一和胡丽娟由下表参数估计结果得出了客户违约概率的公式: 变量定义如表三所示。通过建立了合适的机器学习模型,信贷风险发生的概率与客户之间的关系得到了较好的阐述。在信息全球化的时代背景下,将大数据与机器学习的方法和商业银行信贷业务的风险管控相结合是一种更加可靠的,更优秀的资产业务管理方法。大数据与机器学习技术的发展给商业银行的资产业务带来了机遇,要积极利用大数据技术解决现存的业务问题。当下,以信息科技为主导的数字化战略已经成为我国商业银行自身的稳健经营的保证与拓宽业务和转型发展的关键。 表3 对应参数及估计结果 四、中间业务 商业银行的中间业务指银行作为代销商或者中间商来协作进行业务,并以此收取费用,譬如代销基金业务等等。如今,银行中间业务大数据与机器学习的应用与银行的负债业务是相似的。二者都是通过基于大数据与机器学习技术为基础建立的用户画像来为客户打标签,不同的是负债业务是通过分析客户消费习惯来吸引存款,而中间业务则是需要综合分析客户的消费行为习惯以及性格来给客户推荐不同的但很有可能感兴趣的基金或理财产品。例如,光大银行会给谨慎,深思熟虑与抗风险能力一般的人推荐光银现金A这类低风险收益较稳定的基金产品。这样既吸收了客户的闲置资金,增加了客户粘性,也带来期望的收益。而对于比较激进的,冒险的,欲望较强与抗风险能力较强的客户,银行则会推荐中风险中等收益甚至是高风险高收益的理财产品(阳光红ESG行业精选等)。即如下图3所示,将银行自身的营销策略通过对用户画像的严谨分析与客户需求紧密相连。 图3 中间业务精准营销 简而言之,商业银行如果希望提高中间业务利润,完全可以根据合适的用户画像来判断用户偏好,挖掘客户的潜在需求;建立集体画像并实现集群化营销;追踪客户行为轨迹以发掘潜在客户;分析客户状态并针对性提供服务;降低营销和服务客户成本并提升风险预警能力。综上所述,商业银行将大数据与中间业务相结合可以大幅增加业务与客户的匹配程度,同时还能提高业务的发展量并对降低业务成本起到了关键性的作用[7]。当然,为了更好的将银行业务与大数据相连,银行可以大力发展线上标准化业务,自主开发数据应用平台并强化据分析等等。 五、银行审计 银行审计是对银行业务活动及财务收支情况的审核、稽查。商业银行在经营过程中会面对各种各样的内部问题,其中危害性最大的是部分银行员工个人或联合外部人员进行舞弊,即会给银行带来经济与社会方面的危机,这也是为什么银行审计如此重要。随着银行业务信息化,智能化程度增高,员工实施舞弊的手段越来越复杂,使用更智能,权限更高的方法来监控银行员工的行为是否合规合法是非常重要的。 表4 员工风险特征画像所需信息采集及处理[8] 因为大部分商业银行有给客户绘制用户画像的经验,所以在审计方面可以如法炮制,即给员工绘制员工画像,并建立机器模型来判断员工进行舞弊的概率,从而大幅度提高审计效率与准确率。如上所述,虽说大数据会带来一定的风险,但同样会带来机遇。商业银行可以趁此机会推动商业银行内部审计持续化发展,有效革新商业银行内部审计模式,极大提升商业银行内部审计效能和持续推动商业银行自身创新发展。以中国农业银行为例,该行积极采集员工行内外数据,对数据进行合理的分析及处理,并对相应特征赋值来完成员工画像的绘制。表4给出了中国农业银行收集信息的简要内容与分析处理信息的方式。 中国农业银行为了更好的建立员工画像,还给不同类型的员工赋予了不同的权重。中国农业银行赋予不同情况员工不同的权重有助于建立更真实,更有效的机器学习模型,从而减少人工审计的工作量,增加银行规避风险的概率。不过对于银行审计方面,仅仅建立合适的机器学习模型是完全不够的,银行还需要进一步强化审计数据分析、常态化审计监督以及数据管理平台的建设,紧紧围绕住数据审计目标,强化审计工作所应用平台的整体效能。 六、结论及未来展望 综上所述,本文研究了大数据与机器学习模型在银行业务方面的应用。在这个大数据时代,商业银行业务基本趋向于智能化、高效化,而想要切实提升商业银行业务效能,必须要对银行制度、银行员工能力以及数据隐私安全等方面进行充分考量。商业银行还需要在部分方面进行优化,从而保证大数据与银行业务的高效结合。首当其冲的就是要扩大信息化人才队伍,大数据分析与应用不仅仅需要相关职员具有较强的现实业务理解能力,还需要其具有较强的数据建模与挖掘能力。商业银行应当重视对数据人才的发掘与培养,不断扩充大数据人才队伍,针对性的招聘信息科技类人才,建立完善的培养、评价、激励和考核体系,不断推进大数据人才队伍的建设。其次就是要保证大数据的应用有针对性,营销部门、风险管理部门,不同支行、总行与大数据应用团队之间应当建立信息交互平台,这样既可针对全行性的重点、难点工作从大数据视角集体讨论研究攻坚方向,又能够根据不同部门的特色,满足业务拓展的个性化数据分析应用需求。同时在现有基础上,围绕重点工作,立足挖掘客户、提升效率、创新服务等,加强对潜在数据需求的研究和创新应用平台的开发。并高效运用大数据支持,执行总行大数据下的经营决策,积极使用大数据分析平台,最终促进商业银行更好的发展。本文的研究结果对银行业务未来的发展提供可行的发展模式以及发展方向。 参考文献: [1]陈俊清.机器学习模型在商业银行防控电信网络诈骗中的应用与实践[J].中国金融电脑,2021(11):47-51. [2]王楚涵.中国建设银行SY分行电子银行业务大数据营销策略研究[D].吉林大学,2021.
[3]王哂.大数据挖掘在银行业务领域的应用[J].全国流通经济,2019(18):169-170
[4]吴金旺,顾洲一.基于非平衡样本的商业银行客户信用风险评估——以A银行为例 [J].金融理论与实践,2018(7):51-57. [5]周永圣,崔佳丽,周琳云,孙红霞,刘淑芹.基于改进的随机森林模型的个人信用风险评估研究[J].征信,2020,38(1):28-32. [6]顾洲一,胡丽娟.机器学习视角下商业银行客户信用风险评估研究[J]. 金融发展研究. 2022(01):79-84. [7]王崇华.互联网金融背景下光大银行中间业务发展研究[D].贵州财经大学,2019. [8]中国农业银行审计局武汉分局课题组.大数据用户画像技术在商业银行员工行为审计中的应用研究[J].中国内部审计,2021(9):46-48. |