基于数据分析的银行运营管控体系建设
韩健 中国民生银行总行 摘要:伴随着市场开放、技术变革、产业社会形态变化的趋势,中国银行业面临着前所未有的竞争压力,传统的盈利模式、同质的经营模式与粗放的管理状态势必需要向多元化、特色化、精细化转型,在各家银行推进转型之际,提升数据驱动深度挖掘数据价值,已成为了业界的一致认识。 关键词:数据分析;银行运营;管控 伴随着各家银行推进转型之际,提升数据驱动深度挖掘数据价值,已成为了业界的一致认识。目前业内普遍认可的数据分析流程是由SIG组织提出的CRISP-DM,即“跨行业数据挖掘标准流程”。这套流程的核心思路是:业务理解、数据理解、数据准备、建立模型、模型评估、结果应用。通过这套数据分析流程,我们就可以搭建出一个基本的数据分析框架(如图1)。 图1 在数据分析框架的基础上,再将数据分析的不同方法依次嵌入到框架每个模块中,这样我们就得到了一套数据分析的标准流程(如图2)。 图2 银行的运营管理工作需要大量的运营资源支持,包含网点、人员、设备、现金、重空等方方面面,种类数量众多,涉及面广,对这类资源的有效管理和合理利用,是运营条线降本增效的重要手段。由于相关数据分散在不同的系统中,面对这些海量数据,我们的运营人员需要一套科学方法将它们有效的组织起来并灵活运用,以提升日常运营管理的能力。为此,我们要以数据为驱动,以标准化的数据分析流程为工具,搭建数字化的运营资源管控体系。 由于运营资源包含的方面很广,我们先以支行运营人员配置为例,说明如何利用数据来对运营人力资源进行更好的配置和管理。 一、业务理解阶段 数据分析首先要进行业务理解,确定分析目标,明确分析的需求,从而为整个数据分析工作定下一个明确的方向。要从实际业务出发,描述清楚当前的业务背景,找到业务需求,并要对业务需求进行评估,将那些不切实际、无法实现的需求剔除。在这里主要有5种分析方法可以指导我们对当前业务进行分析:PEST分析法、5W2H分析法、逻辑树分析法、4P理论、用户行为分析,这5中方法适用于不同的分析目标。 在我们的案例中,需要对支行运营人力配置情况进行分析,这是一个具体的问题,采用逻辑树分析法比较合适。根据分析结果,我们可以确定本次数据分析的基本方向,即支行运营人员的配置数量的影响因素:支行业务量、支行客流量、支行现金量、支行的营业时间。每个影响因素又可以由一些可量化的指标来进行描述,例如柜面业务量、实际叫号量、柜台现金调缴量等,接下来我们就可以按照这些指标进行下一阶段的数据准备。 二、数据准备阶段 对当前业务需求进行了清晰的分析后,我们得到了一些量化指标,在数据准备阶段就要对找到这些指标进行数据抽取,并对抽取到数据进行质量检查,如果质量不满足要求还要进行数据清洗。 在支行运营人员配置的案例中,我们需要对柜面业务量、自有设备业务量、实际叫号量、柜台现金调缴量、ATM现金调缴量等指标提取数据。然后我们分析这些系统都包含了哪些数据表,每张表的作用及表之间的关联关系,表内数据字段的含义。例如柜面系统主要包含前台流水日志表、渠道日志表、差错日志表、抹账流水表、大额核实表、交易定义表、集中处理交易登记簿等数据表,各个数据表间以业务流水号作为关联键进行连接。我们要统计支行柜面业务量指标,那么就需要研究前台流水日志表。打开前台流水日志表的数据结构,发现这张数据表跟柜面业务量相关的字段有业务流水号、前台机构编号、交易名称、交易编号、服务开始时间、服务结束时间,根据挑选出的这些字段,可以统计出一段时间内支行不同交易的交易量,这就是我们本次数据分析所需的原始数。分析结束后,我们就得到了指标的原始数据。 有了原始数据还不够,我们还需要对这些数据进行清洗。这是由于原始数据中存在着数据缺失和不实数据,需要对数据进行清洗去噪处理,提取出有效数据。针对柜面系统的原始数据,我们随机抽取一天的前台流水日志表的数据进行分析(如果数据量过大的话可以抽取部分流水记录),发现流水日志中不光包含了支行的业务数据,同时还记录了总行、分行处理中心的操作记录,由于我们只关注支行情况,因此要剔除掉中分行的业务流水;另外由于分行营业部规模较大需要单独分析,因此也予以剔除。另外,样本中有部分支行的数据明显失真,这可能是由于部分字段系统记录不全导致,需要把这些支行的数据剔除。经过了数据清洗的操作,我们得到了样本数据。 按照上述的分析思路,我们可以对目前运营资源涉及的各方数据进行预处理,按照不同的资源属性将分散在各个生产业务系统中的数据抽取出来,然后清洗去重形成人员、网点、设备、现金、重空等不同属性组成的运营资源数据集市。这个数据集市就是未来我们要搭建的数字化运营资源管控体系的基础,运营人员可以根据不同的业务需求在数据集市中选取所需要的数据,然后利用这些数据进行下一阶段的数据探索。 三、数据探索阶段 在得到清洗后的样本数据后,我们需要采用数据特征描述、概率分布、结构化分析等方法,对这些数据进行初步分析,发现其数据特征、规律,然后再利用样本数据推断总体数据特征,从而为后续的数据建模提供输入依据。 在实际工作中,我们可以根据不同的业务场景,在已经搭建好的的运营数据集市中抽取一种或多种属性的数据,组合成不同的分析维度。例如我们可以将人员和设备的数据组合起来,分析客户化运营设备对网点人员的替代率;或者将人员和业务量的数据结合,分析人均产能效能等。因此只要有了运营数据集市,我们就可以按照特定的需求抽取不同属性的数据进行组合,形成多样的分析维度。 四、建立模型阶段 在进行了初步数据探索后,就要进行建立模型阶段。建立模型需要采用多种统计分析方法:分类与回归、聚类分析、关联分析、时序分析等。针对不同的业务场景,选择不同的分析方法。 在支行运营人员配置的案例中,我们使用回归分析对支行运营人员的配置数量和业务量、客流量、现金量、营业时间等可能的影响因素之间的关系进行分析。由于因变量Y支行运营人员的配置人数是离散变量,且变量X为多个,因此我们需要采用LOGIXTIC线性回归分析(具体分析过程略)。 经过分析我们得到,对支行运营配置人数影响最大的因素是业务量、客流量和现金量,而营业时间与支行运营人员配置之间无显著的线性关系。 五、模型评估 在模型建立完成后,还需要对模型的精度、准确性、效率和通用性进行评估。在模型评估阶段,需要业务方面的专家根据实际生产的情况对模型的效果进行评估。在支行运营人员配置的案例中,我们可以让每家分行抽取3-5家支行进行数据验算,参照上阶段制定的数据模型,按标准调整现有支行人员配置,评价配置标准是否合理。 六、结果应用 最后,我们需要将模型结果应用于业务实践,实现数据分析的真正价值,解决实际的业务问题,同时还要对模型应用结果进行及时的跟踪反馈,不断进行调整优化。我们根据模型中的指标对支行运营人员的配置情况动态监控,利用模型测算的结果对配置不合理的支行进行人员调整,以达到产能最优。 银行运营工作涉及的各方面内容庞杂,需要的资源繁多,这就需要我们以运营数据集市为基础,利用有效的数据分析方法,将各方面的运营资源进行整合,从而搭建数字化的管控体系,以数据驱动内部运营管理流程,最终达到运营效能的优化和价值的提升。 参考文献 [1]顾芳,刘旭峰,左超.大数据背景下运营商移动互联网发展策略研究[J].邮电设计技术,2012(8):21-24. |