杨望:大数据重塑风控新格局

杨望 原创 | 2018-09-05 09:21 | 收藏 | 投票

编者按:风险控制的思想最早起源于1931年的美国。在1929-1933年的世界性经济危机的大背景下,美国40%的银行和大型企业相继破产倒闭。为了应对经济风险,美国管理协会(AMA)在全美推行风险控制的理念,提倡大型企业和商业银行在内部设立保险部门,以保险项目来控制风险。瀚德金融科技研究院副院长、中国人民大学国际货币研究所研究员杨望,瀚德金融科技研究院研究员曲双石在《长江大数据》撰文探讨风险控制理念金融领域的广泛应用。

传统金融风控模式的尚存问题

在几百年的金融进化史中,政治层面、信用层面、操作层面、系统层面、经营层面、市场层面等各类风险遍布于整个金融环节。为了转移或消除部分风险,传统金融风控模式应运而生。

我国的金融体系是信贷主导型,信贷市场规模全球第一。《巴塞尔协议III》的出台,对商业银行等传统金融机构的影响是巨大的。商业银行的业务定位有了全新的变化,不再是简单的金融服务和信用中介,风险控制在商业银行中扮演着更为重要的角色。为了更加直接地防范系统性风险的出现,提高政府在经济活动中的控制力,互联网金融诞生以前,以商业银行为代表的传统风控模式成为了最符合国情的风控模式。与国外发达国家相比,我国商业银行的风险控制水平远远落后,许多问题亟待解决。《巴塞尔新资本协议》颁布实施后,商业银行等传统金融机构不再只关注信用风险和市场风险的风险控制,而是对同等重要地位的操作风险作并行监督控制。

在信用风险控制方面,尚且存在的问题主要体现在不良贷款率,即违约贷款率。从2008到2015年间,我国商业银行的不良贷款余额的年末存量和不良贷款率出现了双降的现象,而从2008年货币政策改革和商业银行股改的经济背景来看,这种双降实际上是得益于大背景下商业银行计量方法的改变和不良贷款的剥离的。

在操作风险控制方面,樊欣、杨晓光(2003年)指出,操作风险的出现,主要是由业务中断及系统失败、客户产品及业务操作、交割执行及流程管理、内部欺诈和外部欺诈五个方面的原因造成的。不管是从操作风险的损失事件的统计数字上看,还是从损失金额上看,内部欺诈和外部欺诈是近十年来造成操作风险的最主要的两个原因,损失事件数占比高达79%。而损失金额甚至接近100%。内外部欺诈的大案要案屡禁不止,引起全社会的反响,因此,操作风险得到政府和学者越来越多的重视,并将其列为金融风险控制的第二大风险。

图 1我国商业银行操作风险损失事件统计表

数据来源:樊欣、杨晓光《从媒体报道看我国商业银行操作风险状况》

在市场风险控制方面,我国市场化的步伐在上一轮经济快速增长的过程中日益加快。与此同时,不确定因素的涌现,无疑增加了市场风险发生的可能性。市场化发展创新的核心手段是利率市场化和汇率机制改革。在市场化改革过程中,各类金融工具不断更新,传统金融风控模式下的各类业务也得以快速拓展,随之而来的是由利率、汇率、商品价格和股价指数等因素引起的市场风险。当前,利率市场化和汇率敞口所带来的风险问题是传统金融风控过程中所面临的主要问题。

传统金融风控模式的优化路径

信用风险、操作风险和市场风险是目前我国金融风控模式主要考虑的三类风险。深入探讨传统金融风控模式尚存的几大问题,可以得出以下优化路径:

一是金融体制不健全和金融监管不到位,我国目前正通过完善金融法律法规、完善资本市场建设来加强外部监管、分散商业银行的风险,从而达到全面提高风险监管水平的目标。

二是经济增长模式差和社会诚信水平低。供给侧改革的国家战略对经济结构的调整,让经济增长日益合理化、稳定化。以央行为代表的金融监管机构、以阿里芝麻信用为代表的互联网金融企业正在通过建立健全的社会征信系统来降低信用风险。

三是风险管理文化缺失和高素质风控人才匮乏。风险管理意识的淡薄,或是风险控制意识不强,最直接的后果是造成金融机构的倒闭。比如拥有百年历史的巴林银行就是因为其高管里森不顾风险的投资行为一夜倒闭。因此,近年来,我国商业银行非常注重良好的风险控制理念的营造和高素质风控人才的培养。

四是风险控制方法单一,风险管理系统落后。基于前三点优化路径是金融风控模式的外部软性解决方案,与法律法规相关性较强,金融企业无法短时间内完全优化。因此,笔者将着重分析第四点优化路径。况且,互联网对传统金融业务模式的冲击是巨大的,在我国普惠金融国家战略的普及,小额化、分散化需求的日益旺盛,使传统金融机构和互联网企业都在寻求金融风控模式的创新。近年来,大数据技术的发展,极大地推动了传统金融风控模式的变革,商业银行代表的传统金融风控模式的升级改造在所难免。

传统风控模式中,大部分商业银行沿用的都是以程控交换为主的风险管理系统,虽然稳定性较强,但是客户容纳体量有限、交易通讯指令复杂等不足让商业银行难以满足现代投融资需求,特别是全国7000万中小微企业的存贷款需求,早已突破了传统风控模式的压力测试、欺诈检测和风险监管的系统容量上限。需求促进创新,伴随着近年来互联网思维的普及和互联网技术的发展,商业银行等传统金融机构正准备将程控交换系统转换成IP网络为主的互联网风险控制系统。硬件系统的搭建,正是基于大数据风控技术的研发需求而来。大数据风控逐渐成为金融机构创新传统金融风控模式的变革利器。

大数据在金融风控中的探索与实践

金融的中心是风控,风控的核心在于信息管理。历经近一个多世纪的经营发展,国际先进的金融机构均已建立起了完整的风险管理信息系统。目前,我国的授信基础数据尚存在大而不全、泛而不实的问题,特别是商业银行为代表的传统金融机构、蚂蚁金服为代表的互联网金融企业和中诚信为代表的征信机构各自为营,围绕自身互联网平台和业务系统,打造了生态大数据。然而,互不共享的原则让其成为了数据孤岛,成为了大数据风控技术普及过程中最大的拦路虎。不过,随着金融监管机构对大数据风控模式的大力推广,互联互通政策的贯彻,相信不久的未来,我国的大数据风控模式也能被更多的金融企业采用,使其更有效地服务于实体经济。

大数据风控模式的应用原则

大数据风控最核心的原则就是小额和分散,即避免资金相关者过度集中。业内形象的比喻就是将鸡蛋随机地分散放置于不同的菜篮里。

小额的设计原则主要是针对海量数据构成的统计样本,尽量地避免统计学中的 “小样本偏差”。具体如互联网平台需要做总量为1亿的借款业务。如果人均借款4000,那么总共会是2.5万个借款人;另外一种较为集中的情况是,如果人均借款100万,那么总共会是100个借款人。又假设借款人坏账率是1%,那么贷款给2.5万个借款人的坏账可能性会远高于100个借款人的情况,但是,贷款给100个借款人的坏账集中度非常高,极有可能达到10%,形象地说,就是100个人中有10个人极有可能违约。这就是统计学上常说的“小样本偏差风险”。并且,第一种情况明显更符合统计学的“大数定理”,样本量足够大的前提下,更符合正态分布定律,理论上结构更加稳定。

分散的设计原则主要是通过分析借款主体的基本特征、社会属性、社交属性等行为数据来建立大数据风控模型。并由此进行风险定价和决策放贷,目的是在一定程度上降低独立个体同时违约的概率。例如,某P2P平台历史数据显示,10个独立的借款个体的违约概率是30%。那么,n个互相独立的个体同时违约的概率就是30%的n次方。又假设这n个人存在正相关性,小明违约时,小明的好友小红也会违约的概率是60%,那随机挑选出来的两个人同时违约概率就会高达18%,即30%与60%的乘积。这就比两者不相关的同时违约概率30%的平方,即9%高出整整一倍。由此可见,分散的原则在大数据风控模式中的重要性不言而喻。

小额和分散的设计原则固然有利于化解风险,但其借贷客户产生的海量数据,已不是传统的金融风控系统所能承受。由此,利用大数据分析和挖掘技术的大数据风控模式应时而生。最典型的成功案例是目前全球最大的P2P平台——LendingClub。其利用已有的FICO评分,建立大数据风控模型,核心是自动化的决策引擎和评分卡体系,它可以根据客户各方面的行为数据在1-10分钟内判断违约风险,并进行放贷,这种大数据风控模式其实就是我们耳熟能详的信贷工厂模式。这种模式的好处在于能极大地降低成本、提高决策自动化程度、极速放贷。

大数据风控模式的实践案例

目前,全国金融企业正在积极探索大数据风控模式的实际业务应用,特别是互联网企业,其大部分的时间都花在了收集信用数据、分析和挖掘用户价值等工作上。

大数据风控模式最大的瓶颈在于数据来源。已有的征信体系中最可靠的就是中国人民银行的征信系统了,据最新数据显示,央行征信系统收录8.7亿自然人和2102万户企业等的数据。与全国13.5亿自然人和7000万中小微企业的总量相比,相差甚远,特别是企业数据。况且,央行征信系统的数据来源存在以下几方面不足:一是只对商业银行等传统金融机构开放,互联网企业也仅有腾讯一家。对其他金融企业的接口限制将从很大程度上影响到大数据风控模式的有效性。二是数据质量问题。互联网数据虽然大而庞杂,但是真实性确实有待考证。部分自然人在填写征信注册信息时有意隐瞒或错报,让征信系统的数据真实性大打折扣,也将直接影响到大数据风控对这部分自然人的判定结果。那么,如何才能保证征信数据真实有效呢?也许,目前最直接的解决方案就是交叉检验各个线上线下渠道收集的大数据。

在央行等监管部门的积极倡导下,我国商业银行、互联网公司、互联网金融企业和第三方征信机构正在寻求信用数据接口并用的合作方式。伴随着全网大数据共享时代的到来,互联网动态数据勾勒的信用家族图谱也会越发清晰透明。

在大数据风控模式的数据来源中,电商大数据和生活服务类大数据所占的比重是比较大的。电商大数据最成功的例子是阿里巴巴。其利用旗下B2B和B2C电商平台阿里巴巴、淘宝、天猫及第三方支付提供商支付宝等积累的大量交易和支付数据作为大数据风控最基本的数据原料,再利用平台商家的销售信用数据、银行流水及部分水电煤燃气等生活服务类数据作为外部辅助数据原料。大量真实有效的电商大数据是阿里巴巴大数据风控模型成功运行的最坚实的基础。生活服务类的大数据,商业银行的数据最全面的,如水电煤、燃气、物业、取暖、有线电视、电话充值、网络宽带等数据都是绑定个人基本身份信息的,真实度非常高,因此,生活服务类大数据是征信系统中非常重要的一种数据类型。

小贷、银行卡、信用卡类大数据的收集均是以国资系金融机构见长。例如国资系P2P平台的典型代表——开鑫贷。开鑫贷由国家开发银行的子公司国开金融、江苏信托和江苏省再担保等江苏省内国有企业共同投资设立。其特殊的国资背景可以让开鑫贷轻松收集江苏省内49家信用评级在A级以上的小贷公司的交易数据和江苏省内银行交易数据。

社交数据和搜索数据的有效真实性在业界尚处于验证探索期。目前,腾讯微信和百度搜索都与商业银行成立了合资公司,其目的在于提供大数据互联互通的解决方案,试行大数据风控模式和大数据精准营销。在数据来源不再困扰金融企业以后,大数据风控模式就可以进入到实质性应用阶段,对收集来的信用大数据进行加工处理。近年来,阿里巴巴依靠自身平台的长期积累,打造了国内顶尖的大数据风险控制系统。其优势在于:

第一、海量的信用数据来源。据2015年阿里巴巴集团财报显示,活跃用户数已经达到4.07亿,而我国网络购物用户不过4.13亿。全中国98.5%的网购用户均是阿里的用户。与此同时,企业客户也超过了8000万。阿里巴巴的大数据几乎覆盖了现有的电商、社交、生活服务等领域的信用数据。这固然反映了阿里巴巴信息采集能力的强大。

第二、可靠性比较高的信息数据。2015年,阿里巴巴的电商交易额(GMV)继续平稳增加,达到2.95万亿,占据90%左右的网络零售市场。体量巨大的交易额,无疑让阿里巴巴采集的大数据比第三方征信机构的大数据更加广泛,更加贴近交易和支付环节,甚至可以说比央行征信系统的信用数据更加详实、更有活性。

第三、稳健的风险控制能力。经过与银行、基金等传统金融机构的合作,阿里巴巴已经结合内外部优势研发出更符合大数据时代的风险控制系统。风控覆盖贷款前、中、后三个阶段。从2006年最早的支付宝简易账户系统到现在阿里小贷的俗称“水文模型”的智能实时监控系统,阿里巴巴稳健的风险控制能力经历了十年的磨练,一直被业界津津乐道。值得一提的是,传统金融机构也在不断地认可阿里巴巴的大数据风控模式,通过产品组合、投资外包等方式来深化改进自有的传统金融风控模式。例如,2014年7月22日,阿里巴巴与中行、招行、建行、平安、邮储、上海银行、兴业银行7家银行宣布深度合作推出网商贷高级版等产品;

第四、高效实用的信贷模型。在阿里小贷,申请、审查、监控、交易等信贷流程全在互联网完成,从借款到放贷,全程1-10分钟。如此高效的信贷流水线,不仅完美地改善了传统金融风控信贷流程长、手续繁琐等问题,而且最大限度地降低了借贷双方的信贷成本和时间成本。郭功文、晨晓在《阿里金融PK商业银行》里指出:通常商业银行客户经理最多能管理100家小微企业,阿里小贷信贷经理已经提升到1000家以上。而银行单笔信贷成本在2000元左右,阿里小贷只有2.3元。

正如李瑞冬在《中小微企业网络融资问题研究》提到的一样,阿里小贷已经成为这一领域极具代表性的模式。如此惊人的创新源于阿里巴巴先进的大数据风控模式。其风控系统的业务流程如图2所示:

图 2 阿里小贷大数据风控模式结构图

第一步,先通过阿里巴巴公司的阿里妈妈、阿里巴巴等B2B和淘宝、天猫、花呗、阿里旅行、淘点点等B2C电子商务平台收集互联网用户累积沉淀的交易大数据,并利用在线视频技术实现客户资信状况的全方位调查,调查处理部分噪音数据后,将其和支付宝等支付平台的支付大数据及生活服务类大数据进行模式匹配,建立大数据风控模型,即大数据授信审贷模型——水文模型。

第二步, 阿里小贷的主要类型有淘宝贷款和阿里贷款,提供的服务有淘宝或天猫信用贷款、电商订单贷款及阿里信用贷款。客户主要面向阿里电商平台的店铺商家,所以阿里小贷可以轻易获得客户的历史数据。这些历史数据的验证是利用交叉验证技术来实现的,数据的真实性还需要第三方同类型店铺或社交数据进行辅助验证。比如,假设淘宝上卖游泳设备的某一个商家只有夏季的销售业绩最好,这个商家对外的投放额度也会随之增长。通过阿里小贷的水文模型,可以将此商家的数据进行同比和环比分析,验证数据和决策的准确度,进而向店铺发放合适的贷款额度。值得一提的是,阿里小贷的评分卡体系是通过沙盘推演技术和机器学习模型进行确立的,风控系统的决策引擎和量化定价分析都与其有相关性。

第三,阿里小贷的水文模型分为贷款前、贷款中、贷款后、市场分析、信用体系和反欺诈六个创新研究板块。在其实时风险监管方面,研发了一套网络人际爬虫系统,可以不间断地捕捉人际关系信息,通过关系映射还原成跨地域跨时间的信用评价,与专家规则进行匹配和关联分析,最终出具大数据风控报告,供风险管理系统作出相应自动化决策。

原刊于《长江大数据》2016年10月

个人简介
杨望 瀚德金融科技集团研究院执行院长、中国人民大学金融科技研究所高级研究员、国际货币研究所研究员。观察经济气象,思考经济趋势 | 读懂金融商业本质
每日关注 更多
杨望 的日志归档
[查看更多]
赞助商广告