数据化风控:与乐信CRO对话的一点分享

投资互金多年,风雨桀骜,不屈不挠。行业这几年被毒打如家常便血,三天两头,胆战心惊,为点碎银操碎了心。一直以来,我都有两个互金持仓,一个是360数科,另一个就是乐信。虽然数(科)九寒天,但也乐(信)此不疲,我始终认为行业春天不远。

反正最坏的已经过了,我这个死多头,会撑到底。

这次有机会见到乔杨老师,乐信的CRO,他是业内比较早研究、实践大数据风控的专家,之前在Discover和京东数科担任过管理职位,跟我也是前同事。乔老师写过一本信用评分建模的教程叫《数据化风控》,我读了一遍很受益,大家有兴趣也可以读一读。

目前乐信的风控能力看起来确实比较牛逼:

为论述简单起见,我从电商零售行业里借用一个概念,以下将平台的借款额称为GMV。

截止2021年Q2,乐信资产质量达到两年最优,首逾率只有4.92%,同比下降 40%,同时不良回收率同比上升了30%。另外一个比较核心的指标,FPD30(First Payment Default 30,指首个还款日后30天逾期的GMV除以下单月订单GMV的比例)则达到0.62%,也刷了历史新低。这个指标过去12个月连续稳定在1%之下。

那么如何做到这个风控结果:用行业来说,就是在充分利用大数据的基础上,搭建基于AI的风险管理体系。原则是最小化人的主观因素,最小化人工操作风险。简单论述一下:

1. 抽象数据下的AI风控

我认为现代性的本质,就是具象事物的抽象化与数据化,以便于某些人开展进一步的捕捉、管理、预测等骚操作。对于人类尊严这个层面,这种抽象是一种践踏;但对工业化生产与商业效率而言,抽象的威力简直堪比火车头,也是现代社会的起步。艺术也是如此,你画个逼真到堪比光学镜头下的照片的,这不就叫现代艺术,这是古代的照相术;而你画的人像只有一些残枝败叶,才是现代艺术。

在信用业、金融业里,对于人抽象,就是给其做信用画像(credit profile),比较有名的比如5C模型——character, capacity, capital, collateral, conditions;又比如信用评分,从此你是不是靠谱——用马克思韦伯的话来说——就不是一个价值理性,而近似为为一个工具理性;就不是笼统的好坏,而变成了多好与多坏。比如,潘驴的信用评分是720分,而邓小闲的信用评分是660分,那么我们不仅知道潘驴的信用要比邓小闲好,我们还能量化地知道潘驴比邓小闲要好60分。

这个人喜不喜欢读康德对于其会不会守约还钱有没有影响?可能有,但影响不太大。那喜欢吃披萨而不是烧饼呢?估计没什么影响。而对于信用卡、消费贷、现金贷这种无抵押的贷款而言,借款人的抽象无非是字段,年龄、性别、婚姻、学历、职业、住房、居住地、贷款金额、期数,等等,并施以权重。你可以有一个长变量列表(long list),然后将其筛选成更有区隔力与预测力的短变量列表(short list),筛除掉诸如喜不喜欢读康德这样比较不C位的变量,通过正确定价或者有利于出借人的错误定价来赚钱。

贷中的观察也可以用一套抽象,比如什么是坏,可以界定为违约就是坏,比如界定为未来一年内出现M2以上逾期、催收、呆账、强停、拒往、协商,就是违约,就是坏。什么是“中性”或者“不好不坏”,比如“半年内有一次M1”就算不好不坏,无鲜明的风险特征,很难判断好坏。这样又是把一个价值理性问题(判断好坏)近似成了一个工具理性问题(判断高低),为的就是好解决问题。

随计算机科学的发展、人工智能的崛起、不同算法玩命儿式的迭代,这样的数据可以越来越丰富,数据处理可以越来越精细化,策略可以越来越得心应手。乐信搭建了一整套基于人工智能的风险策略系统,而底层技术靠啥——大数据、人工智能、区块链、云计算等等前沿科技。以下是走来的是乐信风控方阵:

但光有这些其实是不够的的。至少在此时此刻,我们还不能完全把所有决策,都交给机器人。

2. 人类介入的管理与监控

所以我们一定还要有一整套的有“人类专家”介入的管理体系,去监控、管理上述一整套基于AI的策略功能体系。比如乐信怎么做,他们搭建了一套可以认为干预的系统,分析、监控并预警风险,完成按天、按周、按月一整套的追踪预警分析机制。

以下这段话乔阳老师说得很到位,我就直接引用了。

“比如在‘ 按天’这个维度上,可以对实时坏帐率有一个预测,比如对风险指标的一些目标进行走势的预测,包括核心指标影响力的自动化评估,在周期里我们可能基于大盘各业务进行收益的复盘,在每月的维度,我们可以去根据人群的风险识别以及策略效能进行管控。

有了这套系统,基于我们的坏帐预测,我们能够把我们的策略、模型价值、用户管理、催收运营,这一系列指标拆分到天的维度,基于我们的体系,按天的维度去追踪我们目标达成是否出现偏差,如果出现偏差我们可以用自动化算法,把造成偏差的‘ 罪魁祸首’展现出来,再进行针对化的一些风险管控和拦截。

比如我们在今年早期发现我们的入催率有一定的上升,我们自动化预警系统就发现了这个趋势提出了预警,那有了这个预警,我们的自动化归因系统就会对这个波动产生最大的一些影响,根据气泡图的方式展现出来,气泡的大小代表影响力的大小。”

专家的话比较抽象,我来举个例子。有一批人,可能既是乐信也是某呗授信用户。今年初,某宝对某呗用户搞了一波降额和关帐户的操作,这批用户的流动性就出现压力,乐信就可以快速分析并定位出这批用户风险上升。但这毕竟还是一个粗分类,再通过自动化检测数据,一键拆分,把造成风险上升的用户再精细到不同的用户分组,最后针对不同用户分组人群,进行针对性的策略拦截和管控。

3. 高增长下的优化逻辑

当然数据风控极大增加了效率,提高了通过率,也降低了坏账率,这些我认为都是创新之于金融业的效率的提升;而更多的人能享受到普惠金融,也可以说是一种公平的提升。效率与公平都得到了照顾。

当然我们也要注意,过往这个行业增速非常快,所以也就是分母增长非常快,坏账率自然比较低。信用卡的不良率为什么会相对比较高(不良率定义为M3+,远超1%),且长期降不下来?就是因为信用卡整个行业发展停滞,分母增长极慢。所以互金在增速下降后是否还能维持现在的坏账率,能够解决信用卡一直解决不了的问题,是行业的挑战。

在整个监管趋严和利率下沉的趋势下,各家互金平台的风控管理能力,需要更高的要求。乐信之前在搭建整个风险定价和额度体系的时候,或许在意的是怎么去提升GMV;但现在,尤其是利率下行的市场环境下,管理层会更在乎,在风控技术架构以及系统完善后,能够通过精细化运营,兼顾各方面的影响因素,来实现针对不同人群进行不同定价(额度、利率等),以保证利润和整个业务能健康增长。

结语

达尔文有句话,叫不是最强的物种,也不是最聪明的物种能够生存下来,而是那些最能适应变化的。我认为拥抱数据化风控互金有这方面的潜质,没有最强的模型,没有最聪明的算法,只有适应于现在的风控系统;而对于未来的不确定性,我们也仍然要有敬畏之心。

我们永远都不要忘了,数据只反映过去,因为它们是来自于过去,它们对未来有一定的预见力、洞见力,但是它们不能100%准确预言未来,甚至90%也做不到。金融风险,债务危机,我们几乎能说,无论我们怎么预防,都难以避免;本来在模型里趋于完美的借款人,理性经济人,他们在可能会黑化变身,导致坏账。总之人是一个复杂的因素,你将其简化成一串串数字、一行行代码、一个个算法,在效率上确实有效,但也肯定不是万全之举。

人类有个毛病就是急于求成,常常锤子还没研究透,就开始到处找钉子。这个问题,整个数字化创新的行业都要面对。而对于信用行业、金融行业而言,所有风控从业者都应该认识到,没有百分百完美的模型,只有相对适应于当下的模型。对于未来的不确定性,我们都应该保守地留有余地。知识的僭妄永远是高悬在人类头顶的一把剑,我们不可不察。

在这种清醒下,我们来看乐信的风控,或者我们说的数字化大风控,给整个行业带来的重塑,就更有意义;我保持审慎乐观,我也相信乐信这样的互金公司在数字化风控上的迭代,是一个可以长期投资的方向。

正好昨天乐信也发了财报,数字来看依然保持稳步高速的增长,而多项核心指标也继续创历史新高。我在文章最后简单帖下数据吧,有兴趣的可以交流。

Q2营收33亿, 息税前利润10.01亿元(Non—GAAP),同比增长85%;

促成借款额达到606亿元,同比增长47.6%;

注册用户数达到1.44亿,连续8个季度增长超千万;

授信用户达到3290万元,同比增长45.2%;

90天以上的逾期率为1.85%,新增借款FDP30连续12个月小于1%。

✽本文转载自互联网,请读者仅作参考,并自行核实相关内容。