Skip to main content
首页 > 综合资讯 > 网络快报 »正文

马上消费金融大数据应用与风控技术部:揭秘大数据风控实时审批系统

网络快报 来源:头条新闻网 adminyang 2018-04-08 15:10:48 查看评论 加入收藏

  近年来,消费金融行业快速发展,在金融回归本源大趋势下,线上线下的大量消费场景得到开发,但风控始终是消费金融发展的基石,在越来越强调普惠金融、服务效率、用户体验、消费者权益保护的当下,消费贷款的审批对IT系统尤其是对核心风控决策系统提出了很高的要求和挑战。

  首先,消费贷款的客单价只有3000-4000元,如何做到较低的审批成本,较高的审批通过率和较低的逾期率,是最关键也是最大的一个挑战;第二,相对于传统银行,互联网消费金融公司从线上线下全国多渠道获客,客户流量容易出现突发性,且全自动审批,依靠大量数据做决策,体现出高并发、大数据的特性;第三,消费金融业务大多发生在实时借贷场景,这决定了审批授信的速度对用户体验非常关键,如何做到极致的审批速度,提升用户体验,增加获客成功率也是一大挑战。

  针对消费金融业务场景的特点与挑战,马上消费金融进行了一些创新性探索,其搭建的基于大数据消费金融智能决策平台可以做到全自动审批(无人工处理)、提供24小时不间断服务并且具有高并发、大数据、人工智能等能力,其关键创新点如下:

  审批数据的接入与管理

  马上消费金融作为互联网消费金融持牌机构除了直连央行征信外,也会接入公安、芝麻等数十个外部数据源,以及自建数据源,在审批过程中将并行调用这些数据源服务,瞬时产生大量的数据作为自动决策的依据基础。

  数据对于审批至关重要,马上从数据源管理制度和IT系统建设两方面做了大量的工作,设有专门的团队负责数据源发现、商务谈判、评测、生产效果跟踪、下线等工作;在IT系统方面,自主研发了统一数据接入系统,满足数据源接入需求,目前已升级到3.0版本,具有少量编码即可完成开发、灵活的mock测试支持、调用可精细化追踪、数据成本可精细化管理与分摊、稳定的服务、自动服务切换、关键数据源的动态配额、精细的数据质量与服务稳定性监控、数据安全控制、高并发与大数据量存储支持、可在大数据平台准实时分析数据的能力。

  二、自建与应用人工智能技术

  对于小额、分散、高频、大量的消费金融业务,传统的人工审批已经不再适合,以马上消费金融公司为例,日审批峰值100万单,假设1人平均1单审批耗时5分钟,1日工作8小时测算,1000000/(8*60/5)=10416,最多需要1万人做审批,招聘1万专业的审批人员是不可能完成的任务,且成本巨大,假设人均工资年薪20万,则年人力成本:10416*200000=2083200000,约20亿RMB,加上为1万人提供的场地等附加费用,实际成本将更加巨大,可见在消费金融领域,人工智能有着很好的应用场景,也是消费金融公司的核心能力。

  马上消费作为一家金融科技公司,在人工智能领域做了相当多的投入,目前拥有超过百人的人工智能专家团队,主要服务于以下4个方面:

  1, 反欺诈与授信模型:基于存量用户数据、外部接入数据、自建数据,围绕信贷审批,利用传统、机器学习方法训练模型,用于自动识别用户欺诈行为和给予合理的授信额度,目前已经建立了几十万的变量特征库和上百个模型,用于不同的数据源、产品和审批阶段,组合应用后效果显著,做到较高的通过率和较低的逾期率;

  2, 人脸识别:自研Face X活体人脸识别技术,经过几十亿样本数据的训练与生产应用的不断优化,目前识别精准度高达99%,可以应对绝大部分复杂环境,对于检验是否是真人以及是否是客户本人起到了非常好的效果,有效降低了欺诈的概率,马上消费自研的人脸识别技术效果优与市面上通用产品,其中有2点关键的因素:一是在业务开展中积累了大量的照片库,而这些照片均来自消费金融这个业务领域,更利于训练出符合该领域特征的模型;第二:建立了欺诈份子的照片库,对于欺诈份子的照片可以做单独的处理,进一步提升效果。

  3, 文本识别:应用NLP的语意分析等技术识别文本语意,应用在智能客服和舆情监控方面,马上消费金融自研的智能客服系统对客户的问题解决率超过80%,达到一流水准,大幅降低了语音客服的占比,降低客服成本的同时改善了客服体验。

  4, 语音识别:自研语音识别技术,目前应用在催收和客服场景,未来会拓展到贷前环节,应用到反欺诈领域。

  三、审批规则引擎

  对于自动化风控决策,马上消费金融公司在多年的实践下,逐渐形成以模型为主、规则为辅的审批策略,以便做到更高的通过率和更低的逾期率,围绕该策略,创新性的研发出为消费金融领域独有的决策规则引擎,该规则引擎主要特点如下:

  1, 轻规则、重模型:模型可以综合更多维度的数据做出最佳判断,而规则更适合强因素的判断,比如:黑名单;

  2, 具有变量池和规则池,可以更好的做到变量共享和规则共享;

  3, 支持A/B test、空转测试功能;

  4, 支持线下效果评测,在开发新规则/模型或者调整规则/模型时,模拟生产环境,应用真实数据评测新规则/模型效果

  5, 精细化的监控机制,可以快速发现规则/模型异常和任何规则变化对审批效果的影响分析。

  四、审批工作流系统

  在用户申请贷款的审批过程中,需要经过多个决策环节,总体上可以归类为3个环节,1:合规性判断;2:反欺诈;3:信用与额度评估,这些大的环节下可能会有一些小的环节,每个小环节对应一到多个工作流节点,通常是一个小环节由2个工作流节点组成,第一个节点负责并行调用决策依赖的原始数据或者模型数据,第二个节点调用规则引擎进行决策,一个正常的用户通常会走完整个流程,而不合规用户则在第一个大的环节被拒绝,欺诈用户在第二个大的环节被拒绝,对于走完整个流程的正常用户审批耗时最长,由于消费金融通常是在消费场景下开展放贷业务,所以对实时性要求较高,是决定用户体验的很重要一个因素,马上消费金融目前已经做到平均亚秒级授信。

  除了速度快的特点外,还有如下特点:

  1, 适合金融风控:具有延迟审批、限流、全自动、与决策规则引擎配合等功能;

  a、 延迟审批:当审批依赖的数据、系统异常或者系统容量不足时,暂时挂起该申请单,当具备条件后再继续审批,不放弃任何一个用户,同时保护系统的稳定;

  b、 限流:当流量过大时,启动限流机制,确保审批系统的稳定性;

  c、 全自动:无人工环节,根据规则引擎返回结果自动流转;

  d、 与决策规则引擎配合:打通决策流程与决策规则系统,支持灰度发布、线上A/B test, 线下审批效果评测等功能。

  2, 支持高并发和大数据:审批工作流在流程流转过程中将产生大量流程数据和业务数据,马上消费金融公司最高日审批百万单,峰值200单/秒,产生数据峰值超过1000万条/秒(在自动审核1个用户的过程中,将调用上十个原始数据服务,上十个变量服务,产生数据总量可达十万级),采用大数据分布式存储技术和分布式缓存技术支持大量数据的高并发读写,架构支持在线无感知扩容,理论上支持任意流量。

  3, 完善/精细的业务监控,比如:审批通过率异动监控,这是非常复杂的工作,不同产品、渠道,以及申请时间所属的周天和时段不同,产品进件体量不同均有不同的通过率波动,会参考历史数据并充分考虑业务差异,做精细化的监控策略,尽量及时、准确的判断出异常波动,相关人员及时跟进,减少损失, 如果判断出现较大误差,则真假难辨,监控实则无效。

  、支撑审批的大数据技术

  离线计算平台

  放贷审批业务具有典型的数据驱动特性,审批规则的形成、模型训练、反欺诈方案的形成都非常依赖对数据理解、挖掘和加工,这些是风控业务必不可少的核心工作,如何通过IT方式支持好该工作,对于风控至关重要。

  马上消费金融公司对于该IT需求,提供了一套整体的解决方案:整合元数据系统、数据质量系统、调度系统、数据交换平台、大数据计算与存储平台、数据开发平台、变量管理系统、模型训练平台、审批效果预测平台等系统,形成统一的离线计算平台,从数据来源、管理、存储、计算、应用、分发、安全形成整体的方案,支持到大数据仓库、大数据分析、变量开发、模型训练、安全合规、提数等业务。

  统一变量计算平台

  通过规则/模型做实时决策时需要依托计算的变量,变量计算在规则/模型训练占据非常重要的作用,在开发阶段如何快速开发,上线后如何快速计算并且提供良好的管理与监控功能,以及如何提升规则/模型岗与IT技术岗的协作效率,提升规则/模型迭代速度,这些是金融风控面临的核心问题,为解决这些问题打造了统一变量计算平台,该平台具有如下功能或者特性:

  1, 从变量需求、开发、上线、监控进行全生命周期支持;

  2, 形成变量池,高效共享变量;

  3, 零编码,只需提供sql或者配置化即可完成绝大部分变量的开发,由于采用sql和配置化的开发方式,大大降低了变量开发的难度,实现非技术岗的规则/模型师可以自助完成变量开发,避免需求提交给IT时,走IT研发过程带来的时间消耗,大幅提升开发效率,从而实现规则与模型的快速迭代上线,快速提升风控能力,提升审批通过率,降低逾期率;

  4, 执行引擎采用基于开源技术扩展后的大数据流计算技术,做到高效开发与运行,计算速度与传统多线程计算相比提升巨大,比如:人行征信5000个变量只需20ms计算完成;

  5, 打通离线与实时计算,避免离线跑批计算与生产实时计算技术不同带来的研发和时间损耗。

  复杂网络

  借款欺诈中,团伙或者类团伙(后续均称为团伙)欺诈通常会带来巨大的逾期损失,是重点防范对象,基于图技术的复杂网络可以实时识别出团伙欺诈,在复杂网络中放入用户的身份证号、电话、关键的行为数据等,形成用户的个人档案,并且与其他用户的档案相关信息建立关联,实现毫秒级追踪,大幅提升实时反欺诈的效果。

  实时数仓

  在实时决策中,需用到账务、支付、审批等系统的最新数据,基于这些数据加工成审批规则/模型的变量,整个过程需毫秒级完成。实时数仓项目提供2种创新方案:

  1,实时同步全公司所有库表数据到同一个大数据数据库,并且自研分布式sql查询引擎,实现二级索引和跨表join查询;

  2,不移动数据,直接在业务系统从库实现跨库跨表联合查询。

  以上2种方案均可以实现跨异构数据库、大数据量、实时联合查询。

  实时数仓的建立进一步提升实时审批决策能力,并且可以优化整个公司的数据架构、降低数据应用难度并避免了数据服务化需开发与排期的工作,让数据应用像水电煤一样快捷与方便。

  结语

  消费信贷审批,如何把资金给到真正需要的客户,满足各种场景的消费需求,而不是流入欺诈份子,更好的实践普惠金融,在金融科技上还需不断创新,并且对已有科技能力不断深化,这是长期持续的工作。

广告06

微信