快速导航×

风控那些事2024-02-04 17:26:04

  最近有一部分同学想做评分卡模型开发,得知他们都是想从传统的风控模块或者是策略模块想转到数据建模的方向来。转型是痛苦的,需要学习一些知识跨过自己的舒适区,起码工具这一块得先提前学习了解下。曾经见证过一家传统的金融公司在转型之际,公司对一传统的信贷人员开刀。所以未雨绸缪总是好。某些消费贷公司,由于产品额度低、周期短、客户体量大,靠人工已经基本不可能支持公司的运营了。这些类型的公司基本已经砍掉传统审批的团队,人工审批的人数是0。比如X聚盈,一家P2P公司,18年时候整个风控团队加起来是5个人,1个领导+2个模型+2个策略。而且领导和2个策略的同事是要同担批核的任务。5个人的风控团队,这在传统的信贷行业看来是很不可思议的。泛亚电竞官方在很多传统公司里,起码都是几十个人的配置。传统公司里,会把Underwriting+MIS+催收,合在一起构成整个风控,单单催收就有十几二十号人。而在这家纯P2P公司里,完全不同,自家公司的催收人员占比非常少,只催DPD7内的。只要超过DPD7,马上交给催收公司。传统的机构,人力成本负担太重,已经严重拖垮了整个公司的运营。互金公司,基本已经是非常轻资产运营了。虽然目前仍然是个弱人工智能的时刻,在信贷领域也是偏策略居多,但是不排除以后会随着数据丰富与多样性,模型可以完全占大头,或者完全替换掉策略,最后实现强人工智能来根据风险偏好主动筛选客户。说到这个就突然想起来了,泛亚电竞官方前阵子突然很流行的量化投资,某机构用人工智能替客户选了一部分股票,结果碰到了政策面,股市一片哀嚎!股市能预测的到的吗?特别是中国的股市。回归主题,策略跟数据当然在风控领域是相当关键的,有些公司完全做这方面的轻资产转型了,但是目前还是有一些问题存在。从一些做过的项目里挑一些普遍的现象:曾经参与过一些模型冷启动的项目,了解到目前一些传统行业的巨头,比如华润、美的 金蝶,连富士康这样的企业都在跨板块经验。当然这些公司大部分都是成立一个金融事业部如果后期运作良好便独立运营为一个金融子公司。但是由于是跨板块经营的,所以苦于前期确实没有大量模型样本,而且重要的是数据获取权限也是个大问题。前期能出来一个精准的模型,用脚想想也知道。比如说HuaRun,对外宣传手里有将近一两千万的优质资产在手,想做批额在十几到三十几万的产品,前期就想开发模型。他们这些客户都是一些在自己渠道里持有的客户,各种跟社区绑定的用户,据说还有HuaRunTong这样的商城数据能获取。我们不说用户对他们家社区的粘性有多少,就是一个金融子公司要想有权限获得集团的数据,想想也不是件容易的事。鉴于此,模型只能靠冷启动进行。什么叫冷启动,业内叫暴力建模,所以模型的效果从字面都可略知一二。公司的数据化平台建设,是和我们的数据提取相关的。一个大型的信贷平台,至少包括的系统有以下几部分:(当然这部分我在之前的文章里也有涉及到:风控建模:催收评分卡(四)--变量整理除了跟数据获取相关外还跟什么有关系?)· 核心系统:存储客户的账务信息,还款计划,还款流水等;完成客户开户、放款、冻结额度等操作· 客户端系统:客户在使用终端的一些交互内容,与后台逻辑;将对应的数据存储· 数据计算平台:满足风控实时审批过程中需要变量的实时计算,对接业务范围内审批需要的内部系统数据· 征信平台:统一对接所有外部数据源,进行统一管理;满足审批过程中的灵活调用· 资管系统:匹配开户资金方与放款时资金方的选择;P2P模式中单个资产的撮合· 反欺诈系统:主要做关系网络的生成与衍生变量的计算;定义网络中节点的黑白当然以上是最理想的一个风控系统,然后在实际中,我们平时工作中的最常涉及的可能就是某几个系统而已。为了帮助大家理解,我举一个稍微简单点的案例:比如审批系统是经常会跟征信平台进行交互的,但是当征信平台出现调用外部数据源异常的时候,这时该怎么处理?

  1.找一个备用数据源。但是目前该数据源是仍在生产库中的数据源,找备用数据源就会造成卡单情况。2.空跑。如果是刚好调用的是黑名单,那这个客户就会被绕过去。3.挂起来。才用人工干预的方式,并且把这个节点进入到差错中心里,进一步等待人工审核。思考下,上面哪个才是正确答案。所以扯回来,公司的IT平台建设能力跟数据埋点能力才是和我们的数据能否有效获取息息相关。试想一下,我们在做某条策略的时候,想取用户在最近一个月使用app的次数,突然被IT部门告知接口没有开发好,或者因为权限不足没有获得客户的授权,导致这个数无法获取。相关应用需要在下次版本更新的时候迭代完成,下次迭代的时间是在1个月后。好好想想,遇到这种情况还能怎样取数…..归根到底,公司的系统平台的数据化建设,都是跟前期的架构有很大关系。如果在之前的某些系统功能因为设计和架构的缺陷导致无法实现,之后也就只能舍弃了某些平台,从新开发需求。好运的是,该系统前期留好端口,咱们之前提的需求:获取一个3期的产品的客户在夜间手机的使用轨迹,也许加急做个需求就能顺利开发完成。如果悲剧点,被告知系统层面根本不支持该功能,只能另外开发新平台。但更悲剧的是新平台建设好了,但是因为金融业务迭代快,之前的三期产品已经不再运营,目前已经需要上线期的贷款产品,再发现新平台依旧不能满足目前的某些功能,又需要IT在新系统上继续开发新的需求。循环的怪圈像在开玩笑,咱们还怎么做事。反正见证的公司已经不止一次出现过这种问题了。三;外部公司的数据支持多头、反欺诈、黑名单、这些外部数据都是很好的支撑,是对公司自身数据的很好的一个补充,目前很多金融公司非常依赖这样的公司提供数据的。但是这些公司部分数据参差不齐,大的平台商可能还好,因为他们能跟一手数据产商合作,拿到最前端数据,但是一分钱一分货啊,价格也是忒贵的。数据方一般能被大家使用的,泛亚电竞官方一般也就那么几家。但对于一些实力有所欠缺的公司,只能跟非一手产商合作,而这些非一手产商,是很少会标配自己的数据是二手的。一手数据跟二手数据的区别时什么呢?首先是数据质量。有时候一手数据和二手数据的数据质量差的不只是一个档次。比如最基本的指标,查得率就没法说。虽然这些指标前期能通过对数据抽查验证,但是真正在使用的时候却往往又变得其低。当然这个数据质量的测试是跟数据人员的测试能力相关。之前看一位同事说数据测试,测得某个产商的数据返回值特别低,分析后发现他只拿批核后的那部分客群做测试。在做测试的时候,除了按照常规的指标:查得率、 覆盖率、误拒率、有效差异率、无效差异率之外,再稍微提几点稍微说下,(更详细点的会在VIP粉丝群跟知识星球里分享)1.你应该拿同时进件的同批客户去做数据测试。从目前来看,拒绝的客群覆盖率比较高,批核后的客群覆盖低。2.最好拿最多的数据样本进行测试,但是目前来看,不太可能3.如果可以拿全年的数据,如果不能拿全年的数据测试,可以测试同类产品或者近期数据节点的数据样本进行测试另一点就是稳定性,这些产商,往往出来的数据里,会有一个问题,就是到了某个节段,返回值通常都非常慢,有时候需要耗时是平日的几十倍;平时需要几秒或者十几秒的,到了某个时间段,耗时常常会花到半个小时。这些二手产商,因为跟一手再倒腾了数据,所以有时一手进行系统更迭或者数据同步的时候,影响到了他们的数据同步性,导致了返回值的延后。所以除了真正数据测试时候,是真要跟同行的朋友打听下目前数据产商的数据质量情况等。模型跟策略要完美结合,风控才有一个比较好的成绩。否则,单单靠策略根本不可能精细化运营。风控故事太多啦,篇幅有限,下次再慢慢多说一些,如果有兴趣感觉开个专题叫:话痨风控。我在文章里,一直强调的大家做任何事实要看全局,看基本面,看业务逻辑。我们应该以模型、策略,或者其他能打开整个金融信贷行业的口子,慢慢去了解整个行业。一个公司能否发展壮大依赖整个行业是不是处于朝阳有活力,而我们作为其中的一份子能发展也是依赖于公司是否能良性发展。所以归根到底,个人的发展还是跟整个行业前景密切相关,最近大环境不景气,想必也影响到大部分人的钱途。退潮的时候才知道谁是在裸泳,行业在洗盘的时候不仅清洗的是不良企业,同时也会是技术和专业度上相对薄弱的同仁。所以,为了自己的良性发展,童鞋们一起努力学习,争取进步吧!如果想获取下数据测试更深入的方法或者之前文章的数据源代码,欢迎加下官微聊聊,跟我们一起学习一起成长!

  十年职场生涯,这个长期混迹在风控界和科技界,摸爬滚打的大叔,曾经就职于全国最大的固网运营商平台、国内最大的ERP软件公司和一家老牌的互金公司,如果你想了解他,欢迎加入一起学习一起聊!