风控特征画像体系建设实践

admin 2024年1月17日08:41:02评论22 views字数 2537阅读8分27秒阅读模式
风控特征画像是从多个维度描述客户风险的工具。维度细分有助于我们准确地刻画每个具体维度的差异,达到准确认识客户的目的。风控特征画像体系可以针对营销、贷前、贷中和贷后4个场景,选取合适的数据维度分别进行搭建。根据不同场景先给出每个场景下的可用数据维度,再给出可用特征维度,直观地展示每个场景下的特征画像。

用户维度画像

风控特征画像体系建设实践

  • 营销特征画像

关于营销特征数据,对于历史存量客户,包括客户基本信息、历史申请记录信息和多头借贷信息等;对于全新客户,数据积累较少,可能有浏览行为数据、客户的部分基本信息和第三方数据。以对历史存量客户做客户召回场景为例,我们给出主要数据维度和基于这些数据维度创建的特征画像。营销特征画像可用的数据维度如图所示。

风控特征画像体系建设实践

客户基本信息主要是客户在历史申请时自填的信息,通常包含客户本人的学历、年龄、性别、从事行业和居住地等;对于多头借贷信息,我们通常从第三方数据服务提供商有偿获取,这类信息通常包含客户在多个机构的申请、放款和逾期情况;历史申请记录是指客户在本机构的历史申请情况。基于上述信息,我们可以描绘出某一类客户的营销特征画像,如图所示。

风控特征画像体系建设实践

  • 贷前特征画像

贷前特征画像可以应用在反欺诈、信用风险评估和风险定价阶段。我们以新客户申请阶段中的信用风险评估和风险定价的应用为例进行介绍。在决定是否对客户放款和放款额度时,我们主要考虑客户的偿还能力、守约概率。这些需要考虑的信息可以从客户基本收入情况、自有资产情况、历史借贷情况、社交关系和行为习惯上体现,它们也是贷前特征画像主要依赖的数据维度。贷前特征画像可以使用的数据包括客户基本信息、客户行为数据、历史订单数据、客户授权数据和ID关联数据等。从数据获取来源上来说,有些数据来自客户申请时自填或授权获取,有些数据来自外部接入。贷前特征画像可用数据维度如图所示。

风控特征画像体系建设实践

1.客户基本信息 客户基本信息是贷前特征画像紧密依赖的一类数据,可以体现客户偿还能力。客户基本信息主要来自客户注册时自填,还有部分数据来自客户征信报告中的基本信息项。客户基本信息通常包含客户本人的基本情况,工作与收入情况,家庭情况,借贷信息,公共服务数据,以及地址类数据等。通过客户基本信息,我们可以描绘某类客户的贷前特征画像,如下图所示。客户注册信息与征信报告中均包含的信息项可以进行交叉验证,产生“是否一致”类特征并作为特征画像的一部分,这类数据作为交叉验证类特征,将在本节最后列出。

风控特征画像体系建设实践

2.客户授权数据 客户授权数据是指客户填写、上传或授权抓取的数据。客户授权数据体现了客户的行为习惯、社会关系,这些数据有助于对客户进行风险评估。例如,客户使用的手机的品牌、手机价格是客户消费习惯的一种体现,结合客户的职业、收入情况等,我们可以评估客户的风险,如收入偏低但短期内用多个高端手机申请借款的客户,其违约的概率会偏高。客户授权数据通常包含设备指纹信息、联系人信息、手机应用列表和GPS位置信息等。需要注意的是,客户授权数据是在客户授权的情况下获得的,一些数据可能因客户未授权而缺失。贷前基于客户授权数据创建的特征画像,如图所示:

风控特征画像体系建设实践

3.客户行为数据 客户行为数据包括App(前端)埋点数据、服务端埋点数据、消费行为数据和网页浏览数据。这些数据可以描述客户在操作行为上的偏好。贷前基于客户行为数据搭建的特征画像如图所示。

风控特征画像体系建设实践

4.ID关联数据 ID关联数据是指多个标识客户唯一身份类ID的数据。此类数据中通常会隐含一些客户自身信息或客户之间的关联关系,通过挖掘这些关系,我们可以提升对客户风险评估的准确性。例如,我们可以将某客户的身份证号码作为索引,在数据库中,查询与此身份证号码关联的订单,以获取此客户利用其他手机号申请的订单,从而丰富客户画像。贷前利用ID关联数据可以生成的特征画像如图所示。

风控特征画像体系建设实践

5.历史订单数据 历史订单数据反映了客户对历史订单的守约或违约情况,是贷前特征画像依赖的重要数据。我们可以从多个角度分析历史订单数据并生成特征画像,如通过唯一身份标识(身份证号、手机号、设备ID),订单类型(申请订单与放款订单),联系人和GPS关联订单,以及订单额度相关指标生成客户特征画像,如图所示。

风控特征画像体系建设实践

客户基本信息、客户授权数据、客户行为数据、ID关联数据和历史订单数据是贷前特征画像依赖的主要数据。另外从外部获取的多头数据、征信数据也可以用来丰富贷前特征画像。除单一数据源维度以外,我们还可以通过跨数据源交叉验证的方式创建贷前特征画像,如客户自填收入和征信报告中客户月收入的差值过大,可能意味着客户未如实填写收入信息,与如实填写的客户相比,这类客户的违约风险高。交叉验证类特征画像如图所示。

风控特征画像体系建设实践

  • 贷中特征画像

在数据维度上,贷中特征画像可以使用贷前特征画像的所有数据(但特征取值可能和贷前时间点不同),如“客户安装贷款类App的个数”在贷前时间点和贷中时间点特征的变化值可以反映客户在首笔订单放款之后对资金的需求情况。除此之外,贷中特征还可以使用当前未完结订单数据(可能有已完结账单)、贷中行为埋点数据、审批结果和还款提醒数据。贷中特征画像可用数据维度如图所示。

风控特征画像体系建设实践

  1. 贷中行为及订单数据 贷中特征画像可以使用贷中客户行为数据、未完结订单数据、审批结果和还款提醒数据,使用这些数据创建的特征维度如图所示。

    风控特征画像体系建设实践

  2. 客户授权数据及其变化 除贷中产生的数据以外,用户授权数据的变化信息也可用在贷中特征画像。客户授权数据的变化可能预示着客户违约风险的变化。挖掘相关特征,有助于我们捕捉这种动态变化,达到准确了解客户违约风险变化的目的。此类特征示例如图所示。

    风控特征画像体系建设实践

  • 贷后特征画像

贷后特征画像反映了客户在贷后的违约风险(主要体现为客户还款的意愿和能力),我们可以将其用于贷后风险模型或规则中。贷后特征画像可使用历史订单的审批结果和贷后跟进记录,贷后客户行为数据,以及贷前与贷中的所有数据维度来挖掘不同时间点信息变化类特征。贷后特征画像可用数据维度如图所示。

风控特征画像体系建设实践

贷后特征画像可用数据维度分为两类:一类是包含贷后客户行为、审批结果和贷后跟进记录的数据;另一类是与贷前和贷中相比信息变化的数据。贷后特征画像的生成方式与贷前特征画像和贷中特征画像类似,此处不再赘述。

(本文来源:数据科学与智能风控)

原文始发于微信公众号(数据思考笔记):风控特征画像体系建设实践

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2024年1月17日08:41:02
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   风控特征画像体系建设实践http://cn-sec.com/archives/2401600.html

发表评论

匿名网友 填写信息