-->
近年来,随着资本市场改革进程提速,改革利好持续释放,证券行业迎来较好的发展机遇。但在互联网技术的迭代和金融开放的背景下,财富管理领域的竞争形势不断加剧,除了来自行业内的竞争,券商还要面对银行、基金甚至互联网金融的挑战,获客成本不断增加。因此,相比提高市场占有率、扩大经营规模,减少客户流失对企业来说更具吸引力。提升客户留存已成为行业关注的重要方向,能够在客户流失前及时预警,对于提高公司的竞争力有举足轻重的战略意义。
在实际的运营场景中,“流失预警”包括“资产流失人群预测”和“客群营销干预”两大部分,第一部分的工作重点是根据客户的交易和行为数据,洞察出客户隐性流失的风险;第二部分的首要难题是依托准确的数据采集,找到导致客户流失的原因,企业才能据此制定精准的营销策略,搭配特定的行为报警推送,系统化的管理客户流失。
对于预流失客群识别,传统的方式依赖于运营经验,从大量客户标签中手工选出和预流失行为最相关的标签集,组合圈选目标客群。这种方法不仅圈选结果的准确率低,而且费时费力,很难起到预期的管理效果。而数势科技基于机器学习算法,对流失预警场景进行建模,对预流失客户的精准预测和因果推断,能够有效降低客户流失率,提高客户资产留存。
下面,我们以与某证券公司的合作为例,分享数势科技通过样本构造、特征收集和模型训练三步,帮助企业建立流失预警模型的最佳实践,解析利用预警模型降低客户流失风险、提高资产留存,最终打造全生命周期精细化运营体系的方法。
在该券商内部,定义“客户流失”主要有两种方式。一种是“资产流失客群”,定义为当月日均资产小于之前某个特定月日均资产一定比例的客群(为尽量减少大盘波动因素影响,需要监测连续3个月的日均资产,但由于首月预流失客群中大部分的客户仍会在次月继续流失,因此,主要考量算法模型对首月预流失客户的预测能力),另一种是“客户销户”。通过实际分析发现,不同定义下的流失形式往往具有一定的关联,例如,在一段时间内资产降幅较大的客户,发生销户的概率大大增加。
据此,数势将流失场景的本质进行抽象,通过日期窗口轮转方式进行稀疏样本数据的有效扩充,经过数据清洗、数据采样、特征转换、特征筛选等多个环节完成特征工程。在此过程中,“数据采样”相较于其他企业运营场景有比较明显的特点和难点。因为流失客户与未流失客户天然存在巨大的量级差别,根据流失定义不同,通常会存在百级别到千级别的倍数差距,这会导致在线下进行模型训练时,即使使用均衡样本得到的模型效果非常好(AUC、F1均可达到90%以上),一旦上线验证,效果也会变得很差。究其原因,是由于训练集和测试集(也就是上线验证的真实数据)的样本分布不同,直接修改样本等同于强行改变事实。
因此,在正负样本量级差距如此大的训练集上训练模型,是一件很困难的事情。如我们将流失客户与未流失客户按照9:1的比例表示为图1的两个高斯分布,分布1的均值为0,方差为3,分布2的均值为2,方差为1,对于任意的样本点,通过先验概率来计算得出,未流失的概率总是大于流失概率,很难区分出两者,在此情况下,机器学习模型倾向于将所有样本直接判断为未流失。但是对于图2来说,两类客户有明显的区分度,机器学习模型可以从中学习到有效的区分信息。而事实情况通常类似图3,两类分布存在一些容易区分的样本,也存在较难区分的样本。
针对此现状,数势首先采用SMOTE算法基于已有样本生成新样本,帮助模型学习到更多少数类样本信息,然后借鉴Focal Loss加权思想,通过调节了对不同准确率的样本学习的努力程度,让模型更多的学习难区分的样本。
更重要的是,数势认为在该业务场景中,还应当采用特征挖掘方法,以提升在样本极不均衡情况下的算法效果,更好地解决数据量巨大、高维空间的交叉组合等问题。
在实践中,数势经过机器学习模型挖掘到了很多特征因子,这些特征因子有一些是显性的,例如,对于未来发生销户的客户,往往有清仓且资金账户变动的行为发生;也存在很多隐性因子,例如,对于未来发生资产流失的客户,往往在前几个月有连续的资产变动行为,这些数值通过复杂的统计甚至是非线性组合之后,才可以判别客户未来的流失情况。
数势科技将算法得到的各类特征因子与业务实践相结合,与未流失客户的行为进行对比,最终判断预流失客户在资产类、交易类、App行为类、账户操作类等方面都有不同程度的区别。
基于这些有效特征,数势通过机器学习模型在“资产类”客户流失场景中进行落地实践,为预测功能上线做模型训练,进而输出下个月预流失人群名单和优化模型及预流失名单版本迭代,并通过AB对照方法做持续的效果评估和复盘优化。
在具体的实践和效果评估方面,数势将算法圈选客户数量等于手工圈选客户数量,通过对预流失客群真实命中数量、预流失客群的潜在价值和圈选准确率等核心指标数据,确认算法圈选明显好于专家圈选效果。数据显示,使用数势预流失预警模型可将客户预测准确数量提升9-18倍、命中率提升11-30倍。(对比专家经验法)以此预测精准度为前提,券商采用线下服务和线上触达相结合的模式,对客户进行有效安抚和召回,或将带来显著的收入和AUM增长,降本提效。
以某月资产流失客户数据为例,相较于规则命中的105人,算法命中人数为931人,算法带来的增量为826人,假设通过运营策略挽回率为50%,按一年来推算,将会带来AUM增长约20亿元,佣金率按万分之二来计算,如一年交易量为二十倍,可带来400万的收入增长。现在券商的平均引流成本日趋增高,甚至很多渠道已经超过了2000元,如果以平均引流成本1000元每个客户为例来计算,等同于一年节省了约400万元的引流推广费用。
综上,数势的客户流失预警模型能够对将要发生流失的客户进行精准识别并预测,是金融证券机构以客户全生命周期为核心、建立精细化运营体系的重要手段,能够帮助机构提早洞察危险信号,减少客户流失。
面对这些即将流失的客户,营运人员又当如何开展创新运营活动,实现业务增长?后续文章我们进一步分享某券商针对预流失人群的策略探索,以期为业内同行带来进一步思考与讨论,请关注数势科技,了解更多数字化运营方法论与行业最佳实践。
商务合作:business@digitforce.com
市场合作:marketing@digitforce.com
电话:010-53383810 (工作日10:00-19:00)地址:北京市海淀区花园路庚坊国际大厦15层