var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

基于大数据分析的电信用户赢回策略探究

来源:武汉CPDA数据分析师、中国联合网络通信有限公司武汉市分公司 / 作者:韩露、郑茂、叶峰、刘宇、胡作梁、韩芹 / 时间:2020-06-22

随着通信市场的饱和度以及电信产品与服务同质化程度不断提高,同时,运营商之间的价格竞争激烈,并且面临云联网技术的巨大挑战,离网用户的规模也日渐增多,移动产品作为电信行业的主要收入来源,在提速降费政策面前停滞不前,面临巨大的挑战。 


因此,以数据分析视角研究电信行业离网用户赢回策略有助于明确离网用户的驱动因素及赢回的逻辑依据和动机因素,本文研究以大学生市场为背景,通过数据收集、处理与分析,从而指导电信企业更有效、更有针对性地制定大学生用户赢回策略,增加大学生用户的赢回效率。


1 概述

客户离网是全球各大电信运营商非常重视的话题,根据统计,美国电信行业的客户离网率达到了30%,欧洲则为25%。客户离网导致的直接后果就是公司利益的损失,因此对客户离网进行预警,能够对高潜在离网的用户进行挽留操作。如果存在高潜在离网用户,通过对该用户的历史行为进行分析,懂得用户真正的需求,给用户进行个性化的服务推荐,满足用户需求,可以减小用户离网的可能性。


本文研究数据处理主要可以分为下面三个部分:一是基于用户行为、用户属性的离网预测,前期对电信大量数据进行预处理(样本采样、过滤,数据分类、归一化、离散化、特征降维等等), 通过公式计算得出一系列规律,建立较为准确的模型和损失函数,使用正规化选择较好的算法模型,利用梯度下降算法对参数进行快速的确定,使用 xgboost,将多个算法结合投票的得出结果。二是基于得出的离网用户,配合各个不同营业员的特征参数,话术参数进行第二次回归分析将步得到的结果,作为第二步的参数,再次进行分类,利用 Softmax 回归迚进行分类,得出结果。 第三是针对步和第二步的结果精准判断哪些是潜在用户,哪些是保有用户,哪些是离网用户,正确画出用户画像后,对比用户的购买行为,在层使用逻辑回归算法,第二层使用人工神经网络,从而实现精准营销。 


2 数据处理

数据获取:在武汉联通,我们采用 HDFS 和 Spark 负责原始数据的存储和管理包括详细的通话记录单及宽带用户表。其中两张表均含有用户自身数据,包括年龄、性别、主套餐、融合 套餐、资费、基站、套餐使用情况、教育程度、通话时间、流量APP、流量使用前10名APP等。 数据预处理:(1)进行数据清理,对数据的属性值进行删除(如身份证、姓名等)。(2)对数据进行缺失值填充,先对异常数据进行过滤,将其值变为控制,然后使用拉格朗日插值方 法对数据进行填充,使用回归分析法进行噪声平滑处理。(3)对特征值进行One-HotEncoding,使得我们能够处理非数值属性;在一定程度上扩充了特征;编码后的属性是稀疏的,存在大量的零元分量。(4)对数据进行标准化操作于每个属性,设minA和maxA分别为属性A的小值和值,将A的一个原始值x通过min-max标准化映射成在区间[0,1]中的值x',其公式为:新数据=(原数据-小值)/(值-小值)。(5)因为前期进行了One-HotEncoding,为了减轻维度灾难问题,对特征向量使用filter进行降维处理。Feature Engineering:特征工程模块将原始数据处理成和离网相关的结构化特征,用作分类器的输入,在这里,我们使用GMM和EM聚类方法。我们将用户的特征集进行划分,得到了三种行为分类:通信行为判别模型、交友圈与社交行为模型、业务质量感知评估模型。


Classifiers:利用分类器训练出来的模型预测未来有离网倾向的用户,按照离网倾向高低排名,根据这个名单进行个性化维挽。在分类过程中,我们整体的算法使用了投票的机制,运用多种机器学习算法,得出阈值,再对阈值迚行xgboost分类,从而得出终的结果,在层,我们分别使用了SVM算法、随机森林算法、逻辑回归算法,使用决策树将三种算法的阈值迚进行分类,得到的分类结果。将用户维挽的结果反馈到模型中形成闭环,不断提高模型预测容易维挽的离网用户精度。通过设置一个预警值来进行离网预警,使用随机森林画出用户特征值的影响程度,并找到相关的特征变量。通过交叉验证,迚进行模型的优化,防止过拟合和欠拟合,模型融合可以比较好地缓解训练过程中产生的过拟合问题,从而对于结果的准确度提升有一定的帮助。用python中scikit-learn里面的Bagging来完成。

结合营销话术进行二次分类:本文的亮点就是在找到离网用户和即将离网的情况下,如何通过营销话术和用户行为偏好挽留用户,在这里,我们结合已经画好的用户画像,对我们的营业员数据和营销数据进行结合,再次进行新的一轮数据清理,使用人工审计网络的方法对每一项特征值计算得出相对应的权值,使用后向传播算法对其进行二次分类。 


收集用户属性和偏好。要从客户的行为和偏好中发现规律,并基于此给予推荐,如何收集用户的偏好信息成为系统推荐效果基础的决定因素。 


找到相似的用户。当已经对用户行为进行分析得到用户喜好后,我们可以根据用用户喜好计算相似用户,然后基于相似用户进行推荐,这就是典型的基于用户的协同过滤。采用皮尔逊相关系数或者余弦相似度计算用户的相似度。 


计算推荐。基于用户对物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户。计算上,就是将一个用户对所有物品的偏好作为一个向量来计算用户之间的相似度,找到K邻居后,根据邻居的相似度权重以及他们对物品的偏好,预测当前用户没有偏好的未涉及物品,计算得到一个排序的物品列表作为推荐。 


初始化推荐列表,对列表迚行过滤、排名等处理,从而生成终的推荐结果。 


3 策略分析

(1) 顾客赢回

    顾客赢回是指企业采取积极有效的补救措施,重新恢复与流失顾客之间业务关系的过程,是企业重新激活与已流失顾客关系的过程。在电信行业,研究发现,流失顾客先前交易期关系的整体满意度显著正向影响赢回绩效,而关系时长尽管不显著但负向影响赢回绩效。


(2)赢回策略

赢回策略是指企业为赢回流失顾客所采用的营销手段和工具,其对赢回流失顾客至关重要。一般而言,赢回策略主要包括价格促销和关系投资,前者是指企业在某个特定时期通过降低某种商品的价格,或增加单价下商品商量的一种营销手段。后者是指企业通过投入大量的时间、精力甚至金钱等资源,设法越过关系门槛,取得顾客信任和情感依附,从而在企业与顾客之间建立起关系纽带,并达成长期合作的目的。


价格促销策略无法赢得顾客信任,但对顾客持续使用意愿仍具有一定效果。关系投资是顾客赢回的重要策略,且赢得信任至关重要。尽管在之前的营销经验中,价格促销都是有效顾客赢回的“利器”,但对于新时代的大学生而言,价格促销策略相较于关系投资策略效果已经变弱,且不能在流失客户中建立信任,因为电信运营商在赢回客户的管理过程中,应尽量减少使用价格促销策略,转变现有的营销理念,将赢回工作重心放在关系投资商,通过专业的顾客赢回服务团队,丰富的沟通工具,增加互动,促进价值共创行为或精心挑选赠品等,加强与流失客户的深层情感沟通,终越过情感“门槛”而建立足够的信任,从而一贯的流失客户的青睐。另外,随着大学生消费支配能力的提升,其越来越关注使用体验,因为运营商应在套餐涉及、硬件及技术上加大投资,减少顾客因产品或信号不好而流失。

Prev article

2020年《数据分析》行业特刊第二期

Next article

洞察时代的5条数字情报规则

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务