基于数据分析方法的电信移动业务收入预测探究
来源:CPDA数据分析师 武汉 付俊、黄耘、丁琳、张嫚、罗光耀 / 作者:CPDA数据分析师 / 时间:2019-12-10
本文探究电信移动业务收入预测,由于电信移动业务收入具有时间序列的特点,本文采用了综合ARPU法和三次指数平滑法的数学模型,结合实际进行了模型修正,从而对电信移动业务收入进行了实证分析,通过实证分析与精度检验发现,数据分析模型在电信移动业务收入预测方面具有较高的可靠性。
1.引言
当前电信服务市场的竞争异常激烈,业务收入的增长是衡量电信运营商经营绩效的重要考核指标。在电信运营商的实际工作中,全年业务收入一般基于存量收入保有率、存量收入、增量收入等历史数据的经验值进行预测,较少基于数据模型进行业务收入的预测。然而,电信业务收入明显符合时间序列的特点,其每月的态势具有稳定性或规则性,时间序列的核心思想是近的过去态势,在某种程度上会持续到未来,即预测值是以前观测值的加权和。因此,本文拟定使用时间序列中的指数平滑法对电信移动业务收入进行预测探究,并选取某电信运营商某个分公司(以下简称“A分公司”)2016年和2017年两年的电信移动业务收入数据作为预测数据集和测试数据集,以检验指数平滑法的准确性,从而验证该数学模型在工作实践中应用的可靠性。
2.电信业务收入前人研究综述
所谓预测,就是根据事物以往的历史资料,应用科学的判断方法或者计量方法,对不确定性事件或者未知事件可能的演变情况,事先做出推测和估计,以指导和调节人们的行动。经查阅相关文献,业务收入定量的预测方法包括:专家预测法、回归分析预测法、时间序列法、综合ARPU法、增长率法、GDP分析法等。本文拟定采用时间序列之指数平滑法和综合ARPU法相结合进行业务收入预测。
2.1 时间序列之指数平滑法概述
时间序列是某个对象的过去与现在的数列,是按时间先后的顺序排列而成的一个数列。指数平滑由布朗提出,他认为时间序列的态势具有稳定性或规则性,所以时间序列可被合理地顺势推延;他认为近的过去态势,在某种程度上会持续的未来,所以将较大的权数放在近的资料。指数平滑法的基本原理为:指数平滑法是移动平均法中的一种,其特点在于给过去的观测值不一样的权重,即较近期观测值的权数比较远期观测值的权数要大。根据平滑次数不同,指数平滑法分为一次指数平滑法、二次指数平滑法和三次指数平滑法等。它们的基本思想都是:预测值是以前观测值的加权和,且对不同的数据给予不同的权数,新数据给予较大的权数,旧数据给予较小的权数。
2.2 综合ARPU法概述
ARPU是单用户价值法,ARPU注重一个时间段内运营商从每个用户所得到的收入。综合ARPU法适用拥有电信企业(研究对象)在规划期内各年的综合ARPU值、规划期内各年通话出账用户数,使用方法为规划期内电信企业(研究对象)各年收入值=规划期内各年的综合ARPU值x规划期内各年通话用户数。
电信运营商业务收入的变化是有一定趋势的,而且有很强的季度型特点,由于存量用户占比较大,新增用户占比较小,因此,业务收入的历史时间越近,对未来的影响就越大;业务收入的历史时间越远,对未来的影响就越小。同时,当前电信运营商每月出帐用户数和ARPU值主要受外部行业环境的影响较大,如提速降费导致ARPU值不断降低,移动电话的普及率超100%,出帐用户数的增长越来越缓慢。由上可知,电信运营商的业务收入特点非常切合指数平滑法的数学模型和综合ARPU法。
3.指数平滑法模型的原理
3.1 传统模型的原理
指数平滑法是生产预测中常用的一种方法。也用于中短期经济发展趋势预测,所有预测方法中,指数平滑是用得多的一种。根据平滑次数不同,指数平滑法分为:一次指数平滑法、二次指数平滑和三次指数平滑法等。由于电信移动业务收入符合三次指数平滑法数学模型的特点,模型不仅考虑了变量的线性增量,而且还考虑了变量的抛物线增量,因此,采用三次指数平滑模型进行电信移动业务收入的预测。预测电信移动业务收入三次指数平滑法的数学模型如下:
模型中,
3.2 传统模型的修正
考虑到指数平滑法对数据的转折点缺乏鉴别能力,在电信移动业务收入预测中,由于2月当月只有28天,通话时长相对其他月份少2天或3天,而预测时按整月计算,这将导致2月ARPU的预测结果出现偏差。因此,对于上述情况,须专门针对2月的ARPU预测值进行修正,修正公式为2月ARPU预测值=1月ARPU预测值-(1月ARPU预测值/31)*2。
4.指数平滑法的模型训练与检验
4.1 模型的训练与测试
模型的训练与测试,拟定按照三次指数平滑法的数据采集和数据预处理,特征构造初始平滑指数及平滑系数,根据指数平滑法模型以及2016年历史数据,预测2017年的电信移动业务收入。
4.1.1 数据采集
选取A分公司2016年和2017年两年的移网业务收入数据作为训练集和测试集(数据详见表4-1),按照综合ARPU法将业务收入拆解为出帐用户数和ARPU两项,同时选择指数平滑法进行分项预测。具体如下:
4.1.2 数据预处理
经查,训练集与测试集数据值完整,无异常值、无缺失值,数据可用。
4.1.3 特征构造—初始平滑指数和平滑系数确定
初始平滑指数和平滑系数这两个参数的选择,对预测模型的准确度影响非常大,是模型能否应用在实际工作中的关键。
初始平滑指数的确定。利用2016年前三个月的实际收入,计算它们的算术平均值,得到模型的初始平滑指数。由此得到ARPU和出账用户数对应的初始平滑指数,如表4-2.
平滑系数α值的确定。由于有足够的历史数据,为更精确的得到α,使得α值更贴切实际,现基于A分公司2015年和2016年全年的历史数据,基于三次指数平滑法的数学模型,通过线性规划求解实际值与真实值之差的平方和小值,从而求出ARPU和出账用户数对应的平滑系数α值为0.13。
4.1.4 收入模型预测
根据修正后的三次指数平滑法,A分公司2017年ARPU及出账用户数如表4-3中“ARPU预测值”和“出账用户预测值”对应列;运用综合ARPU法,通过对应月份的ARPU值×出账用户数,可以得出A分公司的对应月份业务收入,如表4-3中的“预测收入”列。
4.2 收入预测模型的检验
依据2017年实际收入与预测收入开展模型检验,收入预测误差如表4-3:
由上可知,2017年度按月预测出账收入与实际出账收入对比情况,当月预测出账收入与实际出账收入误差基本控制在之内。2017年度累计全年度的预测收入19979万元,实际收入为19793万元,预测值与实际值误差为-0.94%,远低于项目要求的1.5%准确度。
5.指数平滑法模型的展望
基于平滑指数法的模型原理,本文选取了收入波动不显著的某运营商A分公司的历史数据,运用了修正的三次指数平滑法模型进行了预测。从模型的训练和测试、模型检验过程来看,模型当月预测值和真实值的误差基本控制在+-3.5%之内,模型效果拟合度高,可见修正的三次指数平滑法用于预测电信业务收入的方法可行。但在实际工作中,要保证业务收入的准确性,仍需要考虑各种外部因素对业务收入带来的影响,须重点考虑流量资费越来越低、语音需求处于萎缩、固网资费捆绑促销、携号转网政策全国开放、跨网漫游启动等因素,从而确保业务收入的预测达到预期。