应用案例 | 数据分析中的时间序列,打开通往未来的窗
来源: / 作者: / 时间:2023-10-19
在当今数据驱动的世界中,数据分析已经成为众多领域不可或缺的工具,它不仅可以帮助我们理解过去,还可以指导我们预测未来。时间序列分析作为一种强大的数据分析技术,正在广泛应用于经济学、金融、气象学、销售预测、医疗保健等各个领域。
“时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。经济数据中大多数以时间序列的形式给出。根据观察时间的不同,时间序列中的时间可以是年份、季度、月份或其他任何时间形式。”——摘自百度百科
随着科技的发展,我们产生了越来越多的时间序列数据,这些数据蕴含着宝贵的信息。从每日股票价格到每月销售额,从每小时气温到每分钟网站访问量……时间序列数据反映了随时间变化的现象和趋势。然而,要从这些数据中提取有意义的信息并进行准确的预测,需要掌握时间序列分析的知识和技巧。
接下来我们将通过一例销售预测问题带领大家揭开时间序列数据的面纱。
某商业公司想通过近几年市场上每月男装、女装、珠宝的销售情况预测未来的销售量,作为数据分析师,我们应从哪里着手呢?
首先我们拿到了该公司的销售数据,数据如下图所示:
某商业公司想通过近几年市场上每月男装、女装、珠宝的销售情况预测未来的销售量,作为数据分析师,我们应从哪里着手呢?
首先我们拿到了该公司的销售数据,数据如下图所示:
从折线图我们可以看出时间序列包含不规则变动,长期渐增趋势和季节波动等,可以考虑采用Winter指数平滑或季节分解法来进行销量预测。
接下来要进行模型的训练,Datahoop平台简化了建模的步骤,只需要通过拖拉拽的形式就可以完成模型的创建,对于时间序列数据只需要修改参数就能完成不同序列的预测模型,这大大加快了我们分析数据的效率。所以我们用Datahoop平台建立了两种时间序列模型,分别是Winter指数平滑和季节分解法,模型建立的过程图如下图所示:
因为男装、女装和珠宝模型的建立过程十分相似,只需要调整输入模型的变量就可以完成对男装、女装和珠宝三种模型的搭建。所以以珠宝时间序列模型为例建立模型并解读模型结果。
把珠宝销售数据连接模型,调整模型参数,在算法中点击执行,并拉出来一个结果展示模块,将模型与结果展示进行连接,在结果展示模块就可以看到模型的相关信息,下面为Winter指数平滑的模型结果:
对于建立好的模型,我们如何通过可视化结果来判断模型的好坏呢?
均方根误差(RMSE):计算了每个预测值的误差的平方的平均值,然后取平方根。RMSE越小,表示模型的预测越准确。
通过比较分解预测与Winter指数平滑的均方根误差发现分解预测的模型误差更小。从预测数据与真实数据的拟合图像上来看,分解预测的预测数据可以更好地拟合真实数据。
综上所述分解预测模型可以更好的对珠宝销量进行预测。当我们有了精准预测模型,就可以帮助企业制定更有效的战略和决策。比如通过预测未来销量,企业可以避免缺货,降低库存成本,并确保产品供应能够满足市场需求。