当模型漂移成为洪水时-冠状病毒大流行严重破坏了数据科学和ML模型?
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-08-07
没有任何统计或AI模型可以提供100%的确定性
既然我们已经建立了所有模型都是错误的,并且预测很困难,那么这如何与模型漂移和冠状病毒联系起来?让我们从进化生物学开始,我们目睹了一个标点符号的平衡-只是没有平衡,理解和预测供应链,客户倾向,利率套利的模型是成千上万的分析模型之一,这些模型随着时间的推移从根本上保持一致,并受到渐进主义的影响。
既然我们已经建立了所有模型都是错误的,并且预测很困难,那么这如何与模型漂移和冠状病毒联系起来?
让我们从进化生物学开始。在1992年之前流行的进化论是对“渐进主义”的种种说法,这是不言而喻的,标点平衡”提出了这样一种理论,即绝大多数物种起源于地质时刻(标点符号)并持续滞留,我们目睹了一个标点符号的平衡-只是没有平衡。理解和预测供应链,客户倾向,利率套利的模型是成千上万的分析模型之一,这些模型随着时间的推移从根本上保持一致,并受到渐进主义的影响。
渐进主义的一个例子?从零售商店到在线购买的转变
我记得二十四年前在1996年首次从亚马逊购买书籍。大约二十年前,我有一部智能手机,至少十五年就拥有宽带互联网。互联网业务,智能手机和宽带改变了我们的经济和生活,但这花了十年或两年的时间。冠状病毒在两个月内破坏了一切。
那就是标点符号,这是ML模型得到广泛使用的个标点事件
冠状病毒并不是现代的标点符号,2007-2008年的金融危机以及随后的衰退。所不同的是,这些事件中没有一个因广泛使用机器学习和AI模型而发生(2008年使用受限)。在机器学习之前,预测模型是基于少量的少量数据样本(相对而言)。如今,机器学习模型由大量的历史数据驱动,以辨别得出结论的模式。
大部分天气预报都基于飞机上的传感器。随着空中交通量下降80%,现有模型的可靠性如何?
这些因素(它们是重要的驱动因素)都没有参与训练模型的数据。到2020年6月,冠状病毒在美国已经夺走了11万人的生命,全球有666万例,所有这一切都发生在三个月左右的时间里,而且没有疫苗或治疗剂。在这种情况下,他们应该怎么做?刷新模型,修改模型还是废弃模型?这就是当今数据科学团队面临的困境。
为了有效地解决这个问题,我们还必须处理足够的数据集问题,这是我在 COVID-19大流行模型中处理过的问题-机器学习模型有用吗?
机器学习与大量的数据一起使用,因为它的目的是在数据中找到可预测的模式,如今大型数据集的可用性正正影响着这种需求。问题仍然是,机器学习和人工智能技术是否可以对少得多的数据集有效?
客服热线:400-050-6600
商业联合会数据分析专业委员会