高级分析和数据科学需要类似的东西?
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-12-10
在持续的软件开发环境中解决了工程设计,部署和维护软件的挑战
对于高级分析和数据科学,我们需要类似的东西,整个生命周期,从分析模型的开发和培训到生产中的分析洞察的部署和维护,我们看到的一遍又一遍的事情是,数据科学家将经历他们的生命周期并产生某种东西-例如,分析模型或该模型的派生模型-然后是企业是您实际如何将其部署为见解,因为仅当您可以将其(例如,在生产中)用作见解时才有用。
分析开发的两个不同阶段
通常分析开发分为两个不同的阶段,每个阶段都有其自己的生命周期和优先级,阶段包括数据集的获取和准备,分析模型的开发,培训和完善,以及分析见解的整理,第二个是生产数据环境的环境,它具有部署,维护和升级计划,当然还有其正在进行的操作。
我们倾向于人为地将分析开发与部署和运营区分开来,反之亦然
现在占主导地位的分析开发模型将阶段的优先级作为第二阶段的代价,并不是说部署软件是事后的想法,这是因为我们倾向于人为地将分析开发与部署和运营区分开来,反之亦然。部署不是数据科学团队和分析开发人员的职责范围,可以这么说,这不是他们的问题,在描述这种情况时,援引开发人员或数据科学团队“将其工作”“扔到墙上”进行操作的旧比喻并不是一件容易的事,如果有的话,反馈循环对于分析开发比对通用软件开发更为关键,在种情况下,成功使用分析见解可以并且应该改变您的工作方式:不仅是您的业务运作和组织方式,而且还是您如何识别企业,通过分析洞察力,您可以更灵活地拓展新市场,利用新的商机,甚至采用全新的商业模式。
随着时间的流逝分析见解的准确性趋于下降
随着分析模型所基于的世界条件的变化,该模型的预测能力也随之变化一个机器学习规则和模型为例,随着时间的流逝,机器学习规则和模型需要重新训练-在某些情况下,还需要废弃,当您实际部署机器学习模型时,您希望不断监视该模型,以查看预测的准确性,如果您没有监控准确性的手段,那么您就不会有一个恒定的反馈循环,我们将其视为一个迭代循环,您可以在其中不断完善模型,淘汰模型,管理模型和版本控制模型,只有一个方向,这就是现在的方向。
这是一个引人入胜的梦幻般的愿景
对于高级分析和数据科学,我们需要类似的东西,整个生命周期,从分析模型的开发和培训到生产中的分析洞察的部署和维护,我们看到的一遍又一遍的事情是,数据科学家将经历他们的生命周期并产生某种东西-例如,分析模型或该模型的派生模型-然后是企业是您实际如何将其部署为见解,因为仅当您可以将其(例如,在生产中)用作见解时才有用。
分析开发的两个不同阶段
通常分析开发分为两个不同的阶段,每个阶段都有其自己的生命周期和优先级,阶段包括数据集的获取和准备,分析模型的开发,培训和完善,以及分析见解的整理,第二个是生产数据环境的环境,它具有部署,维护和升级计划,当然还有其正在进行的操作。
我们倾向于人为地将分析开发与部署和运营区分开来,反之亦然
现在占主导地位的分析开发模型将阶段的优先级作为第二阶段的代价,并不是说部署软件是事后的想法,这是因为我们倾向于人为地将分析开发与部署和运营区分开来,反之亦然。部署不是数据科学团队和分析开发人员的职责范围,可以这么说,这不是他们的问题,在描述这种情况时,援引开发人员或数据科学团队“将其工作”“扔到墙上”进行操作的旧比喻并不是一件容易的事,如果有的话,反馈循环对于分析开发比对通用软件开发更为关键,在种情况下,成功使用分析见解可以并且应该改变您的工作方式:不仅是您的业务运作和组织方式,而且还是您如何识别企业,通过分析洞察力,您可以更灵活地拓展新市场,利用新的商机,甚至采用全新的商业模式。
随着时间的流逝分析见解的准确性趋于下降
随着分析模型所基于的世界条件的变化,该模型的预测能力也随之变化一个机器学习规则和模型为例,随着时间的流逝,机器学习规则和模型需要重新训练-在某些情况下,还需要废弃,当您实际部署机器学习模型时,您希望不断监视该模型,以查看预测的准确性,如果您没有监控准确性的手段,那么您就不会有一个恒定的反馈循环,我们将其视为一个迭代循环,您可以在其中不断完善模型,淘汰模型,管理模型和版本控制模型,只有一个方向,这就是现在的方向。
这是一个引人入胜的梦幻般的愿景
但是这即将成为现实吗?这里有很多活动的部分,尤其是对一种或另一种通用元数据基础的假定需求,数十年来统一的元数据标准一直是IT部门的IT目标,您需要...建立一个非常强大的基础元数据层,(该层不仅支持]每个人都在考虑的数据的传统技术表示...,而且还包括业务术语,业务模型以及这些之间的映射,[以及]沿袭信息,以及也包括[可能执行]的治理层。
商业联合会数据分析专业委员会