var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

不要忘记机器学习过程的后端

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-12-14

我们看到企业经常担心雇用数据科学家来构建模型
并将大量的精力和资源投入到分析生命周期的模型开发阶段,同时他们没有考虑将模型投入运营所需的所有细节。这可能导致项目失败或增加部署模型所需的时间,至少要考虑四个步骤,模型管理,正如对软件进行版本控制和注册一样,机器学习模型也应该如此,在模型构建阶段以及进行更改后立即部署新版本的情况下,对模型进行版本控制很重要,这意味着要对模型进行注册和版本控制,以及捕获有关模型的元数据-包括何时建立模型,谁建立模型以及用于训练模型的数据,这样企业可以跟踪投入生产的模型,并知道每种模型的运行版本。

模型部署一旦构建并验证了模型,就可以将其部署到生产中
这涉及导出模型以及开发管道以对新数据进行评分,有多种模型部署方法。一些组织将重写模型,使其适合生产系统或应用程序,通常不建议这样做,因为它会在过程中引入许多错误。其他人则使用API导出模型,越来越多的人开始将它们出口到集装箱中,无论使用哪种方法,重要的是能够将数据馈送到生产中的模型,这将需要收集数据,对其进行预处理并重新计算需要输入到模型中的特征,模型监控。模型在某些时间段(几个月,几周或几天(或更短的时间,取决于使用情况))中是好的,之后模型可能会过时,模型降级可能是一个严重的问题,因此组织需要监视生产中的模型以查看它们是否在漂移。

重新训练模型将模型投入生产后模型的假设可能会更改
作为模型输入的客户行为假设肯定已经改变,然后,对分析进行操作的一步是,一旦模型投入生产并且组织正在监视其绩效,便要对其进行重新培训,我们通常会看到企业可能生产三到五个模型,这意味着他们目前正在摆脱手动执行上述许多步骤的麻烦,例如他们可能使用某种文件系统来跟踪模型,他们可以手动监视他们的模型,但是这不是可扩展的解决方案,此外他们的数据科学家可能会承担这项工作,同样这是不可扩展的。

将模型部署到生产中终将需要团队来完成这项工作

它还将需要工具和自动化来部署和管理生产中的模型,某些早期的商业供应商提供了“后端”功能,开源社区也在尝试提供此类工具,但它们仍在追赶,建议企业在机器学习扎根时尽早考虑模型管理,以便他们可以适当地部署适当的人员,流程和技术,以便在开始扩展时做好准备。



Prev article

本地对象存储适合当今企业的四个原因

Next article

机器智能的创新可能势不可挡

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务