400 050 6600
数据分析师

手机号

验证码

30天自动登录
当前位置:首页 - Q&A问答

Q&AQ&A问答

如何使用模型操作来操作数据科学?

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-04-08

案就是模型操作或模型操作
通过将数据科学模型投入生产然后进行管理来使数据科学运作的过程,流程中的四个主要步骤-构建,管理,部署/集成和监视-形成了一个可重复的循环,您可以利用该循环将模型重用作软件工件,可确保模型继续为组织带来价值,他们还提供关键的见解,以管理基于模型的决策的潜在风险,即使潜在的业务和技术条件发生变化也是如此,跨功能,协作,连续的过程,其重点是管理机器学习模型,以通过可重复的部署过程使它们可重用和高度可用,此外涵盖了各种管理方面,例如模型版本控制,审核,监视和刷新,以确保它们在条件变化时仍能带来积极的业务价值。

企业需要整体地实现数据科学和机器学习模型的价值
而不是仅仅作为模型开发的过程。数据科学和ML流程专注于构建模型,专注于对业务系统中的整个数据科学管道进行操作,要求企业内许多不同角色的编排和协调,包括数据工程师,数据科学家,业务用户,IT运营和应用程序开发人员,实际上许多企业都有专门的模型操作工程师来促进此过程,面向人的ML模型必须公正,公平且可解释,这就是公众的需求以及监管机构和机构越来越多的需求,对于此类应用程序,必须设计ML Ops生命周期,以在涉及各种风险时实现透明性和可解释性。

模型操作的四步走方法 
为了解决模型可操作性方面的常见痛点(例如,启动数据科学项目与部署模型之间的长时间延迟),公司采取了四步方法:构建,管理,部署/集成和监视。 

建造 
数据科学家使用Python和R等语言以及商业应用程序来创建分析管道,他们使用创新的ML算法,构建预测模型,并设计新功能,以更好地表示业务问题并增强模型的预测能力,在建立预测模型时,数据科学家需要同时考虑生产环境中数据的结构,同样对于要素工程,数据科学家需要确保可以在实时生产环境中足够快地创建所创建的任何新要素。  

管理 
模型的生命周期在中央存储库中进行管理,在该存储库中,可以跟踪其来源,版本控制,批准,测试,部署和终替换,除了与模型工件关联的元数据之外,管理平台和存储库还应跟踪准确性指标以及模型和数据集之间的依赖关系。

部署/整合
数据科学管道取材于其原始开发环境,并以可以独立执行并集成到业务应用程序中的形式表示,您需要能够以适合于目标运行时环境的格式/语言来部署管道。  

监视器
部署模型后,将对其进行监视,以预测其准确性以及对业务的影响,即使基础数据发生变化,模型也需要保持准确性,例如这考虑了来自人类专家的输入,或者自动进行中的持续训练和挑战者循环,并获得了人类的认可。

通过实现数据科学的价值

通过使用此四步方法,组织可以通过Model Ops来实现数据科学的价值,它确保将模型嵌入到业务系统中,并确保模型保持状态,与那些始终无法运行模型并且无法将行动仅基于洞察力的公司相比,实践此方法的公司具有巨大的竞争优势,企业可以超越仅建立模型的范围,而可以真正实现其数据科学用途的操作。


免费客服热线:400-050-6600

商业联合会数据分析专业委员会


Prev article

如何持续智能实现卓越运营的10种方法?

Next article

对抗COVID-19的好数据

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务