高级分析如何继续在企业中建立动力?
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-11-06
机器学习的大部分动力是由开源推动的
开源在2019年继续增长,特别是对于大数据和数据科学用例而言,在2019年TDWI调查中,有91%的受访者表示开源对他们的高级分析工作至关重要,在2019年期间,Python继续吸引新用户,在某些情况下超过了R的采用,项目来更好地利用深度学习,商业软件供应商通过使其平台更加开放来继续拥抱开源。其他供应商扩展了平台,以支持使用R和Python等软件包中开发的模型,以帮助在生产中部署这些模型。
供应商大肆宣传的一个领域是将机器学习注入到商业分析产品中
以在整个分析生命周期中创建“智能工具”(其他名称包括机器智能,增强智能,自动化智能)。在这里,机器学习被注入产品中,以帮助识别数据准备中的数据质量问题。在数据目录中填充元数据;提出视觉分析产品的见解;并自动建立模型。尽管这种趋势在2019年才刚刚出现(使用这些工具的受访者不到20%),但它将继续作为公司数字化转型战略的重要组成部分,并在2020年成为热点。
我们看到许多组织继续采用云技术,尤其是云数据仓库来支持分析
在接受调查的公司中,约有三分之一使用了某种云数据仓库,有些使用的是专为云计算而设计的数据仓库(例如,云原生),更多计划迁移到云,这些趋势将继续炙手可热,但是,随着机器学习尘埃落定,企业将面临需要采取行动的实际考虑,企业将需要解决几个重要问题。
1.提高业务分析师的技能是正确的策略吗?
随着机器学习成为主流,组织将继续组建数据科学团队以支持模型构建。TDWI研究表明,大多数构建模型的组织都认为他们需要更多的数据科学家。但是,鉴于数据科学家是昂贵的资源且经常供不应求,因此许多组织计划“提高”业务分析师的技能,以建立(至少部分)模型。实际上,这通常被认为是使分析变得更高级的一项顶级策略。在2020年,企业将开始协调提高技能是否对他们有用,以及成功实施此策略将需要什么。
2.增强智能是敌还是友?
许多分析供应商正在提供工具,以帮助业务分析师甚至业务用户构建机器学习模型。在某些工具中,用户所需要做的就是指定感兴趣的结果或目标变量以及被认为具有预测性的属性。该软件选择模型。其他工具甚至更加自动化。尽管增强智能工具的使用仍相对较新,但我们调查的大多数受访者表示,他们将在2020年和2021年使用这些工具。许多人将这些工具视为将更复杂的分析(例如ML)放入数据库中的一种方法。业务分析师之手。换句话说,正在研究这些工具,部分是为了帮助缩小人才差距。
在实践方面企业将需要确定这些工具可以为他们提供多少帮助
以及使用这些工具会涉及哪些方面。我们建议用户应该具有验证这些工具产生的见解的技能;对于组织而言,选择透明的工具非常重要,这样用户才能知道幕后发生的事情。此外,组织需要一个过程来验证模型,然后再将其投入生产。未来几年将说明这些工具是否对组织构建模型有用。
我们需要DataOps吗?
使用ML的组织将意识到,这不仅仅是建立模型,大部分实际工作来自将这些模型投入生产并确保它们保持状态,这种需求将需要新的角色,包括DataOps,作为机器学习过程的一部分,DataOps(在某些组织中称为ModelOps,MLOps或DevOps)是负责模型管理的团队:验证,注册,部署,监视和重新训练生产中的模型。随着组织扩展ML努力,这一角色将继续变得越来越重要。
我们与之交谈和调查的大多数组织只有少数几种模型正在生产中
随着组织开始扩大工作量,他们将意识到DataOps的重要性,DataOps团队精通Java,R或Python;他们了解如何使用API部署模型,甚至将模型打包到容器中,对于许多仅专注于模型构建过程前端的组织来说,明年将是不容错过的一年。
我们将看到更多的技术进步
开源在2019年继续增长,特别是对于大数据和数据科学用例而言,在2019年TDWI调查中,有91%的受访者表示开源对他们的高级分析工作至关重要,在2019年期间,Python继续吸引新用户,在某些情况下超过了R的采用,项目来更好地利用深度学习,商业软件供应商通过使其平台更加开放来继续拥抱开源。其他供应商扩展了平台,以支持使用R和Python等软件包中开发的模型,以帮助在生产中部署这些模型。
供应商大肆宣传的一个领域是将机器学习注入到商业分析产品中
以在整个分析生命周期中创建“智能工具”(其他名称包括机器智能,增强智能,自动化智能)。在这里,机器学习被注入产品中,以帮助识别数据准备中的数据质量问题。在数据目录中填充元数据;提出视觉分析产品的见解;并自动建立模型。尽管这种趋势在2019年才刚刚出现(使用这些工具的受访者不到20%),但它将继续作为公司数字化转型战略的重要组成部分,并在2020年成为热点。
我们看到许多组织继续采用云技术,尤其是云数据仓库来支持分析
在接受调查的公司中,约有三分之一使用了某种云数据仓库,有些使用的是专为云计算而设计的数据仓库(例如,云原生),更多计划迁移到云,这些趋势将继续炙手可热,但是,随着机器学习尘埃落定,企业将面临需要采取行动的实际考虑,企业将需要解决几个重要问题。
1.提高业务分析师的技能是正确的策略吗?
随着机器学习成为主流,组织将继续组建数据科学团队以支持模型构建。TDWI研究表明,大多数构建模型的组织都认为他们需要更多的数据科学家。但是,鉴于数据科学家是昂贵的资源且经常供不应求,因此许多组织计划“提高”业务分析师的技能,以建立(至少部分)模型。实际上,这通常被认为是使分析变得更高级的一项顶级策略。在2020年,企业将开始协调提高技能是否对他们有用,以及成功实施此策略将需要什么。
2.增强智能是敌还是友?
许多分析供应商正在提供工具,以帮助业务分析师甚至业务用户构建机器学习模型。在某些工具中,用户所需要做的就是指定感兴趣的结果或目标变量以及被认为具有预测性的属性。该软件选择模型。其他工具甚至更加自动化。尽管增强智能工具的使用仍相对较新,但我们调查的大多数受访者表示,他们将在2020年和2021年使用这些工具。许多人将这些工具视为将更复杂的分析(例如ML)放入数据库中的一种方法。业务分析师之手。换句话说,正在研究这些工具,部分是为了帮助缩小人才差距。
在实践方面企业将需要确定这些工具可以为他们提供多少帮助
以及使用这些工具会涉及哪些方面。我们建议用户应该具有验证这些工具产生的见解的技能;对于组织而言,选择透明的工具非常重要,这样用户才能知道幕后发生的事情。此外,组织需要一个过程来验证模型,然后再将其投入生产。未来几年将说明这些工具是否对组织构建模型有用。
我们需要DataOps吗?
使用ML的组织将意识到,这不仅仅是建立模型,大部分实际工作来自将这些模型投入生产并确保它们保持状态,这种需求将需要新的角色,包括DataOps,作为机器学习过程的一部分,DataOps(在某些组织中称为ModelOps,MLOps或DevOps)是负责模型管理的团队:验证,注册,部署,监视和重新训练生产中的模型。随着组织扩展ML努力,这一角色将继续变得越来越重要。
我们与之交谈和调查的大多数组织只有少数几种模型正在生产中
随着组织开始扩大工作量,他们将意识到DataOps的重要性,DataOps团队精通Java,R或Python;他们了解如何使用API部署模型,甚至将模型打包到容器中,对于许多仅专注于模型构建过程前端的组织来说,明年将是不容错过的一年。
我们将看到更多的技术进步
但是组织还将解决与利用高级分析和ML相关的实际问题,他们将确定是否可以提高业务分析师的技能;评估他们是否能够使用市场上的一些新工具;并认识到,如果他们想大规模成功地进行高级分析,他们需要一个DataOps团队。
客服热线:400-050-6600商业联合会数据分析专业委员会