400 050 6600
数据分析师

手机号

验证码

30天自动登录
当前位置:首页 - Q&A问答

Q&AQ&A问答

您的企业应如何以及为何使数据科学民主化?

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-11-17

克服挑战并加速企业数据科学的明显趋势之一是数据科学民主化
它将使公民数据科学家(例如业务分析师和商业智能工程师)能够解决复杂的数据科学问题,从而有可能实现更广泛的范围从业人员执行数据科学项目。尽管已经对该概念进行了广泛讨论,但许多企业一直在努力使数据科学真正民主化。本文讨论了使数据科学民主化时企业可以遵循的实践。

数据科学项目要求
典型的企业数据科学项目非常复杂,涉及许多步骤,而不仅仅是机器学习,首先您需要了解业务和领域,以便定义影响的用例,任何数据科学项目都需要具有定义明确的业务假设的明确业务目标,的数据和特征流水线步骤是在机器学习准备的手册,具有挑战性,且费时的步骤,其转换的业务数据,此步骤需要深厚的领域知识,才能从业务数据中提取有意义的模式以及处理大型和复杂数据的数据工程技能。

该机器学习模型的开发步骤是对发展的机器学习模型来解决你的问题
这通常涉及测试不同的机器学习算法以找到性能的算法。不同的算法通常具有不同的特征(准确性与可解释性),因此您必须根据项目的性质选择正确的算法,在可视化和验证步骤中,您将向业务团队展示建模结果并征求他们的反馈,这一点至关重要,因为在业务实施和采用之前,业务团队必须接受这些结果,生产和运营化是将数据科学流程投入生产的一步,这是一个非常复杂的领域,因为在此步骤中必须解决数据科学的许多实际操作问题(质量,可伸缩性,可维护性,集成性和可移植性)。

考虑到数据科学过程的复杂性
即使对于经验丰富的团队来说,一个企业数据科学项目通常也要花费几个月的时间才能完成,总体而言数据科学的民主化对于企业而言既不容易也不容易,如何使数据科学民主化
让我们研究使组织实现数据科学民主化的实际步骤,建立数据驱动的文化,数据科学项目的结果终将由业务团队使用,因此对他们进行数据科学的价值以及局限性的教育非常重要。数据驱动型用户的数据驱动文化和素养对于成功实施业务中的数据科学项目至关重要。

实施数据和分析治理
数据无疑是数据科学实践中重要的资产,强大的数据治理可确保安全灵活地利用数据,可以使“公民”执行更多的数据科学项目,培养BI和分析人才,从相邻领域(例如BI工程师或业务分析师)“重新培养”您目前的员工,成为公民数据科学家,他们已经具有数据分析的相关背景,并且熟悉数据科学过程,经验丰富的数据科学家可以扮演传福音者的角色,以分享数据科学实践并在整个过程中指导公民数据科学家。

介绍适当的工具
数据科学本质上是一个跨学科领域,它涉及许多技术组件,例如数学,统计和计算机科学以及SQL,R和/或Python编码,如前所述,数据科学过程本身也非常复杂,利用适当的工具集可以大大缩短学习曲线,使公民数据科学家能够专注于解决问题而不是解决问题。

支持数据科学民主化的工具
尽管传统的基于可视化编程的平台(例如SAS,SPSS)不需要编码技能(包括SQL,Python和R),但它们仍然需要大量的知识和专业知识以及手动工作才能从中提取整个流程源数据和功能工程以进行机器学习,机器学习自动化工具近在数据科学民主化中变得很流行,这些工具大大简化了我们提到的几个步骤,例如机器学习模型开发以及可视化和验证。

用于开发和生产的数据和功能流水线仍然是手动且耗时的
这阻碍了真正的数据科学民主化,智能数据准备平台本质上是智能数据流水线工具,可为数据处理和仓储提供交互式环境,从而简化主数据管理流程,相比之下,一类新的自动化工具-数据科学自动化平台通过自动化整个端到端数据科学过程(包括机器学习)来支持上述所有任务,和功能工程来支持数据科学民主化。

民主化将如何改变数据科学?
数据科学家会被公民数据科学家取代吗?答案是不,企业仍然需要熟练的专家来交付影响重大的数据科学项目,同时数据科学的民主化将在三个主要方面从不同角度影响企业,缓解稀缺资源,鉴于市场上数据科学资源的严重短缺,经验丰富的数据科学家是重要但稀缺的资源,从企业增长战略的角度来看,数据科学民主化使企业可以通过利用公民数据科学家执行数据科学项目来减轻数据科学家短缺的风险。

将重要资源集中在创造更高价值的任务上

数据科学可以解决数百种潜在的用例,但它们并非同等重要。您可以将高技能的数据科学家集中在可创造更多价值的用例上,同时利用您的公民数据科学资源来解决其余问题,交付10倍以上的数据科学项目,正如我们所提到的,典型的数据科学项目是手动且耗时的,这阻碍了数据科学项目的上市时间,自动化工具使数据科学实践民主化,使您的团队能够比以往更快地交付更多项目,随着越来越多的企业将自己转变为数据驱动型组织,数据科学创新变得不可或缺,通过自动化实现的数据科学民主化无疑将有助于加速数据科学和业务创新,从而产生更大,更广泛的业务影响。


 客服热线:400-050-6600

商业联合会数据分析专业委员会




Prev article

AI for BI:更好或更快速的决策?

Next article

如何使用预测分析做出更好的业务决策?

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务