数据科学家充满魅力,但是,哇,需要数据工程师吗?
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-08-28
数据科学家和数据工程师是同一数据科学价值链的组成部分
首先让我们区分这两个角色,数据科学家提供了以下方面的专业知识:分析(处理指标,数据讲故事和工具构建),算法(支持数据产品的解释算法)以及推论(提供与统计的因果关系),简而言之,数据科学家清理,揉捏和组织大数据。
数据工程师的工作可以包括数据治理和质量控制
复杂的分布式体系结构实施(本地或云中),数据管道构建和维护,存储或计算集群中的资源利用优化以及批处理作业管理以实现对新鲜,准确的数据,换句话说,她开发,构建,测试和维护数据库,处理系统和其他体系结构。
目前数据科学家获得了所有的魅力和关注,部分原因是数据科学是整个旅程中的一步,也是更明显的一步
数据科学家甚至无法开始工作之前就需要执行的所有其他步骤(这可能是围绕数据的提取,转换和结构化的数十个过程),这些工作属于数据工程师,而且通常比“收集见解”的工作量更大。 ”部分。
数据怎么说?
既然我们要问有关数据科学的问题,那么用数据来回答是有意义的。如果某个领域存在短缺,我们希望看到它表现为
(1)比可用候选人要多的职位空缺。
(2)雇主提供了很高的薪水以吸引少量可用候选人。
对于每个开放数据工程师职位
都有2.53个合适的人选,对于每个开放数据科学家职位,都有4.76个合适的候选人,对于每一个开放的大数据工程师职位,都有2.47个合适的人选,与其他开发人员的对比非常引人注目,这表明与大量的Web开发人员(每个职位10.8)和市场经理(每个职位空缺53.79)相比,实际上数据专业人才短缺的情况。
数据科学家负责数据操作的关键部分,而不是整个过程
想要与大数据成功合作的组织必须对“数据研磨”有远见,即从旅程的开始到结束需要什么,以及哪些类型的人才可以提供所需的技能,在数据科学家发挥作用之前,数据工程师必须构建大量基础架构,您需要同时使用两种才能来优化数据科学价值链的结果。
所以,让我们开始工作吧!
显然这不是数据科学家和数据工程师之间的“竞争”,而实际上该领域实际上是人才短缺,为了使您的数据成功,您将需要数据工程师的专业知识来构建基础架构和准备数据,以及使用此数据来进行分析,算法和研究的数据科学家的技能。任何一个领域的人才短缺只会增加人力成本,并注定整个数据科学项目的失败,由于媒体关注的是数据科学人才缺口,因此现在有很多建议可以解决这一问题。为了解决数据工程师的技能差距,没有太多的存在。
1、深入了解公司内部:您可以通过培训现有人员的数据工程框架,编程语言和系统,来增加数据工程专业知识,而无需依赖外部候选人。
2、投资技术:如果您投资于可自动执行数据工程流程和工作流程的解决方案,则将需要更少的数据工程师。
3、想象未来:随着数据工程师薪资的增长,为研发和IT预算的激增做好准备。全面了解您的数据操作。
如果您了解数据科学的真正运作方式以及数据科学家和数据工程师的实际工作
那么您的数据工作就可以转化为有意义的业务价值您可能已经有了合适的人员,现在您只需要使用合适的技术将他们放在合适的位置即可–则您根本不必参与这场斗争。
客服热线:400-050-6600
商业联合会数据分析专业委员会