大数据工程师:难以捉摸的职位描述
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-12-17
大数据工程师的平均起薪范围很广
尽管有几篇文章确实提到了大数据工程师的个人或角色,但其中没有“大数据工程师”的条目,可以说大数据条目不包含任何此类参考,几乎所有内容都可以说,有数十个与大数据工程师有关的帖子-其中许多是切线的,有些是工作清单,大数据工程师构建了大数据解决方案架构师设计的东西, 好的但这实际上意味着什么?大数据工程师在组织内部开发,维护,测试和评估大数据解决方案,由于他们在基于Hadoop 的技术,方面拥有丰富的经验,因此他们大多数时候还参与了大数据解决方案的设计。
大数据工程师至少与数据科学家一样熟练
大数据工程师不仅要负责构建大规模数据处理系统,还必须在数据仓库和NoSQL技术方面拥有相当多的专业知识,重要的是,该角色需要编码专业知识,企业架构专业知识和数据科学知识,在转向大数据领域之前,大数据工程师应该具有足够的软件工程经验,具有面向对象的设计,编码和测试模式的经验,以及在工程……软件平台和大型软件方面的经验,规模的数据基础设施应该存在。
大数据工程师还应该具有使用不同的开源工具来构建高度可扩展的分布式系统的能力
应该了解算法是如何工作的,并具有构建高性能算法的经验,还有就是这样的事,作为一个大数据工程师, 这是有道理的因为数据工程师既是既定的工作类别又是既定的实践领域以数据工程或信息工程的形式,大数据工程师可能比数据科学家更稀有,请记住数据科学家有时被描述为独角兽:实际上并不存在的神话般的生物。可以将大数据工程师视为梦幻的生物:绿色的独角兽。
大数据工程师必须能够构建和实施组合的数据管理和数据处理基础架构
担任该角色的人还必须具有与数据科学家在某种程度上重叠的分析技能,工程师几乎肯定也必须具备某种编码专业知识-通常是在通用和/或专门的高级编程语言中,例如Python,R,Scala或SQL,也许他们就像数据工程师一样,其技能与数据科学家的技能重叠,但是他们也具有扎实的工程背景。凭借这种背景,数据工程师确实擅长于识别,分解和解决面向数据的问题。像所有工程师一样,他们直观地了解到几乎所有解决方案都需要某种成本。
也许像数据工程师这样的大数据工程师既不会沉迷于企业体系结构中
也不会对面向对象编程的多语言实践者有所了解,但是由于几乎所有的大数据技术都已编码并且希望使用Java代码,因此几乎可以肯定,掌握Java是一项额外的好处,如果有的话,大数据工程师需要知道Java,因为所有工具都是用Java编写的,并且以更高级别的抽象形式公开(或泄漏)了Java。
像数据工程师,也许是大数据工程师的主要激情转化,扯皮和操作-工程-数据
尽管有几篇文章确实提到了大数据工程师的个人或角色,但其中没有“大数据工程师”的条目,可以说大数据条目不包含任何此类参考,几乎所有内容都可以说,有数十个与大数据工程师有关的帖子-其中许多是切线的,有些是工作清单,大数据工程师构建了大数据解决方案架构师设计的东西, 好的但这实际上意味着什么?大数据工程师在组织内部开发,维护,测试和评估大数据解决方案,由于他们在基于Hadoop 的技术,方面拥有丰富的经验,因此他们大多数时候还参与了大数据解决方案的设计。
大数据工程师至少与数据科学家一样熟练
大数据工程师不仅要负责构建大规模数据处理系统,还必须在数据仓库和NoSQL技术方面拥有相当多的专业知识,重要的是,该角色需要编码专业知识,企业架构专业知识和数据科学知识,在转向大数据领域之前,大数据工程师应该具有足够的软件工程经验,具有面向对象的设计,编码和测试模式的经验,以及在工程……软件平台和大型软件方面的经验,规模的数据基础设施应该存在。
大数据工程师还应该具有使用不同的开源工具来构建高度可扩展的分布式系统的能力
应该了解算法是如何工作的,并具有构建高性能算法的经验,还有就是这样的事,作为一个大数据工程师, 这是有道理的因为数据工程师既是既定的工作类别又是既定的实践领域以数据工程或信息工程的形式,大数据工程师可能比数据科学家更稀有,请记住数据科学家有时被描述为独角兽:实际上并不存在的神话般的生物。可以将大数据工程师视为梦幻的生物:绿色的独角兽。
大数据工程师必须能够构建和实施组合的数据管理和数据处理基础架构
担任该角色的人还必须具有与数据科学家在某种程度上重叠的分析技能,工程师几乎肯定也必须具备某种编码专业知识-通常是在通用和/或专门的高级编程语言中,例如Python,R,Scala或SQL,也许他们就像数据工程师一样,其技能与数据科学家的技能重叠,但是他们也具有扎实的工程背景。凭借这种背景,数据工程师确实擅长于识别,分解和解决面向数据的问题。像所有工程师一样,他们直观地了解到几乎所有解决方案都需要某种成本。
也许像数据工程师这样的大数据工程师既不会沉迷于企业体系结构中
也不会对面向对象编程的多语言实践者有所了解,但是由于几乎所有的大数据技术都已编码并且希望使用Java代码,因此几乎可以肯定,掌握Java是一项额外的好处,如果有的话,大数据工程师需要知道Java,因为所有工具都是用Java编写的,并且以更高级别的抽象形式公开(或泄漏)了Java。
像数据工程师,也许是大数据工程师的主要激情转化,扯皮和操作-工程-数据
另一方面,大数据工程可能主要是熟练掌握一个或多个大数据技术堆栈的功能,也许这是一种需要某种限制的东西-甚至是证书,也许有很快,我们会看到诸如“ 认证的大数据工程师”或“ 大数据工程专家”之类的荣誉,这可能只是时间问题。