400 050 6600
数据分析师

手机号

验证码

30天自动登录
当前位置:首页 - Q&A问答

Q&AQ&A问答

数据科学哪些技术很热门哪些不是?

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-01-06

这是Python的世界
从2018年10月10日开始,与数据科学相关的工作清单,在2019年由于难以收集LinkedIn数据,删除了该来源,如果您查看职位发布和简历中列出的受欢迎的数据科学技术,并将2018年与2019年进行比较,那么值得注意的是其中的多少没有改变,Python曾经是并且现在是数据科学中主要的编程语言,而R在过去一年中的普及率有所下降,然而2018年至2019年之间却发生了变化,例如PyTorch的爆炸式增长,而SAS和Matlab等更传统的专有工具则继续下降。

如果您不熟悉PyTorch很快就会知道
由Google开发的TensorFlow通常是那些关注数据科学框架的人们的考虑因素,但由Facebook开发的PyTorch之所以受欢迎,其原因与MongoDB等非关系型数据库日益流行的原因相同:灵活性,两者之间重要的区别是这些框架定义计算图的方式。当Tensorflow创建静态图时,PyTorch相信动态图。那么这是什么意思?在Tensorflow中,您首先必须定义模型的整个计算图,然后运行ML模型。但是在PyTorch中,您可以随时定义/操作图形。在RNN中使用可变长度输入时,这特别有用。

PyTorch与Python一样因为它比TensorFlow更易于学习
并且建立ML模型感觉更直观,不过作为一个相对较新的ML框架,PyTorch在社区和其他资源方面落后于TensorFlow,Python吞噬了世界:一个开发人员的副项目如何成为地球上热门的编程语言,说到社区,这是研究发现的另一个显而易见的结论:开源作为一个整体在数据科学中方兴未艾,是的有一些实用的专有工具不断出现,但开源在排行榜中占主导地位,无论单个项目变得越来越流行,还是开放源代码作为一个类别,它的力量越来越强大。 

与其试图掌握以上技术列表,不如是“专注于一次学习一种技术”推荐顺序?

Python(用于常规编程)

熊猫(用于数据操作)

Scikit学习库(用于学习ML)

SQL(用于查询)

Tableau(用于数据可视化)

云平台(用于运行模型/应用程序)

TensorFlow()或PyTorch(增长快)(用于深度学习)

幸运的是,这些工具大多数都是开源的,并且/或者很容易以低廉的成本获得。这是由数据科学驱动的未来有希望的事情之一:与过去相比,进入成本相对较低。 


免费客服热线:400-050-6600

商业联合会数据分析专业委员会






Prev article

2021年的AI用例将如何推动人工智能部署?

Next article

对于技术知识较少的业务用户,您如何描述容器以及容器为什么重要?

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务