是什么让数据科学家打勾?
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-12-11
具有不断推高极限的能力很重要
企业数据科学也是如此,企业在数据分析中遇到的大部分问题实际上都是内在思维的产物,例如区分传统信息源(使用他的语言的“旧式系统”)和非传统源,例如开放数据集,订阅数据服务,社交媒体数据,多媒体数据和地理空间数据,由于前者在企业环境中大量存在,因此倾向于不成比例地依赖于传统数据源和传统工具进行分析,他认为这是一个错误,仅使用遗留系统,软件或专有解决方案将终阻碍分析,这些系统通常过于复杂且过于昂贵,无法解决当前和新的数据处理范例。
对使用一组现有的无法更改或发展的流程持严格的态度只会使数据分析受到影响
正如数据科学家必须优先考虑获取和完善新知识和技能一样,企业也必须优先考虑培训-重点是新概念,这个想法并不是要加强您已经知道的知识,企业应该始终专注于培训和教学,而不仅仅是重新学习他们已经掌握的知识,以您当前的知识为基础,但要培训您的员工以适应新的思想和范例,他还强调传福音的重要性-要知道,网络。这个想法是尽可能地见面,打招呼和互动。
您这样做并非只是为了听自己的话
您也在学习和聆听,与客户或在聚会上不断传福音,使您不仅能够讲话,而且还能(倾听)并理解问题,解决方案和痛点,充当用于数据准备,探索和分析的多合一工具箱,为工作选择合适的工具很重要-不要试图使工作适应该工具,但是对于像通用平台,这基本上不是问题,我需要的所有工具都是在一种舒适而强大的用户体验中提供的:笔记本,集群,数据科学,可视化和和语言(例如Python,R,Scala,SQL),他指出并没有缺乏特定领域的Python库。
每天使用的另一个重要工具是一个令人惊讶的平凡工具
Python和其他开源软件技术的优势在于每个人都可以参与并创建,上面提到的那些特定于域的Python库?其中许多可以在网上免费获得,不想重复其他人的工作,而是更愿意来搜索Python库,开放数据集,案例研究和其他预制工件。
利用开源社区来增强您的工作和社区
企业数据科学也是如此,企业在数据分析中遇到的大部分问题实际上都是内在思维的产物,例如区分传统信息源(使用他的语言的“旧式系统”)和非传统源,例如开放数据集,订阅数据服务,社交媒体数据,多媒体数据和地理空间数据,由于前者在企业环境中大量存在,因此倾向于不成比例地依赖于传统数据源和传统工具进行分析,他认为这是一个错误,仅使用遗留系统,软件或专有解决方案将终阻碍分析,这些系统通常过于复杂且过于昂贵,无法解决当前和新的数据处理范例。
对使用一组现有的无法更改或发展的流程持严格的态度只会使数据分析受到影响
正如数据科学家必须优先考虑获取和完善新知识和技能一样,企业也必须优先考虑培训-重点是新概念,这个想法并不是要加强您已经知道的知识,企业应该始终专注于培训和教学,而不仅仅是重新学习他们已经掌握的知识,以您当前的知识为基础,但要培训您的员工以适应新的思想和范例,他还强调传福音的重要性-要知道,网络。这个想法是尽可能地见面,打招呼和互动。
您这样做并非只是为了听自己的话
您也在学习和聆听,与客户或在聚会上不断传福音,使您不仅能够讲话,而且还能(倾听)并理解问题,解决方案和痛点,充当用于数据准备,探索和分析的多合一工具箱,为工作选择合适的工具很重要-不要试图使工作适应该工具,但是对于像通用平台,这基本上不是问题,我需要的所有工具都是在一种舒适而强大的用户体验中提供的:笔记本,集群,数据科学,可视化和和语言(例如Python,R,Scala,SQL),他指出并没有缺乏特定领域的Python库。
每天使用的另一个重要工具是一个令人惊讶的平凡工具
Python和其他开源软件技术的优势在于每个人都可以参与并创建,上面提到的那些特定于域的Python库?其中许多可以在网上免费获得,不想重复其他人的工作,而是更愿意来搜索Python库,开放数据集,案例研究和其他预制工件。
利用开源社区来增强您的工作和社区
从某种意义上说,成为数据科学家需要定期执行不可能的事情,您总是面临资源限制-特别是在时间方面-以及极其棘手的问题,不可能是数据科学的功能,而不是错误,时间紧缺迫使我迅速确定优先级,并提供更多现成的想法和解决方案,一些看起来非常复杂的问题常常迫使我成为有创造力的自我,以完成这些任务。
商业联合会数据分析专业委员会