【应用案例】 第一期:IT运维师的数据分析之路
来源: / 作者: / 时间:2023-05-22
第一期故事的主角是一名IT运维分析师,他学习了数据分析课程后,将自己记录和收集的运维数据,通过Datahoop分析工具进行了清洗、分析和可视化。发现了一些隐藏在数据背后的规律和趋势。最后通过数据分析思维提出了解决方案,成功的解决了工作中经常遇到的一些运维问题。
1、运维工作中遇到的问题
作为一名运维工程师,我在日常工作中经常会发现一些IT基础设施和应用程序的运行问题:例如服务器负载过高、网络延迟等,这些问题涉及到多个领域,例如硬件、软件和网络等,不仅影响用户的体验,也影响公司的业务运营。
为了解决这些问题,我每天都需要时时关注服务器状态,采取“死盯”战术,但是长此以往,眼睛、腰都开始出现问题,身体有些吃不消,但自己的工作并没有创造出价值,勉强维持日常使用。我也曾有意识的寻找服务器规律,但是由于思维方式有限并没有取得很好的效果。这样的状态让我产生了挫败感和自我怀疑:是我不够努力?还是专业技术差?是不是自己根本不适合做运维?
2、引入数据分析思维
后来是在网上查阅资料看到数据分析思维,那是我第一次看到这个名词。我总觉得思维是学生才会使用的方法技巧。后来经过论坛里的一些评论、领导的沟通。我发现自己最缺少的就是数据分析思维,于是便开始查询数据分析的相关知识。原本我每天的工作就是发现问题,解决bug,记录。很多的现象、很多的数据,非常多的表格,记录完就交给了领导或者存档了。但是最关键的,通过这些数据进行分析,发觉规律、问题,指导的我运维工作我并没有做!
经过学习,我发现思维和工具是相辅相成的。利用数据分析思维定位问题,给出解决方案,然后利用工具将解决方案落地执行。日常我使用的工具是Excel和Python,工作非常的忙碌。但是CPDA的视频课、datahoop智能分析平台、数据分析思维……这些内容真的一一缓解了我当时既没有充足的时间、又缺乏方案论和实际应用的短板。
3、利用Datahoop将方法落地
在课程结束以后,我开始尝试利用学习到的数据分析思维来找到我工作中的问题,我将自己记录和收集的运维数据(服务器的性能指标、网络的延迟和吞吐量等),利用Datahoop分析工具,对数据进行清洗、分析和可视化。在分析过程中,我发现了一些隐藏在数据背后的规律和趋势。
例如,我发现在某些时间段,服务器的负载非常高,这导致了一些应用程序的响应时间延长,从而影响了用户的体验。通过进一步分析,我发现了造成服务器负载高的具体原因,并提出了解决方案,例如预测服务器访问量并设置预警系统,提前进行维护,增加服务器的容量、优化应用程序的代码和配置等。这些措施不仅显著降低了服务器负载和应用程序响应时间,降低故障率,同时提高了我的工作效率,我们服务质量的和用户体验也得到显著提升。
CPDA数据分析课程中思维培养和Datahoop平台的使用,是对我帮助最大的,我的工作效率越来越高,自信心和成就感一步步找回来了,也逐渐开始和同事以及在一些网站社区上做交流分享,对于我的运维职业生涯产生了深远的影响。