var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

公司如何通过克服许多重要挑战来使数据可访问和有用

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-10-12

数据是一种严重未充分利用的资产

在大多数公司中,数据位于不干净且很少被查询或分析的数据库上。由于以下原因,难以利用数据,数据库/ SQL、不良数据、集合体通常,只有很少的工程师或数据分析师有足够的信心来查询数据来回答业务问题,从而阻碍了整个组织的机会和效率。业务用户无法提出自己的问题,而不得不提交票证以获取见解,为了使组织能够在各个层面上获得信息,他们必须改变他们处理数据管理的方式,并且必须正确地获取数据,我们都认为,易用性和可访问性是成功的数据工具的一个至关重要且经常被忽视的方面,使用BI产品具有挑战性,而构建易于使用的BI产品则更加困难,测试假设,获得常规用户反馈并快速了解新产品正在使用或不使用的能力对于其成功至关重要。

 

公司可以使数据可访问和有用,这为业务用户像分析师一样思考和做出决定打开了大门

 

数据库/ SQL首先,制作生产数据库的只读副本,以便在向更多用户及其查询开放数据库时,不影响应用程序的性能。其次,SQL是一种相对简单的查询语言。通过举办有关如何查询数据库的定期或半定期内部培训,您将使更多的人参与其中。人们更有动力去尝试和学习是否与同龄人一起做,而不是独自在家。

 

克服编写SQL威胁的另一种策略是采用为业务用户和数据专家构建的灵活BI工具。传统企业解决方案需要庞大的数据分析人员和科学家团队来建立,因此需要寻找一个支持任何类型的用户轻松查询和可视化数据的平台。这些是BI工具的类型,可以更快地建立数据置信度,而不必先将表导出到excel中,然后才能对其进行操作。

 

不良数据:公司有很多不良数据。因此,即使您对如何使用SQL进行了培训,查询干净表与凌乱的表之间仍然存在很大的差距。这样的一些例子是:

1、空值

2、重复项

3、资料类型

4、手动输入字段

 

即使查询在语法上正确,它们也会产生意外的结果或潜在的错误,有三种解决方法。首先,您可以提供有关如何在查询时检测数据中这些问题的更多培训。其次,您可以尝试记录这些问题在数据中存在的所有位置。第三,您可以先清除数据,然后再提供给其他任何人。

 

走清洁路线。教育和文档编制都很重要,但是您必须正确处理顺序,并且拥有干净的数据为优先。这样,您可以消除在每次查询之前必须执行的重复过程,以确保指标准确无误。这是前进的方法。数据经过防伪和整洁后,由于它们基于准确的信息,因此教育和文档将变得更强大,更环保。

 

集合体:使数据可访问的一步是确保人们了解他们正在查询的数据,在大多数情况下,由于要分析的数据总量,将以某种方式汇总数据。您可能有一百万行交易,但是您需要总金额或平均金额。乍一看,这似乎很容易,但是如果不深入研究,人们可能会得出错误的结论,聚合意味着将所有数据压缩为单个值,并且该值可能会产生误导。例如,平均值可以掩盖值不是正态分布的事实。

 

我们真的认为平均数会准确地代表基础数据吗?

为了克服这个问题,公司需要继续进行普遍的教育-这意味着像培训分析师一样对企业用户进行培训,教大家看每个聚合背后的分布。查看一段时间内的汇总也很重要,作为一家信息灵通的公司,不仅要访问数据,还需要了解其叙述并能够定义数据告诉您的故事,分割聚合很重要,通过这些方式查看汇总后,您可以更加自信地使用单个数字来传达见解。

 

使公司中的每个人都可以访问数据

使所有业务用户都能获得问题的答案,而不会给数据或IT团队造成负担,设置数据程序需要一定的技术实施和培训,但是值得这样做,您将成为一家能够在每个业务部门的各个级别做出明智决策的公司,将数据获取到只读数据库中,附加一个BI工具,并进行有关如何使用SQL以及如何避免分析错误的培训。


Prev article

大数据生态系统是新石油

Next article

数据评分指标:找到预测模型的正确指标

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务