实现大数据收集和提炼收益的3个步骤
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-01-25
有时将数据收集与炼油过程进行比较
但是尽管数十年来从地面提取原油然后进行提炼的过程已发展成为一门精细科学,但数据采集和提炼仍在进行中,有一些工具可让您提取,转换和加载(ETL)数据到较小的数据集市中,终用户可将其用于分析,还有用于智能分析数据以确定在给定业务环境中哪些数据真正重要的工具,以及使您能够汇总不同的数据类型以提出新的数据模型的工具,这些模型有望带来突破性的答案,但是到目前为止自动化和工具可以带您入内,在某个时候,组织必须利用业务洞察力对数据进行操作,以使其能够利用数据和数据工具来发挥优势。
为了使组织优化其数据使用,IT主管必须将业务洞察力应用于的数据收集方式,并在数据准备期间程度地利用数据,公司不应该只为终产品数据设置报表查询,而仅做其他事情。以下是一些组织用于提高数据精炼和收获量的三种实践。
1:定义您的业务案例
公司需要定义希望其数据产生答案的业务案例,通过这种方式,数据收集,提炼和发现被赋予任务,并且可以提取数据并将其发送到数据集市以促进产生答案的查询,在这些应用程序中,组织可以更好地了解客户何时有可能购买产品,或者为什么在特定地理区域内发生特定疾病的可能性更高。
2:为剩余数据提出策略
不幸的是,在解决了层次的问题(例如,为什么以及何时进行购买,或者为什么某些地点因特定的医疗状况而遭受重创)之后,一些公司仍然将收集到的80%的数据留在桌上,在炼油过程中,这是对中级汽油和柴油进行分类的地方,必须重新评估以查看是否还有其他用途,在解决数据遗留问题时,公司有三种选择:将其丢弃,或者无限期保存直到存储成本飞涨,或者进一步优化和/或探索数据遗留问题,看看您可以如何处理它们,大多数企业都选择保留其数据,这迫使他们重新审视其数据存储策略,并决定是否要将一些很少使用的数据存储在云中。
3:全球化您的数据
选择进一步完善和/或探索其数据的公司应将其全球化。例如,Sales需要数据来告知哪些商品在哪里卖得多,因此创建了业务案例,并收集了数据并将其定向为回答的问题,不再使用它之后可以丢弃或存储数据,但是如果公司中的其他业务部门知道原始数据包含什么,又可以找到其他用途该怎么办?原始数据也许表明东北地区的销售下降了,而Sales则将他们在该地区的代表集中在建立客户关系上,但这就是他们对数据所做的全部,当客户服务经理看到此数据时,东北地区的产品保修索赔,有了这些信息可以在服务中采取纠正措施,并将新信息转发给工程和制造以及其他部门。
但是尽管数十年来从地面提取原油然后进行提炼的过程已发展成为一门精细科学,但数据采集和提炼仍在进行中,有一些工具可让您提取,转换和加载(ETL)数据到较小的数据集市中,终用户可将其用于分析,还有用于智能分析数据以确定在给定业务环境中哪些数据真正重要的工具,以及使您能够汇总不同的数据类型以提出新的数据模型的工具,这些模型有望带来突破性的答案,但是到目前为止自动化和工具可以带您入内,在某个时候,组织必须利用业务洞察力对数据进行操作,以使其能够利用数据和数据工具来发挥优势。
为了使组织优化其数据使用,IT主管必须将业务洞察力应用于的数据收集方式,并在数据准备期间程度地利用数据,公司不应该只为终产品数据设置报表查询,而仅做其他事情。以下是一些组织用于提高数据精炼和收获量的三种实践。
1:定义您的业务案例
公司需要定义希望其数据产生答案的业务案例,通过这种方式,数据收集,提炼和发现被赋予任务,并且可以提取数据并将其发送到数据集市以促进产生答案的查询,在这些应用程序中,组织可以更好地了解客户何时有可能购买产品,或者为什么在特定地理区域内发生特定疾病的可能性更高。
2:为剩余数据提出策略
不幸的是,在解决了层次的问题(例如,为什么以及何时进行购买,或者为什么某些地点因特定的医疗状况而遭受重创)之后,一些公司仍然将收集到的80%的数据留在桌上,在炼油过程中,这是对中级汽油和柴油进行分类的地方,必须重新评估以查看是否还有其他用途,在解决数据遗留问题时,公司有三种选择:将其丢弃,或者无限期保存直到存储成本飞涨,或者进一步优化和/或探索数据遗留问题,看看您可以如何处理它们,大多数企业都选择保留其数据,这迫使他们重新审视其数据存储策略,并决定是否要将一些很少使用的数据存储在云中。
3:全球化您的数据
选择进一步完善和/或探索其数据的公司应将其全球化。例如,Sales需要数据来告知哪些商品在哪里卖得多,因此创建了业务案例,并收集了数据并将其定向为回答的问题,不再使用它之后可以丢弃或存储数据,但是如果公司中的其他业务部门知道原始数据包含什么,又可以找到其他用途该怎么办?原始数据也许表明东北地区的销售下降了,而Sales则将他们在该地区的代表集中在建立客户关系上,但这就是他们对数据所做的全部,当客户服务经理看到此数据时,东北地区的产品保修索赔,有了这些信息可以在服务中采取纠正措施,并将新信息转发给工程和制造以及其他部门。
简而言之,公司在问:谁能使用我们收集的这些数据?
终目标是通过使数据可普遍访问来程度地利用整个公司的数据价值,在公司中这三个看似很小的数据利用步骤仍未得到充分利用,这就是为什么在数据收集,准备和提炼中充分利用数据与简单地查询和报告数据并驾齐驱,以化数据产量的原因。