数据仓库设计与价值随时代而变
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-08-06
拿数据仓库当选择一个数据仓库来支持快速分析查询和报告时,一个大小并不适合所有情况
因此明确的目标感和定制设计至关重要,糟糕的数据仓库设计可能导致收集和使用不正确,不一致或不完整的源数据,从而使公司在战略规划和运营决策中处于众所周知的商业智能八球之后。
精心设计的数据仓库包括对自助式BI的支持
以避免依赖IT并赋予业务用户权力,低维护成本可抵消高昂的初始成本通过灵活地向关键决策者和利益相关者展示数据仓库的优势,灵活地适应不断变化的业务需求和重要的价值,然而,数据经理有时仍努力定义适合其存储和分析需求的存储库。这种犹豫不决完全不是他们的错,通常存储选项之间的界线模糊不清,而部分责任归咎于供应商在竞争激烈且不断变化的赛马争夺有利地位的过程中肩负重任。
公司可以从其仓库中获得的价值
首先我们研究支持和选择数据仓库的公司,为什么这样做以及如何使用处理后的数据。接下来,云正在重新定义仓库设计的方法。,主要供应商的大数据平台反映了在云中快速发展的按需先用的数据仓库方法。
手动数据集成阻碍了数据专家
数据集成是任何企业数据管理策略的重要组成部分,可减少孤立和重复的数据量并创建具有凝聚力的数据集。正在进行的密集数据集成过程可维护数据存储库中组织数据的全面更新视图。但是,尽管近年来数据集成技术已经发展为实现流程自动化,但一些公司仍然坚持采用手动策略。
手动数据集成之所以盛行,是因为它可以在短期内降低成本
对于中小型企业,一次性的手动数据集成项目的成本可能更低,但是对于重复过程而言,维护成本可能会很高。手动集成还使数据管理员可以更好地控制数据集成过程,但通常会限制项目的可伸缩性。此外,维护手动集成代码可能会浪费时间,而这些时间可能会花在开发其他项目上。
根据机器学习软件制造商图8的一项调查
有30%的数据科学家表示,他们将工作时间的一半到四分之三用于研发,而不是将新模型投入生产。随着自动化程度的提高,数据专业人员可以花费更少的时间手动收集,清理,转换和存储数据,从而使他们有更多的时间来解释数据并根据见解采取行动。
这本有关数据集成技术的手册探讨了数据经理和科学家在整个集成过程中遇到的挑战
我们着眼于围绕可信数据的问题,以及数据集成工具在强大的数据治理策略中扮演的关键角色,数据集成与提取,转换和加载策略之间的区别,以及集成ERP系统以改善数据访问和简化业务流程的问题。