提高业务洞察速度的五个步骤
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-07-15
大数据的一大挑战是大多数员工不具备使用它的技能或时间
销售、营销、人力资源和组织中的所有其他关键职能可以而且应该利用数据来推动决策,但如果无法访问单一的事实来源,这不是一种选择,能够在技术层面处理数据的IT 团队成员(数据科学家、业务分析师、工程师和其他人)通常没有将原始数据转化为同事洞察所需的工具——当然不是快速或大规模,BI 的成功取决于速度。在商业智能方面,速度并不是虚荣指标,因为数据只有在新鲜、准确和可操作时才有价值,在理想的世界中,商业洞察力应该只受到构建正确问题的能力的限制,速度和准确性不应该是一个问题——但这说起来容易做起来难。
根据我的经验,以下是推进组织的数据战略以使商业智能更快、更易于访问所需的五个步骤。这些涉及所有传统的“3 V”数据:数量、速度和多样性。
第 1 步:通过虚拟化加速访问实时数据
通过数据管道的串行处理和一次性数据分析工作,不可能获得可靠、新鲜的数据,加速访问实时数据是缩短提供业务洞察所需时间的步,数据摄取堆栈是成功进行大数据分析和提供业务洞察力的关键。在我们看来,将所有数据放在一个地方是不现实的,这就是为什么智能数据虚拟化是一种重要的数据集成方式,可以增强传统的 ETL/ELT 方式并提供对各种数据源的访问。
第 2 步:投资可扩展的基础设施和处理
为处理数据配置本地基础设施通常需要很长时间来批准、获取和运行,这会显着延迟向终用户获取分析和洞察,投资可扩展和弹性的数据基础设施至关重要——通常是通过云,大型企业和拥有大量数据的企业需要高度弹性、水平可扩展的容量来增长,另外如果您正在处理半结构化数据(想想:多样性),您需要能够以可扩展的方式展开嵌套数据以获得速度。
步骤 3:删除数据移动约束
构建物理多维数据集和数据集市可能很脆弱且容易出错,从而导致相当大的维护和风险,尤其是在尝试将数据从一个位置物理移动到另一个位置时,如果该过程失败,您很容易出现持续数小时甚至数天的中断,从而导致数据中断,为了消除数据移动限制,由数据虚拟化支持的语义层可能是一个很好的解决方案,有了通用语义层,您可以限度地减少 IT 和用户之间的延迟,将数据准备时间从几周缩短到几分钟,并打破将数据从 A 点移动到 B 点的物理限制。
第 4 步:计划数量增长
数据正以的速度增长,许多企业可以轻松地看到其管理下的数据流量同比增长 100%,这就是为什么企业需要一个计划-来处理它们今天的数据量和之后,今年他们将有明年的数据量和,有了现实的、着眼于未来的数据量增长计划,分析大型数据集和利用有用的情报推动业务计划将变得更加容易,这意味着选择能够随着您的数据需求弹性增长的数据存储和处理架构至关重要。
第 5 步:构建自助式分析
在缩短洞察时间方面,您可以采取的举措是向所有业务用户提供自助式分析,没有人需要知道如何使用 SQL 或运行复杂的数据查询来获得做出关键(甚至是平凡)决策所需的洞察力,提供自助工具意味着无论用户喜欢哪种工具(从 Power BI 到 Excel 再到 Tableau),都可以提供访问权限,它还意味着为每个指标的含义(对人类和机器)开发一个单一的、共享的词汇表。这就是语义层的目的,如果产品团队和销售团队都确切地知道“净销售额”在您的企业中的含义,那么跨团队共享见解就具有真正的意义,并且可以实现跨职能协作,终这会导致更好的、更多数据驱动的决策。
销售、营销、人力资源和组织中的所有其他关键职能可以而且应该利用数据来推动决策,但如果无法访问单一的事实来源,这不是一种选择,能够在技术层面处理数据的IT 团队成员(数据科学家、业务分析师、工程师和其他人)通常没有将原始数据转化为同事洞察所需的工具——当然不是快速或大规模,BI 的成功取决于速度。在商业智能方面,速度并不是虚荣指标,因为数据只有在新鲜、准确和可操作时才有价值,在理想的世界中,商业洞察力应该只受到构建正确问题的能力的限制,速度和准确性不应该是一个问题——但这说起来容易做起来难。
根据我的经验,以下是推进组织的数据战略以使商业智能更快、更易于访问所需的五个步骤。这些涉及所有传统的“3 V”数据:数量、速度和多样性。
第 1 步:通过虚拟化加速访问实时数据
通过数据管道的串行处理和一次性数据分析工作,不可能获得可靠、新鲜的数据,加速访问实时数据是缩短提供业务洞察所需时间的步,数据摄取堆栈是成功进行大数据分析和提供业务洞察力的关键。在我们看来,将所有数据放在一个地方是不现实的,这就是为什么智能数据虚拟化是一种重要的数据集成方式,可以增强传统的 ETL/ELT 方式并提供对各种数据源的访问。
第 2 步:投资可扩展的基础设施和处理
为处理数据配置本地基础设施通常需要很长时间来批准、获取和运行,这会显着延迟向终用户获取分析和洞察,投资可扩展和弹性的数据基础设施至关重要——通常是通过云,大型企业和拥有大量数据的企业需要高度弹性、水平可扩展的容量来增长,另外如果您正在处理半结构化数据(想想:多样性),您需要能够以可扩展的方式展开嵌套数据以获得速度。
步骤 3:删除数据移动约束
构建物理多维数据集和数据集市可能很脆弱且容易出错,从而导致相当大的维护和风险,尤其是在尝试将数据从一个位置物理移动到另一个位置时,如果该过程失败,您很容易出现持续数小时甚至数天的中断,从而导致数据中断,为了消除数据移动限制,由数据虚拟化支持的语义层可能是一个很好的解决方案,有了通用语义层,您可以限度地减少 IT 和用户之间的延迟,将数据准备时间从几周缩短到几分钟,并打破将数据从 A 点移动到 B 点的物理限制。
第 4 步:计划数量增长
数据正以的速度增长,许多企业可以轻松地看到其管理下的数据流量同比增长 100%,这就是为什么企业需要一个计划-来处理它们今天的数据量和之后,今年他们将有明年的数据量和,有了现实的、着眼于未来的数据量增长计划,分析大型数据集和利用有用的情报推动业务计划将变得更加容易,这意味着选择能够随着您的数据需求弹性增长的数据存储和处理架构至关重要。
第 5 步:构建自助式分析
在缩短洞察时间方面,您可以采取的举措是向所有业务用户提供自助式分析,没有人需要知道如何使用 SQL 或运行复杂的数据查询来获得做出关键(甚至是平凡)决策所需的洞察力,提供自助工具意味着无论用户喜欢哪种工具(从 Power BI 到 Excel 再到 Tableau),都可以提供访问权限,它还意味着为每个指标的含义(对人类和机器)开发一个单一的、共享的词汇表。这就是语义层的目的,如果产品团队和销售团队都确切地知道“净销售额”在您的企业中的含义,那么跨团队共享见解就具有真正的意义,并且可以实现跨职能协作,终这会导致更好的、更多数据驱动的决策。