利用数据虚拟化克服分散式数据管理困境
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-06-15
对于许多实用的用例
例如简单地查询数据、执行数据发现以及用于应用程序或分析消费的工程数据,数据格局的不断增长的分布只是加强了对集中化的需求。大多数企业通过在不同地点之间复制数据来应对,虽然提供了一些短期可行性,但并不是真正可持续的我们不能仅仅为了管理数据而不断移动和复制数据,有一个终点,它不再起作用了,一般来说,我们比人们意识到的更接近那个点。
数据虚拟化已成为无休止地复制数据和招致这种方法产生的麻烦的可靠替代方案
当使用现代数据模型正确实施时,它创造了两个好处,通过使用户能够“将数据保留在现有数据源中,并在数据所在的地方、本地或本地执行所有这些复杂的查询”云,”克拉克肯定道,因此无需数据移动,企业就可以以集中方式访问它们,从而在数据质量、数据集成和其他数据管理支柱方面获得大量收益。
数据质量
不断复制数据是站不住脚的主要原因之一是这种做法对数据质量的有害影响,在不同位置之间复制数据会加剧数据孤岛,并引发关于哪些版本正确的问题——在不同位置下游操作数据后不可避免地会发生这种情况,在这种情况下,特定用例决定了数据质量“标准”,当将这些数据用于多个应用程序或多次时,这些标准并不总是值得信赖的,我担心的数据复制或数据移动是当我们制作副本并且每个人都可以看到所有不同的副本时,不是每个人而是当他们对企业可见时,这带来了诸如哪个是的,我们要更新哪个的问题?这会引起混乱,这种情况很容易通过数据虚拟化提供的抽象层得到改善,其中数据保留在原处,但可以通过集中式平台进行访问,采用另一种方法,公司面临“数据、数据流通、数据陈旧和数据新鲜度问题”的风险。
架构
虚拟化技术的另一个关键区别是数据(如数据模型中所述)有效地从其存储层中解放出来,这支持数据管理优势,例如用于为各种用例建模数据的可重用模式,而不是将数据模型绑定到特定应用程序,这种可重用性有利于加快数据准备的各个方面并减少数据驱动流程的行动时间,在这方面从用户的角度来看,支持虚拟化功能的是相同的业务级别含义和上下文数据建模,通过依赖语义图特征的通用数据模型标准,这种能力得到了显着改善。
数据整合
虚拟化的这一方面的根本好处是数据集成,这比以往任何时候都更加重要,因为企业外部存在大量异构数据源,其中许多涉及结构化和非结构化数据,如果数据的集成和连接仅存在于物理层,那么物理层的变化会破坏集成——或者它们可以,我们正在努力做的就是提升游戏水平,让你可以在另一个地方进行集成和从存储中抽象出来的连接,企业可以将数据(如果他们愿意)移动到有意义的地方,例如在云中对时间敏感的用例进行计算的位置旁边,现在这是一件好事,因为现在存储级别可以独立发展,这对底线来说是件好事, 重要的是,当组织确实想要移动数据时,他们可以“不破坏事物”,或者花费很长时间重新校准数据模型、进行集成和延迟实现价值的时间。
非结构化和半结构化数据
基于标准的数据模型的实用性质补充了企业通过数据虚拟化实现的通用可访问性,语义图模型非常适合将笨拙的半结构化和非结构化数据与用于结构化数据的相同模式相一致,通过利用这种模型来支持数据虚拟化功能,“在虚拟化故事中添加图形的好处是能够虚拟化或连接更重要的企业数据环境,我们已经不再是一个只关注关系数据的世界了,半结构化数据与结构化数据的虚拟化使企业用户可以平等地访问两者,此外数据虚拟化方法甚至不需要以这些术语来构思数据,特别是使用基于标准的方法对真实知识图进行数据建模,从客户的角度来看,将图形和虚拟化结合在一起的主要好处是您可以获得更多数据。
主要价值主张
例如简单地查询数据、执行数据发现以及用于应用程序或分析消费的工程数据,数据格局的不断增长的分布只是加强了对集中化的需求。大多数企业通过在不同地点之间复制数据来应对,虽然提供了一些短期可行性,但并不是真正可持续的我们不能仅仅为了管理数据而不断移动和复制数据,有一个终点,它不再起作用了,一般来说,我们比人们意识到的更接近那个点。
数据虚拟化已成为无休止地复制数据和招致这种方法产生的麻烦的可靠替代方案
当使用现代数据模型正确实施时,它创造了两个好处,通过使用户能够“将数据保留在现有数据源中,并在数据所在的地方、本地或本地执行所有这些复杂的查询”云,”克拉克肯定道,因此无需数据移动,企业就可以以集中方式访问它们,从而在数据质量、数据集成和其他数据管理支柱方面获得大量收益。
数据质量
不断复制数据是站不住脚的主要原因之一是这种做法对数据质量的有害影响,在不同位置之间复制数据会加剧数据孤岛,并引发关于哪些版本正确的问题——在不同位置下游操作数据后不可避免地会发生这种情况,在这种情况下,特定用例决定了数据质量“标准”,当将这些数据用于多个应用程序或多次时,这些标准并不总是值得信赖的,我担心的数据复制或数据移动是当我们制作副本并且每个人都可以看到所有不同的副本时,不是每个人而是当他们对企业可见时,这带来了诸如哪个是的,我们要更新哪个的问题?这会引起混乱,这种情况很容易通过数据虚拟化提供的抽象层得到改善,其中数据保留在原处,但可以通过集中式平台进行访问,采用另一种方法,公司面临“数据、数据流通、数据陈旧和数据新鲜度问题”的风险。
架构
虚拟化技术的另一个关键区别是数据(如数据模型中所述)有效地从其存储层中解放出来,这支持数据管理优势,例如用于为各种用例建模数据的可重用模式,而不是将数据模型绑定到特定应用程序,这种可重用性有利于加快数据准备的各个方面并减少数据驱动流程的行动时间,在这方面从用户的角度来看,支持虚拟化功能的是相同的业务级别含义和上下文数据建模,通过依赖语义图特征的通用数据模型标准,这种能力得到了显着改善。
数据整合
虚拟化的这一方面的根本好处是数据集成,这比以往任何时候都更加重要,因为企业外部存在大量异构数据源,其中许多涉及结构化和非结构化数据,如果数据的集成和连接仅存在于物理层,那么物理层的变化会破坏集成——或者它们可以,我们正在努力做的就是提升游戏水平,让你可以在另一个地方进行集成和从存储中抽象出来的连接,企业可以将数据(如果他们愿意)移动到有意义的地方,例如在云中对时间敏感的用例进行计算的位置旁边,现在这是一件好事,因为现在存储级别可以独立发展,这对底线来说是件好事, 重要的是,当组织确实想要移动数据时,他们可以“不破坏事物”,或者花费很长时间重新校准数据模型、进行集成和延迟实现价值的时间。
非结构化和半结构化数据
基于标准的数据模型的实用性质补充了企业通过数据虚拟化实现的通用可访问性,语义图模型非常适合将笨拙的半结构化和非结构化数据与用于结构化数据的相同模式相一致,通过利用这种模型来支持数据虚拟化功能,“在虚拟化故事中添加图形的好处是能够虚拟化或连接更重要的企业数据环境,我们已经不再是一个只关注关系数据的世界了,半结构化数据与结构化数据的虚拟化使企业用户可以平等地访问两者,此外数据虚拟化方法甚至不需要以这些术语来构思数据,特别是使用基于标准的方法对真实知识图进行数据建模,从客户的角度来看,将图形和虚拟化结合在一起的主要好处是您可以获得更多数据。
主要价值主张
数据格局日益分散的性质意味着很多事情,它反映了在家工作的远程协作特征、云作为部署应用程序的实际手段的起飞以及向非结构化和半结构化数据的外部来源的转变,但是它还强调了与数据质量、模式和数据集成相关的问题,这些问题是数据管理的基础,数据虚拟化使企业能够克服后一个障碍,专注于前一个好处,用可变图形数据模型补充它可以提高它对所有类型数据的适用性,因此公司可以自信地查询数据所在的位置,而无需移动或复制它,如果您必须以一种抽象的方式总结价值主张主要是查询数据以推动某些业务成果,而不必移动或复制与该业务问题相关的数据。