分布式云的数据仓库
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-04-07
分布式云模型提供了减少的延迟
增加的数据主权更高的安全性,满足了数据重力要求,并提供了基础架构和服务方面的统一性,分布式云还为远程位置的云应用程序提供支持,这些远程应用程序可能只是断断续续地连接到Internet。
分布式云的采用者包括
结合了私有和公共基础设施的SaaS公司,以确保始终获得对其服务的访问,银行保险和医疗保健(以及公共部门机构)等受监管行业中的公司,其用例需要使用混合方法来满足监管和数据主权要求,电信,物流,制造和零售公司,其物联网分析的新兴用例受到数据引力的挑战,分布式云可以看作是混合云部署模型的必然结果,该模型在网络边缘结合了公共云,私有云和云堆栈,并提供了跨云边界无缝整合的资源,数据和分析的整合,一个控制平面。
定义分布式云
为了充分利用分布式云所提供的好处,我们必须重新考虑在这种均匀,地理上分离且逻辑互连的环境中如何管理数据的方法,分布式云将提供通用的基础硬件和软件基础结构,将在该基础上部署跨云联合的新应用程序,为了支持这些应用程序,还必须联合堆栈中更高级别的基础数据管理服务,考虑当今现代企业数据体系结构的各个组成部分,我们可以将分析生态系统分解为一组垂直服务,从数据的生产者到数据和分析的消费者,以及支持每种垂直服务所需的通用水平服务。
对于当今的许多企业而言,这些服务在很大程度上已本地化以在同一数据中心或公共云中运行
随着分布式云的兴起,需要在地理上分离但集成的资源中考虑这些组件,我们认为当今许多企业中的本地化分析生态系统将让位于基于数据引力或由于延迟或治理需求而部署服务的非本地化生态系统,在分布式云基础架构上运行的联合数据管理服务集将形成一个分布式云,数据仓库平台将必须发展以满足这些要求,通过单个控制平面进行管理,它们将能够根据数据的重心,数据主权,数据治理和延迟要求,在适当的物理和虚拟基础架构组合上根据需要提供分析应用程序。
数据作为头等公民
分布式云应在正确的位置和正确的时间提供对正确数据的无缝访问,并保证数据质量和出处,在当前的生态系统体系结构中,重点通常放在基础结构组件(例如数据湖和ETL管道)上,而不是在业务问题和生态系统要支持的数据上,数据从整个企业流向集中的数据湖和仓库,而在业务范围内则远离数据生产者和消费者。当脱离企业主的行列并由集中的IT组织进行管理时,此数据可能会开始失去意义和价值。
分布式云模型寻求逆转这种集中式数据管理
并将数据归生产者所有,生产者通过API和自助服务方式将数据直接提供给企业中其他地方的消费者,数据成为分布式云中的一等公民,通过可用于每个业务域的通用基础结构提供服务,并且可在整个企业中发现,自动化的数据移动,联合,分类和访问策略可确保以方式为消费者提供正确的数据,在此模型中基础架构本身是集中管理和保护的,但是每个业务域都管理和保护对自己数据产品的访问,这种方法的主要好处是,数据保留在业务领域的主题专家中,他们可以利用通用的数据管理和分析服务来提取,转换,分析,描述和提供数据给其他业务用户,诸如数据湖和数据仓库之类的基础架构组件仅成为分布式云中的服务,而数据本身成为的公民。
解锁分布式云的钥匙
支持分布式云成功的供应商将是那些将其数据管理和分析应用程序调整为云原生的供应商,从而使它们与支持供应,扩展,安全性,存储,和网络,此外那些调整其应用程序以利用微服务架构和容器化部署的供应商将具有额外的优势,因为这些方法在更快地部署新功能,灵活性和可伸缩性方面提供了好处。
构建同类的分布式云意味着需要保留客户选择的丰富生态系统
分布式云模型将具有广泛的联合服务和应用程序,以支持数据分类,治理,沿袭,安全性,数据虚拟化,数据提取,数据仓库,数据湖,流分析,工作流管理,AI / ML引擎以及许多其他应用程序其他组件,分布式云的实施将需要生态系统的努力,其中分布式云就绪的ISV与SI一起工作,以确保成功所需的技术,人员和流程。
分布式云的数据仓库
一直在为分布式云的到来做准备,个能够集成到此新环境中的数据仓库,我们的方法可能有助于说明技术供应商为准备为客户构建分布式云而需要采取的步骤,作为云原生核心架构,以帮助客户跨私有云和公共云环境以及在网络边缘部署,管理和协调数据仓库工作负载,以应对IoT分析等未来用例,独特的自适应“直通式”架构可确保在任何环境下(无论是在裸机上(例如,仙女座优化实例)还是在虚拟化基础架构上,均具有出色的性价比。
IoT边缘以及公共云数据中心中拥有应用程序
增加的数据主权更高的安全性,满足了数据重力要求,并提供了基础架构和服务方面的统一性,分布式云还为远程位置的云应用程序提供支持,这些远程应用程序可能只是断断续续地连接到Internet。
分布式云的采用者包括
结合了私有和公共基础设施的SaaS公司,以确保始终获得对其服务的访问,银行保险和医疗保健(以及公共部门机构)等受监管行业中的公司,其用例需要使用混合方法来满足监管和数据主权要求,电信,物流,制造和零售公司,其物联网分析的新兴用例受到数据引力的挑战,分布式云可以看作是混合云部署模型的必然结果,该模型在网络边缘结合了公共云,私有云和云堆栈,并提供了跨云边界无缝整合的资源,数据和分析的整合,一个控制平面。
定义分布式云
为了充分利用分布式云所提供的好处,我们必须重新考虑在这种均匀,地理上分离且逻辑互连的环境中如何管理数据的方法,分布式云将提供通用的基础硬件和软件基础结构,将在该基础上部署跨云联合的新应用程序,为了支持这些应用程序,还必须联合堆栈中更高级别的基础数据管理服务,考虑当今现代企业数据体系结构的各个组成部分,我们可以将分析生态系统分解为一组垂直服务,从数据的生产者到数据和分析的消费者,以及支持每种垂直服务所需的通用水平服务。
对于当今的许多企业而言,这些服务在很大程度上已本地化以在同一数据中心或公共云中运行
随着分布式云的兴起,需要在地理上分离但集成的资源中考虑这些组件,我们认为当今许多企业中的本地化分析生态系统将让位于基于数据引力或由于延迟或治理需求而部署服务的非本地化生态系统,在分布式云基础架构上运行的联合数据管理服务集将形成一个分布式云,数据仓库平台将必须发展以满足这些要求,通过单个控制平面进行管理,它们将能够根据数据的重心,数据主权,数据治理和延迟要求,在适当的物理和虚拟基础架构组合上根据需要提供分析应用程序。
数据作为头等公民
分布式云应在正确的位置和正确的时间提供对正确数据的无缝访问,并保证数据质量和出处,在当前的生态系统体系结构中,重点通常放在基础结构组件(例如数据湖和ETL管道)上,而不是在业务问题和生态系统要支持的数据上,数据从整个企业流向集中的数据湖和仓库,而在业务范围内则远离数据生产者和消费者。当脱离企业主的行列并由集中的IT组织进行管理时,此数据可能会开始失去意义和价值。
分布式云模型寻求逆转这种集中式数据管理
并将数据归生产者所有,生产者通过API和自助服务方式将数据直接提供给企业中其他地方的消费者,数据成为分布式云中的一等公民,通过可用于每个业务域的通用基础结构提供服务,并且可在整个企业中发现,自动化的数据移动,联合,分类和访问策略可确保以方式为消费者提供正确的数据,在此模型中基础架构本身是集中管理和保护的,但是每个业务域都管理和保护对自己数据产品的访问,这种方法的主要好处是,数据保留在业务领域的主题专家中,他们可以利用通用的数据管理和分析服务来提取,转换,分析,描述和提供数据给其他业务用户,诸如数据湖和数据仓库之类的基础架构组件仅成为分布式云中的服务,而数据本身成为的公民。
解锁分布式云的钥匙
支持分布式云成功的供应商将是那些将其数据管理和分析应用程序调整为云原生的供应商,从而使它们与支持供应,扩展,安全性,存储,和网络,此外那些调整其应用程序以利用微服务架构和容器化部署的供应商将具有额外的优势,因为这些方法在更快地部署新功能,灵活性和可伸缩性方面提供了好处。
构建同类的分布式云意味着需要保留客户选择的丰富生态系统
分布式云模型将具有广泛的联合服务和应用程序,以支持数据分类,治理,沿袭,安全性,数据虚拟化,数据提取,数据仓库,数据湖,流分析,工作流管理,AI / ML引擎以及许多其他应用程序其他组件,分布式云的实施将需要生态系统的努力,其中分布式云就绪的ISV与SI一起工作,以确保成功所需的技术,人员和流程。
分布式云的数据仓库
一直在为分布式云的到来做准备,个能够集成到此新环境中的数据仓库,我们的方法可能有助于说明技术供应商为准备为客户构建分布式云而需要采取的步骤,作为云原生核心架构,以帮助客户跨私有云和公共云环境以及在网络边缘部署,管理和协调数据仓库工作负载,以应对IoT分析等未来用例,独特的自适应“直通式”架构可确保在任何环境下(无论是在裸机上(例如,仙女座优化实例)还是在虚拟化基础架构上,均具有出色的性价比。
IoT边缘以及公共云数据中心中拥有应用程序
并且能够在云数据中心之外运行数据库,我们相信我们在分布式云空间上进行投资的战略意味着我们不仅有能力满足当今的混合云部署,还可以满足新兴的分布式云的数据仓库需求。