将数据存储在云中有哪些好处?
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-05-12
1.什么是拟合数据库类型?
2.哪种部署模型合适?
3.确切的服务功能是什么?
数据库类型–如何存储和如何管理数据
大型云厂商提供了多种存储数据的技术,包括用于云的数据库解决方案,首先它们都提供关系数据库,示例是虚拟机上的RDS或SQL Server,它们是为典型的在线交易工作负载而设计的,其次它们还都提供No-SQL数据库, 例如支持文档和图形数据的Cosmos DB或Cloud Datastore,第三,有数据仓库和大数据解决方案,例如SQL数据仓库或基于Hadoop的Azure Data Lake Storage Gen2,通常会混合使用专有技术和开源技术,但是解决方案是否需要关系数据库或SQL数据库,数据仓库(分别是大数据技术)还是混合方法的基本决定与本地环境相同,一旦做出决定,仅剩很少的技术选择。
数据库不是存储数据的选择
无论是在云中还是在本地世界中,云提供商还提供文件共享,它们允许应用程序将数据存储在文件中,并与其他应用程序共享和交换信息,为此提供了适用于Linux的弹性文件服务或适用于Windows文件服务器的Amazon FSx,此外虚拟机需要连接到虚拟机的本地“磁盘”存储,云提供商将这些服务打上商标,即使这些概念是众所周知的,对于现有概念来说,如此奇特的新名称也可能使新来者感到困惑。
云普及了对象存储技术
著名的可能是AWS S3。在云中二进制大型对象(例如图片或文档)存储在对象存储中,这同样适用于日志数据,即大量的小文件,对象存储即使在PB级范围内也能有效处理大型数据集。管理和识别相关对象基于两个概念,全局标识符和(高度可定制的)元数据,该元数据允许详细描述对象并查询完全相关的对象。
部署模型
云改变了内部IT员工和IT服务提供商(分别是云提供商)之间的工作分配,在许多领域,责任很明确,但是在运行组织的数据管理基础架构时,存在多种变体,部署模型决定了例如谁来修补软件或操作系统以及谁来确保可伸缩性,在传统的客户管理的部署模型中,客户的数据库管理员部署基础架构即服务组件,虚拟机存储设备等,接下来将安装文件上载到云中的VM,他们启动数据库软件的安装例程,然后进行配置,在操作阶段,会安装补丁程序,监视稳定性或添加缺少的存储,简而言之,在此部署模型中,数据库管理员的任务与本地环境中的任务相同。
客户管理的部署选项是流行与3次第三方软件供应商
供应商可以通过公共云提供商的市场提供其软件的即用型映像,这大大减少了设置和配置软件的时间,此外所有新安装始终具有的补丁程序级别,但是此后在操作过程中,数据库管理员将执行与以前相同的任务,更新和打补丁,监视稳定性和性能,添加存储等,一个管理数据库实例转移更多的工作,以云服务提供商,客户可以立即运行安装,并且云提供商可以运行实例。云提供商负责操作的稳定性和保护应用程序的安全,例如,通过部署的安全补丁程序,客户仍然可以选择数据库和基础架构的大小,如果客户想通过运行多个数据库实例来水平扩展,则必须确保应用程序可以利用它们。
托管数据库实例以及之前讨论的部署模型仍然允许传统的基于CPU的软件许可
2.哪种部署模型合适?
3.确切的服务功能是什么?
数据库类型–如何存储和如何管理数据
大型云厂商提供了多种存储数据的技术,包括用于云的数据库解决方案,首先它们都提供关系数据库,示例是虚拟机上的RDS或SQL Server,它们是为典型的在线交易工作负载而设计的,其次它们还都提供No-SQL数据库, 例如支持文档和图形数据的Cosmos DB或Cloud Datastore,第三,有数据仓库和大数据解决方案,例如SQL数据仓库或基于Hadoop的Azure Data Lake Storage Gen2,通常会混合使用专有技术和开源技术,但是解决方案是否需要关系数据库或SQL数据库,数据仓库(分别是大数据技术)还是混合方法的基本决定与本地环境相同,一旦做出决定,仅剩很少的技术选择。
数据库不是存储数据的选择
无论是在云中还是在本地世界中,云提供商还提供文件共享,它们允许应用程序将数据存储在文件中,并与其他应用程序共享和交换信息,为此提供了适用于Linux的弹性文件服务或适用于Windows文件服务器的Amazon FSx,此外虚拟机需要连接到虚拟机的本地“磁盘”存储,云提供商将这些服务打上商标,即使这些概念是众所周知的,对于现有概念来说,如此奇特的新名称也可能使新来者感到困惑。
云普及了对象存储技术
著名的可能是AWS S3。在云中二进制大型对象(例如图片或文档)存储在对象存储中,这同样适用于日志数据,即大量的小文件,对象存储即使在PB级范围内也能有效处理大型数据集。管理和识别相关对象基于两个概念,全局标识符和(高度可定制的)元数据,该元数据允许详细描述对象并查询完全相关的对象。
部署模型
云改变了内部IT员工和IT服务提供商(分别是云提供商)之间的工作分配,在许多领域,责任很明确,但是在运行组织的数据管理基础架构时,存在多种变体,部署模型决定了例如谁来修补软件或操作系统以及谁来确保可伸缩性,在传统的客户管理的部署模型中,客户的数据库管理员部署基础架构即服务组件,虚拟机存储设备等,接下来将安装文件上载到云中的VM,他们启动数据库软件的安装例程,然后进行配置,在操作阶段,会安装补丁程序,监视稳定性或添加缺少的存储,简而言之,在此部署模型中,数据库管理员的任务与本地环境中的任务相同。
客户管理的部署选项是流行与3次第三方软件供应商
供应商可以通过公共云提供商的市场提供其软件的即用型映像,这大大减少了设置和配置软件的时间,此外所有新安装始终具有的补丁程序级别,但是此后在操作过程中,数据库管理员将执行与以前相同的任务,更新和打补丁,监视稳定性和性能,添加存储等,一个管理数据库实例转移更多的工作,以云服务提供商,客户可以立即运行安装,并且云提供商可以运行实例。云提供商负责操作的稳定性和保护应用程序的安全,例如,通过部署的安全补丁程序,客户仍然可以选择数据库和基础架构的大小,如果客户想通过运行多个数据库实例来水平扩展,则必须确保应用程序可以利用它们。
托管数据库实例以及之前讨论的部署模型仍然允许传统的基于CPU的软件许可
根据数据库供应商,云环境和确切的部署模型,客户可以在云中重用其本地许可证,从而保护其早期投资,一个变体是托管服务部署模型。云提供商可确保服务的可用性以及可扩展性,客户不必做出任何规模决定,如果工作负载从每小时3个SQL查询增加到每分钟1000个SQL查询,然后减少到每分钟30个查询,则无需重新配置托管服务,无论云提供商需要数百台服务器来管理工作负载还是只管理一台,这对客户都是透明的,托管服务通常基于消耗量收费,例如,基于提交的操作数或读取和传输的数据量。
商业联合会数据分析专业委员会