var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

混合云分析为数据分析的新挑战

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-11-18

数据维度
当您想到“混合”时,您可能会首先考虑云配置的类型(公共,私有或组合),但是混合可以描述您的企业正在使用的数据类型-结构化,非结构化和多结构化数据。混合还可以描述数据的位置,仅在本地的数据会迁移到云(或在云中创建),如果数据已复制,则数据既在本地又在云中,有时数据会从本地数据仓库卸载到云中,例如,以卸载负担重的系统。这不一定是一种提升和转变,而更多是一种循序渐进的基于价值的方法,有时数据着陆和分段正在转移到云中,并且一些组织非常勇敢,并且将所有数据都转移到了云中,但是,我们更经常看到混合混合模型,通常组织会将数据从一种来源拉到另一种。

将新的存储平台添加到此组合中
您拥有或计划建立什么样的基础设施来进行预测分析? 企业当然有数据仓库,但是现在有超过四分之一(28%)的受访者正在使用它在公共云中的使用,如果用户坚持自己的计划,这个数字将增加一倍以上。” 像新的数据存储平台(如数据湖)一样受欢迎,它可以处理各种数据类型。数据湖-以及公共云上的Hadoop和公共云上的分析平台-还将在几年内翻倍使用。

变更分析对这些分散的数据执行的分析也正在更改为混合模型
企业正在扩展其分析工具套件,采用机器学习,自然语言处理(NLP)和AI技术,对这些技术的处理方式,超过一半的人正在将其部署在用于预测性维护和供应链优化等各种用例的操作中,一位高级用户指出,市场营销将预测分析和机器学习用于分析客户行为,尤其是客户流失,正在用于分析社交媒体数据并执行情感分析,IT部门还使用这些技术来预测机器故障,不同类型的分析被一起使用,并且被分别用于获得业务价值,在同一分析中某人可能会使用文本分析来确定客户的情感,然后将该信息与其他数据集成关于客户的问题,为客户创建大数据集以创建保留模型,与地理空间数据类似:您可以将其与客户数据结合起来,以预测保险公司的风险。

企业不仅在扩展执行的分析类型
他们还改变在那里进行分析,混合云分析意味着能够访问在内部或云中完成的分析,如果我在场所执行一种分析,也许使用可视化分析工具对客户进行分析,然后我想在云中构建客户流失模型,那么我应该有一种简单的方法来进行本地分析,它应该作为终用户,这对我来说似乎是无缝的。

迁移到云的背后是什么
云功能对于分析非常重要,因为该平台可以提供多个关键优势。前三名:可伸缩性,灵活性和成本,很明显云可以根据您的需要进行伸缩,当您需要对大型数据集执行分析处理时,云使您能够根据需要获取尽可能多的存储和计算服务,完成分析后,您便可以可以发布这些服务,因此您不再为所需的费用付费,借助云的虚拟资源,与在本地执行相同任务相比,启用新数据源和设置分析沙箱更加容易。

云平台会自动提供其软件的版本,这对分析很有帮助
在成本方面,超过三分之一(37%)的调查受访者表示,这是云计算的主要推动力,云不一定总是经济的选择,与本地数据平台相比,启动成本可以降低,并且云环境的日常维护可以更低,其他好处包括处理数据多样性的能力(传统的数据仓库通常不打算处理不同的数据类型,例如非结构化数据),将计算能力放在数据所在的位置(程度地减少数据移动)以及分离的能力计算和存储资源(因此您可以独立启动和关闭它们)。

以数据类型位置和存储平台为基础
将它们与新的分散分析相结合,您将看到复杂性增长的速度,您可能有多个本地分期付款,可能有多个云甚至是不同的云提供商,数据可以来自内部来源,外部来源,云中的应用程序以及本地应用程序,企业正在制定解决方案,例如将这些系统集成到某种统一体系结构中,或者它们正在联合或虚拟化数据,现在大多数现代数据仓库都具有这种混合多平台系统架构,该架构已由该逻辑架构统一。

企业正在使用另一种应对机制
使用语义层尝试通过元数据获得更好的视图,以在不同的数据源之间进行集成,拆分“所到之处”是另一种方法,一些组织将其数据仓库用于某些类型的分析,而其他平台则用于更新和更复杂的分析,例如机器学习,数据进入云上的一个平台,在该平台上可以对其进行浏览,然后构建模型,这意味着您需要迁移数据,当然在初始迁移方面,有多种方法可以迁移数据,然后根据需要卸载数据,混合云会加剧您已经在处理的数据问题,例如治理,您的企业将需要跨多个平台的可见性,因此沿袭成为元数据中的一个问题,同样由于数据可能位于多个位置(如果您已复制数据,有时在同一时间),因此安全问题也变得很复杂。

提到的一个挑战是多个地点

您可能在一个地方开发报告和可视化,但在另一个地方构建模型,如果要在一个地方查看它们,则需要更多的统一视图,用户通常很难解决这种复杂性,因此他们选择了一家供应商,该供应商可以通过提供扩展后的分布式平台的统一且易于使用的视图的工具来补充处理数据合并和聚合的问题。



Prev article

成功的AI需要精心计划

Next article

商业成功秘诀:全新的分析手段

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务