2021年要寻找的6种现代数据堆栈趋势
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-12-24
当互联网大革命发生时,我是一名网络工程师,我感到非常幸运能参与到这场云和数据革命之中
明年和未来五年将见证数据革命推动的数字化转型,由于企业的发展和更新速度比以往任何时候都要快,因此财富500强或标准普尔500强公司的平均寿命正在缩短,适应和变化的方法是使用数据,并使用预测模型和AI / ML进行即时查看,这些因素使新数字经济中的赢家和输家有所区别,数据管理正在从以分析为先的策略发展为基于结果的策略,这意味着数据现在是动态的,面向流的,并通过流程和机器学习模型进行编排。
数据堆栈将从数据结构扩展到数据网络
数据管理将是集中式的和超本地化的,以创建即时情报和体验,解决方案架构越来越依赖整个生态系统和功能集合中的消息传递,网关API和微服务,群体智能和智慧城市用例就是其中的例子,网络架构成为明天的数据架构,数据栈的民主化,近数据简化浪潮是一个非常重要的趋势,这种趋势将持续到2021年。
更好地管理大量数据感兴趣的公司就不得不做大量的繁重工作
雇用大量的数据工程师,并在令人印象深刻的开源技术上投资了数百万元,如今可以通过订阅其中一个高端数据仓库来完成许多工作,数据管理变得越来越容易,技术通常会朝相反的方向发展,变得越来越复杂,但是我们看到了一场风雨飘摇,我认为这很重要,也是一件好事,基本组件的成本已经降低,但事实也是如此,人们正在用数据做更多的事情,一些分析师可以完成五年前不得不投资1000万元的工作,这很了不起,这使复杂程度较低的公司,非沿海公司或聘用秀的团队,更像是凡人可以做到这一点,这是一件好事。
公司迁移到云并拥抱多云
越来越多的大公司对云表示出了兴趣,尤其是对于分析之类的东西, 我们当然也很关注多云,拥有在任何大型云厂商中启动平台的能力变得越来越重要,客户想要这样,他们不喜欢被该平台或一个平台捆绑到任何一个解决方案中的想法,正在向行业转移到云,这是因为云允许快速扩展容量并减少冗长的供应周期和前期许可证投资,灵活地满足需求的能力是快速响应的关键,这是数字转换策略的一部分。
人们讨厌管理数据中心,因为它们很昂贵
实际上,对于云在安全性,隐私和数据治理方面进行大量投资,他们实际上感到更加安全,不幸的是冠状病毒大流行使每个行业的企业别无选择,只能使用数字系统和云平台来满足需求,它从本质上加速了这一数字化转型的挑战,而且我认为,不管人们有什么犹豫,我们都已经超越了这一点,许多客户要求公司能够使用许多不同类型的数据集和云提供商。
除了地区法规之外,大多数公司只是对将数据保存在多个地方感兴趣
您不能将所有东西都放在一个地方,因为您需要备份并且需要冗余,真正需要的是一个可以跨越多个云的联合数据湖, 例如如果您将点击流数据存储之类的文件中,并且您的核心生产应用和日志都存储,那么就网络入口和出口而言,集中所有数据可能过于昂贵,取而代之的是,我们需要学习承受多云的复杂性以及如何地进行导航,探索数据的预测价值,没有数据背景的企业越来越意识到,它对于预测性行动很有用,到2020年以及肯定会在2021年,没有内部AI / ML技能组的企业将从供应商产品中嵌入的AI / ML功能中受益。
在应用程序部署过程中,将数据,数据科学和ML管道保持一致
对于在基于AI的解决方案中持续交付和持续集成定期增强的ML模型至关重要,这需要利用DataOps,MLOps和Platform Ops for AI来扩展AI架构,因此用于AI的AI编排平台正在兴起,这不只是查看上一季度或上周的数据,并试图找出过去发生的情况,这是关于查看即将到来的事件流并实时采取行动的,拥有实时分析将非常重要,人们对转角处和预测将要发生的事情非常感兴趣,如果您能比其他人更快地从数据中获得价值并创造出真正的差异化价值,那就是人们的原因,对预测分析和预测模型非常感兴趣。
越来越多地使用人工智能和机器学习
现代数据堆栈未来的关键要素将是包含AI / ML驱动的智能和预测分析功能,这些功能将利用广泛的历史和实时数据, 在IT运营管理领域,这涉及到分析数据,包括指标,事件,日志,拓扑,事件和更改,并且需要开放的平台并且可以集成来自众多工具和技术的数据。还需要使用本地数据中心基础架构和应用程序中的数据以及多种云资产来支持混合客户,随着企业发展成为自主的数字企业,它不仅仅是从数据分析中获得更多见解,而且还越来越涉及可操作性,并能够采取自动化措施。
面对一年的不可预测性,企业在使技术堆栈可靠无误和主动性方面必须期望出乎意料
我们将看到对AIOps的需求持续增长,因为它可以使用AI解决和预测这些意想不到的情况, ML和预测分析,注入AI和机器学习已成为一切的一部分,该工具通过执行自动缩放,自动修复,自动优化等功能,广泛用于管理基础结构,普通企业用户,人们使用AI / ML做非凡的事情的方式,将改变企业未来的运营方式,正在寻找进一步使人工智能和机器学习民主化的方法,以便那些没有数据背景的人可以通过简单的电子表格进行访问。
明年还将有更多的增强分析
您将看到越来越多的AI和机器学习被集成到人们自然的业务工作流程中,现代的BI是关于在数据资产之上创建数据API,然后进行集成仪表板,您的工作就会流入业务应用程序,对AI和机器学习的兴趣已经显示出希望,并将在2021年变得更加广泛,我们开始看到人们实际上在构建这些数据产品以供内部使用,我们与几个流服务一起工作,其中一个构建了数据产品,而我之所以使用这种产品,通常是因为它实际上是工作表下面的仪表板,但是您实际上,就像在流服务中一样,浏览标题,因此它具有产品所有徽标的图标,并且具有触摸功能,但是您可以单击并钻取以获取有关其的指标。
他们正在提供类似产品的体验,并且我看到它的发生越来越多
构建这类东西的成本更高,但是我认为,越来越多的人会看到为内部使用而构建的数据产品,有关锁定数据的担忧,一些专家表示担心,到2021年数据中的一些知名人士将开始将其数据锁定在竞争对手的平台之外,我一直以来担心的是人们正在使用越来越多的这些SaaS工具,一般的公司都拥有大量的SaaS工具,并且所有这些工具都已锁定了数据,拥有您的一些销售数据,您就会拥有所有持有数据集的系统。
的担心是这些服务将开始尝试更多地锁定其数据
而且始终害怕数据将无法用于其他产品或服务,因为SaaS应用程序适合所有人,并且不允许任何形式的差异化或定制化,所以我们可能会看到一波具有前瞻性的公司,它们正在采用更现代的应用程序平台方法-将这个过时的模型抛在后面,以构建自己的应用程序,从而真正实现差异化并在此过程中节省大量资金,但是尽管这种担心是真实的,但其他专家表示,客户担心被某些供应商所困,将迫使他们保持数据公开程度。
试图成为所有基础数据和云数据仓库需求的一站式商店的分析工具也将迎接挑战
明年和未来五年将见证数据革命推动的数字化转型,由于企业的发展和更新速度比以往任何时候都要快,因此财富500强或标准普尔500强公司的平均寿命正在缩短,适应和变化的方法是使用数据,并使用预测模型和AI / ML进行即时查看,这些因素使新数字经济中的赢家和输家有所区别,数据管理正在从以分析为先的策略发展为基于结果的策略,这意味着数据现在是动态的,面向流的,并通过流程和机器学习模型进行编排。
数据堆栈将从数据结构扩展到数据网络
数据管理将是集中式的和超本地化的,以创建即时情报和体验,解决方案架构越来越依赖整个生态系统和功能集合中的消息传递,网关API和微服务,群体智能和智慧城市用例就是其中的例子,网络架构成为明天的数据架构,数据栈的民主化,近数据简化浪潮是一个非常重要的趋势,这种趋势将持续到2021年。
更好地管理大量数据感兴趣的公司就不得不做大量的繁重工作
雇用大量的数据工程师,并在令人印象深刻的开源技术上投资了数百万元,如今可以通过订阅其中一个高端数据仓库来完成许多工作,数据管理变得越来越容易,技术通常会朝相反的方向发展,变得越来越复杂,但是我们看到了一场风雨飘摇,我认为这很重要,也是一件好事,基本组件的成本已经降低,但事实也是如此,人们正在用数据做更多的事情,一些分析师可以完成五年前不得不投资1000万元的工作,这很了不起,这使复杂程度较低的公司,非沿海公司或聘用秀的团队,更像是凡人可以做到这一点,这是一件好事。
公司迁移到云并拥抱多云
越来越多的大公司对云表示出了兴趣,尤其是对于分析之类的东西, 我们当然也很关注多云,拥有在任何大型云厂商中启动平台的能力变得越来越重要,客户想要这样,他们不喜欢被该平台或一个平台捆绑到任何一个解决方案中的想法,正在向行业转移到云,这是因为云允许快速扩展容量并减少冗长的供应周期和前期许可证投资,灵活地满足需求的能力是快速响应的关键,这是数字转换策略的一部分。
人们讨厌管理数据中心,因为它们很昂贵
实际上,对于云在安全性,隐私和数据治理方面进行大量投资,他们实际上感到更加安全,不幸的是冠状病毒大流行使每个行业的企业别无选择,只能使用数字系统和云平台来满足需求,它从本质上加速了这一数字化转型的挑战,而且我认为,不管人们有什么犹豫,我们都已经超越了这一点,许多客户要求公司能够使用许多不同类型的数据集和云提供商。
除了地区法规之外,大多数公司只是对将数据保存在多个地方感兴趣
您不能将所有东西都放在一个地方,因为您需要备份并且需要冗余,真正需要的是一个可以跨越多个云的联合数据湖, 例如如果您将点击流数据存储之类的文件中,并且您的核心生产应用和日志都存储,那么就网络入口和出口而言,集中所有数据可能过于昂贵,取而代之的是,我们需要学习承受多云的复杂性以及如何地进行导航,探索数据的预测价值,没有数据背景的企业越来越意识到,它对于预测性行动很有用,到2020年以及肯定会在2021年,没有内部AI / ML技能组的企业将从供应商产品中嵌入的AI / ML功能中受益。
在应用程序部署过程中,将数据,数据科学和ML管道保持一致
对于在基于AI的解决方案中持续交付和持续集成定期增强的ML模型至关重要,这需要利用DataOps,MLOps和Platform Ops for AI来扩展AI架构,因此用于AI的AI编排平台正在兴起,这不只是查看上一季度或上周的数据,并试图找出过去发生的情况,这是关于查看即将到来的事件流并实时采取行动的,拥有实时分析将非常重要,人们对转角处和预测将要发生的事情非常感兴趣,如果您能比其他人更快地从数据中获得价值并创造出真正的差异化价值,那就是人们的原因,对预测分析和预测模型非常感兴趣。
越来越多地使用人工智能和机器学习
现代数据堆栈未来的关键要素将是包含AI / ML驱动的智能和预测分析功能,这些功能将利用广泛的历史和实时数据, 在IT运营管理领域,这涉及到分析数据,包括指标,事件,日志,拓扑,事件和更改,并且需要开放的平台并且可以集成来自众多工具和技术的数据。还需要使用本地数据中心基础架构和应用程序中的数据以及多种云资产来支持混合客户,随着企业发展成为自主的数字企业,它不仅仅是从数据分析中获得更多见解,而且还越来越涉及可操作性,并能够采取自动化措施。
面对一年的不可预测性,企业在使技术堆栈可靠无误和主动性方面必须期望出乎意料
我们将看到对AIOps的需求持续增长,因为它可以使用AI解决和预测这些意想不到的情况, ML和预测分析,注入AI和机器学习已成为一切的一部分,该工具通过执行自动缩放,自动修复,自动优化等功能,广泛用于管理基础结构,普通企业用户,人们使用AI / ML做非凡的事情的方式,将改变企业未来的运营方式,正在寻找进一步使人工智能和机器学习民主化的方法,以便那些没有数据背景的人可以通过简单的电子表格进行访问。
明年还将有更多的增强分析
您将看到越来越多的AI和机器学习被集成到人们自然的业务工作流程中,现代的BI是关于在数据资产之上创建数据API,然后进行集成仪表板,您的工作就会流入业务应用程序,对AI和机器学习的兴趣已经显示出希望,并将在2021年变得更加广泛,我们开始看到人们实际上在构建这些数据产品以供内部使用,我们与几个流服务一起工作,其中一个构建了数据产品,而我之所以使用这种产品,通常是因为它实际上是工作表下面的仪表板,但是您实际上,就像在流服务中一样,浏览标题,因此它具有产品所有徽标的图标,并且具有触摸功能,但是您可以单击并钻取以获取有关其的指标。
他们正在提供类似产品的体验,并且我看到它的发生越来越多
构建这类东西的成本更高,但是我认为,越来越多的人会看到为内部使用而构建的数据产品,有关锁定数据的担忧,一些专家表示担心,到2021年数据中的一些知名人士将开始将其数据锁定在竞争对手的平台之外,我一直以来担心的是人们正在使用越来越多的这些SaaS工具,一般的公司都拥有大量的SaaS工具,并且所有这些工具都已锁定了数据,拥有您的一些销售数据,您就会拥有所有持有数据集的系统。
的担心是这些服务将开始尝试更多地锁定其数据
而且始终害怕数据将无法用于其他产品或服务,因为SaaS应用程序适合所有人,并且不允许任何形式的差异化或定制化,所以我们可能会看到一波具有前瞻性的公司,它们正在采用更现代的应用程序平台方法-将这个过时的模型抛在后面,以构建自己的应用程序,从而真正实现差异化并在此过程中节省大量资金,但是尽管这种担心是真实的,但其他专家表示,客户担心被某些供应商所困,将迫使他们保持数据公开程度。
试图成为所有基础数据和云数据仓库需求的一站式商店的分析工具也将迎接挑战
因为客户将对供应商锁定保持警惕,要使现代数据堆栈正常工作,必须对所有原始源,分析和可视化目标位置开放,数据堆栈的安全需求,几乎每个行业都有网络安全评估,数据管理也不例外,越来越多的客户要求后期在数据的各个不同部分建立统一的端到端数据治理结构,公司实质上是在您的数据仓库中制造一个定时炸弹,客户正在寻求有关数据安全性的更多信息,以至于像这样的公司现在都在强调其加密功能,以确保客户的数据安全,这是人们即将到来的变化之一,就像过去的三,三到六个月一样,人们现在才开始意识到这一点并认真对待它。