var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

大数据可以说已经被驯服了

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-04-30

对于许多企业而言,快速数据现在是圣杯
可以捕获组织内发生的每个事件并将其转变为数据点,机器中传感器的温度读数,送货卡车的遥测数据,联系中心的电话,网站的访问者,每个事件都有价值,并且该价值会根据捕获,处理,分析和采取行动所花费的时间长度而降低,这种“机会之窗”通常仅用十亿分之一秒的时间来构成,成为金融服务,太空探索,电信网络和家庭能源提供商等众多领域的公司实现差异化竞争的关键指标。

在讨论实时数据分析时
当您将其与历史数据结合在一起以“即时”组合,比较和对比时,其价值将呈指数增长,例如从嵌入在机器中的传感器获取温度数据,实时了解“数据”对于检查机器是否有效运行或未达到温度阈值非常有用,但是当您将其添加到经过数天和数月映射的历史数据中时,不仅会获得更丰富的信息了解机器的性能,但是您还可以基于其他机器性能配置文件建立预测模型,以了解何时可能发生问题并提前采取措施。

您可以将该示例推论到各种形式的用户方案和行业
跟踪汽车中的数据,警告工程师引擎异常,结果出现时将投放什么广告,自动驾驶车辆上的传感器的位置数据或警告障碍的无人机。清单几乎是无止境的,从大数据到快速数据,我们将其称为“连续智能”时代,即组织能够根据从数据分析(无论是实时,历史数据还是两者)中获得的洞察力,在尽可能短的时间内做出更明智的决策,从需要提高产量和减少浪费的精密制造机器,到偏远地区的设备监控,实时优化4G和5G网络,甚至甚至提高赛车队的车辆性能,历史数据都必须能够告知和塑造大量传入数据(在创建数据时),以便将实时信息立即放置在企业已经了解的上下文中,这样可以更快,更明智地制定决策,并使我们超越数据管理时代,进入持续智能时代。

对于许多企业而言
挑战在于,当其数据管理和分析软件堆栈经常被孤立和严重分散时,如何提供持续的情报,为了管理过去十年来见证的数据量的巨大增长,并试图使其中的内在价值化,企业在大规模数据基础架构解决方案上进行了投资,源自数据仓库和数据湖的企业级数据库都与集成和治理系统结合在一起,结果许多公司终获得了一个复杂的软件堆栈,其中包含来自不同供应商的多个应用程序,涉及存储,分析,可视化等方面。

尽管其中某些复杂性是有意的和可以理解的
例如法律和合同要求,隐私控制和保密技术,但在寻求实施技术时确实会带来挑战。尽管这些大数据解决方案相对比较擅长管理大量历史数据,而捕获和分析的速度并不是关键要求,但它们并不适合从“当前”捕获的数据中提供实时洞察力,在性能和提高的总体拥有成本方面存在效率低下的问题,并且由于使用相同数据集的多个应用程序而导致的数据复制风险也存在。

随着数据在速度和容量上变得越来越丰富
更快和成倍增长,孤立的数据管理方法已不适合连续智能时代,但是方便地有一些技术和平台可以提供互操作性和智能,从而可以从孤岛快速合并和获取数据,并可以立即进行分析和可视化,流分析入门,这些技术的总称是实时或流分析,对于希望实施这种解决方案的企业,需要牢记一些注意事项和实践。

考虑如何将流分析引入现有的数据管理环境中
现实是许多企业已经在数据存储和管理解决方案上投入了大量资金,因此,假设他们只是简单地撕掉并更换它们,这是不现实的,理想情况下,流分析解决方案应与主要的云平台和计算体系结构兼容,可与流行的编程语言互操作,并且在部署方法方面具有灵活性-取决于在内部,在云或混合模型中运行的项。

与任何新的解决方案部署一样
企业应考虑以及流分析部署可能对成本产生的影响。具有低内存占用量和在商用硬件上运行的能力是重要的考虑因素,尤其是对于物联网和其他情况,在这些情况下,边缘或边缘附近的分析需要软件在不太可能具有强大计算能力的设备上运行,持续的维护和运营成本以及可用于支持数据分析,修复和迁移的专业服务水平是其他要考虑的因素,企业可能还希望查看组织内部的经验,以查看是否存在适当的技能或是否需要更新培训和雇用政策。

至关重要的是无论位置

格式和大小如何,任何解决方案都必须具有互操作性和智能,才能按需合并和获取数据,要释放持续的智能,就需要重塑数据环境–摒弃孤立的解决方案,而转向提供满足现代企业需求所需的性能和规模的水平平台方法,通过采用从简单的数据管理到现在将实时和历史数据结合起来进行分析的策略,各行各业的企业将能够管理数据泛滥,同时提取高价值的见解,从而将其更有效地推向新的高度,在增长,效率或盈利能力方面发生重大变化。



Prev article

Microsoft Excel数据科学和机器学习简介

Next article

2021年一季度考试Top10榜单揭晓!

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务