var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

为每种高级分析形式地管理数据的案例

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-11-05

经过仔细清洗的数据的维建模与数据挖掘通常需要的大量随机结构化原始数据有很大不同
这就是为什么传统数据仓库的结构无情的原因,而数据湖的主要任务是要保留未更改的源数据,以适合数据探索和发现驱动的分析,再举一个例子,大多数用于自然语言处理的工具适合与以人类语言文本形式存储在文件中的数据一起使用,这与大多数用于报告和自助数据访问的工具所假定的关系表有很大不同,和可视化,机器学习支持预测分析是一个极端的情况,学习数据,培训数据和生产数据的集成和管理方式完全不同。

当您将所有形式的高级分析的所有数据需求
用于集成存储和相关任务汇总在一起时,该列表将变得艰巨,数据管理专业人员面临着为比以往更多的用例和工具类型开发解决方案的压力,一个不相关的趋势带来了更大的压力许多新数据类型来自IoT和SaaS应用程序和数据平台在云和开源上的出现,为所有这些不同的用例提供解决方案对于工作人员,部署和管理而言既费时又昂贵,但是必须这样做才能从新的分析和数据资产中获得全部的商业价值和组织优势。

先进分析的数据管理趋势
为什么针对分析程序的需求量身定制数据管理变得更加紧迫?现代企业需要现代分析,许多组织将致力于多种形式的分析,因为每种形式都能揭示不同但有价值的见解,机会和解决方案,因此许多企业正在将其分析产品组合多样化,以包括更广泛的分析范围,以便他们可以做出更好的基于事实的决策,规划不确定的未来,竞争分析并增加客户数量,这些高价值的业务目标需要先进的分析形式,而这些分析又需要适合用例的数据管理,如果在正确的平台上以正确的格式没有正确的数据,高级分析中的关键和昂贵的工作将限制业务价值或投资回报ROI。

高级分析工具和实践的日益普及正在迫使数据管理发生变化
满足此类高级分析工具对数据管理的各种要求是推动数据仓库现代化,采用自助服务分析(数据准备,可视化),部署新数据平台(Hadoop,NoSQL,云,湖泊)的主要推动力,和多平台混合数据架构,数据管理必须现代化,以更好地支持高级分析,从数据工具的角度来看,用于高级分析的数据管理涉及各种形式的数据集成(ETL / ELT,虚拟化,质量过程等),数据语义(元数据,目录),数据库管理系统(关系型,列型,NoSQL),和新的数据平台(基于云,开源,Hadoop),所有这些数据管理工具和平台都必须实现现代化,以解决高级分析的数据需求。

每种形式的高级分析都有不同的数据要求

例如自助服务分析适合轻度标准化数据和业务元数据的子集,而挖掘和统计数据往往在大量原始数据和很少或没有元数据的情况下表现出色,您满足特定形式的高级分析的数据要求(集成和存储)的程度会影响其成功或失败的程度,您无法以单一方式对高级分析执行数据管理,并且不能期望所有高级分析实现都能产生有用且准确的结果,取而代之的是,数据管理解决方案必须设计用于特定形式的高级分析,有时甚至用于特定的分析应用程序。



Prev article

会计团队如何利用大数据

Next article

数据准备如何加速AI

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务