400 050 6600
数据分析师

手机号

验证码

30天自动登录
当前位置:首页 - Q&A问答

Q&AQ&A问答

数据沿袭–怎样了解数据格局的关键?

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-07-03

大多数组织面临着来自各种供应商的,可能支持不同平台的,混杂在服务器上的数据的复杂性
这些多样的大数据生态系统可以和谐地协同工作,但是通常系统之间的联系记录薄弱。大多数组织可能会在一个紧要关头确切地说出他们的数据驻留在哪里以及它如何与上游和下游应用程序交互。

您的数据真正发生了什么?
了解环境的数据沿袭和数据关系是掌握数据实际情况的关键,数据沿袭类似于数据生命周期,可以帮助我们跟踪数据从源头到目的地的过程,它详细说明了数据流及其依赖性。从数据沿袭中捕获的信息使追踪数据回到其起源成为可能,这也解释了数据的使用过程,如果没有自动化的数据沿袭解决方案,该过程将非常耗时,简而言之,数据沿袭会回答诸如“这些数据来自何方?”之类的问题。或“您是如何得出这个报告的数字的?”。

数据关系的知识在评估变更对其他系统的影响方面起着关键作用
这些知识对于更好的数据治理,改进的数据质量和完整性流程,“隐藏”数据管理以及整体元数据管理非常有用。

映射数据以建立基准
映射数据流和数据沿袭的基本好处之一是它可以建立基线,以图形方式映射数据有助于更好地可视化各种数据元素及其关系,这些技术在识别不同阶段的潜在隐患方面非常有用,并有助于数据管理人员主动采取必要的纠正措施。

数据沿袭可以帮助提供更全面的数据视图,从而有助于更好地进行数据合规性并更轻松地诊断业务规则差异,捕获并表示完整数据沿袭的起点是访问元数据,大多数数据库通常已经知道此信息,这是很容易的部分,真正的工作始于发现和学习数据环境中“隐藏的”未记录数据。

“隐藏”数据的挑战
在较旧的旧式和孤立系统中,“隐藏数据”的情况非常普遍,在这些系统中经常缺少或缺少完整的文档,如果企业仅在原始数据库元数据级别使用其可见(“已知”)数据的20%进行数据管理和分析,则发现和跟踪所有数据元素和数据关系是一个巨大的问题,并且无法有效地进行利用其“隐藏”数据资产的其他80%,解决此问题需要付出很多努力,导致上市时间延迟和/或使用不合格产品或错误信息进行部署,与其他精通数据的公司相比,这使企业处于明显的竞争劣势。

通过数据透明度实现数据沿袭
要创建良好的数据沿袭解决方案,必须确保数据透明,作为金融部门的一个简单案例研究,监管机构希望全面理解银行如何得出其风险评估数字,例如资本流动性比率。为此,金融机构必须能够及时向监管机构解释他们如何得出报告的数字,包括用于计算数字的所有原始数据,在技术层面上,这要求银行搜索其企业数据库以识别数据项并跟踪数据库之间以及数据库内部的数据关系。银行必须及时(通常多在5个工作日之内)回应审计师的要求,询问数字的来源及其来源数据的方式,问题在于,这通常是高度手动,繁琐。

所需解决方案
许多业务计划都要求您了解数据环境,除非您知道当前的数据资产,否则很难确定需要访问或更改哪些内容以满足新的业务需求,缺乏对公司数据资产的了解或无法理解关系和数据流会导致工作浪费和结论不正确,因此数据库基准确定是一项基础活动,可帮助CDO,CTO,应用程序架构师和数据架构师:

了解并利用组织数据并限制数据负担

控制IT成本,实现并购尽职调查和合规性如果没有合适的工具,数据基准化将令人沮丧,费力且容易出错,需要一种工具来提供易于使用的解决方案,该解决方案通过使人们对跨技术的数据资产具有统一的了解,可以自动发现隐藏的“未记录”数据,从而节省时间并消除孤岛,洞察力将为简化系统,消除冗余和发现新机会提供机会–甚至使复杂的数据环境都易于理解,并向用户提供可操作的信息,以利用您的数据的全部价值。



Prev article

云后端即服务是应用程序开发人员的秘密武器的四个原因

Next article

我们如何利用我们的数据预测能力呢?

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务