事务性,主数据,黄金数据和参考数据
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-04-25
交易数据
交易数据描述了业务事件。它是企业中的数据量。商业事件的示例包括:
从供应商那里购买产品
向客户销售产品
将物品运送到客户现场
雇用员工,管理假期或更改职位
您每天都在管理交易数据!他们使企业世界旋转
交易数据通常在CRM,ERP,SCM,HR等首字母缩写的运营应用程序中处理
主要的数据
主数据是支持交易的关键业务信息。
主数据描述了交易中涉及的客户,产品,零件,员工,材料,供应商,地点等。它通常被
称为场所(位置,地理位置,地点等),各方(个人,客户,供应商,雇员等)和事物(产品,物品,材料,车辆等)。
主数据已经存在并且已在操作系统中使用,但存在一些问题,这些系统中的主数据是:
不是高质量的数据
分散和重复
没有真正的管理
主数据通常是在现有业务流程的正常操作过程中编写和使用的
不幸的是这些运营业务流程是针对此主数据的“特定于应用程序”的使用案例量身定制的,因此无法满足整个企业的要求,即要求整个应用程序使用高质量标准和通用治理来强制跨应用程序使用通用主数据。
参考资料
它是由许多系统引用和共享的数据,大多数参考数据是指影响业务流程的概念,例如订单状态(“已创建” |“已批准” |“已拒绝” |等),或者用作附加的标准化语义,进一步阐明了数据记录的解释,例如员工职位(初级|高级|副总裁|等)一些参考数据可以是通用的和/或标准化的,其他参考数据可以在企业(客户状态)内或在给定的业务域(产品分类)内“商定”,参考数据通常被视为主数据的子集。该数据类别的全名是“ 主参考数据”。
报告数据
报告数据是为报告和商业智能目的而企业的数据(非常简短),用于运营报告的数据以及用于企业(高度汇总)报告的数据都属于此类别,报告数据是根据交易数据,主数据和主参考数据创建的。
元数据
元数据是描述其他数据的数据,它是数据的基础定义或描述, 元数据的示例包括媒体文件的属性,其大小,类型,分辨率,作者和创建日期。 软件应用程序,文档,电子表格和网页都是通常具有关联元数据的示例,主数据,参考数据和日志数据都具有相关的元数据。
大数据
大数据有许多不同的定义,大数据数量种类和速度就其本质而言,传统技术无法有效维护大数据,很简单它是前四种数据类型的组合:日志数据,事务数据,参考数据和主数据。
非结构化数据
非结构化数据是没有预定义结构的数据。这种类型的数据主要是指文本数据,诸如文本挖掘之类的域可以从非结构化文档中提取相关的和结构化的数据。
主数据有什么问题?
如前所述主数据通常是在操作系统中创作(创建)和使用的,但并不总是足够准确和完整以适合所有目的,电话设备的订购过程(或应用程序)可能会超出仅收集与订购有关的数据的范围,还可以提供下订单方的帐单和送货地址,但是由于该电子邮件地址与该过程无关,因此可能不会创建该电子邮件地址,一个网站的注册过程将侧重于电子邮件地址的质量,但不能保证电话号码的质量,等等,在这些应用中输入的数据确实为每个特定应用场景和使用情况量身定做,但是在企业级别,此类客户主数据应包括准确的账单/送货地址以及有效的电子邮件地址和电话号码。
在数据的企业中交易和报告数据依赖于主(和参考)数据
结果错误的主数据直接反映为无用的报告和操作效率低下,黄金数据,现在想象一个托管客户(或产品,员工,站点)记录的数据库,所有相关信息(从各种运营来源汇总),仅有效信息(没有错误的地址或电子邮件退回)无重复。
黄金数据是原始主数据的经过清理,重复数据删除,合并和验证
交易数据描述了业务事件。它是企业中的数据量。商业事件的示例包括:
从供应商那里购买产品
向客户销售产品
将物品运送到客户现场
雇用员工,管理假期或更改职位
您每天都在管理交易数据!他们使企业世界旋转
交易数据通常在CRM,ERP,SCM,HR等首字母缩写的运营应用程序中处理
主要的数据
主数据是支持交易的关键业务信息。
主数据描述了交易中涉及的客户,产品,零件,员工,材料,供应商,地点等。它通常被
称为场所(位置,地理位置,地点等),各方(个人,客户,供应商,雇员等)和事物(产品,物品,材料,车辆等)。
主数据已经存在并且已在操作系统中使用,但存在一些问题,这些系统中的主数据是:
不是高质量的数据
分散和重复
没有真正的管理
主数据通常是在现有业务流程的正常操作过程中编写和使用的
不幸的是这些运营业务流程是针对此主数据的“特定于应用程序”的使用案例量身定制的,因此无法满足整个企业的要求,即要求整个应用程序使用高质量标准和通用治理来强制跨应用程序使用通用主数据。
参考资料
它是由许多系统引用和共享的数据,大多数参考数据是指影响业务流程的概念,例如订单状态(“已创建” |“已批准” |“已拒绝” |等),或者用作附加的标准化语义,进一步阐明了数据记录的解释,例如员工职位(初级|高级|副总裁|等)一些参考数据可以是通用的和/或标准化的,其他参考数据可以在企业(客户状态)内或在给定的业务域(产品分类)内“商定”,参考数据通常被视为主数据的子集。该数据类别的全名是“ 主参考数据”。
报告数据
报告数据是为报告和商业智能目的而企业的数据(非常简短),用于运营报告的数据以及用于企业(高度汇总)报告的数据都属于此类别,报告数据是根据交易数据,主数据和主参考数据创建的。
元数据
元数据是描述其他数据的数据,它是数据的基础定义或描述, 元数据的示例包括媒体文件的属性,其大小,类型,分辨率,作者和创建日期。 软件应用程序,文档,电子表格和网页都是通常具有关联元数据的示例,主数据,参考数据和日志数据都具有相关的元数据。
大数据
大数据有许多不同的定义,大数据数量种类和速度就其本质而言,传统技术无法有效维护大数据,很简单它是前四种数据类型的组合:日志数据,事务数据,参考数据和主数据。
非结构化数据
非结构化数据是没有预定义结构的数据。这种类型的数据主要是指文本数据,诸如文本挖掘之类的域可以从非结构化文档中提取相关的和结构化的数据。
主数据有什么问题?
如前所述主数据通常是在操作系统中创作(创建)和使用的,但并不总是足够准确和完整以适合所有目的,电话设备的订购过程(或应用程序)可能会超出仅收集与订购有关的数据的范围,还可以提供下订单方的帐单和送货地址,但是由于该电子邮件地址与该过程无关,因此可能不会创建该电子邮件地址,一个网站的注册过程将侧重于电子邮件地址的质量,但不能保证电话号码的质量,等等,在这些应用中输入的数据确实为每个特定应用场景和使用情况量身定做,但是在企业级别,此类客户主数据应包括准确的账单/送货地址以及有效的电子邮件地址和电话号码。
在数据的企业中交易和报告数据依赖于主(和参考)数据
结果错误的主数据直接反映为无用的报告和操作效率低下,黄金数据,现在想象一个托管客户(或产品,员工,站点)记录的数据库,所有相关信息(从各种运营来源汇总),仅有效信息(没有错误的地址或电子邮件退回)无重复。
黄金数据是原始主数据的经过清理,重复数据删除,合并和验证
有人称其为真相的单一版本或360°客户视图您可能会想到,这些黄金数据对应用程序(BI,可运行的或其他的)具有巨大的价值,它还揭示了其他挑战。