如何解决企业中的数据聚合?
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-12-29
了解您公司的短期和长期分析目标
您的目标可能是今天了解客户的购买偏好,但是明天您可能想要汇总来自新来源的数据,以确定客户的爱好和兴趣,以便可以预测地出售给他们,该数据可以是结构化或非结构化形式,您公司的目标可能是改善客户体验的个性化,或者更多地了解您的产品制造和工程流程以提高产品质量,无论哪种情况,都有可能会改变您的数据聚合要求的近期目标和长期目标,您的数据聚合策略应反映出这一点,您今天可能不需要客户的生活方式或有缺陷的产品退货数据,但将来可能需要汇总来自新来源的外部数据。
如果您从外部合作伙伴那里购买数据
请确保其治理和隐私标准与您自己的兼容医疗保健数据就是一个很好的例子,如果您是出于分析和治疗目的而从外部来源获取有关某些类型疾病患者遗传构成的数据,则很可能需要将数据匿名以保护患者的隐私,当您向自己的患者保证其数据将保持私密性时,对数据匿名化的需求更大。
确定如何存储数据以及用户如何访问数据
您是否打算将汇总数据交付给公司特定功能区域内的用户或整个部门?这将决定您是选择将数据聚合并存储在具有许多不同访问选择的大型数据存储库中,还是选择存储在针对特定用户集需求的小型数据集市中。
尽可能自动化数据集成
无论您是要从呼叫中心音频,网站文本消息还是从外部付费数据源中汇总数据,您都需要一种简便的方法来审核并将这些数据集成到目标数据存储库或数据集市中,您要避免的是必须手动编码每个数据集成接口的必要性。数据聚合的集成方法是通过标准API或可以为您执行许多数据集成的自动集成工具。
开源的成功与创新息息相关,而不是供应商的锁定问题
每个企业都使用开源,但这样做的原因通常取决于企业在企业中的角色,一个流行的数据科学平台,拥有超过2000万用户,对其用户进行了调查,以更好地了解数据科学采用的当前状态,包括开源在其中的作用,在其他调查结果,开发商看重开源,使他们能够完成工作,现在,而他们的同事可能看重的是价格标签或效用,但是,实际上没有人将“避免供应商锁定”作为使用开源的(甚至第四)考虑因素,开源可以帮助公司实现多云战略,但是开源本身并不能神奇地使任何工作负载变得可移植,这根本不是开源(或企业)软件的工作方式。
受访者被要求为开源软件的五种常见利益中的每一项赋予一个比例值
您的目标可能是今天了解客户的购买偏好,但是明天您可能想要汇总来自新来源的数据,以确定客户的爱好和兴趣,以便可以预测地出售给他们,该数据可以是结构化或非结构化形式,您公司的目标可能是改善客户体验的个性化,或者更多地了解您的产品制造和工程流程以提高产品质量,无论哪种情况,都有可能会改变您的数据聚合要求的近期目标和长期目标,您的数据聚合策略应反映出这一点,您今天可能不需要客户的生活方式或有缺陷的产品退货数据,但将来可能需要汇总来自新来源的外部数据。
如果您从外部合作伙伴那里购买数据
请确保其治理和隐私标准与您自己的兼容医疗保健数据就是一个很好的例子,如果您是出于分析和治疗目的而从外部来源获取有关某些类型疾病患者遗传构成的数据,则很可能需要将数据匿名以保护患者的隐私,当您向自己的患者保证其数据将保持私密性时,对数据匿名化的需求更大。
确定如何存储数据以及用户如何访问数据
您是否打算将汇总数据交付给公司特定功能区域内的用户或整个部门?这将决定您是选择将数据聚合并存储在具有许多不同访问选择的大型数据存储库中,还是选择存储在针对特定用户集需求的小型数据集市中。
尽可能自动化数据集成
无论您是要从呼叫中心音频,网站文本消息还是从外部付费数据源中汇总数据,您都需要一种简便的方法来审核并将这些数据集成到目标数据存储库或数据集市中,您要避免的是必须手动编码每个数据集成接口的必要性。数据聚合的集成方法是通过标准API或可以为您执行许多数据集成的自动集成工具。
开源的成功与创新息息相关,而不是供应商的锁定问题
每个企业都使用开源,但这样做的原因通常取决于企业在企业中的角色,一个流行的数据科学平台,拥有超过2000万用户,对其用户进行了调查,以更好地了解数据科学采用的当前状态,包括开源在其中的作用,在其他调查结果,开发商看重开源,使他们能够完成工作,现在,而他们的同事可能看重的是价格标签或效用,但是,实际上没有人将“避免供应商锁定”作为使用开源的(甚至第四)考虑因素,开源可以帮助公司实现多云战略,但是开源本身并不能神奇地使任何工作负载变得可移植,这根本不是开源(或企业)软件的工作方式。
受访者被要求为开源软件的五种常见利益中的每一项赋予一个比例值
适合我的需求的工具和创新速度获得了分,其中避免了供应商锁定被排在,如果您多年来一直关注开源,那么这些数字就不足为奇了。被调查者离代码本身越近,他们就越在乎开源实现创新的速度,而对锁定的担心就越少,供应商谈论的是“锁定”-客户似乎并没有以同样的方式迷恋它,不相信我吗 在过去的几十年中,开源一直在蓬勃发展,与此同时,专有数据库,ERP系统等也在蓬勃发展,确实在我为开源公司工作的20年中,我几乎从未有过客户“投票”反对使用钱包进行锁定,这并不是说公司没有大举购买开放源代码,而是这样做,仅仅是“不锁定”是这样做的简单的理由。
客服热线:400-050-6600
商业联合会数据分析专业委员会