如何使用预测分析做出更好的业务决策?
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-11-16
作为CPDA数据分析师,我经常听到的一些挑战包括:
1、我们已经收集了很多数据,但是还没有找到使用它的方法。
2、访问和整理数据太困难且费时。
3、我们有一个数据科学家团队,尽管他们的发现很有趣,但我们并没有发现许多实际的,实用的见解。
4、我们的机器学习结果很难理解和实现。
5、验证我们已经知道的内容很容易,但是我们如何发现新的,以前未知的见解,从而为我们的业务带来可衡量的(甚至破坏性的)价值?
6、获取数据非常昂贵。除非我们能清楚地表明投资回报率,否则我们无法证明成本合理。
为了克服这些挑战,企业既需要正确的方法论
也需要正确的工具来执行该方法论,真正的关键是找到一种经济高效,可重复的方式,以向组织内已经存在的数据量添加智能,发生这种情况的一种方法是使用组织内部(和外部)任何地方的数据湖和流数据源来实施数据驱动的操作并支持实时结果,通过使分析更接近数据,您可以更快地提取价值,当今的创新者采用以下四个步骤来简化其分析供应链。
步骤1:从目标开始
紧迫的业务挑战或目标是什么?您过去如何使用数据(和分析,甚至决策规则)来满足这一需求?哪些指标可以证明成功?您可以规划的目标越多,就越容易获得政治和组织的支持并简化项目的执行,许多企业都从一个定义明确的问题开始,这可以帮助他们随着时间的推移对流程进行微调并不断进行改进。请注意,这种映射过程还将帮助定义资源-不仅可以定义数据科学家,还可以定义领域专家和业务中的其他人员(甚至跨功能边界),这些资源可以为从大数据到更深入的见解的发展做出贡献并从中受益。
步骤2:收集并充实数据
明确确定目标之后,您需要访问,理解和评估所有可能的数据源的可行性,表面上看,许多数据源,无论是内部还是外部,似乎都很有希望,但需要对其包含的信息的广度和深度以及潜在价值进行评估,您可能从大量原始数据开始,因此要充实数据,就需要机器学习算法以一种全面而有效的方式提取特征(也称为属性或特征)。
步骤3:检测信号
您还需要一个全面,高效且可扩展的工具,该工具可以计算,确定优先级并可视化通常隐藏在数据中的有价值的定性和定量智能,机器学习算法可以快速提供各种信号的全面且优先的分析,这些信号表明给定的数据集是否有价值,包括关系,线性和非线性模式以及异常值,回顾这些信号,并问自己是否有意义,这是机器专家的智能需要挑战和解释机器的智能的时候,人机智能的迭代协作可以产生新的突破性见解。
步骤4:采取行动
此步骤并不总是意味着要实现预测性或规范性模型。业务问题可能需要从此练习中获得的见解以多种方式使用,例如修改产品设计或客户服务策略。说明性模型可以走得更远-预测将要发生的事情并规定将产生有利可图的结果的特定操作。随着多渠道客户参与度的重要性日益提高,预测和说明性模型可以在整个客户生命周期中不断提供出色的体验。
一个真实的例子
一旦到位,这些步骤将为决策过程增加许多见解,而不会减慢它的速度,从而为企业带来持续的竞争优势,这是操作步骤的示例,我们与拉丁美洲的金融服务公司之一合作,以发现数据驱动的见解,这将有助于他们为客户提供个性化服务并建立这些关系的价值,该公司需要在客户和客户两个层面上分析行为,将数据驱动的处理方式定位到可以产生影响的特定级别。
公司一直在收集来自多个来源的大数据
人们普遍期望,更多(和更多样)的数据将帮助公司过渡到以客户为中心的业务模型并提高竞争力,然而公司的经理们知道,这些海量数据所包含的“噪声”远比“信号”多得多,它们无关紧要,而不是可以帮助他们做出更好的客户决策的数据,他们如何快速提取有意义的数据,如何识别有力的洞察力来预测客户行为,并根据这些预测制定保留和交叉销售策略?
答案始于数据探索和争论
他们消除了数据冗余并解决了差距。他们对来自不同来源的数据进行了结构化和标准化处理,以便可以对其进行比较,合并和评估相关性。然后,团队增强了数据,使其现有的大数据变得更大,机器学习技术识别了成千上万潜在有价值的信号,这些信号已被优先处理和优化以准备用于模型开发的数据,这些信号是用于设计预测模型和治疗策略的决策就绪构建基块,它们包括“传统”数据变量(例如客户年龄)以及交易银行活动信息(例如每日帐户余额或两次登录之间的时间)。
当检测跨数据源的关系时,机器学习功能非常强大
我们发现某些类型的银行产品,客户年龄和跨越三个数据源的余额之间的交互。跨领域的数据源之间的交互通常会被人类专家遗漏,但是很容易被机器学习算法发现,但是如果这些发现终对人类专家没有意义,那么它们将仍然无法使用,然后分析了成千上万的洞察力,使银行能够计划其下一步行动,这些行动通常以预测模型或决策策略的形式发生,此特定项目的业务环境是提高客户保留率,但创建可重复且灵活的“数据以获取见解,进而导致采取行动”方法使银行可以轻松地将其业务目标转向预测性信贷,有风险的客户或提高投资组合的获利能力。
关于机器学习的传统思维将团队的大部分精力集中在模型或策略的开发
1、我们已经收集了很多数据,但是还没有找到使用它的方法。
2、访问和整理数据太困难且费时。
3、我们有一个数据科学家团队,尽管他们的发现很有趣,但我们并没有发现许多实际的,实用的见解。
4、我们的机器学习结果很难理解和实现。
5、验证我们已经知道的内容很容易,但是我们如何发现新的,以前未知的见解,从而为我们的业务带来可衡量的(甚至破坏性的)价值?
6、获取数据非常昂贵。除非我们能清楚地表明投资回报率,否则我们无法证明成本合理。
为了克服这些挑战,企业既需要正确的方法论
也需要正确的工具来执行该方法论,真正的关键是找到一种经济高效,可重复的方式,以向组织内已经存在的数据量添加智能,发生这种情况的一种方法是使用组织内部(和外部)任何地方的数据湖和流数据源来实施数据驱动的操作并支持实时结果,通过使分析更接近数据,您可以更快地提取价值,当今的创新者采用以下四个步骤来简化其分析供应链。
步骤1:从目标开始
紧迫的业务挑战或目标是什么?您过去如何使用数据(和分析,甚至决策规则)来满足这一需求?哪些指标可以证明成功?您可以规划的目标越多,就越容易获得政治和组织的支持并简化项目的执行,许多企业都从一个定义明确的问题开始,这可以帮助他们随着时间的推移对流程进行微调并不断进行改进。请注意,这种映射过程还将帮助定义资源-不仅可以定义数据科学家,还可以定义领域专家和业务中的其他人员(甚至跨功能边界),这些资源可以为从大数据到更深入的见解的发展做出贡献并从中受益。
步骤2:收集并充实数据
明确确定目标之后,您需要访问,理解和评估所有可能的数据源的可行性,表面上看,许多数据源,无论是内部还是外部,似乎都很有希望,但需要对其包含的信息的广度和深度以及潜在价值进行评估,您可能从大量原始数据开始,因此要充实数据,就需要机器学习算法以一种全面而有效的方式提取特征(也称为属性或特征)。
步骤3:检测信号
您还需要一个全面,高效且可扩展的工具,该工具可以计算,确定优先级并可视化通常隐藏在数据中的有价值的定性和定量智能,机器学习算法可以快速提供各种信号的全面且优先的分析,这些信号表明给定的数据集是否有价值,包括关系,线性和非线性模式以及异常值,回顾这些信号,并问自己是否有意义,这是机器专家的智能需要挑战和解释机器的智能的时候,人机智能的迭代协作可以产生新的突破性见解。
步骤4:采取行动
此步骤并不总是意味着要实现预测性或规范性模型。业务问题可能需要从此练习中获得的见解以多种方式使用,例如修改产品设计或客户服务策略。说明性模型可以走得更远-预测将要发生的事情并规定将产生有利可图的结果的特定操作。随着多渠道客户参与度的重要性日益提高,预测和说明性模型可以在整个客户生命周期中不断提供出色的体验。
一个真实的例子
一旦到位,这些步骤将为决策过程增加许多见解,而不会减慢它的速度,从而为企业带来持续的竞争优势,这是操作步骤的示例,我们与拉丁美洲的金融服务公司之一合作,以发现数据驱动的见解,这将有助于他们为客户提供个性化服务并建立这些关系的价值,该公司需要在客户和客户两个层面上分析行为,将数据驱动的处理方式定位到可以产生影响的特定级别。
公司一直在收集来自多个来源的大数据
人们普遍期望,更多(和更多样)的数据将帮助公司过渡到以客户为中心的业务模型并提高竞争力,然而公司的经理们知道,这些海量数据所包含的“噪声”远比“信号”多得多,它们无关紧要,而不是可以帮助他们做出更好的客户决策的数据,他们如何快速提取有意义的数据,如何识别有力的洞察力来预测客户行为,并根据这些预测制定保留和交叉销售策略?
答案始于数据探索和争论
他们消除了数据冗余并解决了差距。他们对来自不同来源的数据进行了结构化和标准化处理,以便可以对其进行比较,合并和评估相关性。然后,团队增强了数据,使其现有的大数据变得更大,机器学习技术识别了成千上万潜在有价值的信号,这些信号已被优先处理和优化以准备用于模型开发的数据,这些信号是用于设计预测模型和治疗策略的决策就绪构建基块,它们包括“传统”数据变量(例如客户年龄)以及交易银行活动信息(例如每日帐户余额或两次登录之间的时间)。
当检测跨数据源的关系时,机器学习功能非常强大
我们发现某些类型的银行产品,客户年龄和跨越三个数据源的余额之间的交互。跨领域的数据源之间的交互通常会被人类专家遗漏,但是很容易被机器学习算法发现,但是如果这些发现终对人类专家没有意义,那么它们将仍然无法使用,然后分析了成千上万的洞察力,使银行能够计划其下一步行动,这些行动通常以预测模型或决策策略的形式发生,此特定项目的业务环境是提高客户保留率,但创建可重复且灵活的“数据以获取见解,进而导致采取行动”方法使银行可以轻松地将其业务目标转向预测性信贷,有风险的客户或提高投资组合的获利能力。
关于机器学习的传统思维将团队的大部分精力集中在模型或策略的开发
但它应被看作是强大的创新加速器,它将业务从数据到洞察力引导到行动,那些采用结构化方法将数据转化为可衡量价值的组织-利用正确的工具来帮助他们实现飞跃,同时也使他们的业务发挥积极的,持续的作用-是能持续受益的企业。
商业联合会数据分析专业委员会