自动化对数据科学家的未来意味着什么?
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-12-08
当今市场上有许多分析产品声称您只需要加载数据
然后就会得出可行的见解,尽管很诱人,但这几乎肯定是错误的,如果您的目标只是创建一个预测模型,而行动完全由该模型决定,那么自动化可以很好地发挥作用,例如每次您刷信用卡时,信用卡公司都会根据您的支出方式将您的购买与一系列变量进行比较,包括供应商,金额,位置和中的时间,这种比较有助于信用卡公司标记可疑活动,并且之所以起作用是因为拒绝交易的操作完全基于预测和一个基本规则:如果预测的欺诈可能性大于可接受的水平,则拒绝交易;如果没有,请接受。
这种类型的二元决策与恒温器没有什么不同
恒温器根据设定值和输入的温度读数确定其动作(打开或关闭炉子),如果房间或建筑物中的温度太低,则恒温器会告知炉子打开,业务策略不是恒温器,推动业务战略-我们需要做些什么来取悦客户或发展或扩展业务-并不是完全依赖于预测模型的决定,业务策略很少适合整洁的二进制预测,而且几乎没有像开/关开关那样易于实现的解决方案,这就是为什么从根本上说,分析是管理和领导力的问题,而不是数据科学和IT问题,管理流程很难实现自动化,因为从分析到行动的联系可能意味着在不同环境下的情况大不相同,上下文是关键:管理操作通常需要特定于上下文的判断和内容专业知识,而这仅仅是分析所没有的。
分析是关于确定分析可以帮助解决的重要问题
下一步是确定分析结果如何通知行动,可能有一个安全的假设,就是使用移动应用程序的人(像我一样)购买自己喜欢的饮料和食品要比不使用该应用程序的人花更多的钱,假设这是正确的,那么营销部门可以得出结论,星巴克为增加销售额所需要做的就是让所有客户使用该移动应用。
分析是关于确定分析可以帮助解决的重要问题
下一步是确定分析结果如何通知行动,但是这种逻辑可能是错误的,使用应用程序的人很可能已经是忠实的客户,并且无论使用什么应用程序,其花费都比其他人多,企业常常忽略这样一个事实,即通过分析做出好的决策需要对业务环境有深入的了解,并且需要了解如何生成数据。如果进行了一次真实的实验,随机分配了一些客户来获取该应用程序,而其他人则分配给了一个没有这样做的对照组,那么得出结论认为该应用程序增加了支出可能是正确的。但是,在没有真正的随机对照实验的情况下,您无法得出有关该应用是否增加支出的任何结论。
我不认为星巴克会很快实现其营销决策的自动化
但是这个假设的例子表明了自动化的缺点,即使数据看起来相同,不同的数据生成过程也常常得出截然不同的结论,自动化分析无法轻松区分数据生成过程,也无法捕获细微的业务环境,当我们掩盖这些关键细节时,我们会得出错误的结论并做出错误的决定,这是数据科学家和业务战略家都无法承受的结果。
桥接数据科学和业务战略
这对数据科学家的未来意味着什么?成功的企业将需要在数据科学与业务战略之间建立明确的桥梁,以便前者可以为后者提供信息,我们不能仅仅将数据科学家视为构建良好模型并将这些结果发送给业务专家的技术专家,这种方法已被证明是有问题的-此外,只有技术技能的数据科学家将容易被分析自动化取代,为了使分析成功,业务主管必须精通(甚至熟练)数据分析,并且他们必须确保其数据科学家沉浸在业务环境中,数据科学家不仅要努力成为技术专家,还必须开发尽可能多的业务专业知识。
分析自动化可以在发现趋势和建立模型方面做得非常出色
然后就会得出可行的见解,尽管很诱人,但这几乎肯定是错误的,如果您的目标只是创建一个预测模型,而行动完全由该模型决定,那么自动化可以很好地发挥作用,例如每次您刷信用卡时,信用卡公司都会根据您的支出方式将您的购买与一系列变量进行比较,包括供应商,金额,位置和中的时间,这种比较有助于信用卡公司标记可疑活动,并且之所以起作用是因为拒绝交易的操作完全基于预测和一个基本规则:如果预测的欺诈可能性大于可接受的水平,则拒绝交易;如果没有,请接受。
这种类型的二元决策与恒温器没有什么不同
恒温器根据设定值和输入的温度读数确定其动作(打开或关闭炉子),如果房间或建筑物中的温度太低,则恒温器会告知炉子打开,业务策略不是恒温器,推动业务战略-我们需要做些什么来取悦客户或发展或扩展业务-并不是完全依赖于预测模型的决定,业务策略很少适合整洁的二进制预测,而且几乎没有像开/关开关那样易于实现的解决方案,这就是为什么从根本上说,分析是管理和领导力的问题,而不是数据科学和IT问题,管理流程很难实现自动化,因为从分析到行动的联系可能意味着在不同环境下的情况大不相同,上下文是关键:管理操作通常需要特定于上下文的判断和内容专业知识,而这仅仅是分析所没有的。
分析是关于确定分析可以帮助解决的重要问题
下一步是确定分析结果如何通知行动,可能有一个安全的假设,就是使用移动应用程序的人(像我一样)购买自己喜欢的饮料和食品要比不使用该应用程序的人花更多的钱,假设这是正确的,那么营销部门可以得出结论,星巴克为增加销售额所需要做的就是让所有客户使用该移动应用。
分析是关于确定分析可以帮助解决的重要问题
下一步是确定分析结果如何通知行动,但是这种逻辑可能是错误的,使用应用程序的人很可能已经是忠实的客户,并且无论使用什么应用程序,其花费都比其他人多,企业常常忽略这样一个事实,即通过分析做出好的决策需要对业务环境有深入的了解,并且需要了解如何生成数据。如果进行了一次真实的实验,随机分配了一些客户来获取该应用程序,而其他人则分配给了一个没有这样做的对照组,那么得出结论认为该应用程序增加了支出可能是正确的。但是,在没有真正的随机对照实验的情况下,您无法得出有关该应用是否增加支出的任何结论。
我不认为星巴克会很快实现其营销决策的自动化
但是这个假设的例子表明了自动化的缺点,即使数据看起来相同,不同的数据生成过程也常常得出截然不同的结论,自动化分析无法轻松区分数据生成过程,也无法捕获细微的业务环境,当我们掩盖这些关键细节时,我们会得出错误的结论并做出错误的决定,这是数据科学家和业务战略家都无法承受的结果。
桥接数据科学和业务战略
这对数据科学家的未来意味着什么?成功的企业将需要在数据科学与业务战略之间建立明确的桥梁,以便前者可以为后者提供信息,我们不能仅仅将数据科学家视为构建良好模型并将这些结果发送给业务专家的技术专家,这种方法已被证明是有问题的-此外,只有技术技能的数据科学家将容易被分析自动化取代,为了使分析成功,业务主管必须精通(甚至熟练)数据分析,并且他们必须确保其数据科学家沉浸在业务环境中,数据科学家不仅要努力成为技术专家,还必须开发尽可能多的业务专业知识。
分析自动化可以在发现趋势和建立模型方面做得非常出色
但是不能解决复杂的业务问题,这仍然需要对业务环境有深入的了解,并且需要对数据科学有足够的了解,才能了解趋势和模型在制定业务决策中的作用,随着时间的流逝,自动化可能会减少对仅技术专家的需求,但是对将数据科学转化为业务问题的熟练数据科学家的需求将会增长,对于愿意拥抱它的数据科学家来说,这是个好消息。
商业联合会数据分析专业委员会