var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

特色商店将如何革新企业AI

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-12-30

提高数据科学生产力
数据科学家寥寥无几,而且价格不菲,通过消除重复和不必要的工作来提高数据科学的生产率,这意味着您可以用更少的时间在现有员工的基础上制作更多的模型,在典型的数据科学孤岛中,数据科学家将80%的时间用于数据准备,而实际上仅剩余20%的时间用于部署机器学习模型。数据准备工作是手动,单调且乏味的:76%的数据科学家认为数据准备是工作中不愉快的部分。重要的是,整个公司中的许多数据科学家终都会遍历数据,以计算出公司中另一位数据科学家已经创建的相同功能,借助功能存储,数据科学家可以通过探索现有功能来立即开始新问题,在许多情况下,过去某个人已经创建了相关功能,因此数据科学家可以轻松生成训练集并立即开始构建模型,如果还没有所需的功能,则他们可以随时创建自己的功能或与数据工程师合作,这将在将来增强其他功能。

启用管道完整性
除了不必要工作的时间和精力外,缺乏一致的功能计算方法也会导致模型在数据孤岛之间发生巨大变化,例如在一家零售公司中,一个团队可以通过从销售中减去收益来计算“客户总收入”,而另一个团队仅使用销售来计算它,两者都是有效的指标,但是如果都称为“客户总收入”,则结果是在不同数据管道中计算出的指标不一致,功能存储通过在提供功能的数据管道中添加可追溯性,可见性和版本控制来解决此问题,此外功能库中内置了命名约束,可以阻止一个团队覆盖另一个团队的工作;第二小组必须给他们的计算取些新的名称,以区别他们的工作,但是不仅可以简化数据科学家的生活,还可以帮助他们解决问题,它们还允许根据机器学习模型进行更好的预测。

增强数据新鲜度
如果您的机器学习模型是根据不准确或过时的数据进行训练的,那么您的模型将犯下可能会导致您付出代价的错误。在业务环境中,拥有数据至关重要。如果客户从昨天看过的广告中购买了产品,但是广告数据直到明天才更新,则今天可以向他们显示他们已经拥有的产品,担任过该职位的任何人都知道要显示它是多么令人讨厌-如果它继续发生,将来可能会阻止他们支持该公司,通过管理数据管道,可以确保您和您的团队始终检索到数据,计划按数据的节奏运行管道,每月计算每月功能,每天计算一次每日指标,实时功能即时更新,因此您的预测始终基于数据。

促进时间一致性
时序是机器学习模型的一切,人脑根据当前的知识和过去的经验来做出决策;我们无法根据未来的信息来做出决策,机器学习模型以相同的方式学习,创建训练数据时,考虑到这一点非常重要,用于训练的功能集必须是事件发生时已知的值,特征存储库通过生成训练数据集来解决此问题,该训练数据集具有在建模事件的时间点从每个功能集的历史记录中获取的时间一致的特征值,通过保留所有功能的历史值,功能存储可让您创建准确的训练集,进而转换为准确的预测。

提供模型可解释性
拥有时间一致的数据强大的好处之一是,它可以在检查机器学习模型时实现信任,假设您经营一家银行,并且银行监管机构来审核您软件的性能,监管者希望检查您的模型在授予客户贷款请求方面的过程是否公正,如果您拥有一个具有时间一致的数据和透明的数据沿袭的功能存储,那么监管机构就很容易检查承保过程,并确保数据或软件中没有先天的区别,一个更强大的组合是将您与您的机器学习工作流系统链接起来。通过此强大的链接,您可以创建用于训练模型的所有活动和笔记本工件的存储库,您可以一直追溯到训练该模型的数据中所讨论的模型的血统,能够分析这些数据对于确保您的模型不建立在有偏见的数据上至关重要,因此您可以向监管机构展示您的模型为何得出结论。

为什么需要功能存储?

它不仅节省了数据科学家的时间和精力,还允许机器学习模型做出更准确的预测,从而可以增加公司的收入,重要的是,通过自动化机器学习管道的关键部分,可以更快,更便宜地创建模型,从而使企业AI的扩展速度提高100倍,使所有这些步骤清晰可见并易于审查,可以轻松确保法规遵从性,从而在客户和批评家之间建立信任。


Prev article

COVID-19数据块使企业可以了解不断变化的数据

Next article

广泛采用AI的催化剂

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务