var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

AI驱动的平台识别并纠正数据中的偏见

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-01-14

综合功能使该功能立即可用,无需任何编码或深厚的技术知识即可上手
用户只需上传一个结构化的数据文件(如电子表格)即可开始分析过程。该平台固有的简单性使该解决方案可以跨行业使用,该数据平台可用于财务以建立更公平的信用等级,可用于保险以更好地更公平地评估索赔,可用于人力资源以识别偏见(作为招聘过程的一部分),还可以用于大学以确保录取决定公平,由于数据偏差,所有组织的声誉风险都受到威胁,我们已经看到这种情况将不再容忍。

重新平衡有偏见的数据
除了这种深入的分析和偏差检测之外,该平台还提供了另一个极其强大的功能: 在称为“重新平衡”的过程中自动删除整个数据集中存在的偏差,尽管有许多现有的,有限的技术来重新平衡偏向数据,开发了一种专有算法,该算法更快,更准确。AI驱动的平台具有对原始的有偏见的数据集进行大规模随机更改的能力,以构建新的,完全合成的数据集。随着合成数据的生成,为其用户提供了在数据集中平均分配所有属性的能力,以消除偏差并完全重新平衡数据集,用户还可以手动更改数据集内的单个数据属性(例如性别),从而提供对重新平衡过程的精细控制。 

缓解偏见的社区版–工作原理
上载结构化的数据文件(如Excel电子表格)以启动分析过程。用户还可以连接到关系数据库服务,包括AWS,Azure,Google Cloud,Oracle等,以构建用于分析的自定义数据集,该平台实时了解数据的结构,分析过程可以在大约十分钟内处理四百万行数据,偏差摘要和得分:分析完成后,将为用户提供综合总公平得分,该得分显示数据集中包含偏差数据的百分比,该平台还突出显示了检测到偏差的数据区域。

重新平衡:此过程中可用的终功能是能够自动重新平衡有偏见的数据

综合的完整解决方案,该社区版是合成的数据平台的一个组成部分,完整的平台使用AI来自动化数据供应的所有阶段,以有序和安全的方式使数据可用的过程,这种自动化水平使组织能够生成综合数据集,从而使他们能够更好地测试新产品和工具的数据,验证数学模型或训练机器学习模型,综合完全消除了查找,收集和准备数据的沉重且昂贵的负担,数据科学家和测试工程师目前在这种重复性任务上浪费了多达80%的宝贵时间,数据平台可帮助企业终解锁并化数据的真实价值。 


Prev article

数字化转型成功的11个迹象

Next article

公用事业如何使用分析来改善与客户的互动

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务