400 050 6600
数据分析师

手机号

验证码

30天自动登录
当前位置:首页 - Q&A问答

Q&AQ&A问答

新AI冬季背后的秘密:转移学习?

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-11-23

转移学习允许开发人员采用针对一个问题进行训练的模型
然后针对新问题进行再培训,从而重用所有先前的工作以提高新模型的精度,而无需花费大量数据或计算规模来生成新模型从头开始的模型。这使得缺乏这些资源的团队可以访问构建复杂模型的过程,要了解为什么如此迫切的需求,我们需要全面了解与构建模型相关的成本。

ML不是新的,而是新近可访问的
机器学习的迅速普及可能导致人们认为ML是新的,并非如此-30年来,企业一直在从ML驱动的见解中获取价值,什么是新的是,现在有更多的问题和机会,学习机可以解决,而且它越来越明显,早期采用ML可导致各部门的利润优势,对机器学习的兴趣激增已超出学术界。机器学习已渗透到数据驱动型企业的所有部分,因为两项关键的技术创新使其更易于被广泛的业务和角色使用:处理成本的大幅度降低和转移学习的兴起。

现在可以负担得起大规模处理
GPU和分布式计算资源的创新使机器学习和AI成为了价格可承受的领域,过去开始使用高性能或超级计算中心是必需的,如今数据科学家经常在其本地计算机,云节点甚至商用GPU硬件上执行初始工作,一旦硬件成本变得可管理,重点便转移到机器学习和人工智能的人工成本上,昂贵而繁琐的标签问题,要了解迁移学习为何如此革命性的发展,您首先需要了解以前的过程有多痛苦。

机器学习常见的用例是分类问题
您有一组数据和一组标签,并且想要将标签应用于数据,例如欺诈分析,垃圾邮件检测和对象识别,要训练模型在实践中识别这些连接,您需要大量的带标签数据,获取大量高质量的标签数据非常昂贵,并且需要领域专家提供有用的标签,为了了解标记数据集的成本,请考虑尝试在CT扫描中标记肿瘤,每种类型您都需要数千张图像,并且有资格标记这些图像的人员是受过专门训练的放射科医生,并且每小时可以完全注释4张图像,而我们需要大约10,000张图像。

转移学习是一项革命性的突破,它使得重用先前的工作并使机器学习模型民主化成为可能
在迁移学习中,开发人员采用经过预先训练的基本模型,以使用大量数据来区分常见功能,在您的特定数据集上重新训练该模型是一项重点工作,需要少得多的数据和计算资源,从而使缺乏可从头训练精确模型所需的大量资源的团队可以访问该过程,迁移学习如何减少建立模型的时间和成本,我想建立一个可以根据照片识别出可能的犬种的模型。首先,我必须建立一个模型,该模型可以识别边缘和物体,然后识别狗,然后识别各个犬种的特征。

迁移学习使机器学习民主化

因为它允许开发人员重用以前的工作,这意味着他们不必在每种情况下都重新发明众所周知的轮子,这降低了进入的门槛,允许更多的团队进行探索和实验,这将导致创新,我不必从头开始此过程,因为初的工作已经为我进行了众包,我能够采用已经在完整数据集上进行训练模型,转移学习和将标签和培训外包的民主化使我可以在几个小时内使用非常复杂的计算机视觉模型起步并运行,我产生的成本是运行几个云实例的成本。

客服热线:400-050-6600

商业联合会数据分析专业委员会




Prev article

大数据时代如何让AI发挥作用保护您的数据?

Next article

如何在数据驱动的企业中避免效率低下和增强信任度?

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务