人工智能机器学习和深度学习
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-09-11
这是一个用于生成符号音乐的开源Python库
MusPy为音乐生成系统中的基本组件提供了易于使用的工具,包括数据集管理,数据I / O,数据预处理和模型评估。为了展示其潜力,MusPy当前支持的11个数据集的统计分析。此外,通过在每个数据集上训练自回归模型并在其他数据集上测量保持的可能性,可以进行跨数据集的可概括性实验-MusPy的数据集管理系统使此过程变得更加容易。结果提供了各种常用数据集之间的域重叠图,并显示某些数据集比其他数据集包含更具代表性的跨类型样本。随着数据集分析,这些结果可作为将来研究中选择数据集的指南。
现有的语义分割模型严重依赖于密集的逐像素注释
为了减轻注释的压力,本文重点研究了一项具有挑战性的任务,称为零镜头语义分割,该任务旨在用零注释分割看不见的对象。可以通过语义词嵌入跨类别传输知识来完成此任务。本文提出了一种新的用于零镜头分割的上下文感知特征生成方法,特别是在观察到像素级特征高度依赖于其上下文信息的情况下,该技术在分割网络中插入了一个上下文模块以捕获像素级上下文信息,从而指导了生成更多种和上下文感知的过程语义词嵌入的功能。该方法可在三个基准数据集上实现的结果,实现零散度分割。
随着在线零售服务的普及和在现代生活中的普及,从图像数据中对时尚服装特征进行分类的应用变得越来越不可或缺
从领先公司到初创公司的在线零售商都可以利用此类应用程序,以提高利润率并增强消费者体验,已经提出了许多著名的方案来对时尚物品进行分类,但是,大多数方案集中在对基本级别的类别进行分类,例如T恤,裤子,裙子,鞋子,包等。与大多数先前的努力相反,本文旨在对同一类别中的时尚商品属性进行深入分类。从单件礼服开始,目标是对礼服下摆的类型,下摆长度和袖子长度进行分类。拟议的方案包括三个主要阶段:使用语义分割从输入图像中定位目标项目,使用预训练和边界框检测人的关键点(例如,肩点),以及进行三个阶段分类使用算法方法和深度神经网络相结合的属性。实验结果表明,该方案是高效的,所有类别的平均精度均在93.02以上,并且优于现有的基于卷积神经网络的方案。
强化学习任务的可组合规范语言
强化学习是一种学习机器人任务控制策略的有前途的方法。然而,由于用户必须设计对整个任务进行编码的奖励功能,因此指定复杂的任务(例如,具有多个目标和安全约束)可能具有挑战性。此外,用户经常需要手动调整奖励以确保学习算法的收敛性。本文提出了一种用于指定复杂控制任务的语言,以及一种将我们语言中的规范编译为奖励函数并自动执行奖励整形的算法。
机器视觉中的许多结构化预测任务都有一组可接受的答案,而不是一个确定的基础事实答案
例如,图像的分割容易受到人类标签偏见的影响,类似地存在多个可能的像素值,可以合理地完成被遮挡的图像区域,通常对的监督学习方法进行优化,以对每个查询进行单个测试时间预测,从而无法在输出空间中找到其他模式。允许采样的现有方法通常会牺牲速度或准确性。本文介绍了一种用于训练神经网络的简单方法,该方法可以为每个测试时间查询做出各种结构化的预测。对于单个输入,我们将学习预测一系列可能的答案,与通过网络集成寻求多样性的方法相比,我们具有优势。这样的随机多选学习面模式崩溃,其中一个或多个集合成员无法接收任何训练信号。性能的解决方案可以部署到各种任务中,仅需对现有的单模体系结构,损失函数和训练方案进行少量修改,该方法在三个挑战性任务上实现了定量的改进:2D图像完成,3D体积估计和流量预测。和训练制度。该方法在三个挑战性任务上实现了定量的改进:2D图像完成,3D体积估计和流量预测。和训练制度,该方法在三个挑战性任务上实现了定量的改进:2D图像完成,3D体积估计和流量预测。
蒙面人脸识别以实现安全认证
随着近全球范围内COVID-19大流行,使用口罩已成为我们生活中的重要组成部分。鼓励人们在公共区域遮住脸孔,以免感染扩散。这些面罩的使用对用于跟踪学校/办公室出勤和解锁电话的面部识别系统的准确性提出了一个严重的问题。许多组织使用面部识别作为身份验证的手段,并且已经在内部开发了必要的数据集以能够部署这样的系统。不幸的是,被遮盖的面部难以检测和识别,从而威胁到内部数据集无效,并使此类面部识别系统无法操作,一种通过使用工具来扩展当前面部数据集的方法,该工具能够以较低的假阳性率和较高的总体准确性识别被遮盖的面部,而无需通过拍摄新图片进行身份验证来重新创建用户数据集,可以有效地遮盖脸部,从而创建大量的被遮盖脸部数据集。
具有周期性动量的周期性随机梯度下降以进行分散训练
近年来,积极研究了分散培训。尽管已经提出了各种各样的方法,但是分散动量SGD方法仍未得到充分研究。本文提出了一种新颖的周期性分散动量SGD方法,该方法利用动量图式和周期性通信进行分散训练。结合这两种策略以及分散式训练系统的拓扑,我们提出的方法的理论收敛性分析非常困难。该研究解决了这一具有挑战性的问题,并为我们提出的方法可以实现关于工人数量的线性加速提供了条件。
自适应无服务器学习
随着分布式数据的出现,以无服务器方式训练机器学习模型近年来引起了越来越多的关注。在这种情况下,已经提出了许多培训方法,例如分散的SGD。但是,所有现有的分散算法仅关注标准SGD。它可能不适用于某些应用程序,例如深度分解机器,在该应用程序中该功能非常稀疏和分类,因此需要自适应训练算法。本文提出了一种新颖的自适应分散训练方法,该方法可以动态地从数据中计算学习率。据研究人员所知,这是种自适应分散训练方法。理论结果表明,所提出的算法可以实现相对于工人人数的线性加速。
深造假的心如何跳动?通过解释带有生物信号的残留物进行的深层假源检测
伪造的肖像视频生成技术已经通过对政治宣传,名人模仿,伪造证据和其他与身份相关的操纵的逼真的深度伪造对社会构成了新的威胁。遵循这些生成技术,由于它们的高分类精度,一些检测方法也被证明是有用的。然而,几乎没有花费任何精力来追踪深层假货的来源。本文提出了一种方法,不仅可以将真实视频中的伪造品分离出来,而且还可以发现伪造品背后的特定生成模型。一些纯粹的基于深度学习的方法尝试使用CNN对深层伪造品进行分类,在其中它们实际学习生成器的残差。相信这些残渣包含更多信息,并且可以通过将它们与生物信号解开来揭示这些操纵伪像。关键的观察结果表明,生物信号中的时空模式可以被认为是残差的代表性投影。为了证明这一观察的正确性,从真实和伪造的视频中提取了PPG细胞,并将其馈入的分类网络,以检测每个视频的生成模型。