NEWS前沿动态

人工智能、机器学习和深度学习

来源：CPDA数据分析师网 / 作者：数据君 / 时间：2021-06-10

一种用于视觉的全 MLP 架构
卷积神经网络是计算机视觉的模型。近，基于注意力的网络，也变得流行起来，虽然卷积和注意力都足以获得良好的性能，但它们都不是必需的，一种完全基于多层感知器 (MLP) 的架构，包含两种类型的层，一种是将独立应用于图像块（即“混合”每个位置的特征），另一种是跨块应用（即“混合”空间信息）。当在大型数据集上或使用现代正则化方案进行训练时，在图像分类基准上获得有竞争力的分数，预训练和推理成本可与的模型相媲美。

扩散模型在图像合成方面击败 GAN
扩散模型可以实现优于当前的生成模型的图像样本质量，这是通过无条件图像合成通过一系列消融找到更好的架构来实现的，对于条件图像合成，我们通过分类器指导进一步提高了样本质量：一种简单、计算效率高的方法，用于使用分类器的梯度在多样性和保真度之间进行权衡。

使用应用程序衡量编码挑战能力
虽然编程是现代社会应用广泛的技能之一，但现代机器学习模型仍然无法编写基本问题的解决方案，尽管它很重要，但令人惊讶的是，在评估代码生成方面的工作很少，而且很难准确地严格评估代码生成性能，为了迎接这一挑战，一种代码生成的基准，与之前在更受限环境中的工作不同，该基准测试衡量模型采用任意自然语言规范并生成令人满意的 Python 代码的能力，类似于公司评估候选软件开发人员的方式，提议的解决方案然后通过检查他们在测试用例上生成的代码来评估模型，基准包括 10,000 个问题，范围从简单的单行解决方案到重大的算法挑战，大型语言模型在和特殊训练集上都进行了微调，并且发现随着模型的改进，语法错误的发生率呈指数级下降，近的模型如 GPT-Neo 可以通过大约 20% 的介绍性问题的测试用例，因此发现机器学习模型现在开始学习如何编码，可以找到与本文相关的代码所以发现机器学习模型现在开始学习如何编码，发现机器学习模型现在开始学习如何编码。

随机梯度下降的正则化效应
层神经网络中参数和输入数据的乘法结构，以建立损失函数相对于参数的格局与模型函数相对于输入数据的格局之间的联系，通过这种联系，表明平坦小值对模型函数的梯度进行了正则化，这解释了平坦小值具有良好的泛化性能，然后本文超越了平坦性，考虑了梯度噪声的高阶矩，并通过围绕全局小值的线性稳定性分析表明，随机梯度下降倾向于对这些矩施加约束，与乘法结构一起，根据输入数据对模型函数半范数进行正则化。为在数据分布假设下找到的解决方案提供了泛化误差和对抗性鲁棒性的界限。

将分层凝聚聚类扩展到十亿级数据集

分层凝聚聚类是古老但仍然使用广泛的聚类方法之一，然而众所周知很难扩展到大型数据集，因为底层的复杂性至少是数据点数量的二次方，而且许多解决的算法本质上都是顺序的，本文提出了互惠凝聚聚类，一种用于分布式算法，它使用一种新颖的策略来有效地并行合并集群，论文从理论上证明了恢复了精确解，此外在可集群性和平衡性假设下，由于并行性，它在总运行时间中显示出可证明的加速，它还表明，对于某些概率数据模型，这些加速是可以实现的。

Prev article

为什么云是医疗保健数字化转型的基石

返回列表

Next article

营销策略可以从基于人工智能的非结构化数据分析中受益