NLP趋势将在新的一年中得到改善
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-01-04
准确性:技术不断提高
近的NLP调查的受访者提到的挑战之一是准确性,实际上超过40%的受访者认为准确性是评估NLP库的重要标准,准确性对于医疗保健和金融等高度受监管的行业至关重要,即使是很小的误解也可能产生重大影响,那就是说新的学术研究正在帮助NLP技术的提供者挑战现状,从而使客户几乎可以立即将新的,高度精确的预训练模型应用于生产,近发布了新的命名实体识别和药品不良事件分类器,使用户可以更准确地检测和预防药物的有害反应。这些模型经过了临床嵌入软件的预训练,这是当今临床领域中功能强大的上下文语言模型,其性能超过了当前的解决方案,并且将不断改进。这样的增强功能不仅可以帮助节省医院和护理提供者大量的间接费用,而且可以保护患者的安全。和的部分?这可用于发现任何行业中的重要发现。
更多预培训的型号广泛可用
随着模型中心,云提供商和开源NLP库的出现,当涉及到数千种可预训练的模型可供使用时,数据科学家会无所适从,虽然NLP社区和资源如此成倍增长是一件很棒的事情,但是在为您的特定NLP项目选择正确的模型时,尤其是对于机器学习新手来说,变得有些模糊。为此,更好的分面搜索,精选的建议以及更明智的搜索结果排名正在实现。这一直是诸如模型中心的关注点,任何人都可以在其中上传模型,从而很难找到您想要的东西。
转向NLP库的许多工具为其发布的模型提供了支持
这意味着,当可以使用更好的算法,模型或嵌入时,将定期更新或替换每个NLP任务的模型和管道。为了进一步简化易用性,将运行历史上准确,复杂的深度学习模型简化为仅一行Python代码,而Auto NLP即将问世,这不仅有助于使刚开始使用NLP的人们民主化,而且使熟练的数据科学家更加轻松地快速找到所需信息并开始工作,这对所有人来说都是双赢。
更好地支持代表性不足的语言
NLP的功能与其所能理解的语言一样强大,直到近,这些语言还仅限于英语,普通话和其他几种语言,如果我们希望看到NLP的进一步采用和实施,至关重要的是要扩展当前的产品以适应全球使用的多种语言,值得庆幸的是,现在,多语言产品的发布速度几乎与技术准确性的提高一样快,诸如搜索引擎之类的云提供商已提供对数百种语言的支持,使NLP在全球范围内都可作为数据科学家使用,随着诸如语言不可知的句子嵌入,零镜头学习以及近多语言嵌入的公共可用性等实践,这已成为一种规范,正如前面提到的趋势所述,对NLP用户的更多使用使代码的访问和多种语言的可用性变得均匀,从而在需要的时候促进了多样性和技术融合的文化。
2020年对于NLP来说是令人振奋的一年
近的NLP调查的受访者提到的挑战之一是准确性,实际上超过40%的受访者认为准确性是评估NLP库的重要标准,准确性对于医疗保健和金融等高度受监管的行业至关重要,即使是很小的误解也可能产生重大影响,那就是说新的学术研究正在帮助NLP技术的提供者挑战现状,从而使客户几乎可以立即将新的,高度精确的预训练模型应用于生产,近发布了新的命名实体识别和药品不良事件分类器,使用户可以更准确地检测和预防药物的有害反应。这些模型经过了临床嵌入软件的预训练,这是当今临床领域中功能强大的上下文语言模型,其性能超过了当前的解决方案,并且将不断改进。这样的增强功能不仅可以帮助节省医院和护理提供者大量的间接费用,而且可以保护患者的安全。和的部分?这可用于发现任何行业中的重要发现。
更多预培训的型号广泛可用
随着模型中心,云提供商和开源NLP库的出现,当涉及到数千种可预训练的模型可供使用时,数据科学家会无所适从,虽然NLP社区和资源如此成倍增长是一件很棒的事情,但是在为您的特定NLP项目选择正确的模型时,尤其是对于机器学习新手来说,变得有些模糊。为此,更好的分面搜索,精选的建议以及更明智的搜索结果排名正在实现。这一直是诸如模型中心的关注点,任何人都可以在其中上传模型,从而很难找到您想要的东西。
转向NLP库的许多工具为其发布的模型提供了支持
这意味着,当可以使用更好的算法,模型或嵌入时,将定期更新或替换每个NLP任务的模型和管道。为了进一步简化易用性,将运行历史上准确,复杂的深度学习模型简化为仅一行Python代码,而Auto NLP即将问世,这不仅有助于使刚开始使用NLP的人们民主化,而且使熟练的数据科学家更加轻松地快速找到所需信息并开始工作,这对所有人来说都是双赢。
更好地支持代表性不足的语言
NLP的功能与其所能理解的语言一样强大,直到近,这些语言还仅限于英语,普通话和其他几种语言,如果我们希望看到NLP的进一步采用和实施,至关重要的是要扩展当前的产品以适应全球使用的多种语言,值得庆幸的是,现在,多语言产品的发布速度几乎与技术准确性的提高一样快,诸如搜索引擎之类的云提供商已提供对数百种语言的支持,使NLP在全球范围内都可作为数据科学家使用,随着诸如语言不可知的句子嵌入,零镜头学习以及近多语言嵌入的公共可用性等实践,这已成为一种规范,正如前面提到的趋势所述,对NLP用户的更多使用使代码的访问和多种语言的可用性变得均匀,从而在需要的时候促进了多样性和技术融合的文化。
2020年对于NLP来说是令人振奋的一年
很明显该技术的进步和增强,加上其更广泛的可用性和民主化,只会加速其应用。尽管该领域仍然存在挑战和痛苦,但NLP的潜力是巨大的,该行业对新功能的采用才刚刚起步。