2020年让我们瞥见了多少AI开始渗透到日常生活中
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-01-08
AI生成的文本
也许2020年的轰动是OpenAI的GPT-3模型,GPT-3(生成式预训练变压器3)是一种能够理解和生成文本的AI,在此AI的能力令人印象深刻-早期用户已经哄着AI回答琐事问题,创建小说和诗歌,并生成批示简单的网页,也许令人印象深刻的是,人类无法区分GPT-3撰写的文章和人类撰写的文章,尽管GPT-3尚未达到技术上的独特性,但在未来几年中,这种模型和其他类似模型将被证明非常有用,公司和个人可以通过API请求访问模型输出当前处于私有Beta测试中,Microsoft现在拥有GPT-3的许可证,其他小组正在努力创造类似的结果,我希望我们很快会看到与理解语言的AI相关的新功能的激增。
蛋白质折叠
在自然语言处理之外,2020年在生物技术方面也取得了重要进展。从今年年初开始,我们得到了及时,及时的疫苗开发,全年临床试验证明这些方法非常有效,随着一年的临近,似乎又向前迈了一大步,这次是在蛋白质折叠领域,今年秋天版本在每两年一次的名为评估的蛋白质折叠预测竞赛中与其他方法竞争,在这场竞赛中,算法的任务是将氨基酸序列转换为蛋白质结构,并根据模型在一定范围内正确预测的氨基酸位置分数来进行判断。在挑战性的“自由建模”类别中,能够预测未见蛋白质的结构,中位值为88.1。本年度比赛中下一个接近的预测变量得分32.4。这是一个惊人的飞跃,展望未来,科学家可以使用这样的模型来加速他们对疾病和遗传学的研究,也许在2021年底,我们将庆祝像这样启用的技术。
深度学习民主化
如上所述,深度学习是许多的基本方法,事实证明,深度学习在生物学和自然语言这两个领域都非常有用。使深度学习更容易被领域专家和从业者使用的努力正在加速AI在许多领域的采用,现在任何具有Internet连接的人都可以生成逼真的但完全伪造的人脸照片,类似的技术已经被用于在虚假宣传活动中创建更现实的,更难发现的假社交媒体帐户,其中包括一些导致2020年美国大选的假媒体。而且OpenAI计划通过相对易于使用的API将GPT-3的功能提供给经过审查的用户,真正令人担忧的是,随着启用了深度学习的技术变得越来越容易获得,它也变得更易于武器化。
也可以利用AI与人类领域专家的配对
领域专家可以引导AI解决有影响力的可解决问题,并诊断AI何时存在偏见或得出错误的结论,AI提供了快速处理海量数据的能力(有时比人类具有更高的准确性),使分析变得更加便宜和快捷,并解锁了否则可能无法获得的见解,用户友好的工具,API和库促进了AI的采用,特别是在可以利用诸如图像分类之类的成熟技术的领域。
人工智能伦理
AI和ML系统变得更易于访问的有趣结果之一是AI伦理学领域优先级的变化,在2020年的AI伦理学领域脱颖而出的不是任何单一的成就或突破,而是在重新定向和将注意力集中在紧迫关注的主题上所做的大量工作,这些问题包括问题,从如何处理数据集中的种族和性别偏见到低薪工作所造成的不平等,这些工作都标记了用于训练算法的数据,由于与AI系统的交互作用日益增加,这些问题中的一些现在正面临着,但另一个驱动因素是一小组但专门的研究人员,通常来自更广泛的AI社区中代表性不足的小组,他们不仅发出了警报,关于这些道德问题的考虑,但也一直在推动该领域自身的多样性和代表性。
尽管到目前为止已经取得了所有进展,但仍存在艰巨的艰苦战斗
12月初,不仅因为试图发布有关培训大规模语言模型对Google业务至关重要的环境后果以及已经暴露的缺乏多样性问题的研究报告作为审查过程的结果,还因为此事件引发了有关学术研究界应如何与行业联系的问题,然而在这个迅速发展的领域中的成就为确定应该为谁使用人工智能以及为什么使用人工智能奠定了基础。
展望2021
在2020年初,一些研究人员对AI研究可能即将进入另一个冬季表示担忧,该冬季的进展停滞不前,兴趣和资金都枯竭了。虽然围绕深度学习的新颖性和兴奋性的确可能消失了,但值得一提的是有趣的是,2020年激动人心的两项突破是GPT-3和AlphaFold,它们都利用了现有的理论方法,但极大地推动了实际应用各自领域中的AI算法。展望未来,我们怀疑重点将转向使人们有可能从更少量的数据中学习,同时提高通用性和可解释性,这一切都是为了使AI模型更加实用。
随着民主化努力继续将AI功能推向新的领域
也许2020年的轰动是OpenAI的GPT-3模型,GPT-3(生成式预训练变压器3)是一种能够理解和生成文本的AI,在此AI的能力令人印象深刻-早期用户已经哄着AI回答琐事问题,创建小说和诗歌,并生成批示简单的网页,也许令人印象深刻的是,人类无法区分GPT-3撰写的文章和人类撰写的文章,尽管GPT-3尚未达到技术上的独特性,但在未来几年中,这种模型和其他类似模型将被证明非常有用,公司和个人可以通过API请求访问模型输出当前处于私有Beta测试中,Microsoft现在拥有GPT-3的许可证,其他小组正在努力创造类似的结果,我希望我们很快会看到与理解语言的AI相关的新功能的激增。
蛋白质折叠
在自然语言处理之外,2020年在生物技术方面也取得了重要进展。从今年年初开始,我们得到了及时,及时的疫苗开发,全年临床试验证明这些方法非常有效,随着一年的临近,似乎又向前迈了一大步,这次是在蛋白质折叠领域,今年秋天版本在每两年一次的名为评估的蛋白质折叠预测竞赛中与其他方法竞争,在这场竞赛中,算法的任务是将氨基酸序列转换为蛋白质结构,并根据模型在一定范围内正确预测的氨基酸位置分数来进行判断。在挑战性的“自由建模”类别中,能够预测未见蛋白质的结构,中位值为88.1。本年度比赛中下一个接近的预测变量得分32.4。这是一个惊人的飞跃,展望未来,科学家可以使用这样的模型来加速他们对疾病和遗传学的研究,也许在2021年底,我们将庆祝像这样启用的技术。
深度学习民主化
如上所述,深度学习是许多的基本方法,事实证明,深度学习在生物学和自然语言这两个领域都非常有用。使深度学习更容易被领域专家和从业者使用的努力正在加速AI在许多领域的采用,现在任何具有Internet连接的人都可以生成逼真的但完全伪造的人脸照片,类似的技术已经被用于在虚假宣传活动中创建更现实的,更难发现的假社交媒体帐户,其中包括一些导致2020年美国大选的假媒体。而且OpenAI计划通过相对易于使用的API将GPT-3的功能提供给经过审查的用户,真正令人担忧的是,随着启用了深度学习的技术变得越来越容易获得,它也变得更易于武器化。
也可以利用AI与人类领域专家的配对
领域专家可以引导AI解决有影响力的可解决问题,并诊断AI何时存在偏见或得出错误的结论,AI提供了快速处理海量数据的能力(有时比人类具有更高的准确性),使分析变得更加便宜和快捷,并解锁了否则可能无法获得的见解,用户友好的工具,API和库促进了AI的采用,特别是在可以利用诸如图像分类之类的成熟技术的领域。
人工智能伦理
AI和ML系统变得更易于访问的有趣结果之一是AI伦理学领域优先级的变化,在2020年的AI伦理学领域脱颖而出的不是任何单一的成就或突破,而是在重新定向和将注意力集中在紧迫关注的主题上所做的大量工作,这些问题包括问题,从如何处理数据集中的种族和性别偏见到低薪工作所造成的不平等,这些工作都标记了用于训练算法的数据,由于与AI系统的交互作用日益增加,这些问题中的一些现在正面临着,但另一个驱动因素是一小组但专门的研究人员,通常来自更广泛的AI社区中代表性不足的小组,他们不仅发出了警报,关于这些道德问题的考虑,但也一直在推动该领域自身的多样性和代表性。
尽管到目前为止已经取得了所有进展,但仍存在艰巨的艰苦战斗
12月初,不仅因为试图发布有关培训大规模语言模型对Google业务至关重要的环境后果以及已经暴露的缺乏多样性问题的研究报告作为审查过程的结果,还因为此事件引发了有关学术研究界应如何与行业联系的问题,然而在这个迅速发展的领域中的成就为确定应该为谁使用人工智能以及为什么使用人工智能奠定了基础。
展望2021
在2020年初,一些研究人员对AI研究可能即将进入另一个冬季表示担忧,该冬季的进展停滞不前,兴趣和资金都枯竭了。虽然围绕深度学习的新颖性和兴奋性的确可能消失了,但值得一提的是有趣的是,2020年激动人心的两项突破是GPT-3和AlphaFold,它们都利用了现有的理论方法,但极大地推动了实际应用各自领域中的AI算法。展望未来,我们怀疑重点将转向使人们有可能从更少量的数据中学习,同时提高通用性和可解释性,这一切都是为了使AI模型更加实用。
随着民主化努力继续将AI功能推向新的领域
人类领域的专家还将继续扮演重要的角色,即使有所不同,随着这些变化继续改变着AI部署的格局以及我们与此类系统交互的方法,我们还可能会继续关注具有实际社会影响的务实问题,并继续讨论AI的作用社会上,无论如何实际应用在耗尽可用的理论进展之前似乎都有很大的空间,与以往的几十年不同,人工智能在社会中的渗透以及可实现的实用解决方案的前景似乎有可能在可预见的未来维持人工智能的进步。