什么是人工智能?你需要知道的关于人工智能的一切
什么是人工智能?你需要知道的关于人工智能的一切
人工智能执行指南,从机器学习和通用人工智能到神经网络。
作者: 尼克希思 | 2020 年 12 月 11 日 -- 格林威治标准时间 09:58(新加坡标准时间 17:58) | 主题:[在企业中管理 AI 和 ML
目录- 什么是人工智能?你需要知道的关于人工智能的一切
- 什么是人工智能(AI)?
- 人工智能有什么用途?
- 有哪些不同类型的人工智能?
- 狭义人工智能可以做什么?
- 通用人工智能能做什么?
- 人工智能发展的最新里程碑是什么?
- 什么是机器学习?
- 什么是神经网络?
- 什么是其他类型的人工智能?
- 是什么推动了人工智能的复兴?
- 机器学习的要素是什么?
- 哪些是人工智能领域的领先公司?
- 有哪些人工智能服务可用?
- 哪家主要科技公司正在赢得人工智能竞赛?
- 哪些国家在人工智能领域处于领先地位?
- 如何开始使用 AI?
- AI将如何改变世界?
- AI会杀死我们所有人吗?
- 人工智能会抢走你的工作吗?
什么是人工智能(AI)?
这取决于你问谁。
早在 1950 年代,该领域的先驱 明斯基和麦卡锡将人工智能描述为由机器执行的任何任务,而这些任务以前被认为需要人类智能。
这显然是一个相当宽泛的定义,这就是为什么你有时会看到关于某物是否是真正的 AI 的争论。
创造智能意味着什么的现代定义更加具体。谷歌人工智能研究员、机器学习软件库 Keras 的创建者弗朗索瓦乔莱表示,智能与系统在新环境中适应和即兴发挥的能力、概括其知识并将其应用于不熟悉的场景的能力有关。
“智能是你在以前没有准备的任务中获得新技能的效率,”他说。
“智力不是技能本身,也不是你能做什么,而是你学习新事物的能力和效率。”
在这个定义下,现代人工智能驱动的系统,如虚拟助手,将被描述为展示了“狭义人工智能”;在执行一组有限的任务时概括训练的能力,例如语音识别或计算机视觉。
通常,人工智能系统至少表现出以下与人类智能相关的一些行为:计划、学习、推理、解决问题、知识表示、感知、运动和操纵,以及在较小程度上的社交智能和创造力。
人工智能有什么用途?
AI 在今天无处不在,用于推荐您接下来应该在线购买什么,了解您对虚拟助手(例如亚马逊的 Alexa 和 Apple 的 Siri)说的话,识别照片中的人物和内容,发现垃圾邮件或检测信用卡欺诈。
有哪些不同类型的人工智能?
在非常高的层面上,人工智能可以分为两大类:狭义人工智能和通用人工智能。
如上所述,狭义 AI 是我们今天在计算机中看到的一切:智能系统已经被教导或学会了如何执行特定任务,而无需明确编程如何去做。
这种类型的机器智能在 Apple iPhone 上的 Siri 虚拟助手的语音和语言识别、自动驾驶汽车的视觉识别系统或根据您的喜好推荐您可能喜欢的产品的推荐引擎中很明显。过去买的。与人类不同,这些系统只能学习或被教导如何完成定义的任务,这就是为什么它们被称为狭义人工智能。
狭义人工智能可以做什么?
狭义人工智能有大量新兴应用:解释来自无人机的视频源,对石油管道等基础设施进行目视检查,组织个人和企业日历,响应简单的客户服务查询,与其他智能系统协调以执行在合适的时间和地点预订酒店、帮助放射科医生发现X 射线中的潜在肿瘤、在线标记不当内容、根据物联网设备收集的数据检测电梯的磨损、从卫星生成世界的 3D 模型等任务图像,这个列表不胜枚举。
这些学习系统的新应用一直在涌现。显卡设计师Nvidia 最近公布了一个基于人工智能的系统 Maxine,它可以让人们进行高质量的视频通话,几乎不管他们的互联网连接速度如何。该系统通过不通过互联网传输完整的视频流,而是以一种旨在重现呼叫者面部表情和动作的方式为呼叫者的少量静态图像制作动画,从而将此类呼叫所需的带宽减少了 10 倍。实时且与视频无法区分。
然而,尽管这些系统具有未开发的潜力,但有时对该技术的雄心壮志超过了现实。一个典型的例子是自动驾驶汽车,它本身由计算机视觉等人工智能驱动的系统提供支持。电动汽车公司特斯拉落后于首席执行官埃隆·马斯克 (Elon Musk) 将汽车自动驾驶系统从系统更有限的辅助驾驶功能升级为“全自动驾驶”的原始时间表,而全自动驾驶选项最近才推出作为 Beta 测试计划一部分的精选专家驱动程序组。
通用人工智能能做什么?
通用人工智能非常不同,它是人类中发现的适应性智力类型,是一种灵活的智力形式,能够学习如何执行截然不同的任务,从理发到构建电子表格,或基于推理对各种主题进行推理其积累的经验。这是在电影中更常见的那种人工智能,比如 2001 年的 HAL 或终结者中的天网,但今天并不存在——人工智能专家们对于它多久会成为现实存在激烈的分歧。
人工智能研究人员文森特·C·穆勒 (Vincent C Müller) 和哲学家尼克·博斯特罗姆 (Nick Bostrom) 在 2012/13 年对四组专家进行的一项调查报告称,在 2040 年至 2050 年之间开发通用人工智能 (AGI) 的可能性为 50%,到 2075 年上升到 90%。小组更进一步,预测所谓的“超级智能”——博斯特罗姆将其定义为“在几乎所有感兴趣的领域都大大超过人类认知能力的任何智力”——预计在 AGI 实现大约 30 年后出现。
然而,人工智能专家最近的评估更加谨慎。现代人工智能研究领域的先驱,如 Geoffrey Hinton、Demis Hassabis 和 Yann LeCun 表示,社会离发展 AGI 还很远。鉴于现代人工智能领域领先者的怀疑以及现代狭义人工智能系统与 AGI 的截然不同的性质,担心社会将在不久的将来被通用人工智能扰乱可能没有什么根据。
也就是说,一些人工智能专家认为,鉴于我们对人类大脑的了解有限,这种预测是非常乐观的,并且认为 AGI 还有几个世纪的路程。
人工智能:如何构建商业案例
AI 可能是一个热门话题,但您仍然需要证明这些项目的合理性。
人工智能发展的最新里程碑是什么?
虽然现代狭义人工智能可能仅限于执行特定任务,但在其专业范围内,这些系统有时能够表现出超人的表现,在某些情况下甚至表现出卓越的创造力,这种特质通常被认为是人类的本能。
已经有太多的突破无法列出一个明确的清单,但一些亮点包括:2009 年,谷歌表明其自动驾驶丰田普锐斯有可能完成 10 多次 100 英里的旅程,使社会走上无人驾驶的道路车辆。
IBM Watson 与 Jeopardy 竞争!2011年1月14日图片:IBM
2011 年,IBM Watson计算机系统赢得美国智力竞赛节目 Jeopardy!,击败了该节目有史以来最好的两名球员。为了赢得这场演出,Watson 使用自然语言处理和分析对大量数据存储库进行了处理,以回答人工提出的问题,通常在几分之一秒内完成。
2012 年,另一项突破预示着 AI 有潜力处理许多以前认为对任何机器来说都过于复杂的新任务。那一年,AlexNet 系统在 ImageNet 大规模视觉识别挑战赛中果断获胜。AlexNet 的准确性如此之高,与图像识别竞赛中的竞争对手系统相比,它的错误率减少了一半。
AlexNet 的性能证明了基于神经网络的学习系统的强大功能,这种机器学习模型已经存在了几十年,但由于架构的改进和摩尔定律使并行处理能力的飞跃成为可能,它最终实现了其潜力。机器学习系统在执行计算机视觉方面的实力也在当年成为头条新闻,谷歌训练了一个系统来识别互联网上的最爱:猫的照片。
引起公众注意的机器学习系统功效的下一个展示是2016 年谷歌 DeepMind AlphaGo AI 战胜人类围棋大师,围棋是一种古老的中国游戏,其复杂性困扰了计算机数十年。围棋每回合大约有 200 步,而国际象棋大约有 20 步。在围棋过程中,有很多可能的走法,从计算的角度来看,提前搜索每个走法以确定最佳棋法成本太高。取而代之的是,AlphaGo 通过将人类专家在 3000 万场围棋游戏中的动作输入深度学习神经网络来训练如何下棋。
训练这些深度学习网络可能需要很长时间,随着系统逐渐完善其模型以实现最佳结果,需要摄取和迭代大量数据。
然而,最近谷歌使用 AlphaGo Zero 改进了训练过程,该系统与自己玩“完全随机”的游戏,然后从结果中学习。谷歌 DeepMind 首席执行官德米斯·哈萨比斯 (Demis Hassabis) 还推出了新版本的 AlphaGo Zero,它掌握了国际象棋和将棋游戏。
AI 继续冲刺突破新的里程碑: OpenAI 训练的系统在在线多人游戏 Dota 2 的一对一比赛中击败了世界顶级玩家。
同年,OpenAI 创建了 AI 代理,该代理发明了 自己的语言来更有效地合作并实现目标,随后 Facebook 培训代理进行谈判甚至撒谎。
2020 年是人工智能系统似乎获得了像人类一样写作和谈话的能力的一年,几乎可以讨论任何你能想到的话题。
有问题的系统,被称为 Generative Pre-trained Transformer 3 或简称 GPT-3,是一个神经网络,它训练了开放网络上数十亿篇英语文章。
在非营利组织 OpenAI 将其提供给测试使用后不久,互联网上就充斥着 GPT-3 能够生成几乎任何主题的文章的能力,这些文章乍一看往往难以理解。区别于人写的。在其他领域也取得了同样令人印象深刻的结果,它能够令人信服地回答有关广泛主题的问题,甚至可以通过 JavaScript 新手。
但是,尽管许多 GPT-3 生成的文章都具有真实性,但进一步的测试发现生成的句子通常没有通过审核,提供表面上看似合理但令人困惑的陈述,有时甚至是彻头彻尾的胡说八道。
使用模型的自然语言理解作为未来服务的基础仍然有相当大的兴趣,并且可以选择开发人员通过 OpenAI 的 beta API 构建到软件中。它还将被纳入未来通过微软 Azure 云平台提供的服务中。
人工智能潜力最显着的例子可能出现在 2020 年末,当时基于谷歌注意力的神经网络 AlphaFold 2 展示了一些人认为值得获得诺贝尔化学奖的结果。
该系统能够查看蛋白质的组成部分(称为氨基酸)并推导出该蛋白质的 3D 结构,这可能会对了解疾病和开发药物的速度产生深远的影响。在蛋白质结构预测的关键评估竞赛中,AlphaFold 2 能够确定蛋白质的 3D 结构,其准确度可与晶体学相媲美,这是令人信服地建模蛋白质的黄金标准。
与需要数月才能返回结果的晶体学不同,AlphaFold 2 可以在数小时内模拟蛋白质。由于蛋白质的 3D 结构在人类生物学和疾病中发挥着如此重要的作用,这种加速被认为是医学科学的里程碑式突破,更不用说在生物技术中使用酶的其他领域的潜在应用了。
什么是机器学习?
迄今为止提到的几乎所有成就都源于机器学习,这是人工智能的一个子集,占该领域近年来的绝大多数成就。当人们今天谈论人工智能时,他们通常谈论的是机器学习。
目前正在复兴,简单来说机器学习是计算机系统学习如何执行任务,而不是被编程如何执行。这种对机器学习的描述可以追溯到 1959 年,当时它是由该领域的先驱 Arthur Samuel 创造的,他开发了世界上第一个自学系统之一,即 Samuel Checkers-playing Program。
为了学习,这些系统需要输入大量数据,然后它们会使用这些数据来学习如何执行特定任务,例如理解语音或为照片添加字幕。该数据集的质量和大小对于构建能够准确执行其指定任务的系统很重要。例如,如果您正在构建一个机器学习系统来预测房价,则训练数据应不仅包括房产大小,还应包括其他重要因素,例如卧室数量或花园大小。
什么是神经网络?
机器学习成功的关键是神经网络。这些数学模型能够调整内部参数以改变它们的输出。在训练期间,神经网络会收到数据集,这些数据集会教它在呈现某些数据时应该吐出什么。具体来说,网络可能会收到 0 到 9 之间数字的灰度图像,以及一串二进制数字——0 和 1——指示每个灰度图像中显示的数字。然后对网络进行训练,调整其内部参数,直到它以高精度对每个图像中显示的数字进行分类。然后,这个经过训练的神经网络可用于对 0 到 9 之间数字的其他灰度图像进行分类。
神经网络的结构和功能非常松散地基于大脑中神经元之间的连接。神经网络由相互连接的算法层组成,这些算法层相互馈送数据,并且可以通过修改数据在这些层之间传递时的重要性来对其进行训练以执行特定任务。在这些神经网络的训练过程中,当数据在层之间传递时附加到数据上的权重将继续变化,直到神经网络的输出非常接近所需的值,此时网络将“学习”如何携带出一个特定的任务。所需的输出可以是任何东西,从正确标记图像中的水果到根据传感器数据预测电梯何时可能发生故障。
机器学习的一个子集是深度学习,其中神经网络被扩展为具有大量使用大量数据训练的相当大的层的庞大网络。正是这些深度神经网络推动了当前计算机执行语音识别和计算机视觉等任务的能力的飞跃。
有各种类型的神经网络,具有不同的优点和缺点。循环神经网络 (RNN) 是一种特别适用于自然语言处理 (NLP)(理解文本的含义)和语音识别的神经网络,而卷积神经网络的根源在于图像识别,其用途多种多样推荐系统和 NLP。神经网络的设计也在不断发展,研究人员改进了一种更有效的深度神经网络形式,称为长期短期记忆或 LSTM——一种用于 NLP 等任务和股票市场预测的 RNN 架构——使其能够运行足够快,可以在谷歌翻译等按需系统中使用。
深度神经网络的结构和训练。图片:细微差别
什么是其他类型的人工智能?
AI 研究的另一个领域是进化计算,它借鉴了达尔文的自然选择理论,并看到遗传算法在世代之间经历随机突变和组合,以试图进化出给定问题的最佳解决方案。
这种方法甚至被用于帮助设计 AI 模型,有效地使用 AI 来帮助构建 AI。这种使用进化算法来优化神经网络的方法被称为神经进化,随着智能系统的使用变得越来越普遍,尤其是在对数据科学家的需求往往超过供应的情况下,它可能在帮助设计高效人工智能方面发挥重要作用。Uber AI Labs展示了这项技术,该实验室发布了关于使用遗传算法训练深度神经网络以解决强化学习问题的论文。
最后,还有专家系统,其中计算机被编程规则,允许它们根据大量输入做出一系列决策,从而允许该机器在特定领域模仿人类专家的行为。例如,这些基于知识的系统的一个例子可能是驾驶飞机的自动驾驶系统。
是什么推动了人工智能的复兴?
如上所述,近年来人工智能研究的最大突破是在机器学习领域,尤其是在深度学习领域。
这在一定程度上是由于数据易于获得,但更重要的是并行计算能力的爆炸式增长,在此期间,使用图形处理单元 (GPU) 集群来训练机器学习系统变得更加普遍。
这些集群不仅为训练机器学习模型提供了更强大的系统,而且它们现在作为云服务在互联网上广泛可用。随着时间的推移,谷歌、微软和特斯拉等主要科技公司已经转向使用专门为运行和最近训练机器学习模型量身定制的芯片。
这些定制芯片之一的一个例子是谷歌的张量处理单元 (TPU),其最新版本加快了使用谷歌 TensorFlow 软件库构建的有用机器学习模型从数据中推断信息的速度,以及他们可以接受培训。
这些芯片不仅用于训练 DeepMind 和 Google Brain 的模型,还用于支持 Google Translate 和 Google Photos 中的图像识别的模型,以及允许公众使用Google 的 TensorFlow Research构建机器学习模型的服务云。第三代芯片于 2018 年 5 月在谷歌的 I/O 大会上亮相,此后被打包成机器学习引擎,称为 pods,每秒可执行超过十万万亿次浮点运算(100 petaflops) . 这些正在进行的 TPU 升级使谷歌能够改进其建立在机器学习模型之上的服务,例如将训练谷歌翻译中使用的模型所需的时间减半。
机器学习的要素是什么?
如前所述,机器学习是人工智能的一个子集,通常分为两大类:监督学习和无监督学习。
监督学习
教授 AI 系统的常用技术是使用大量标记示例对其进行训练。这些机器学习系统接受了大量数据,这些数据已经过注释以突出显示感兴趣的特征。这些可能是贴有标签的照片,以表明它们是否包含狗或带有脚注的书面句子,以表明“低音”一词与音乐或鱼有关。一旦经过训练,系统就可以将这些标签应用于新数据,例如应用于刚刚上传的照片中的狗。
这种通过示例教授机器的过程称为监督学习,标记这些示例的角色通常由在线工作人员执行,通过 Amazon Mechanical Turk 等平台雇用。
训练这些系统通常需要大量数据,有些系统需要搜索数百万个样本才能学习如何有效地执行任务——尽管在大数据和广泛的数据挖掘时代,这越来越有可能。训练数据集庞大且规模不断扩大 ——Google 的 Open Images Dataset 拥有大约 900 万张图像,而其标记视频存储库 YouTube-8M链接到 700 万个标记视频。 ImageNet是此类早期数据库之一,拥有超过 1400 万张分类图像。经过两年多的编译,它由近 50,000 人(其中大部分是通过 Amazon Mechanical Turk 招募的)组装在一起,他们检查、分类和标记了近 10 亿张候选图片。
从长远来看,访问大量标记数据集也可能不如访问大量计算能力重要。
近年来,生成对抗网络 ( GAN ) 已被用于机器学习系统中,该系统只需要少量标记数据和大量未标记数据,顾名思义,这需要较少的人工准备工作。
这种方法可以允许更多地使用半监督学习,与当今使用监督学习的训练系统相比,系统可以使用更少的标记数据来学习如何执行任务。
无监督学习
相比之下,无监督学习使用不同的方法,其中算法尝试识别数据中的模式,寻找可用于对数据进行分类的相似性。
一个例子可能是将重量相似的水果或具有相似发动机尺寸的汽车聚集在一起。
该算法不是预先设置来挑选特定类型的数据,它只是寻找可以按其相似性分组的数据,例如 Google 新闻每天将类似主题的故事分组在一起。
强化学习
强化学习的一个粗略类比是在宠物表演技巧时奖励它。在强化学习中,系统试图根据其输入数据最大化奖励,基本上会经历一个反复试验的过程,直到达到可能的最佳结果。
强化学习的一个例子是 Google DeepMind 的 Deep Q-network,它已被用于在各种经典视频游戏中实现最佳人类表现。该系统从每个游戏中获取像素并确定各种信息,例如屏幕上对象之间的距离。
通过查看每场比赛的得分,系统建立了一个模型,说明在不同情况下哪些动作将使得分最大化,例如,在视频游戏 Breakout 的情况下,应该将球拍移到那里以拦截球。
该方法还用于机器人研究,其中强化学习可以帮助教授自主机器人在现实世界环境中的最佳行为方式。
许多与 AI 相关的技术正在接近或已经达到 Gartner 炒作周期中的“期望过高的峰值”,而由强烈反对驱动的“幻灭低谷”正在等待中。图片:Gartner / 注释:ZDNet
哪些是人工智能领域的领先公司?
Google 的 DeepMind 和 NHS:一瞥人工智能对未来医疗保健的意义
谷歌子公司与英国医疗服务机构达成了一系列交易——那么到底发生了什么?
随着人工智能在现代软件和服务中发挥越来越重要的作用,各大科技公司都在努力开发强大的机器学习技术供内部使用,并通过云服务向公众销售。
每个人都经常成为人工智能研究新领域的头条新闻,尽管谷歌的 DeepMind 人工智能 AlphaFold 和 AlphaGo 系统可能对公众的人工智能意识产生了最大的影响。
有哪些人工智能服务可用?
所有主要的云平台——亚马逊网络服务、微软 Azure 和谷歌云平台——都提供了对 GPU 阵列的访问,用于训练和运行机器学习模型,谷歌还准备让用户使用其张量处理单元 ——其设计的定制芯片针对训练和运行机器学习模型进行了优化。
所有必要的相关基础设施和服务都可以从三大巨头中获得,基于云的数据存储,能够保存训练机器学习模型所需的大量数据,转换数据以准备分析的服务,可视化工具清晰地显示结果,以及简化模型构建的软件。
这些云平台甚至简化了自定义机器学习模型的创建,谷歌提供了一项服务,可以自动创建 AI 模型,称为 Cloud AutoML。这种拖放式服务可构建自定义图像识别模型,并且要求用户没有机器学习专业知识。
基于云的机器学习服务在不断发展。亚马逊现在提供了一系列旨在简化机器学习模型训练过程的 AWS 产品,并且最近推出了 Amazon SageMaker Clarify,这是一种帮助组织消除训练数据中可能导致训练模型出现偏差预测的偏见和不平衡的工具.
对于那些不想构建自己的机器学习模型,而是想使用 AI 驱动的按需服务(例如语音、视觉和语言识别)的公司,Microsoft Azure 在以下方面的服务范围内脱颖而出提供,紧随其后的是 Google Cloud Platform,然后是 AWS。与此同时,IBM 与其更通用的按需产品一起,还试图销售针对从医疗保健到零售的各个领域的特定行业人工智能服务,将这些产品组合在IBM Watson 保护伞下,并已投资 20 亿美元收购 The Weather Channel解锁大量数据以增强其人工智能服务。
哪家主要科技公司正在赢得人工智能竞赛?
在内部,每一家科技巨头——以及 Facebook 等其他巨头——都使用人工智能来帮助推动无数的公共服务:提供搜索结果、提供推荐、识别照片中的人和事物、按需翻译、发现垃圾邮件——名单非常广泛。
但这场人工智能战争最明显的表现之一是虚拟助手的兴起,例如苹果的 Siri、亚马逊的 Alexa、谷歌助手和微软的 Cortana。
Amazon Echo Plus 是一款智能扬声器,可以访问内置的亚马逊 Alexa 虚拟助手。图片:Jason Cipriani/ZDNet
严重依赖语音识别和自然语言处理,以及需要庞大的语料库来回答查询,大量的技术用于开发这些助手。
但是,虽然苹果的 Siri 可能首先脱颖而出,但谷歌和亚马逊的助手已经在人工智能领域超越了苹果——谷歌助手能够回答广泛的查询,亚马逊的 Alexa 拥有大量“技能”第三方开发人员创建以增加其功能。
随着时间的推移,这些助理正在获得能力,使他们的反应更快,能够更好地处理人们在常规对话中提出的问题类型。例如,谷歌助手现在提供了一项名为“持续对话”的功能,用户可以在其中询问他们最初查询的后续问题,例如“今天天气怎么样?”,然后是“明天怎么样?” 并且系统理解后续问题也与天气有关。
这些助手和相关服务还可以处理的不仅仅是语音,最新版本的 Google Lens 能够翻译图像中的文本,并允许您使用照片搜索衣服或家具。
尽管内置于 Windows 10 中,但 Cortana 最近经历了一段特别艰难的时期,亚马逊的 Alexa 现在可以在 Windows 10 PC 上免费使用,而微软则 改造了 Cortana 在操作系统中的角色, 以更多地关注生产力任务,例如管理用户的日程安排,而不是其他助手中更多以消费者为中心的功能,例如播放音乐。
哪些国家在人工智能领域处于领先地位?
认为美国科技巨头将人工智能领域缝合起来是一个很大的错误。中国公司阿里巴巴、百度和联想正在从电子商务到自动驾驶等领域大力投资人工智能。作为一个国家,中国正在推行三步走计划,将人工智能转变为国家的核心产业,到2020 年底,该产业的 价值将达到 1500 亿元人民币(220 亿美元), 目标是成为世界领先的人工智能强国。到 2030 年。
百度已投资开发自动驾驶汽车,由其深度学习算法百度 AutoBrain 提供支持,经过几年的测试,其 Apollo 自动驾驶汽车已 在测试中行驶超过 300 万英里,并搭载在全球 27 个城市运送超过 100,000 名乘客。
百度今年在北京推出了一支由 40 辆 Apollo Go Robotaxis 组成的车队,该公司创始人预测,自动驾驶汽车将在五年内在中国城市普及。
百度的自动驾驶汽车,改装的宝马3系。图片:百度
百度、阿里巴巴和腾讯等大公司薄弱的隐私法、巨额投资、协同数据收集和大数据分析的结合,意味着一些分析人士认为,在未来的人工智能研究方面,中国将比美国更具优势一位分析师将中国领先美国的可能性描述为 500 比 1 对中国有利。
如何开始使用 AI?
虽然你可以为你的 PC 购买一个中等强大的 Nvidia GPU——在 Nvidia GeForce RTX 2060 或更快的某个地方——并开始训练机器学习模型,但最简单的人工智能相关服务试验方法可能是通过云。
所有主要的科技公司都提供各种 AI 服务,从构建和训练您自己的机器学习模型的基础设施到允许您按需访问 AI 驱动的工具(例如语音、语言、视觉和情感识别)的网络服务.
AI将如何改变世界?
机器人和无人驾驶汽车
机器人能够自主行动并理解和导航周围世界的愿望意味着机器人和人工智能之间存在自然重叠。虽然人工智能只是机器人技术中使用的技术之一,但人工智能的使用正在帮助机器人进入新领域,如自动驾驶汽车、送货机器人,以及帮助机器人学习新技能。2020 年初,通用汽车和本田推出了电动无人驾驶汽车Cruise Origin,谷歌母公司 Alphabet 旗下的自动驾驶集团 Waymo 最近在亚利桑那州凤凰城向公众开放了机器人出租车服务,提供了服务覆盖城市50平方英里的区域。
假新闻
我们即将拥有可以创建逼真图像或以完美音调复制某人声音的神经网络。随之而来的是具有巨大破坏性的社会变革的潜力,例如不再能够相信视频或音频片段是真实的。人们也开始担心这些技术将如何被用来盗用人们的形象,已经创建了一些工具来 令人信服地将名人面孔拼接到XX电影中。
语音和语言识别
机器学习系统帮助计算机识别人们在说什么,准确率接近 95%。微软的人工智能和研究小组还报告说,它已经开发出一种系统,能够像人工转录员一样准确地转录口语英语。
随着研究人员追求 99% 准确率的目标,预计与计算机对话与更传统的人机交互形式一起变得越来越普遍。
与此同时,OpenAI 的语言预测模型 GPT-3 最近引起了轰动,因为它能够创建可以被视为由人类编写的文章。
人脸识别和监控
近年来,人脸识别系统的准确率有了飞跃,中国科技巨头百度表示,只要视频中的人脸足够清晰,它就能以 99% 的准确率匹配人脸。虽然西方国家的警察部队一般只在大型活动中试用面部识别系统,但在中国,当局正在开展一项全国性计划,将全国的闭路电视与面部识别系统连接起来,并使用人工智能系统跟踪嫌疑人和可疑行为,以及已经还扩大警察使用的面部识别眼镜。
尽管世界各地的隐私法规各不相同,但这种对人工智能技术(包括可以识别情绪的人工智能)的更具侵入性的使用可能会逐渐变得更加普遍,尽管对面部识别系统公平性的强烈反对和质疑已经导致亚马逊, IBM 和 Microsoft 暂停或停止向执法部门出售这些系统。
卫生保健
人工智能最终可能对医疗保健产生巨大影响,帮助放射科医生从 X 射线中挑选出肿瘤,帮助研究人员发现与疾病相关的基因序列并识别可能导致更有效药物的分子。谷歌的 AlphaFold 2 机器学习系统最近取得的突破有望将开发新药的关键步骤所需的时间从几个月缩短到几小时。
世界各地的医院都在试验人工智能相关技术。其中包括 IBM 的 Watson 临床决策支持工具,该工具由纪念斯隆凯特琳癌症中心的肿瘤学家进行培训,以及英国国家卫生服务中心对 Google DeepMind 系统的使用,它将帮助发现眼睛异常并简化筛查患者的过程头颈癌。
强化歧视和偏见
一个日益令人担忧的问题是机器学习系统如何将其训练数据中反映的人类偏见和社会不平等编入法典。多个例子证实了这些担忧,这些例子表明,用于训练此类系统的数据缺乏多样性会对现实世界产生负面影响。
2018 年,麻省理工学院和微软的一份研究论文发现,主要科技公司销售的面部识别系统在识别肤色较深的人时出现错误率明显更高的问题,这一问题归因于训练数据集主要由白人组成。
一年后的另一项研究强调,亚马逊的 Rekognition 面部识别系统在识别肤色较深个体的性别时存在问题,亚马逊高管对这一指控提出质疑,促使其中一名研究人员解决亚马逊反驳中提出的观点。
自从这些研究发表以来,许多大型科技公司至少暂时停止了向警察部门销售面部识别系统。
另一个训练数据偏差不足的例子在 2018 年成为头条新闻,当时亚马逊取消了一种机器学习招聘工具,该工具将男性申请人视为首选。今天,正在研究如何抵消自学系统中的偏见。
人工智能与全球变暖
随着机器学习模型的规模和用于训练它们的数据集的增长,塑造和运行这些模型的庞大计算集群的碳足迹也在增加。为这些计算农场供电和冷却对环境的影响是世界经济论坛 2018 年一篇论文的主题。2019 年的一项估计是,机器学习系统所需的功率每 3.4 个月翻一番。
最近,语言预测模型 GPT-3 的发布使训练强大的机器学习模型所需的大量能量成为焦点,这是一个拥有约 1750 亿个参数的庞大神经网络。
虽然训练这些模型所需的资源可能是巨大的,而且主要只有大公司才能使用,但一旦训练好,运行这些模型所需的能量就会大大减少。然而,随着基于这些模型的服务需求的增长,功耗和由此产生的环境影响再次成为一个问题。
一种论点是,需要权衡训练和运行更大模型对环境的影响与潜在的机器学习必须产生重大的积极影响,例如,在谷歌 DeepMind 的 AlphaFold 2 取得突破之后,医疗保健领域的进步可能会更快.
AI会杀死我们所有人吗?
同样,这取决于你问谁。随着人工智能驱动的系统变得越来越强大,对不利因素的警告也变得更加可怕。
特斯拉和 SpaceX首席执行官埃隆马斯克声称人工智能是“人类文明存在的根本风险”。作为他推动加强监管和更负责任的研究以减轻人工智能负面影响的一部分,他成立了 OpenAI,这是一家非营利性人工智能研究公司,旨在促进和开发有益于整个社会的友好人工智能。同样,受人尊敬的物理学家斯蒂芬霍金警告说,一旦创造出足够先进的人工智能,它将迅速发展到远远超过人类能力的程度,这种现象被称为奇点,并可能对人类构成生存威胁。
然而,对于一些人工智能研究人员来说,人类正处于人工智能爆炸的边缘,这将使我们的智力相形见绌的想法似乎很荒谬。
微软在英国剑桥的研究主管克里斯毕晓普强调,今天人工智能的狭隘智能与人类的一般智能有多么不同,他说,当人们担心“终结者和机器的崛起等等?胡说八道,是的。充其量,这种讨论还需要几十年的时间。”
人工智能会抢走你的工作吗?
人工智能系统取代大部分现代体力劳动的可能性在不久的将来可能是一种更可信的可能性。
ZDNet 和 TechRepublic 着眼于人工智能、大数据、云计算和自动化对 IT 工作的巨大影响,以及公司如何适应。
虽然人工智能不会取代所有工作,但似乎可以肯定的是,人工智能将改变工作的性质,唯一的问题是自动化将改变工作场所的速度和深度。
几乎没有人工智能无法影响人类努力的领域。正如人工智能专家 Andrew Ng 所说:“很多人都在做着例行的、重复性的工作。不幸的是,技术尤其擅长自动化例行性、重复性的工作”,并表示他认为“未来几十年技术失业的风险很大”。
哪些工作将被取代的证据开始出现。在美国,现在有 27 家Amazon Go商店,这些没有收银员的超市,顾客只需从货架上拿走商品就可以走出去。这对美国超过三百万的收银员意味着什么还有待观察。亚马逊再次在使用机器人提高仓库效率方面处于领先地位。这些机器人将货架上的产品运送给选择要发送的物品的人工拣货员。亚马逊在其履行中心拥有超过 200,000 个机器人,并计划增加更多。但亚马逊也强调,随着机器人数量的增加,这些仓库中的人工数量也在增加。然而,亚马逊和小型机器人公司正在努力使仓库中剩余的手工作业自动化,因此手工和机器人劳动力将继续携手并进并不是必然的。
亚马逊于 2012 年收购了 Kiva 机器人,如今在其整个仓库中使用 Kiva 机器人。图片:亚马逊
完全自主的自动驾驶汽车尚未成为现实,但根据一些预测,即使不考虑对快递员和出租车司机的影响,仅自动驾驶卡车运输行业就有望在未来十年内取代 170 万个工作岗位。
然而,一些最容易自动化的工作甚至不需要机器人技术。目前有数百万人从事管理工作,在系统之间输入和复制数据,为公司寻找和预约约会。随着软件在自动更新系统和标记重要信息方面变得更好,因此对管理员的需求将会下降。
与每一次技术变革一样,将创造新的工作岗位来取代失去的工作岗位。然而, 不确定的是这些新角色是否会以足够快的速度被创造出来,为那些流离失所的人提供就业机会,以及新失业者是否具备必要的技能或气质来填补这些新角色。
计算机视觉、语音、分析和移动机器人技术的进步有望影响与这些技能相关的任何工作。
不是每个人都是悲观主义者。对某些人来说, 人工智能是一种将增加而不是取代工人的技术。不仅如此,他们还认为,作为 AI 辅助的工作人员,商业上必须不完全取代人们——想想一个配备 AR 耳机的人类礼宾员,在他们提出要求之前就告诉他们客户想要什么——将会更多比独立工作的人工智能更有生产力或更有效。
在人工智能专家中,对于人工智能系统超越人类能力的速度有多快,存在广泛的意见。
牛津大学人类未来研究所请数百名机器学习专家预测 未来几十年的人工智能能力。
值得注意的日期包括人工智能撰写论文到 2026 年可能由人类撰写,到 2027 年卡车司机被裁员,到 2031 年人工智能在零售业超越人类能力,到 2049 年写出畅销书,到 2053 年完成外科医生的工作.
他们估计人工智能在 45 年内在所有任务上击败人类并在 120 年内自动化所有人类工作的可能性相对较高。