《摩天城市》中的人形机器人的场景。/ 图源:维基媒体共享资源
在 1949 年之前,计算机缺乏智能所需的关键前提条件。
作者:罗克威尔·安霍亚
研究生
霍克斯特拉实验室
霍华德·休斯医学研究所
哈佛大学
在 20 世纪上半叶,科幻作品让世界熟悉了人工智能机器人的概念。这始于《绿野仙踪》中的“无情”铁皮人,随后是《大都会》中模仿玛丽亚的人形机器人。到了 20 世纪 50 年代,我们这一代科学家、数学家和哲学家已经将人工智能(或 AI)的概念深深根植于心中。
其中一人便是年轻的英国通才阿兰·图灵,他探讨了人工智能的数学可能性。图灵提出,人类利用现有信息并运用推理来解决问题和做决策,那么机器为什么不能做到同样的事情呢?这就是他在 1950 年发表的《计算机器与智能》一文中的逻辑框架,在这篇文章中,他讨论了如何构建智能机器以及如何测试它们的智能。
艾伦·图灵,1936 年。/ 出处:普林斯顿大学,维基媒体共享资源
不幸的是,光说不练假把式。那么,是什么阻止图灵立即开始工作呢?首先,计算机需要从根本上进行改变。在 1949 年之前,计算机缺乏实现智能的关键前提条件:它们不能存储命令,只能执行命令。换句话说,计算机可以被告知做什么,但不能记住自己做过什么。其次,计算成本极其昂贵。
在 20 世纪 50 年代初,租用一台计算机的费用高达每月 20 万美元。只有声誉卓著的大学和大型科技公司才能负担得起在这些未知领域徘徊的费用。需要一个概念验证以及知名人士的倡导,才能说服资助方认为机器智能值得追求。
马文·明斯基、克劳德·香农、雷·索罗门诺夫以及其他参与达特茅斯夏季研究计划的人工智能——DSRPAI 的科学家们。(图片:玛格丽特·明斯基)。/ 公有领域
五年后,通过艾伦·纽厄尔、克利夫·肖和赫伯特·西蒙开发的“逻辑理论家”程序实现了概念验证。该程序旨在模仿人类的问题解决技能,并由研究与发展(RAND)公司资助。许多人认为这是第一个人工智能程序,并在 1956 年由约翰·麦卡锡和马文·明斯基举办的达特茅斯夏季研究项目(DSRPAI)上进行了展示。
在这一历史性的会议上,麦卡锡想象着一场伟大的协作努力,邀请了来自各个领域的顶尖研究人员进行关于人工智能的开放讨论,而“人工智能”这一术语正是在此次会议上由他首次提出的。遗憾的是,这次会议未能达到麦卡锡的期望;人们来去自由,未能就该领域的标准方法达成一致。尽管如此,与会者都全心全意地认同人工智能是可实现的。这场会议的重要性不容忽视,它催化了接下来二十年的人工智能研究。
与 Eliza 的对话。/ 图源:维基媒体公共资源
从 1957 年到 1974 年,人工智能迎来了繁荣时期。计算机可以存储更多的信息,并且变得更快、更便宜、更易于获取。机器学习算法也得到了改进,人们也更擅长选择合适的算法来解决他们的问题。早期的演示,如纽厄尔和西蒙的通用问题求解器以及约瑟夫·韦 izenbaum 的 ELIZA,分别展示了在问题求解和语音语言解释方面取得的进展。这些成功,加上顶尖研究人员(如 DSRPAI 的参会者)的倡导,促使国防高级研究计划局(DARPA)等政府机构资助多个机构的人工智能研究。政府特别感兴趣的是能够转录和翻译语音以及高通量数据处理的机器。人们对这一领域的乐观情绪很高,而期望值则更高。 1970 年,马文·明斯基在《生活》杂志上告诉人们:“从 3 到 8 年,我们将拥有具有普通人类智能的机器。”然而,尽管基本原理已经证明,但在实现自然语言处理、抽象思维和自我识别的目标上,仍然任重道远。
突破最初的人工智能迷雾,发现了一座障碍之山。最大的障碍是缺乏足够的计算能力来实现任何实质性进展:计算机根本无法存储足够的信息或快速处理这些信息。例如,为了进行交流,需要知道许多单词的意义,并理解它们的各种组合。麦卡锡的学生霍恩·莫拉维克当时曾表示,“计算机仍然比表现出智能的能力弱上数百万倍。”随着耐心的消逝,资金也随之减少,研究工作停滞了十年。
在 20 世纪 80 年代,人工智能因两个原因重新焕发了活力:算法工具包的扩展和资金的增加。约翰·霍普菲尔德和戴维·鲁梅哈特推广了“深度学习”技术,使计算机能够通过经验进行学习。另一方面,埃德温·费根鲍姆引入了专家系统,这种系统模仿了人类专家的决策过程。程序会询问某一领域的专家在特定情况下如何应对,一旦学会了几乎所有情况的应对方式,非专家就可以从该程序获得建议。专家系统在各行各业得到了广泛应用。日本政府作为其第五代计算机项目(FGCP)的一部分,大力资助了专家系统和其他人工智能相关项目。从 1982 年到 1990 年,他们投资了 4 亿美元,旨在革新计算机处理技术、实施逻辑编程和提高人工智能水平。不幸的是,大多数雄心勃勃的目标并未实现。然而,可以认为,FGCP 的间接影响激励了一代才华横溢的工程师和科学家。无论如何,FGCP 的资助停止了,人工智能再次淡出了公众视野。
讽刺的是,在缺乏政府资助和公众炒作的情况下,人工智能却蓬勃发展。在 20 世纪 90 年代和 21 世纪初,人工智能许多里程碑式的目标都已实现。1997 年, reigning 世界象棋冠军和国际象棋大师加里·卡斯帕罗夫被 IBM 的深蓝(Deep Blue)象棋程序击败。这场备受瞩目的比赛是国际象棋冠军首次输给计算机,标志着人工智能决策程序的一大进步。同年,Dragon Systems 开发的语音识别软件被应用于 Windows 系统,这是语音识别技术的一大进步,但方向是语音解释的努力。似乎没有什么问题是机器无法解决的。甚至人类情感也成为可能,例如 Cynthia Breazeal 开发的 Kismet 机器人能够识别和表达情感。
晶体管计数与微处理器推出日期的半对数图,几乎每两年翻一番(摩尔定律)。/ 资料来源:Our World in Data,维基媒体共享资源
我们并没有在如何编程人工智能方面变得更聪明,那么是什么变了呢?原来,30 年前阻碍我们的计算机存储基本限制已经不再是问题。摩尔定律预测计算机的内存和速度每一年都会翻一番,终于赶上了我们的需求,在很多情况下甚至超过了我们的需求。
这正是 1997 年深蓝能够击败加里·卡斯帕罗夫,以及几个月前谷歌的 Alpha Go 能够击败中国围棋冠军柯洁的原因。这在一定程度上解释了人工智能研究的起伏;我们将人工智能的能力饱和到当前计算能力(计算机存储和处理速度)的水平,然后等待摩尔定律再次赶上。
Kismet,一个 20 世纪 90 年代制作的机器人头部,能够识别和模拟情绪。/ 图片来源:麻省理工博物馆,维基媒体共享资源
我们现在生活在一个“大数据”的时代,这个时代我们有能力收集大量信息,这些信息对于个人来说处理起来过于繁琐。在这一领域,人工智能的应用已经取得了相当丰硕的成果,尤其是在科技、金融、营销和娱乐等行业。
即使算法没有显著改进,大量数据和强大的计算能力也让人工智能通过 brute force( brute force 指的是一种通过穷举所有可能的方法来解决问题的策略)的方式进行学习。虽然摩尔定律可能正在稍微放缓,但数据量的增长显然没有减缓。计算机科学、数学或神经科学的突破可能为摩尔定律的天花板提供新的出路。
Waymo 无人驾驶汽车在旧金山湾区进行测试。/ 图片来源:Dllu, Wikimedia Commons
那么未来会是怎样的呢?在近期的未来,人工智能语言看起来将是下一个大热门。事实上,这一趋势已经开始。我记不起上一次直接与真人交谈是什么时候了。如今,机器甚至会主动打电话给我!人们可以想象与专家系统进行流畅的对话,或者实时进行不同语言之间的翻译对话。我们也可以期待在未来的二十年内看到无人驾驶汽车上路(这是保守估计)。从长远来看,目标是通用人工智能,即在所有任务上超越人类认知能力的机器。
这就像我们在电影中常见的有意识的机器人。对我来说,我认为在接下来的 50 年内实现这一目标是不可想象的。即使具备了这种能力,伦理问题也会成为实现这一目标的强大障碍。当那一天到来时(甚至最好是在那一天到来之前),我们需要就机器政策和伦理(讽刺的是,这两者都是根本上的人类议题)进行严肃的讨论,但现在,我们还是让 AI 稳步改进并在社会中横行吧。