智能 | #2 人工智能的三种流派

 文 | HW君 

系列文章:


0. 三种流派

近来人工智能领域最流行的词汇当属「大模型」。

在「神经网络」一统江湖的当下,所谓大模型也不过是「非常大的神经网络模型」。

而人工智能一开始并非只有神经网络理论。

 

人工智能领域派系繁杂,各派之间也多有交叉关联。

依据核心思想,我们可以粗略地将其分为3种流派:

符号主义连接主义自然主义

 

连接主义的神经网络理论并非一帆风顺,而是几经起起伏伏。

了解其发展史,对于人工智能才会有整体性的认识。

本篇我们先简单介绍这三种流派。

 

1. 符号主义与逻辑

符号主义又叫符号派、逻辑派。

这一派早已式微,但在人工智能发展的初期,却是占据着最主流的地位。

 

符号派认为智能来源于对符号的操作,机器通过基于逻辑规则的知识表达来模拟人类的思维。

这是最符合直觉的,因为整个计算机科学的发展,就是运用符号和逻辑不断去解决一个又一个的问题。

 

符号派注重算法的可解释性,用明确的规则和逻辑推理解决问题,中间不存在无法理解的黑盒。

而这也是它的局限性,存在着知识获取瓶颈。

因为符号派的人工智能模型,其「智能」来源于人为一条一条地编码规则和知识。

 

1977年IBM的下棋程序「深蓝」战胜了国际象棋的世界冠军,可以说是符号派的巅峰。

深蓝依靠明确的规则和逻辑推理,将大量的棋局规则和策略手动嵌入到程序中,实时搜索评估棋盘上可能的走法,以达成最佳下棋策略。

 

但这是建立在国际象棋比较简单的规则之上的,同样的策略没有办法应用在更复杂的围棋上。

国际象棋的棋盘是8×8,决策树复杂度约为10120

围棋的棋盘是19×19,决策树复杂度约为10360

 

依靠IBM当时最先进的超级计算机,深蓝可以在每秒计算出2亿步棋(2×108,并基于α-β剪枝算法优化部分决策分支,才能够勉强覆盖国际象棋的复杂度,赢得世界冠军。

但这在围棋中是不可能的,围棋的决策复杂度远远大于国际象棋,符号派无能为力。

后来谷歌搞出了神经网络派(连接主义)的AlphaGO,才在更复杂的围棋上战胜了人类。

 

如今符号派在人工智能领域已经衰落,但不代表它就消失不在了,而是被整合进其他理论派系中。

并且符号派也留下了非常多宝贵的遗产。

今天我们在互联网上常用的搜索引擎、数据库、维基百科……这些都可以看做是符号派的成果。

甚至可以说「面向对象编程」(Object-Oriented Programming, OOP)也是符号派的间接遗产,引导了整个软件工程的发展,是现代计算机技术的重要基石。

 

符号派的衰落只能说是在人工智能领域失去了主导权,但它并未在其他领域失败。

在神经网络派大热的今天,了解这一派的思想仍然是有必要的。

 

 

2. 连接主义与神经网络

连接主义又叫神经网络派、统计派。

符号派强调智能的可解释性,追求没有黑盒的理解。

而神经网络派放弃了可解释性,转而认为,如果能够造出一台机器模拟人脑中的神经网络,那么这台机器就有了智能。

 

神经网络的重要原理是通用近似定理(Universal Approximation Theorem)

即,三层以上的神经网络(前馈神经网络:输入层、隐藏层、输出层)可以拟合任意连续函数。

如果拟合效果不好,那么就继续增加神经网络的层数和规模。

 

当下非常热门的大模型,也不过是「非常大的神经网络模型」。

要达成「大」,需要解决多的工程问题,但其底层的思想仍然是连接主义的神经网络。

而神经网络是没有解释性的,是不可解释的黑盒。

我们只知道智能在足够大的神经网络中「涌现」出来。

 

ChatGPT到底怎么学会聊天?我们不知道。

但我们可以把此类聊天机器人当作一个函数,我们对它输入一个(文本),它会输出另一个(文本)

根据通用近似定理,三层以上的神经网络可以拟合任意连续函数。

那么,我们就构建一个足够大的神经网络,然后用足够多的数据去训练这个神经网络,那它就可以拟合为我们期望的「聊天机器人」函数。

于是,聊天机器人就诞生了。

 

而这个过程中,智能并不能被还原为一步一步的符号和逻辑。

对于符号派的深蓝,我们可以从它的程序中提取到国际象棋的棋局规则和下棋策略。

但对于神经网络派的AlphaGo,我们只能从它的程序里得到一堆密密麻麻看不懂的参数,这里没有下围棋的规则,但它就是会下围棋。

 

神经网络派的发展并非一帆风顺,而是几经起伏,直到今天才一统江湖。

我们在《智能 | #1 在神经网络之前》中提到,麦卡洛克和皮茨在1943年开创了神经网络理论,而罗森布拉特在1958年最早实践了神经网络理论研发出了感知机。

1969年明斯基(Minsky)和佩珀特(Papert)在《感知机:计算几何学》(Perceptrons: An Introduction to Computational Geometry)中证明了单层神经网络不能解决XOR(异或)问题,表明了感知机的局限。

这导致整个1970年代神经网络理论也停滞不前。

 

一直到1980年代的多层神经网络和和后向传播算法的提出,神经网络理论才重新被讨论了起来,可以算是人工智能的第一波浪潮。

但随着人工智能领域的过度炒作,实际成果无法匹配资本市场的期望,政府和企业削减了研究投资,整个1990年代人工智能的发展是停滞的。

然而整个1990年代却是互联网爆发式发展的年代,互联网的发展推动了计算机硬件性能的提高,并提供了大量的数据,为后来的人工智能发展铺平了道路。

以辛顿(Hinton)在2006年在《科学》上发表深度学习相关文章为开始,一直到今天的ChatGPT,我们尚处于人工智能的第二波浪潮。

而浪潮的中心,便是神经网络。

 

 

3. 自然主义与强化学习

自然主义又叫进化派、行为派。

很多地方会称为行为主义(behaviorism),但行为主义在很多学科中都有特殊的含义,会造成混淆,因此我们更倾向于称为自然主义。

 

自然主义的源头思想可以追溯到达尔文进化论的「优胜劣汰」。

实际上人工智能研究里,从生物学里寻找计算的模型,大致可以分为两条传承的脉络:

一条来源于麦克洛克和皮茨的神经网络,到今天演化出深度学习(Deep Learning)

另一条来源于冯诺依曼的细胞自动机,历经遗传算法遗传编程,到今天演化为强化学习(Reinforcement Learning)

 

与深度学习在一堆静态的数据中提取模式不同,强化学习则在环境中试错、探索,不断进化最终使其行为适应环境。

但深度学习和强化学习并非是对立的,而是其顶层哲学思想有所不同,深度学习模拟生物神经网络,而强化学习模拟生物进化。

在实际应用中两者常常可以互相结合。

 

例如谷歌的AlphaGo就同时用到了深度学习和强化学习。

深度学习让AlphaGo学习大量的人类围棋对局数据,训练其神经网络。

强化学习则让AlphaGo自己与自己下棋,从而进化出一个更强大的神经网络。

这两者结合之后,才让其能够在围棋上战胜人类。

 

如今在复杂、不确定的场景下,强化学习是不可或缺的一派,例如自动驾驶就综合了深度学习和强化学习,以适应各种未知环境。

 

4. 顶层哲学思想

如今人工智能学科已经百花齐放,各种理论不断涌现出来。

但如果能理解其顶层的哲学思想,那么就会发现其并未超过这3种基本的流派。

符号主义注重逻辑,连接主义模拟神经网络,自然主义模拟进化行为。

 

技术细节固然重要,但迷失在技术细节之中而无法窥见人工智能的全貌,反过来也会阻碍对技术的理解。

本系列梳理人工智能的哲学原理,也是为了更好地去理解人工智能的技术细节。

(本章节完,敬请期待下一节)

By HW君 @ 2024-11-20

guest
0 评论
内联反馈
查看所有评论