文 | HW君
1. 模拟信息与数字信息
在谈论人类沟通之前,我们先介绍一下两个信息学概念。
在电路电子技术中,有一对很常见的概念「模拟电路」和「数字电路」。
模拟电路处理「模拟信息」(模拟信号),数字电路处理「数字信息」(数字信号)。
IT相关专业的朋友很容易理解它们之间的区别,而部分朋友不太清楚这些概念,这里我们先简要介绍。
「模拟信息」是指时间连续、幅值连续的信息。
「数字信息」是指时间离散、幅值离散的信息。
举个例子,我们人的体重是会随时间而发生变化的,变重或轻了。
如果用X轴表示时间,Y轴表示体重,那么我们可以得到类似下面这样的图:
这样的一条曲线,它在时间上是连续的,在幅值(体重)上也是连续的,是生活中真实存在的情况,我们称这样的曲线为「模拟信息」。
一条「模拟信息」曲线,它在时间上是连续的,可以分为无穷个点;在幅值上也是连续的,可以分为无穷个点。
就像一把尺子,虽然我们会把它分成好几个离散的1厘米,但实际上它在物理上是连续的,我们完全可以在尺子上找出例如1.5559厘米这样的没有标出来的位置。
而计算机的运算能力是有限的,内存容量也是有限的,没有办法记录下「模拟信息」的所有信息。
于是计算机对这些「模拟信息」曲线进行采样,采样后就得到了在时间上离散、在幅值上也离散的数据,这样的数据就是「数字信息」。
我们常说数字时代、数码产品,这里面的「数」,指的就是「数字信息」的概念。
如果我们每个月对体重的信息进行一次采样,也就是每月量一次体重,那么会得到下面这样的数据:
如上图所示,如果我们固定每个月测一次体重,那么会得到一组离散的「数字信息」数据,这组「数字信息」可以近似地反映出体重随时间发生的变化。
当然,如果我们改为每个星期测一次体重,那么我们就会得到一组离散点更加密集的数据,它能更精确地反映体重随时间发生的变化:
甚至我们可以改为一天测一次、一秒测一次……那么这组「数字信息」的离散点就会变得非常密集,最终无限趋近于「模拟信息」的连续曲线。
不过,虽然我们会把信息划分成模拟的和数字的,并且的确很好用。
但是在HW君看来,所谓的「数字信息」和「模拟信息」并没有本质上的区别,它们之间的差异主要是在「量级」上。
我们之所以会认为世界是连续不断的,那是因为我们的视角不够微观。
如果人类的视角足够微观,就会发现世界其实也是由离散的粒子构成的。
反过来也是,只要信息的精度足够高,那么我们根本分辨不出「数字信息」和「模拟信息」的差别。
我们认为上面「模拟信息」那张图中的体重曲线是一条连续的曲线,但实际上它是屏幕上一个个离散的像素点组成的。
现实生活中,计算机的计算能力和内存容量有限,我们人脑的思考能力有限和记忆力也有限,所以人们需要把现实中「连续不断」的「模拟信息」采样近似成「数字信息」,才能够对数据进行进一步处理。
2. 自然语言的基础概念
这一小节我们先介绍一下「自然语言」的概念。
所谓「自然语言」,也就是我们人类日常生活中使用的语言。
包括并不限于中文、英文、日文……它其实是相对于「机器语言」的一个概念。
形式上,「自然语言」可以有文字表达或者口语表达。
下面我们会提及一些关于「自然语言」的概念。
如果觉得理解上有困难,可以暂时搁置。
后面给出「人类沟通的信息学模型」的完整理论后,需要用到时再进行查找就行。
我们以文字表达为例。
假设屏幕上有一行文字(即一个语句)。
现在B君的眼睛看到了这个语句。
而B君的意识/自由意志/心灵/思想中存在着一个用来处理「自然语言」的语义网络。
当这个语句经由双眼进入B君的意识后,语句会形成一个语义片段。
语义片段会按照语法规则参与到语义网络中,解析出语句的意义。
于是B君增加了一些关于这段文字的知识(也可以称为其对于文字的感受)。
反过来的过程也是类似的。
A君的意识里出现了一个意图。
A君按照一定的语法规则,在语义网络中将这个意图转换为一个语义片段。
然后他将这个语义片段组织成具体的语句,输入了计算机中。
于是屏幕上多了一行文字。
然后接下来我们会表述一些关于「自然语言」的命题。
同样的,如果觉得难以理解可以先不理睬,后面需要用到的时候再进行查找就行。
关于「自然语言」的命题:
(1) 知识是(可能)影响个体行为的信息。
(2) 知识是中性的,这里不对知识进行涉及对错好坏的「价值判断」。
(3) 知识的意义在于它(可能)如何影响个体的行为。
(4) 知识分散存在于个体的意识中。
(5) 存在于意识之外的其他介质(例如书籍、计算机)中的信息不是知识。
(6) 个体借助「自然语言」这一工具在自身意识或他人意识中形成知识。
(7) 借助「自然语言」,个体意识中产生了一个语义网络。
(8) 语义是且仅是语句(符号)之间的关系。
(9) 语义不包含意义。
(10) 语句可以是存在于意识之外的其他介质(例如书籍、计算机)中的信息。
(11) 语句不包含意义。
(12) 语句按照语法规则纳入意识的语义网络而获得其语义结构,形成一个语义片段。
(13) 语义片段是语义网络中的子语义网络。
(14) 当意识中的语义片段影响行为时,意义出现。
(15) 该影响行为的语义片段即被称为知识。
3. 人类沟通的信息学模型
人类沟通的方式比较复杂。
上面第2节所说的「自然语言」只是人类沟通中的一部分。
具体来说,「自然语言」涉及的是人类沟通中的「数字信息」部分。
我们可以把人类意识中处理「自然语言」的语义网络当作一台「通用图灵机」,它处理的是「数字信息」。
为了便于直观地理解「人类沟通的信息学模型」,我们用下图来描述该模型:
人类沟通的信息学模型
上图描绘了A君和B君进行沟通时的信息流动。
这是个单向的沟通系统,其中A君表达(发送),B君读取(接收)。
图中部分图例的含义:
①. 蓝色部分 为语义网络。
②. 橙色部分 为意识(自由意志/思想/心灵),意识包含语义网络。
③. 灰色部分 为个体,个体包含意识。
④. 箭头 为信息流动方向,也指施加影响的方向。
我们可以把「意识A」作为评估的起点。
当然,个体的非意识部分是会对意识造成影响的,例如身体激素水平会影响一个人的情绪和思考方式。
所以我们在「意识A」之前加了一个箭头「a1」,表示「非意识影响意识」,也可以描述为「信息从非意识流向意识」。
比较符合大部分人直觉的信息流动路径是「a3」→「a5」→「a6」。
也就是个体头脑里的意识中出现了一个意图,这个意图会被组织成一个语句,然后身体表达出这个语句(例如说出一句话)。
这样就个体就完成了一次表达动作。
不过上述是简化版本,实际中「表达」这个动作会比上述简易版本要更加复杂一些。
3.1 表达动作
我们看A君的这个橙色圆框部分,这是A君的意识。
一开始,A君的意识产生了一个意图。
它应该是一个「模拟信号」(生物机体产生的都是模拟信号)。
这个意图是一个连续的想法/感觉/念头,总之一团模模糊糊非常感性的东西。
A君的意识之中有一个专门处理「自然语言」的语义网络。
这个意图会遵循语法规则,在意识的语义网络中生成一个语义片段。(a3)
而这个语义片段是一种「数字信息」,它不再是一团模模糊糊感性的意图,而是一个可以被清晰表述出来的语句。
这一种过程我们称其为「模数转换」,也就是将模拟信息转换为数字信息。
我们站在上帝视角,假设这个语句/语义片段/数字信息是「你好」。
但是「数字信息」并没有办法被直接表达出来。
「数字信息」是一种概念上的东西,而自然界的所有东西都是模拟的。
所以「数字信息」需要加载在「模拟信息」上才能被表达出来。
也就是我们要对「数字信号」进行「数模转换」。
就像一行文字,我没有办法将它的意义透过意念隔空传入到你的脑中。
我要么把它说成一句话(声音),要么把它写在纸上或者输入到屏幕里(光线)。
这些声音和光线被你听到或者看到后,这行文字才能传到你的脑海里然后被解读成为意义。
在通信工程上这叫做「数字调制」技术,也就是将数字信号转变为可以传输的电信号或者电磁波。
概念上的「数字信息」会被转变成物理上的「模拟信息」,对人体细胞产生影响,从而影响人体的行为。(a5)
但是意识除了生成一个「数字信息」语句「你好」之外,也会直接影响「影响人体行为」的「模拟信息」。(a4)
例如此时A君情绪变得变高昂、声音变高、双腿有点小颤抖……当然我们这是站在上帝视角来描述的,实际上A君只是隐约感觉自己发生了变化,但这种变化并没有用语言表达出来。
而还有一些身体行为的变化,是A君根本就没有察觉到的,例如A君无论什么情况下都有一个时不时踮脚尖的动作,这个跟他此刻的意图没有关系,他自己也根本就没有意识到这一点。(a2)
于是a2、a4、a5产生的信息,综合起来对个体的细胞产生一个整体的影响,从宏观上来看就是「个体执行了一个动作」。
这个动作表现为A君张开口腔,肌肉收缩,声带进行特定频率的振动。
于是A君完成了一个表达动作,对外界产生了一定的影响。(a6)
A君的声带进行特定频率的振动,会带动外部世界的空气发生类似的振动。
这些空气振动波可以看做是一种「加载了数字信息」的「模拟信息」。
也就是我们可以从这个「模拟信息」中解读出某些「数字信息」。
3.2 读取动作
A君的声带产生特定频率的振动,带动外部世界的空气发生类似的振动。
而此时B君就在A君的正对面。
空气的振动波(加载了数字信息的模拟信息)传输到了B君的耳膜上,这引起了B君耳膜的振动。(b1)
耳膜细胞的振动是一种「模拟信息」,它出现在B君的身体内部。
这种「模拟信息」可以进入意识的语义网络之中,进行「模数转换」为数字信息/语义片段/语句,当然基于上帝视角我们知道这个信息是「你好」。(b2)
然后「你好」这个语义片段在语义网络中进行语法解析,转变成一段连续感性的想法(模拟信号),进入到意识之中。(b4)
于是当B君解读出这是A君在向他问好之后,B君对A君的好感度增加了。
还有一些「模拟信息」会绕过语义网络,不作语言上的语义分析而直接传导到意识之中,它和经过语义网络的信息一起构成了B君意识中的感受。(b3)
B君感受到「愉悦」,这种来自意识的感受会引起一些B君身体非意识部分的一些变化,例如B君嘴角微微上扬了一下,但他没有发觉这一点。(b5)
当然耳膜细胞的振动这个「模拟信息」可能会对B君的身体产生一些没有被意识到的影响,例如A君的声音很甜美,这直接引起了B君体内某些激素水平的变化。(b6)
结合A君的表达和B君的读取,他们就完成了一次单向的沟通动作。
A君意识中的一个意图,经由A君的动作表达到外界,被B君读取,最后形成B君意识中的一个感受。
4. 自我沟通的信息学模型
我们可以发散一下思维。
如果做出「表达」和「读取」动作的都是A君会怎么样呢?
换句话说,A君在自言自语,或者A君自己在纸上写写画画。
我们将上面的图稍微修改一下:
自我沟通的信息学模型
上图所示就是「自我沟通」的信息学模型。
狭义的「自我沟通」应该是指「s1 + s2 + s3 + s4 + s5 + s6」这几个涉及语言的过程。
HW君未经严谨的推敲,初步得到下面这几个命题:
(4.1) 人类以「自然语言」为工具,通过意识中的语义网络进行「自我沟通」。
(4.2) 外界、意识和非意识,均不同程度影响了个体的「自我沟通」。
(4.3) 这种「自我沟通」过程也被称为「思考」。
(4.4) 人类使用语言思考,而思考也影响语言。
还有一些其他观点。
例如,有些意识中的「意图」和「感受」是不经过语义网络的。(s7+s8)
像在激烈的竞技体育运动中,运动员在电光火石之间做出一个反应,他自己是能意识到的。
也就是在执行某个动作时,他是有意图也有感受的。
但是他说不清楚当时的意图和感受,因为意识跳过了语义网络直接读取和影响「模拟信息」。(s7+s8)
当然事后回想起来,运动员可能会将「当时为什么采取这个行动」解释成一段文字。
这时这些「模拟信息」就进入了语义网络之中,被提取为「数字信息」。(s2+s4)
5. 机器沟通的信息学模型
我们还可以继续发散一下思维。
如果计算机参与到这个沟通系统之中,会是怎么样的呢?
我们可以在原来的图片上增加一点细节:
机器沟通的信息学模型
上图大致上就是「机器沟通」的信息学模型。
HW君认为,计算机的功能和结构等同于人类意识中的「语义网络」部分。
也就是说,计算机可以看做是一个「外部语义网络」。
外界的声光等「模拟信息」,被机器的传感器读取,可以是麦克风读取了一段声音,也可以是摄像头采集到了一幅画面,当然常见的是键盘/鼠标/触控屏幕读取了一次按压。(c1)
这样的「模拟信息」通过计算机的「模数转换」电路转换为一组数据,这组数据是一段「数字信息」,通常是由二进制的0和1组成。(c2)
然后这组数据进入计算机的语义网络中,进行处理运算。(c3)
我们在本文的第二节「2. 自然语言的基础概念」中阐述了这样的一个命题:
(8) 语义是且仅是语句(符号)之间的关系。
这个命题放在计算机的机器语义网络上仍然成立。
在计算机的语义网络中:
(5.1) 语句是「数据」。
(5.2) 语义是「数据」之间的函数关系。
当然我们也会把计算机的语句叫做「程序」。
计算机经过程序运算之后,生成了一组新的数据,这组数据仍然是一段「数字信息」。(c4)
这些通常由二进制0和1组成的「数字信息」需要被转换成为「模拟信息」表达出来,才能被人类识别。
计算机将这些数据加载到「模拟信息」上,变成屏幕上的画面或者喇叭的声音。(c5)
于是在我们看来,计算机执行了一个动作,输出了一些加载了「数字信息」的「模拟信息」。(c6)
这些信息可以被其他个体或者机器读取,进入下一个循环。
6. 其他
本文这些模型也存在着一些严重的缺陷。
例如一个是《模因 | #7 边界在哪里》:
上面这些「边界」明确的概念,它们的划分是准确的吗?
另一个是《逻辑 | 我向你发送了一条负信息》:
这些模型所立足的「信息」概念,其定义是准确的吗?
当然,这两个问题是「哲学诠释」层面上的。
HW君会选择暂时忽略这些问题,毕竟时间精力有限,人生苦短。
这一期也算是严重跑题了,但这也是必要的。
我们下一期会重新回到「语用学」领域,谈谈这几个模型的语用学意义。
(本章节完,敬请期待下一节)
By HW君 @ 2020-11-29