语用 | #4 人类沟通的信息学模型

 文 | HW君 


1. 模拟信息与数字信息

在谈论人类沟通之前,我们先介绍一下两个信息学概念。

在电路电子技术中,有一对很常见的概念「模拟电路」和「数字电路」。

模拟电路处理「模拟信息(模拟信号)数字电路处理「数字信息(数字信号)

IT相关专业的朋友很容易理解它们之间的区别,而部分朋友不太清楚这些概念,这里我们先简要介绍。

 

模拟信息」是指时间连续、幅值连续的信息。

数字信息」是指时间离散、幅值离散的信息。

举个例子,我们人的体重是会随时间而发生变化的,变重或轻了。

如果用X轴表示时间,Y轴表示体重,那么我们可以得到类似下面这样的图:

Analog_signal

这样的一条曲线,它在时间上是连续的,在幅值(体重)上也是连续的,是生活中真实存在的情况,我们称这样的曲线为「模拟信息」。

一条「模拟信息」曲线,它在时间上是连续的,可以分为无穷个点;在幅值上也是连续的,可以分为无穷个点。

就像一把尺子,虽然我们会把它分成好几个离散的1厘米,但实际上它在物理上是连续的,我们完全可以在尺子上找出例如1.5559厘米这样的没有标出来的位置。

 

而计算机的运算能力是有限的,内存容量也是有限的,没有办法记录下「模拟信息」的所有信息。

于是计算机对这些「模拟信息」曲线进行采样,采样后就得到了在时间上离散、在幅值上也离散的数据,这样的数据就是「数字信息」。

我们常说数字时代、数码产品,这里面的「数」,指的就是「数字信息」的概念。

 

如果我们每个月对体重的信息进行一次采样,也就是每月量一次体重,那么会得到下面这样的数据:

Digital_signal_month

 

如上图所示,如果我们固定每个月测一次体重,那么会得到一组离散的「数字信息」数据,这组「数字信息」可以近似地反映出体重随时间发生的变化。

当然,如果我们改为每个星期测一次体重,那么我们就会得到一组离散点更加密集的数据,它能更精确地反映体重随时间发生的变化:

Digital_signal_week

 

甚至我们可以改为一天测一次、一秒测一次……那么这组「数字信息」的离散点就会变得非常密集,最终无限趋近于「模拟信息」的连续曲线。

 

不过,虽然我们会把信息划分成模拟的和数字的,并且的确很好用。

但是在HW君看来,所谓的「数字信息」和「模拟信息」并没有本质上的区别,它们之间的差异主要是在「量级」上。

我们之所以会认为世界是连续不断的,那是因为我们的视角不够微观。

如果人类的视角足够微观,就会发现世界其实也是由离散的粒子构成的。

 

反过来也是,只要信息的精度足够高,那么我们根本分辨不出「数字信息」和「模拟信息」的差别。

​我们认为上面「模拟信息」那张图中的体重曲线是一条连续的曲线,但实际上它是屏幕上一个个离散的像素点组成的。

 

现实生活中,计算机的计算能力和内存容量有限,我们人脑的思考能力有限和记忆力也有限,所以人们需要把现实中「连续不断」的「模拟信息」采样近似成「数字信息」,才能够对数据进行进一步处理。

 

2. 自然语言的基础概念

这一小节我们先介绍一下「自然语言」的概念。

 

所谓「自然语言」,也就是我们人类日常生活中使用的语言

包括并不限于中文、英文、日文……它其实是相对于「机器语言」的一个概念。

形式上,「自然语言」可以有文字表达或者口语表达

 

下面我们会提及一些关于「自然语言」的概念。

如果觉得理解上有困难,可以暂时搁置。

后面给出「人类沟通的信息学模型」的完整理论后,需要用到时再进行查找就行。

 

我们以文字表达为例。

 

假设屏幕上有一行文字(即一个语句)。

现在B君的眼睛看到了这个语句

而B君的意识/自由意志/心灵/思想中存在着一个用来处理「自然语言」的语义网络

当这个语句经由双眼进入B君的意识后,语句会形成一个语义片段

语义片段会按照语法规则参与到语义网络中,解析出语句意义

于是B君增加了一些关于这段文字的知识(也可以称为其对于文字的感受)。

 

反过来的过程也是类似的。

A君的意识里出现了一个意图

A君按照一定的语法规则,在语义网络中将这个意图转换为一个语义片段

然后他将这个语义片段组织成具体的语句,输入了计算机中。

于是屏幕上多了一行文字。

 

 

然后接下来我们会表述一些关于「自然语言」的命题。

同样的,如果觉得难以理解可以先不理睬,后面需要用到的时候再进行查找就行。

 

关于「自然语言」的命题:

(1) 知识(可能)影响个体行为信息

(2) 知识是中性的,这里不对知识进行涉及对错好坏的「价值判断」。

(3) 知识意义在于它(可能)如何影响个体的行为

(4) 知识分散存在于个体的意识中。

(5) 存在于意识之外的其他介质(例如书籍、计算机)中的信息不是知识

(6) 个体借助「自然语言」这一工具在自身意识或他人意识中形成知识

(7) 借助「自然语言」,个体意识中产生了一个语义网络

(8) 语义是且仅是语句(符号)之间的关系

(9) 语义不包含意义

(10) 语句可以是存在于意识之外的其他介质(例如书籍、计算机)中的信息

(11) 语句不包含意义

(12) 语句按照语法规则纳入意识语义网络而获得其语义结构,形成一个语义片段

(13) 语义片段语义网络中的子语义网络

(14)意识中的语义片段影响行为时,意义出现。

(15) 该影响行为语义片段即被称为知识

 

 

3. 人类沟通的信息学模型

人类沟通的方式比较复杂。

上面第2节所说的「自然语言」只是人类沟通中的一部分。

具体来说,「自然语言」涉及的是人类沟通中的「数字信息」部分。

我们可以把人类意识中处理「自然语言」的语义网络当作一台「通用图灵机」,它处理的是「数字信息」。

 

为了便于直观地理解「人类沟通的信息学模型」,我们用下图来描述该模型:

human_communication

人类沟通的信息学模型

上图描绘了A君B君进行沟通时的信息流动。

这是个单向的沟通系统,其中A君表达(发送)B君读取(接收)

 

图中部分图例的含义:

①.   蓝色部分  语义网络

②.   橙色部分  意识(自由意志/思想/心灵)意识包含语义网络

③.   灰色部分  个体个体包含意识

④.   箭头  为信息流动方向,也指施加影响的方向。

 

我们可以把「意识A」作为评估的起点。

当然,个体的非意识部分是会对意识造成影响的,例如身体激素水平会影响一个人的情绪和思考方式。

所以我们在「意识A」之前加了一个箭头「a1」,表示「非意识影响意识」,也可以描述为「信息非意识流向意识」。

 

比较符合大部分人直觉的信息流动路径是「a3」→「a5」→「a6」。

也就是个体头脑里的意识中出现了一个意图,这个意图会被组织成一个语句,然后身体表达出这个语句(例如说出一句话)

这样就个体就完成了一次表达动作。

不过上述是简化版本,实际中「表达」这个动作会比上述简易版本要更加复杂一些。

 

3.1 表达动作

我们看A君的这个橙色圆框部分,这是A君的意识

一开始,A君的意识产生了一个意图

它应该是一个「模拟信号(生物机体产生的都是模拟信号)

这个意图是一个连续的想法/感觉/念头,总之一团模模糊糊非常感性的东西。

 

A君的意识之中有一个专门处理「自然语言」的语义网络

这个意图会遵循语法规则,在意识语义网络中生成一个语义片段(a3)

而这个语义片段是一种「数字信息」,它不再是一团模模糊糊感性的意图,而是一个可以被清晰表述出来的语句

这一种过程我们称其为「模数转换」,也就是将模拟信息转换为数字信息

我们站在上帝视角,假设这个语句/语义片段/数字信息是「你好」。

 

但是「数字信息」并没有办法被直接表达出来。

数字信息」是一种概念上的东西,而自然界的所有东西都是模拟的。

所以「数字信息」需要加载在「模拟信息」上才能被表达出来。

也就是我们要对「数字信号」进行「数模转换」。

就像一行文字,我没有办法将它的意义透过意念隔空传入到你的脑中。

我要么把它说成一句话(声音),要么把它写在纸上或者输入到屏幕里(光线)。

这些声音和光线被你听到或者看到后,这行文字才能传到你的脑海里然后被解读成为意义。

 

在通信工程上这叫做「数字调制」技术,也就是将数字信号转变为可以传输的电信号或者电磁波。

 

概念上的「数字信息」会被转变成物理上的「模拟信息」,对人体细胞产生影响,从而影响人体的行为(a5)

但是意识除了生成一个「数字信息」语句「你好」之外,也会直接影响「影响人体行为」的「模拟信息」。(a4)

例如此时A君情绪变得变高昂、声音变高、双腿有点小颤抖……当然我们这是站在上帝视角来描述的,实际上A君只是隐约感觉自己发生了变化,但这种变化并没有用语言表达出来。

 

而还有一些身体行为的变化,是A君根本就没有察觉到的,例如A君无论什么情况下都有一个时不时踮脚尖的动作,这个跟他此刻的意图没有关系,他自己也根本就没有意识到这一点。(a2)

 

于是a2a4a5产生的信息,综合起来对个体的细胞产生一个整体的影响,从宏观上来看就是「个体执行了一个动作」。

这个动作表现为A君张开口腔,肌肉收缩,声带进行特定频率的振动。

于是A君完成了一个表达动作,对外界产生了一定的影响。(a6)

 

A君的声带进行特定频率的振动,会带动外部世界的空气发生类似的振动。

这些空气振动波可以看做是一种「加载了数字信息」的「模拟信息」。

也就是我们可以从这个「模拟信息」中解读出某些「数字信息」。

 

3.2 读取动作

A君的声带产生特定频率的振动,带动外部世界的空气发生类似的振动。

而此时B君就在A君的正对面。

 

空气的振动波(加载了数字信息的模拟信息)传输到了B君的耳膜上,这引起了B君耳膜的振动。(b1)

耳膜细胞的振动是一种「模拟信息」,它出现在B君的身体内部。

这种「模拟信息」可以进入意识语义网络之中,进行「模数转换」为数字信息/语义片段/语句,当然基于上帝视角我们知道这个信息是「你好」。(b2)

然后「你好」这个语义片段语义网络中进行语法解析,转变成一段连续感性的想法(模拟信号),进入到意识之中。(b4)

于是当B君解读出这是A君在向他问好之后,B君对A君的好感度增加了。

 

还有一些「模拟信息」会绕过语义网络,不作语言上的语义分析而直接传导到意识之中,它和经过语义网络的信息一起构成了B君意识中的感受(b3)

B君感受到「愉悦」,这种来自意识感受会引起一些B君身体非意识部分的一些变化,例如B君嘴角微微上扬了一下,但他没有发觉这一点。(b5)

当然耳膜细胞的振动这个「模拟信息」可能会对B君的身体产生一些没有被意识到的影响,例如A君的声音很甜美,这直接引起了B君体内某些激素水平的变化。(b6)

 

结合A君的表达和B君的读取,他们就完成了一次单向沟通动作。

A君意识中的一个意图,经由A君的动作表达到外界,被B君读取,最后形成B君意识中的一个感受

 

 

4. 自我沟通的信息学模型

我们可以发散一下思维。

如果做出「表达」和「读取」动作的都是A君会怎么样呢?

换句话说,A君在自言自语,或者A君自己在纸上写写画画。

 

我们将上面的图稍微修改一下:

self communication

自我沟通的信息学模型

上图所示就是「自我沟通」的信息学模型。

狭义的「自我沟通」应该是指「s1 + s2 + s3 + s4 + s5 + s6」这几个涉及语言的过程。

 

HW君未经严谨的推敲,初步得到下面这几个命题:

(4.1) 人类以「自然语言」为工具,通过意识中的语义网络进行「自我沟通」。

(4.2) 外界意识非意识,均不同程度影响了个体的「自我沟通」。

(4.3) 这种「自我沟通」过程也被称为「思考」。

(4.4) 人类使用语言思考,而思考也影响语言。

 

还有一些其他观点。

 

例如,有些意识中的「意图」和「感受」是不经过语义网络的。(s7+s8)

像在激烈的竞技体育运动中,运动员在电光火石之间做出一个反应,他自己是能意识到的。

也就是在执行某个动作时,他是有意图也有感受的。

但是他说不清楚当时的意图感受,因为意识跳过了语义网络直接读取和影响「模拟信息」。(s7+s8)

 

当然事后回想起来,运动员可能会将「当时为什么采取这个行动」解释成一段文字。

这时这些「模拟信息」就进入了语义网络之中,被提取为「数字信息」。(s2+s4)

 

 

5. 机器沟通的信息学模型

我们还可以继续发散一下思维。

如果计算机参与到这个沟通系统之中,会是怎么样的呢?

 

我们可以在原来的图片上增加一点细节:

machine_communication

机器沟通的信息学模型

上图大致上就是「机器沟通」的信息学模型。

 

HW君认为,计算机的功能和结构等同于人类意识中的「语义网络」部分。

也就是说,计算机可以看做是一个「外部语义网络」。

 

外界的声光等「模拟信息」,被机器的传感器读取,可以是麦克风读取了一段声音,也可以是摄像头采集到了一幅画面,当然常见的是键盘/鼠标/触控屏幕读取了一次按压。(c1)

这样的「模拟信息」通过计算机的「模数转换」电路转换为一组数据,这组数据是一段「数字信息」,通常是由二进制的0和1组成。(c2)

然后这组数据进入计算机的语义网络中,进行处理运算。(c3)

 

我们在本文的第二节「2. 自然语言的基础概念」中阐述了这样的一个命题:

(8) 语义是且仅是语句(符号)之间的关系

这个命题放在计算机的机器语义网络上仍然成立。

在计算机的语义网络中:

(5.1) 语句是「数据」。

(5.2) 语义是「数据」之间的函数关系

当然我们也会把计算机的语句叫做「程序」。

 

计算机经过程序运算之后,生成了一组新的数据,这组数据仍然是一段「数字信息」。(c4)

这些通常由二进制0和1组成的「数字信息」需要被转换成为「模拟信息」表达出来,才能被人类识别。

计算机将这些数据加载到「模拟信息」上,变成屏幕上的画面或者喇叭的声音。(c5)

于是在我们看来,计算机执行了一个动作,输出了一些加载了「数字信息」的「模拟信息」。(c6)

 

这些信息可以被其他个体或者机器读取,进入下一个循环。

 

6. 其他

本文这些模型也存在着一些严重的缺陷。

例如一个是《模因 | #7 边界在哪里》:

上面这些「边界」明确的概念,它们的划分是准确的吗?

另一个是《逻辑 | 我向你发送了一条负信息》:

这些模型所立足的「信息」概念,其定义是准确的吗?

 

当然,这两个问题是「哲学诠释」层面上的。

HW君会选择暂时忽略这些问题,毕竟时间精力有限,人生苦短。

 

这一期也算是严重跑题了,但这也是必要的。

我们下一期会重新回到「语用学」领域,谈谈这几个模型的语用学意义。

 

(本章节完,敬请期待下一节)

By HW君 @ 2020-11-29

guest
0 评论
内联反馈
查看所有评论