下载客户端

人工智能与哲学｜深度学习机制对于既有人文资源的“剥削”

徐英瑾

2023-02-23 13:54

从表面上看，对任何具有很强的专业性与运作效率，却依然需要人类加以操控的机器而言，其在社会中的大规模运用，一般只会大量解放人类的劳力，增加人类自由创造的时间，并使得人类文明更加繁荣，而不会使其衰弱，据此理路，如果深度学习机制在本质上与这样一种机器相似的话，那么其出现似乎也应当成为人类文明的福音，而不会成为人类文明的远忧。但不巧的是，深度学习机制恰恰在下述方面与前述机器是不同的：一般意义上机器的运作所消耗的主要是自然资源（如煤炭、石油、天然气）而已，而深度学习机制的运作所消耗的资源，除了自然资源之外，还包括人文资源。由于人文资源本身的再生是以大量的人类劳动力的存在为前提的，所以，深度学习机制对于人类劳动力的大量取代，将从根本上对人类社会人文资源的可持续发展构成威胁。

为了将上面这层道理说透，笔者还需要回答两个问题：

首先，什么是人文资源？为何人文资源的基本构成要素一定是自然人，而不能是机器？

其次，为何说深度学习机制对于人类劳动力的取代会消耗人文资源，而传统的机器（如纺纱机、汽车、高铁等）则不会？

先来看第一个问题。笔者所说的“人文资源”是一个相对宽泛的概念，它包括一个经济体内部的社会成员既定的价值观体系、通常具有的文化知识、一般智力水平等等。它与一般所说的“劳动力”这个概念相比，还包括了使得合格劳动力得以产生的培训机制与隐性文化-意识形态背景。具有正面价值的人文资源将具有如下特征：它具备一个稳固的却并不僵化的知识培养体系，能够稳定地培养出具有相应劳动素质的劳动力——这里所说的“劳动素质”除了专业技能之外，还包括劳动者的上进心与诚实、守信等基本品德。其中的高级劳动力还必须进一步具备挑战权威、勇于创新等高级素质。这里需要注意的是，从“量”的角度看，就目前的技术发展水平而言，人文资源的保持与发展是依赖于一定数量的人类劳动者的存在的；而从“质”的角度看，劳动个体之间存在的差异性所造成的市场竞争，又为既有人文资源的日益丰富提供了契机。换言之，具有特定生物学基础，作为人类历史产物并具有一定数量的人类个体，才是上面所说的隐性文化-意识形态的实践者、特定职业培训机构的运作者，以及此类机构的培养对象。

与之相比较，目前的人工智能产品却不能成为人文价值的真实承载者，并由此成为人文资源的有机组成部分。其相关论证如下：

第一步：任何真实的人类人文价值的承载者都需要“理解”相关的价值规范。这里需要注意的是，“理解”不仅仅是指在字面上能够背诵相关的规范内容，还指理解者应当知道如何在各种难以预期的变化语境中以灵活的方式执行规范的内容，比如，一个合格的人类司机应当知道在紧急避险的情况下，要如何适当放宽对于特定交通规范的执行标准，以免造成更大的灾难。而这种理解一般将包括如下内容：（1）规则制定者的制定目的是什么；（2）自己执行这样的规则的目的是什么；（3）规则得以实施的一般条件是什么；（4）为何眼前遇到的紧急避险情形构成了对于上述“一般条件”的反例；（5）在眼前的紧急避险状况中，自己暂且违背交通规则中相关条例的恰当理由是什么——或说得更具体一点，为何说违背条例（却能够救险）所带来的好处能够抵消遵守条例（却无法救险）所带来的坏处。由此看来，完整地“理解”一条价值规范，是需要牵涉到理解者非常复杂的心智活动的。

第二步：目前的深度学习系统只能满足对于特定输入的简单归类活动，而远远没有达到可以模拟上述复杂心智活动的地步（这一点笔者在前文中已反复说明）。

第三步：所以，现有的深度学习产品不能成为人文价值的真实承载者。

对于上述论证的第一步，有的读者或许会有疑问：既然人类行为主体对于同一价值规则的理解方式存在着那么多环节，这就会为不同的行为主体对于同样的价值规则产生不同的理解制造大量的契机。在这样的情况下，我们怎么可能保证在人类社会中，价值体系本身能够得到忠实的传承呢？

这里需要注意的是，适当的修正与变化，不仅是对于人类价值体系自身的“理解”环节所提出的逻辑要求，甚至也正是使得人类人文资源得以保存的内在要求，之所以这么说，本身又是缘于下述这个新的三步论证：

第一步：在质的规定性方面，测算人类文化资源的丰富性的尺度与测算自然资源的丰富性的尺度有着很大的差异。前者与种类的丰富性更相关，后者则往往与数量的丰富性更相关。譬如，如果我们说一个文化共同体内的影视产业所依赖的人文资源丰富的话，我们一般指的是该共同体内能够产生的可供改编的剧本种类的丰富度，可供挑选的演员类型的丰富度，以及消费市场对于多样性文艺作品的接受能力，等等。在这里，并没有统一的标准告诉我们哪些人文资源的品类就一定比另一些品类来得好（举例来说，在一位优秀的喜剧演员与一位优秀的悲剧演员之间再进行比较，往往是非常困难的，甚至是没有意义的。俗语所说的“文无第一、武无第二”，也就是这个意思）。甚至就对于单纯的劳动力资源的测算而言，只要该社会的工业与服务业的复杂性达到了一定的程度，抛开对于劳动力的类型与分层结构的考察而单纯地考察劳动力的数量，也是没有多大意义的（因为一支内部成员具有彼此相似机能的劳动大军，是无法满足一个具有高度多样性的工业-服务业体系的运作要求的）。与之相比较，在我们讨论石油资源或电力资源的质量时，我们往往使用的就是相对统一的衡量标准，并在该标准下更多地将注意力投注到相关资源的量上。当然，在纯粹的自然科学考察中，也有个别学科门类对于自然资源丰富性的度量方式有点类似于对于人文资源的度量方式，如生态学的考察方式（因为生态资源的丰富度的确与生物种类的丰富度更相关，而不是与某特定物种的数量更相关）——不过，由于生态学的学术语境并不包含明显的价值性评判要素，故而，我们是无从仅仅凭借“热带雨林的生态丰富性高于温带阔叶林”这一点就认定温带阔叶林在价值上“劣于”热带雨林的。与之相比较，我们却完全可以判断说，一个能够生产更为丰富种类的文艺作品的文化共同体，在价值上要优于一个文艺作品种类单一的文化共同体。

第二步：很显然，一个文化共同体内不同成员对于同一价值的不同理解方式，是能够促发相关主体行为上的多样性的。而这种多样性彼此竞争，又能促使全社会对于价值规范的集体理解发生迁移或者分化，由此造成文化产品与工业产品的多样化（如果将工业产品也视为某些文化观念的固态化形式的话）。相反，单一的价值把握方式所产生的单一的价值取向与行为模式，一般就会削弱文化共同体的产出物的种类丰富性，甚至造成所谓“文化荒漠”。

第三步：所以，一个文化共同体内不同成员对于同一价值的不同理解方式，对于维护人类价值体系的“有机性存在”——区别于纯粹的石油资源或天然气资源的“无机性存在”——具有重大意义。

从上述结论中我们不难推出，除非现有的人工智能系统能够像人类个体那样对同一价值内容产生多样性的、并带有自身个性色彩的认识，否则，它们对维护人类价值体系的有机性存在并不能产生积极意义。但正如笔者所提到的，目前主流的深度学习机制是无法满足这一要求的，因为深度学习机制无法复刻人类进行价值判断时所经历的那些复杂的心智活动。

那么，为何我们不能满足于深度学习机制在主动维护人类价值体系方面的这种“无能性”，就像我们同样可以容忍汽车、飞机等机械在同样维度上的“无能性”呢？这就牵涉到了笔者对于前述第二个问题的回答——该问题是：为何深度学习机制的广泛应用不仅无法积极地补充人类的既有人文资源，还会消耗之，而传统的机械未必有此负面效力？

为了具体说明深度学习机制与传统机器的不同，我们不妨就将该机制与现代化的交通工具——汽车、飞机等——进行比较。举例来说，尽管汽车的发明的确取代了马车，但是很初步的反思就会让我们发现：这种转变并没有消灭人类劳动力，而是增加了对于人类劳动力的需求——譬如，传统的马车车夫的工作只是被汽车司机的工作所取代了，而且，由于汽车生产流程的复杂性远远超过马车，汽车的生产与销售本身也带来了大量新的劳动岗位。更有甚者，私人汽车的普及其实是大大增加了人类个体的活动能力，并顺带增加了不同个体根据自身对世界的理解与认知来改造世界的能力，或者说，增加了不同的人类个体或人类集团在人类历史中的博弈能力。这样的变化无疑是增加了人类文明的丰富度，并由此为人类的人文资源的发展做出了正面贡献。无独有偶，在“人工智能”概念之外一般计算机技术的发展，也是起到了与“汽车普及”类似的功效。譬如，大量文档处理软件的出现，的确是大大减轻了办公室公文的处理强度，而这一点实际上就等于为其他更需要智力投入的劳动形式的展开留出了大量的时间，并使得更多人能够有更多的闲暇进行文化内容的生产，最终增加了人类文明的丰富度。

然而，深度学习技术的运用则与上述技术有着重要的不同。从表面上看来，深度学习所涉及的运用范围非常广，从“自动言语识别”“图像处理”“艺术修图”“药品发现与毒理学研究”到“金融欺诈检测”，几乎涉及人类生产活动的方方面面，这种“普适性”也就给不少人造成了这样一种假象：既然人类的更广范围内的机械化劳动都可以被人工智能技术所取代，那么，人类也就会有更多的闲暇从事自由的劳动，由此丰富人类的人文积累。但这个粗糙的推论是错误的，因为它本身是立基在一个错误的预设之上的：说某项技术已经涉及了领域A，就等于说该技术已经能基本胜任领域A的主要任务。或说得更具体点，也恰恰是因为深度学习技术在原则上其实是不能真正满足“自动言语识别”“图像处理”“艺术修图”“药品发现与毒理学研究”到“金融欺诈检测”等工作领域对于人类劳动的需求的，因此，过高估计相关技术在这些领域内的运用潜能，就会在根本上威胁到人类劳动者的培养机制的稳定运行，由此威胁到人类文明自身的稳定发展。

对于上述结论感到不服气的读者或许会再问这样两个问题：第一，为何深度学习技术不可能真正取代相关领域内的人类专家？第二，就算深度学习技术与传统技术一样，无法全面取代相关领域内的专家，那么，为何传统技术对于人类特定工作领域的入侵不会威胁人类劳动者的培养机制，而深度学习技术却偏偏会？

在这两个问题中，比较容易回答的是第一个问题，因为我在前文已经指出，任何一个领域内的人类劳动都包含着对于相关规范原则的“理解”，而“理解”所需要的复杂心智活动是深度学习技术在原则上就无法模拟的。现在我们就以“自动言语识别”为切入点，再为此论点提供另外一个案例。“自动言语识别”指的是这样一项技术：使用计算机的手段，将机器所获取的人类发言的语音信息，自动转化为文本信息，由此大大简化人类速记员的工作负担。而这项工作的难度就在于：不同人的发音带有不同的个人色彩，因此，在对这些发音人的信息进行转录的时候，就会产生相当的差错率。而且，同音词现象的存在，也为系统的准确语义归类制造了大量困难。而深度学习技术解决此类问题的典型方式可谓“简单粗暴”：即以大量已标注的人类语音数据与语义符号之间的配对关系为素材，进行海量训练，由此使得系统能够模拟人类在特定语音与特定语义之间的配对活动。譬如，由深度学习技术支持的一个早期的自动语言识别项目——TIMIT——的做法，就从美国寻找到了来自八个美语方言区的630个发音人，让每个人各自说十句话作为素材，以此训练机器进行语音识别，并由此获得了一定的工程学成功。

但麻烦的是，这样的统计学操作却很难覆盖人类理解者的如下智力加工活动：根据对于发言人背景知识的预测，来推测某个发音代表哪个语义。譬如，如果你（作为一个具有充足人类智能的人类语言理解者）能够从某个人前面的发言中听出他的文化水准只有小学水平，你就不会期望他接下来的发言里会使用某些非常“高大上”的词汇；因此，当你貌似听他说到某个“高大上”的词汇的时候，你就会作出猜测：这其实是与之音韵相近的某个另外的词汇。同样的道理，在处理涉及隐喻的词汇表达的时候，由于本体与喻体之间存在着巨大的领域差别（比如将中国历史上的某个典故比附到当代商战的领域中去），理解者本身所储存的语义网范围也就应当能够具有对于这些复杂事项的表征能力，甚至其心智还应当具备在短时间内在不同领域的不同知识点之间搭建临时语义桥梁的能力——否则，相关的语音转化的工作也非常可能会“丢靶”。然而，目前的基于深度学习的自动言语识别系统，至多只能满足对于特定言谈领域的语义建模，而并不具备跨领域的语义类比能力。甚至从原则上看，即使在遥远的未来，在深度学习的技术路径中满足这些要求也是不可能的，其根据则在于如下三段论推理：

大前提：任何在两个领域之间建立类比联系的临时性修辞活动，都会具有鲜明的个性色彩；

小前提：深度学习机制只能对大多数人在大多数情况下所作出的言语行为进行“平均化”，并因此无法把捉任何作为“统计学异常数”出现的个性因素；

结论：深度学习机制无法把握任何在两个领域之间建立类比联系的临时性修辞活动。

再来回答前述第二个问题：为何传统技术对于人类特定工作领域的入侵不会威胁人类劳动者的培养机制，而深度学习技术却偏偏会？在笔者看来，与汽车以及尚未研发成功的通用人工智能技术相比，深度学习技术处在一个很暧昧的位置：一方面，它的确比单纯的机械更多地涉及对于人类智慧的模拟；但另一方面，与真正的通用人工智能相比，它对于人类智慧的模拟却是粗暴与肤浅的。这种暧昧性显然是传统的自动化设备所不具备的，因此，就对于传统设备的使用而言，一般的使用者也能够清楚地厘定“机器”与“人”之间的界限，由此使得人类自主能动性不至于因为机器的介入而受到明显损害——相反，某些更新的人类技能（如汽车驾驶的技能）却反而会由此得到培养。但深度学习却与之不同：该技术是以某种与人脑实际工作方式不同的方式，貌似完成了人脑所完成的某些认知任务，这就会使得人类对这些机器产生更强的依赖，并使得人自身相关认知技能的锻炼机会大为缩减。

从哲学角度看，深度学习机制其实就是海德格尔所说的“常人”（德语“Das man"）的机械化表达：它浓缩了一个领域内的人类智慧的平均意见，并以大量个体化的人类常识判断的存在为其自身存在的逻辑前提。如果我们将这些进行判断的人类个体以及其所依赖的人文背景都视为广义的“人文资源”的一部分（顺便说一句，在前面所提到的TIMIT案例中，这些人文资源指的就是掌握大量美语方言的美国人的存在），那么，深度学习技术就可以被视为寄生在人文资源上的“技术寄生虫”——它会慢慢挥霍人文资源的红利，而本身却不产生新的历史发展可能性。