澎湃Logo
下载客户端

登录

  • +1

算法的形状|图绘自动写作史(二):生成的自主性

李沐杰
2024-06-07 11:14
来源:澎湃新闻
思想市场 >
字号

模拟

事件1:prompt:画一个胸有成竹的男人。AI作画结果:男人,上半身特写,胸部长出竹子。

事件2:小学生做造句练习,老师出的题目是“如果”,一个学生挨了骂,他的句子是:“牛奶不如果汁好喝”。

事件1中的人工智能作画令人啼笑皆非,它因而被人们称为“人工智障”。原因在于,AI没有“理解”成语“胸有成竹”,而是按照“字面义”甚至是“位值”执行了命令。事件2是张大春在《小说稗类》中探讨小说的修辞时,举过的一个生动的例子。这位学生没有将“如果”一词看作依循语法规则定义的一个功能性副词或介词,造句成为了一种语言游戏,它遵循着一种“字面义”。

事件1与事件2所存在的相似,也许令人做出以下感慨:AI的“思考能力”还处在小学生学习阶段;又或者,AI的“作画能力”别具一格地创新。然而,在这一相似的背后,却隐藏着人类对待计算机器的一个惯常逻辑:计算机器是对人类的模拟。这种模拟逻辑支配着人类中心主义式的、对新技术的恐惧,即害怕人类的部分劳动被计算机器所取代,更有甚者,如科幻小说中所描述的,计算机器将“统治”人类。

在知识生产的范畴内,从哲学家到媒介学者——比如海德格尔、麦克卢汉、斯蒂格勒,计算机器的工具性在于它是人类器官的延伸、义肢。这一逻辑甚至贯穿了科技进化史。简单来说,当我们说机器“会读”“会写”“会思考”(还有上文加引号的例子),这些比喻意义上的描述实际上是从人类自身角度来理解机器。此处笔者并非在否认机器会读写会思考,也并非号召以新的词汇来命名计算机器。本文试图争辩的是,我们在理解和使用计算机器时,是否需要模拟逻辑?

机器思考与创新

张大春如此评价小学生的造句:“这是一个大胆的句子——它顽皮,不规矩,未能吻合惯见的文法,却巧妙地拆解又重组了文字意义的可能性”。[1]直观而言,显然这种语言游戏彰显了一种由物质语言的字面义而驱动的想象力,并且具有挑战规则的破坏力。然而,计算机器是否可以以此视角来评判?

以AI程序GPT-3(生成式预训练转换器,版本3)为例,它的转换架构中重要的一个环节是以注意力(attention)为机制来训练数据。简单来说,它聚焦于一个语境序列中的某个词语,生成这个词语的一个概率,这一概率显示了它与句中其它词语的关联的重要程度。凯瑟琳·海耶斯(N. Katherine Hayles)在《深入AI的思想》(Inside the Mind of an AI)一文中,借助热图(heat map)来帮助读者理解转换架构中的注意力机制如何工作。如下图所示,在转换器读取句子“The big red dog”时,句子中词语的密度对应着注意力机制赋予的关联概率。在第一行中,转换器识别出了“the”和“dog”,它们具有较高的概率。在第二行中,“big”与“dog”具有较高的概率。在第三行中,转换器识别出之前的三个词(“the”“big”“red”)均与“dog”有关,并且“dog”是该句话中最重要的词语。[2]

短语“The big red dog”热图 

从上述GPT-3架构的解释不难看出,AI程序读取词语时,实际上是将词语当作了令牌/标记符(token)——AI程序将词语转化为向量,并且在数学意义上操纵它,使其与其它词语和关系相关联(这些词语和关系来自对文本数据库中已被训练的词语和关系的推断)。这即是说,AI探测语言的方式,是由对向量空间的操纵和数学建模意义上的嵌入空间的临接性所构成;它并非像人类自然语言那样,是意识对符号的操纵,因而它无法捕捉人类语言的整体。海耶斯的结论是,神经网络中所蕴含的知识与人类知识有着质的区别:因为前者完全产生于表征(representation),即一种仅凭从其训练的数据集中推断出的错综复杂而广阔的关联关系而来的认知过程;而人类知识则是从具身行动中获取。

海耶斯对于AI程序架构的热图展示和得出的结论,可以充分说明AI关于语言的习得与人类对语言的认知有着很大差异。因而我们无法从人类语言认知的角度来评判机器“思考”。这就是说,以模拟逻辑来讨论计算机器是行不通的。

寓无限于有限

哲学家丹尼尔·W.史密斯(Daniel W. Smith)在《创新的条件》(The Condition of the New)一文中,对创新的定义进行了辨析。“转化”(transformation)和“涌现”(emergence)都不能够被算作遵循差异原则的创新性生产。他指出,当艺术家创作艺术作品时,他们已然便是以一种新的方式来组织世界上业已存在的质料(matter);这种创意仅仅是一种组合,并且创造仅仅是将新形式强加于已有质料之上,这意味着,创意仅仅是一种形式上的突破,质料本身沦为了求新求变的被动盛器。而“涌现”这一在当代科学与哲学领域被广泛讨论的词汇,实际上只是暗示了另一种所谓求新的生产方式,即在一个系统中生成更高等级的复杂性。[3]

在数字语言艺术中,语言更多的是一种鲜活积极的建构过程,而不是结构主义意义上作为对象的抽象化系统。英国文化研究学者雷蒙·威廉姆斯(Raymond Williams)与哲学家维特根斯坦都曾经强调了语言鲜活积极的建构性。其中,威廉姆斯以马克思主义哲学为语境,指出语言的社会性和生产性;[4]而后期的维特根斯坦则指出,语义是通过人们所使用的共同规则和语境而建立的。[5]

自1940年代末以来,美国的算法环境一直推崇一种完全计算,这一幻想认为,算法会对一切事物都按照其全貌进行翻译。在第二次世界大战期间,密码学领域曾出现过数学家和科学家们的一个假设,即语言具有某些不变的属性,这一属性在某种程度上在所有语言中都是普遍的。在控制论的早期发展阶段,科学家和数学家沃伦·韦弗(Warren Weaver)对这一假设深信不疑,他提出使用电子计算机来解决全世界范围内的翻译问题,并且以语言的统计语义研究作为计算机翻译的基础。韦弗认为,“通用语言”具有所有语言的共同特征,并在所有语言之中具有其根源性——即这些共同特征可以支持不同语言的结构。[6]此外,他还预测这一通用语言的逻辑结构可以被机械化,以解决任何翻译问题,并为解决通信的一般问题提供启示。

20世纪上半叶,世界范围内的人民在极权主义政权下遭受着政治压迫,继之而来的先进形式的资本主义消费文化中的大规模生产,则带来了一种对言说行为的幻想,即将言说行为用来为个体主体提供一种扩充的拟像,在这一拟像中,主体具有充分的经验与语言形式。在大众生产中,语言经历着工业化与工具化,它在计算系统中因追求完全透明的翻译而被简化为一项实用任务:“语言被用来传达没有歧义的信息,并且不留下任何可能的解释”。

在此背景下,激浪派艺术家艾莉森·诺尔斯(Alison Knowles)则看到了计算语言中的解放性力量。对于诺尔斯而言,计算语言是一种先进形式的语言异化,它可以介入对语言的工具化使用。诺尔斯认为,艺术品的计算构成可以使得诗歌文本的创作和体验复杂化,“混淆功能参数并使其开放于创造性的表演”,而不是使用技术来促进和维持可能的透明沟通。[7]

在她的作品《尘埃之屋》(A House of Dust)中,计算程序持续不断地生成着四行诗,四行诗被实时打印在纸张上。这一装置所采用的纸张,是美国当时政治和法律体系中常用的白底红线、边缘带纸孔的工具性用纸。这一使用预示着,计算程序开始使用算法来干预对语言的控制和配置。行政纸上的计算机生成文本读起来像是乐谱的五线谱:它将“特定权威和记录不可撤销的陈述性规则的工具”转变为产生开放解释的随机过程领域。[8]

《尘埃之屋》中的11首由计算机生成的四行诗。Verlag Gebrüder König, 科隆,纽约 (1967)。39 x 31.5 cm。

在诺尔斯的《尘埃之屋》中,随机变得具有操作性,因为计算程序中的(不)完整性【(in)completeness】和形式概率开始被用作艺术技巧,这些技巧具有形式不确定性,它们质疑着作品的权威和授权,并提供着替代可能性。诺尔斯受到杜尚和约翰·凯奇(John Cage)的影响,并与他们展开合作。激浪派艺术家倡导的随机运作(chance operation)将达达主义传统带入了计算技术条件下的新社会历史背景。更重要的是,它的媒介语言在不同的物质层次上发挥着作用。在特里斯坦·扎拉(Tristan Tzara)著名的达达诗《制作达达诗》(How to Make a Dada Poem?)中,不确定的形式来自一种对操作型语言的运作:从报纸文章中剪切单词、随机选择并组合成为诗歌文本。相比之下,在诺尔斯的计算机生成的诗歌中,不确定的形式指的是自然语言的句法不确定性,它延伸至艺术制作的不同上下文关系当中。这种句法的不确定性需要进一步澄清自然语言与诗歌生成器的程序语言之间的关系。

在《尘埃之屋》中,用于诗歌生成器的FORTRAN IV是一种高级编程语言。“To list”这个动词短语首先是编程语言中的命令式。它向计算机发出命令,生成文本的选择和组合的排列规则:它构成了四行诗文本的基本结构——“一个……房子/ 在一个……/ ……使用/ ……居住”,并在这个结构中组织了四组元素(材料、位置、光源、居民)。在《尘埃之屋》的四行诗中,列表与诗节共享相同的句法规则。这使得编程语言中的列表命令易于理解。此外,诗节使印在纸上的文本易读,四行诗让整首诗变得可被理解。列表、诗节、四行诗、程序语言、纸上语言和诗的语言共享着相同的句法规则。然而,这种句法规则作用于不同的材料界限:列表是执行机器代码的命令规则,诗节使计算机行为的痕迹在纸上可识别,四行诗允许在诗歌文本和纸上的痕迹中进行可能的阅读,产生理解的方式。与不同语言相关的这三种角色,以这种方式,限制了纸上空间的意义生产。

物质条件中的差异与重复

GPT3中以注意力为核心的数据训练机制,揭示了人工智能技术中的机器思考实际上是对标记符进行的基于数学关系意义上的识别。蕴含其中的模拟逻辑牵引着人工智能技术的发展以及人们对它的理解。历史上,激浪派艺术家们所展示的操作型随机,则使得计算机器的数学特性被置于艺术实践中来探讨。它提供了模拟逻辑之外的另一种逻辑,来理解机器与人的创造性的耦合关系。在这一逻辑之中,操作型语言揭示了物质条件中借由语言元素所实现的差异与重复。如此的递归迭代也展示了计算式写作所具有的生成的自主性。

参考文献

[1] 张大春,2010.《小说稗类》. 桂林:广西师范大学出版社.

[2] Hayles, N. Katherine. 2022. “Inside the Mind of an AI: Materiality and the Crisis of Representation.” New Literary History54 (1): 635–66. 

[3] Smith, Daniel W. 2007. “The Conditions of the New.” Deleuze Studies1 (1): 1–21. 

[4] Williams, Raymond. 1977. Marxism and Literature. Oxford & New York: Oxford University Press.

[5] Wittgenstein, Ludwig. 2009. Philosophical Investigations. Translated by G. E. M. Anscombe, P.M.S. Hacker, and Joachim Schulte. Chicago and London: Blackwell Publishing.

[6] Shannon, C. E., and W. Weaver. 1964. The Mathematical Theory of Communication. The University of Illinois. USA: The University of Illinois.

[7] Maud, Jacquin, and Sébastien Pluot. 2016. “Poetry in Translation.” Art by Translation, no. The House of Dust by Alison Knowles. https://www.artbytranslation.org/publications/houseofdust1.

[8] Ibid.

    责任编辑:朱凡
    图片编辑:张颖
    校对:施鋆
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2025 上海东方报业有限公司

            反馈