- +1
未来城市思辨 | 走出“科幻逻辑”,重建技术话语的公共性
2022年秋,上海外滩,人们刷着各自手机上的信息。澎湃新闻记者 周平浪 图
“炒作周期曲线”真的存在吗
随着人工智能持续成为热议话题,有关它的历史也一再被提及。在它的起起落落中,总是伴随着过度解读或任意发挥的技术进展,以及过高期望落空后迅速降低的热度,乃至对整个领域的过度低估。
有时连最权威的技术专家也出现这种错误估计。1968年,达特茅斯会议的发起人之一约翰·麦卡锡(John McCarthy)曾满怀信心预言,十年内程序就能战胜国际象棋大师,结果事与愿违。另一方面,德雷弗斯(Hubert Dreyfus)于1972年出版《计算机不能做什么》(What Computers Can’t Do),认为机器战胜象棋大师的“预言”不能成真,直到1997年IBM的“深蓝”击败了卡斯帕罗夫。
“深蓝”的成功显示了人工智能技术取得的成就,但同时也标志了经典意义上专家系统的最后辉煌。面对人工智能能否“乘胜追击”、“攻克”围棋,“深蓝”的总设计师许峰雄在2002年认为,机器很难在20年内战胜顶尖棋手,而且这种战胜可能也只是暂时的。
事实虽有所提前,但与“深蓝”的路径相比,到2016年AlphaGo战胜李世石时,采取的已是基于深度神经网络的另一技术路径。
如果将金融市场视为技术预期的风向标,那么,2000年前后的互联网泡沫则堪称一大经典案例。在投机引发的金融泡沫中,一些公司简单改换名称,增加“e-”等暗示互联网和电子商务的前缀,就能引来股票价格高涨。这导致许多公司的市值远高于其实际商业模式所具有的价值,最终导致市场崩溃,一批早期“互联网企业”也随之消泯在商海。
由此,一家咨询公司曾提出所谓“技术成熟曲线”或“炒作周期曲线”(Hype Cycle),将技术发展分为五个阶段:初始期(技术或产品刚刚推出的阶段,是预期快速提升的阶段)、高峰期(人们对这一技术或产品的期望膨胀到一个极端)、谷底期(随着技术或产品的实际应用出现问题,过高的期望幻灭,迅速落回谷底)、稳定期(技术得到进一步发展,市场预期开始恢复)和成熟期(技术或产品成为主流,并得到广泛应用,对它的预期和它的实际表现取得一致)。
批评认为,“炒作周期曲线”并没有充足的经验数据支持,大部分技术或产品也不具有可明确辨识的上述五个阶段。如今的人们身处一个又一个技术热潮的前后夹击,恐怕更难让技术预期如“炒作周期曲线”所理想化地描绘的那样,有足够的耐心等待期待收敛到与技术实际水平相一致的状况。
但是,“炒作周期曲线”至少捕捉到了一种广泛存在的现象,即人们在技术发展的不同阶段,会对它产生不同程度的过高或过低评价,从而与实际状况之间产生落差。当前,技术热点快速地兴起而又消失。这反映在人们的技术预期中,则是在过高与过低的极端之间反复跳跃。这意味着,相比于建构、描绘或设想某种“曲线”,寻找这种在两个极端之间反复摆荡的动因,或许来得更为重要。
走出“科幻逻辑”
已故的知名科幻作家叶永烈先生,曾在其主编的《中国科幻小说世纪回眸》丛书“总序”提出了一种为科幻小说所“‘习惯’的‘科幻思维方式’”,以对他所主编的这套丛书本身加以推演。他写道:“在21世纪末……将依照本书的‘模式’,出版本书的续集,即《中国科幻小说21世纪回眸》;此后的每一世纪末,……都将出版一套《中国科幻小说××世纪回眸》;这一套套《中国科幻小说××世纪回眸》不断出版下去,将构成一大套《中国科幻小说世纪回眸大系》”。
叶先生自知,这只是一种打引号的“推理”,其中并没有经得起推敲的逻辑。显然,在21世纪,这样的出版社、这一形式的纸质出版物是否还会存在?彼时已经出现的互联网与电子形态的出版物,早就为此打上了一个巨大的问号。正是此类事实情况,对上述“推理”的现实展开起到了无法忽视的“刹车”作用。
在文学中,诸如此类的“科幻逻辑”或有其特殊的感染力。当想象力驱使着从一套丛书推演到下一套丛书之时,那些本应在“科幻”视野中预计到的未来发展却被有意无意忽略了,由而描绘出的一番未来图景和与此相对的当下的历史定位,使人获得了某种想象性的满足。读者和作者也都明白,它不是严格的“推理”,而只是一种修辞。
但同样的“逻辑”或修辞,却广泛存在于社会对技术状况的把握之中。譬如,从最近有关ChatGPT代码生成能力的报道中,人们读到它们已能“通过Google的入职测试”,进而激发起有关“设计人工智能的行业本身将被人工智能取代”这一看似玄奥而又有理的论调。但事实上,从目前的模型来看,对于一个清晰定义的实际问题(如,从Word文档中提取粗体字这一相对简单的任务),模型仍然难以给出正确的解答。
在技术的实际应用中,乐观的预期并不总是能够实现,而且就算其实现,往往也晚于人们的预期。而一种与此完全相反的态度,也就是对技术发展的抗拒,很大程度上也与那些过度乐观的设想,基于相同的假定而来。
从历史视野来看,20世纪50年代以来,“什么职业会被计算机代替”“技术会抹杀艺术吗”等问题,就已随当时刚产生的控制论技术主张而出现。它们在字面上是关乎生死存亡的“大问题”,却并非真的扎根于技术的特殊性,而是围绕一系列有关“职业”“艺术”等概念的已有认识,在人工智能技术主张的刺激下呈现出的某种“自辩”。对于这些问题的回应,很大程度上,与上述“科幻逻辑”一样,达成的是一种想象性的、与技术事实无关的自我满足,亦使对技术的预期不顾其实际而在不同极端之间摆荡。
它并不能用以把握技术的现实。诚然,存在不少新的技术,可以视为0到1的突破,或1到2的创新。但这不意味着人们就一定能够接连在可预期的未来到达第三步、第四步甚至第一百步,而不受到某种“刹车机制”的阻挡。换言之,技术想象中已占据某种主导地位的“科幻逻辑”,是由对技术有限的、现象性的认识出发所作的滑坡论证,却自认为能从相关技术现实中得到辩护。
以视角主义重建技术话语的公共性
针对ChatGPT的爆火,人工智能专家杨立昆(Yann LeCun)在他关于大型语言模型的14条观点中认为,程序代码,由于其所描绘的是清晰定义的数据结构等有限知识,而非复杂的现实世界,往往能在当前的语言模型中得到不错的表现。他指出,诸如此类已取得的成效,并不意味着当前这类自回归语言模型(auto-regressive language models)就是通往更好、更有效的人工智能模型的正确路径。
但与此同时,他又强调,这是与他对自己主导研发的Galactica的辩护相一致的。后者是一款声称能“撰写科学论文”的语言模型产品,其在线试用版发布不久,即因有关制造虚假信息、提供难辨真伪的科学陈述、是否鼓励学术不端等的争议而下线。至于杨立昆与尤尔根·施密特胡勃(Jürgen Schmidhuber)之间有关若干神经网络模型的发明归属权的长期论战,更凸显了这种技术话语和评述背后的某种“名利”之争。
面临高投入、长时期、不确定回报,技术研究的实施已越来越依靠具有相当资源的企业,古往今来那些凭借灵感与勤奋而“降临”到个人头脑中的“天才”叙事已很难适用当前状况。大型语言模型的训练,即是一项“烧钱”的工作。据估计,训练一次GPT-3模型的价格在400-1000万美元左右,由此所需的其他支出更难以计算。
在此状况下,技术研究者的发言往往不被视为个人观点的流露,而是与他们所来自和服务的机构关联在一起,或面临来自后者有形无形的压力,或面临人们关于意图的质疑。当然,技术人员有理由抱怨,他们的观点被人误解,或被错误地与外部因素建立关联。但在现状已如此的情况下,技术话语所提供的解释或评论已变得相对化,可以说是一项基本事实。
在人工智能的发展越来越强调“向人类的价值看齐”之时,技术话语向公众看齐或许是在此之前第一要务。不过,径直要求技术研究者抛开成见与立场,采用一种理想化的、具有公共性或为公共利益而讲述的技术话语,多少也显得不切实际。
但这样的公共性并非完全无法达成。如果技术话语在概念上都具有一个从各自立场出发的视角,那么,通过比较、审视不同话语,辅以对这些话语得以产生的原因的考量,而对产生它们的视角加以还原,我们仍有可能从中构建出一种在相当程度上接近公共性的技术论说,此即成语所说的“兼听则明”。
此即所谓的视角主义(perspectivism)。认识到技术话语是特定立场下的一孔之见,那么对它们的“兼听”就落实为,在话语层面展开比较与分析,将技术术语和概念还原为具有历史渊源与深度的构造。同时,因为不同的技术话语毕竟共同指向技术现实,也就保证了它们具有基本限度的可比性。
对技术话语从立场出发而全面否定,同不加批判的全盘接受一样,实际都漠视了视角、话语与事实三者之间的关系。当人们能够比较准确地把握其“现实”之时,也就能进一步要求在新的技术话语中重新找到主动权。
由此得来的一种实践上的启示是,也许技术知识本身有其难以直接突破的壁垒,但停留于话语层面的辨析,至少给予了普通大众重新介入技术发生发展“现场”的权力,并从不同话语的相互比较中,抛去“科幻逻辑”的想象,从而重新接近技术的事实。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司