- +1
破解伏尼契密码的怪奇探索
原创 Jillian Foley 科学艺术研究中心
耶鲁拜内克珍本及手稿图书馆对伏尼契手稿的解说视频这是一个大约有600年历史的谜团,持续困扰着学者、密码学家、物理学家和计算机科学家:一本240页左右的中世纪法典,用一种无法辨认的语言书写,画满了神秘植物、裸体女人和占星术符号的奇异手绘。它被称为伏尼契手稿,无法归类,更别说理解了。
然而,多年来源源不断的有研究人员提出了新的声明,称自己已经破解了它的秘密。
就在去年夏天,加州山麓学院的一位人类学家宣布,里面的文字是用一种晦涩的罗马速记法写的“粗俗的拉丁方言”。而在去年更早些时候,布里斯托尔大学的学者杰拉德·切西尔(Gerard Cheshire)在《罗曼语研究》(Romance Studies)期刊上发表了一篇同行评议的论文,认为这个手稿是一种他称为“原始罗曼语”的混合体。不过到目前为止,每一个关于伏尼契手稿解决方案的主张——包括去年的两个无一不被其他专家、媒体和伏尼奇契们忽视或揭穿。在切西尔的案例中,在其他专家对他的研究提出尖锐质疑后,布里斯托尔大学撤回了一份重点提到他论文的新闻稿。
约翰内斯·开普勒大学的物理学家安德烈亚斯·辛纳(Andreas Schinner)2007年曾在一篇名为《伏尼契手稿:骗局假说的证据》的论文中对它进行过统计学分析,他提到了一个谣言,认为伏尼契手稿可能是学术生涯的“纯毒药”,因为在研究手稿时,“总是让人轻易地就犯下一个荒谬的错。”
在一封电子邮件中,他写道,“学术界是一个丛林,和在任何丛林中一样,大家都装的很强势,不可以显示出潜在的弱点。“
这是一本手工制作的书(来源见水印)我们所能确定的是,这本手稿通过法医学鉴定出来的成型时间很可能要追溯到15世纪,那时的书籍都是手工制作的,不多见。但它的出处和意义尚不明确,因此几乎不可能根据其他史料证实有关其内容的任何说法。
那么,为什么有那么多学者和科学家受到驱使去解决这个难题呢?对许多人来说,这是证明他们在特定领域分析能力的终极机会。对其他人来说,这是一个检验有前途的新数字技术和人工智能进展的机会。对某些人来说,这只是一种狩猎的刺激。
手稿中的部分页面(来源:Wikimedia/Public Domain)1912年,波兰珍本书商威尔弗里德·伏尼契(Wilfrid Voynich)获得了这份手稿。它的装订方式更像一本现代的书而不是一本卷轴,里面充满了精心编排的循环手写文本,并带有奢华的插图。
这一发现并没有让伏尼契赚到大钱,但手稿却在一百多年里持续占据头条新闻,对语言学、植物学和机器学习等多个领域的研究人员提出了挑战。它现在珍藏于耶鲁大学拜内克珍本及手稿图书馆。
起初,它吸引的主要是人文学者。1921年,对密码学很感兴趣的宾夕法尼亚大学哲学家威廉·纽伯德(William Newbold)声称,这是一位13世纪修士写的科学论文。他认为,每一个神秘的字母实际上都是在适当放大率下可读的微小符号集合,这意味着显微镜的发明比我们想象的要早几个世纪。纽伯德死后,美国文学教授兼密码破译者约翰·曼利(John Manly)反驳了纽伯德的理论,表明他的方法过于武断,在科学上不靠谱。
两位现代密码破译的奠基人威廉和伊丽莎白·弗里德曼(William and Elizebeth Friedman),继续在手稿中应用破译技术。尽管他们研究过许多其他文本,并在两次世界大战期间都被招募来破解信息,但两人始终未能找到解决伏尼契手稿的方法。第一次世界大战期间,弗里德曼一家还不得不进行手动计算,但在随后几十年里,IBM的穿孔卡片制表机使计算速度大大加快。20世纪50年代,威廉与刚刚成立的美国国家安全局展开协作,他和其他密码破译者对这本中世纪的手稿产生了兴趣(国安局的内部图书馆里甚至有一个拷贝)。因为手稿是非机密的,冷战时期的密码破译者可以用它来向同事们演示尖端的计算分析技术,而不使用真正苏联信息。
近些年的伏尼契研究也严重依赖于计算机分析,尽管也掺入了其他复杂精巧的工具。利萨·费金·戴维斯(Lisa Fagin Davis)是一位中世纪学者,她从20世纪90年代就开始关注伏尼契手稿的研究,她说,“计算机算力的惊人进展”也帮助揭穿了不少所谓的破解,“我们有一种方法来分析和批判那些以老练纯熟且几乎无可辩驳的方式发表的解决方案。”
这些神秘的插图也吸引了一些研究者。植物学家亚瑟·塔克(Arthur Tucker)自2013年起就宣称伏尼契手稿中的植物原产于16世纪的美洲。在最近的一封电子邮件中,他说,他对每一幅植物插图的非计算性解释激起很多科学家的愤怒,他摈弃了他们那种专注于数据的方法,认为是“循环推理”。但无论是植物学家还是数据科学家也都不受欢迎他的理论。
对于安德烈亚斯·辛纳来说,他是被其他科学家的尝试吸引来的,“也许我只是想知道我是否能做得更好。”
2007年,他利用从数学理论中提取的“随机游走映射”来分析字符串,提出伏尼契文本是由一个潜在随机过程生成的——就像雨滴下落的频率一样——而不是一种有结构的自然语言。他在2019年与人合著的第二篇论文详细阐述了这一理论,提出了一种可能的文本生成算法,简单到中世纪的抄写员就可以用来搞一场骗局。他们的研究支持的似乎是关于这些手稿毫无意义的观点。而最近的其他研究与辛纳的结论却不一致。2013年,巴西和德国的一组科学家做的统计分析认为:文本很可能是用一种语言写成的,而不是随机生成的。2016年,阿尔伯塔大学计算机科学家格雷格·康德拉克(Greg Kondrak)和他的学生布拉德利·豪尔(Bradley Hauer)利用一种机器学习算法,对其中同一块文本的380种翻译进行了训练,他们提出这些内容是用一种奇怪手写体写成的杂驳希伯来语。
与此同时,一位土耳其工程师和他的儿子提出,这段文字是中世纪土耳其方言的拼音,并计划在2020年发表一篇关于他们这一发现的论文。去年11月还有一篇统计论文,描述了如何通过对手稿中字母的视觉分析识别出其中的模式,这些模式似乎与其他书面字母表相似。
中世纪学者戴维斯说:“每个人都想证明它,破解它,以证明自己的能力,证明自己更聪明。”。她还补充提到了一个问题,对于一本复杂的中世纪手稿,研究者们“几乎没有人能理解手稿的所有不同组成部分”,不仅是插图,还包括装订、墨水和手写文字。“这需要一个跨学科的团队。”
手稿中的部分页面 来源于网路她把由切西尔语言分析论文所引发的争论作为学术出版局限性的一个例子。虽然他的论文是同行评议的一般被认为是学术严谨的黄金标准。评论者很可能是罗曼语方面的专家,因为这篇论文发表在一份罗曼语研究期刊上。但同行评议通常也是一个不透明的过程,即使是对于远不如600年历史手稿那么晦涩难懂的主题,也一样不透明。而切西尔对自己的工作仍然充满信心,他把自己和其他想破译代码的人区分开来:他是对的,他们是错的。
“很简单,真的。”他说。
对于其他伏尼契手稿的研究人员而言,重要的一点在于你在研究过程中学到了什么。过去五年里,涵盖计算语言学、物理学、计算机科学和密码学各个领域的期刊都发表过伏尼契有关论文,其中一些后来被推翻了,但其他的许多则提出了分析文本的新方法,而非一个明确的解决方案。后一种情况下,目标可能主要是展示可应用于其他领域的新工具。举例来说,人工智能算法在得到广泛应用之前,往往需要大量数据集进行训练和测试,而对伏尼契手稿的分析,可以帮助物理学家和其他科学家测试新的数字运算方法是否能够在大量抽象数据中识别出有意义的模式。
2013年《巴西物理学》上的论文使用伏尼契手稿来说明如何用统计物理来发现隐藏的语言模式。康德拉克和豪尔的机器学习论文主要集中在描述他们的语言分析算法,来检测希伯来语作为手稿基层语言的可能性。即使这两种理论都没有被接受为解决方案,它们仍可能在其他领域被证明是有效的。
威尔弗里德·伏尼契在伦敦的苏豪广场看书(图片来源:Public Domain)正如辛纳所说,“你永远不知道当你运用这种或那种方法时会发生什么”,因为手稿的内容仍然是未知的。而康德拉克则相信,研究人员通过反复试验学到的任何东西,都可以帮助他们“开发出以后可用于实际问题的技术”。
也许到头来,手稿都只会是一个无法解决的谜。芝加哥大学的科学史学家罗伯特·理查兹(Robert Richards)用它来作为案例讲述科学范式的概念,当一种科学理论对研究领域产生的影响太大时,科学家就往往无法解释或识别理论之外的异常现象。
理查兹将伏尼契文本比作2016年科幻电影《降临》中登陆地球的外星人所使用的难以捉摸的语言:我们甚至根本不确定它是否真的是语言,因为它远远超出了我们的语言范式。尽管它看起来有意义,但“只有在能把它翻译成我们的语言之后,才能确信这一点。”
但谁知道呢,他说:“毕竟,这可能只是一个中世纪的胡搞恶作剧。”
原文链接
https://undark.org/2020/02/12/decoding-bizarre-voynich-manuscript
译文略有改动
ABOUT.
科学艺术研究中心是一家非营利机构,以“跨界促生变革”为核心,致力于打造国内首家科学艺术家们的研究与创新平台,来促进不同学科领域间的高度交叉融合。科学艺术研究中心集创作与传播为一体,推动科学知识的大众普及。
原标题:《破解伏尼契密码的怪奇探索》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2025 上海东方报业有限公司