下载客户端

评估创造力高低，只需说出10个词

2021-07-01 18:38

来源：澎湃新闻·澎湃号·湃客

原创郭瑞东集智俱乐部收录于话题#复杂科学前沿202197个

导语

创造的过程，就是在原来不熟悉的事物中建立联系。这联系越出人意料，创造力就越高。由此出发，PNAS 的论文“命名不熟悉的词汇可预测创造力”，将创造力这一内涵复杂的概念，与一个简单的测试联系起来，可以看成是对创造过程这一复杂现象的自动化建模。

研究领域：创造力，认知科学，计算语言学

郭瑞东 | 作者

赵雨亭 | 审校

邓一雪 | 编辑

论文题目：

Naming unrelated words predicts creativity

论文地址：

https://www.pnas.org/content/118/25/e2022340118

创造力有两个主要的心理成分：收敛性思维和发散性思维，它们在产生创造性产出时共同发挥作用。先是尽可能地产生新的解决方案，之后再评估不同方案的好坏。前者更容易量化评估，而后者最常用的评估方法是给出一个事物的替代性用途，之后根据灵活性，所产生的不同用途类别的数目；独创性——每次使用与样本其他部分相比是多么罕见，以及流畅度——总共产生了多少用途进行评分。

但这样的评估方法，耗时长，需要多位评委做出主观评价，且没有考虑到文化差异。一个人过去的经历，会影响了测试结果，这被称为经验偏差。例如，在替代使用任务中列出砖块的用途时，砖瓦匠肯定和律师有着不同的反应，而这难以被纠正。

有一种假说认为：有创造力的人能够产生更多的不同想法。如果这是正确的，简单地命名不相关的词语，然后测量它们之间的语义距离可以作为发散性思维的客观衡量。

为了验证该假说，8914名受试者被要求说出10个在语意和用途上尽可能不一样的名词。然后估计词之间的平均语义距离；相关的词（如猫和狗）比不相关的词（如猫和顶针）有更短的距离。评估词义相似度的算法Glove，其训练集来自数百亿的网络文本。

为了保证检测的稳定性（避免拼写错误，列出了检测算法未包含的词），只选取了前7个词，之后计算两两之间的相似度，得出平均值，大部分人的得分都在65-90之间，小部分低于65的，是没有理解该任务不是要列出反义词，例如白天和黑夜，而是要列出不同领域的词。

图1. 高中低三种得分的受试者命名的词汇示例

结果发现新方法（Divergent Association Task 不相关联想任务，简称DAT）和传统的创造力检测方法的结果呈现强相关性，下图所示：

图2. DAT得分和传统创造力检测方法的相关性

该研究还发现了男性和女性在创造力上的差距并不显著，这说明该方法具有普适性，同时，受试者的国籍，只可解释其DAT得分差异的1%，进一步论证了该方法的鲁棒性。不论男女，年龄和创造力都呈现倒U型曲线，在20-30岁时创造力达到巅峰，这也符合之前研究的结论。

图3. 不同年龄段的创造力得分折线图

由此论证了采取命名不相关的词汇，可作为发散性思维的一种简单、可靠和客观的测量方法，受试者可在10秒内完成，并给出即时反馈，从而可在大人群中推广，应用于教育或招聘等场景，并可以经常测量，由此可以评估个人在不同时期的创造力水平，例如早睡早起的人是早上还是晚上创造力得分高，女性的创造力得分是不是受生理期波动。

进一步的研究，可以采用实际工作中的创新能力，作为评价标准，来衡量创造力，例如将受试者换成毕业5年内的博士生，要求他们在本学科内的专业词汇中，列出10个差异最大的，再使用相关论文训练的语意距离评估算法衡量相似度，看看是不是发表论文原创性更高的学者，其在这样的评估中得分更高，从而论证类似的方法的实用价值。或通过结合神经影像，找出和创造力高低有关的脑区。