- +1
评估创造力高低,只需说出10个词
原创 郭瑞东 集智俱乐部 收录于话题#复杂科学前沿202197个
导语
创造的过程,就是在原来不熟悉的事物中建立联系。这联系越出人意料,创造力就越高。由此出发,PNAS 的论文“命名不熟悉的词汇可预测创造力”,将创造力这一内涵复杂的概念,与一个简单的测试联系起来,可以看成是对创造过程这一复杂现象的自动化建模。
研究领域:创造力,认知科学,计算语言学
郭瑞东 | 作者
赵雨亭 | 审校
邓一雪 | 编辑
论文题目:
Naming unrelated words predicts creativity
论文地址:
https://www.pnas.org/content/118/25/e2022340118
创造力有两个主要的心理成分:收敛性思维和发散性思维,它们在产生创造性产出时共同发挥作用。先是尽可能地产生新的解决方案,之后再评估不同方案的好坏。前者更容易量化评估,而后者最常用的评估方法是给出一个事物的替代性用途,之后根据灵活性,所产生的不同用途类别的数目;独创性——每次使用与样本其他部分相比是多么罕见,以及流畅度——总共产生了多少用途进行评分。
但这样的评估方法,耗时长,需要多位评委做出主观评价,且没有考虑到文化差异。一个人过去的经历,会影响了测试结果,这被称为经验偏差。例如,在替代使用任务中列出砖块的用途时,砖瓦匠肯定和律师有着不同的反应,而这难以被纠正。
有一种假说认为:有创造力的人能够产生更多的不同想法。如果这是正确的,简单地命名不相关的词语,然后测量它们之间的语义距离可以作为发散性思维的客观衡量。
为了验证该假说,8914名受试者被要求说出10个在语意和用途上尽可能不一样的名词。然后估计词之间的平均语义距离;相关的词(如猫和狗)比不相关的词(如猫和顶针)有更短的距离。评估词义相似度的算法Glove,其训练集来自数百亿的网络文本。
为了保证检测的稳定性(避免拼写错误,列出了检测算法未包含的词),只选取了前7个词,之后计算两两之间的相似度,得出平均值,大部分人的得分都在65-90之间,小部分低于65的,是没有理解该任务不是要列出反义词,例如白天和黑夜,而是要列出不同领域的词。
图1. 高中低三种得分的受试者命名的词汇示例
结果发现新方法(Divergent Association Task 不相关联想任务,简称DAT)和传统的创造力检测方法的结果呈现强相关性,下图所示:
图2. DAT得分和传统创造力检测方法的相关性
该研究还发现了男性和女性在创造力上的差距并不显著,这说明该方法具有普适性,同时,受试者的国籍,只可解释其DAT得分差异的1%,进一步论证了该方法的鲁棒性。不论男女,年龄和创造力都呈现倒U型曲线,在20-30岁时创造力达到巅峰,这也符合之前研究的结论。
图3. 不同年龄段的创造力得分折线图
由此论证了采取命名不相关的词汇,可作为发散性思维的一种简单、可靠和客观的测量方法,受试者可在10秒内完成,并给出即时反馈,从而可在大人群中推广,应用于教育或招聘等场景,并可以经常测量,由此可以评估个人在不同时期的创造力水平,例如早睡早起的人是早上还是晚上创造力得分高,女性的创造力得分是不是受生理期波动。
进一步的研究,可以采用实际工作中的创新能力,作为评价标准,来衡量创造力,例如将受试者换成毕业5年内的博士生,要求他们在本学科内的专业词汇中,列出10个差异最大的,再使用相关论文训练的语意距离评估算法衡量相似度,看看是不是发表论文原创性更高的学者,其在这样的评估中得分更高,从而论证类似的方法的实用价值。或通过结合神经影像,找出和创造力高低有关的脑区。
复杂科学最新论文
集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅:
原标题:《PNAS速递:评估创造力高低,只需说出10个词》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司