- +1
颜真卿把“刺史”错写成了“刾史”?这个智能平台可以判断
在5月28日开展的华东师范大学“冷门绝学”专业“新文科”建设成果发布会上,华东师范大学中国文字研究与应用中心(下简称“文字中心”)发布了“智能型中国文字数字平台”等应用成果,文字中心副教授郭瑞在现场通过平台演示回应了这个问题。
智能识别-刺字 本文图片均为华东师范大学供图(除署名外)
他用“刾”字举例,进入“智能检索中国文字数据库”,用“石刻疑难字形智能识别器”识别唐代文字中貌似“刾”的那个字,识别结果即呈现“刺”字。而进一步搜索“刺”,可以看到从秦代、两汉、魏晋南北朝、隋唐时期的石刻、抄本等多种载体上,有大量形似“刾”的文字。
“从出土文献的材料看,写成‘刾’是颜真卿时代的主流字形。且经过上溯,也可以看到这个字形的流变。”郭瑞说。
智能识别-刺字关联检索 隋唐五代
电子版“字海”,也能识别图像
“智能型中国文字数字平台”的平台建设已走过20余年,目标是将中国历代出土的实物文字材料都纳入可以运用数字化来处理和研究的范围。
相较于此前的数据库类型,文字中心的平台数据库包含的文字材料已覆盖自殷商甲骨到明清文字各种时段的各种类型:先秦部分,基本囊括目前已公布的资料;先秦以后汇集了各时段主要代表性材料。
“平台可提供覆盖整个汉字发展史的相关文字信息的定量性检索查询,堪称电子版的‘字海’。”会上,文字中心副主任刘志基说。
另外,澎湃新闻记者从华东师大了解到,“中国文字智能检索数据库”是国内目前唯一一种可全字符检索的出土文字数据库。研发团队通过海量文献用字的逐一整理,研发了完整的出土实物文字字符集标准体系,保证了数据库各种资料都处于有效的数字化处理的范围内。
此外,研究团队将图像识别工具与数据库进行结合, 降低了数据库使用者的专业知识门槛,扫除使用者不识之字就不能使用数据库检索查询的“盲点”。
发布会现场 澎湃新闻见习记者 邹佳雯 图
系统助力“古文字学”,别的领域也能用
“冷门绝学专业树德育人数字化智能助学系统”也是当天会上发布的重要成果之一。
2020年,华东师大开始招收“强基计划(古文字学)”方向学生,但对于这样讲究积累且相对艰深晦涩的学科,学习与教学难度都很大。
如今,依托系统中不同层次支撑属性的系列数据库,学生可以由浅入深地学习;另外,通过“汉字美育智能资源库”,学生可以检索如金文鸟虫书材料、瓦当材料等历史汉字中最富美饰性的种类。
郭瑞告诉记者,除了用作“强基计划(古文字学)”的助学系统,该系统对如相关历史考古哲学研究、书法艺术研究及创作、社会文创等领域的工作者也将发挥作用。
接下来,团队还将在探索提高平台搜索精度与速度、对未曾出现的古文字进行识别预测、探索单字可能出现的拓片等领域进行进一步的研究。
强基系统-考释检索
强基系统-美育库
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司