Extraction of Biographical Data from "Quan Song Shi" and CBDB

 

哈佛大学IQSS访问学者、厦门大学历史学系副教授梁建国老师以“《全宋诗》人物信息提取与CBDB”为题做了访学工作汇报。

报告分为四部分:

1、《全宋诗》人物信息提取的工作底本及其整理情况;

2、《全宋诗》作者与CBDB人名ID的匹配与消歧;

3、《全宋诗》诗题的人物信息提取;

4、未来的工作设想。

报告指出,由于版权问题,完整权威的《全宋诗》的电子底本尚未获得,对该工作的开展造成一定的影响。包弼德教授表示接下来会积极争取相关方面的合作。报告还指出,基于残缺的《全宋诗》底本进行分析统计,至少有3000个诗歌作者在CBDB里尚没有建立ID,如果再加上诗题中的人物,数量会更为庞大,因此,《全宋诗》人物信息提取工作的完成将会切实扩充CBDB中的人物数据。梁老师指出,CBDB项目组在对人物信息进行提取时,积极使用python等数字技术进行批量处理,再结合文史知识进行消岐和勘误,充分体现了数字人文项目跨学科合作的特点。这项工作的开展得到了包弼德教授、项目经理王宏甦、Lex、Edith的支持和指导,加拿大麦克马斯特大学的杨云飞同学发挥自己计算机专业的优势,也参与了《全宋诗》人物信息的提取工作。对于未来的工作设想,梁老师希望能够对诗题中的社会交往类型以及地名信息进行提取。

随后,梁老师简要介绍了自己在访学期间所做的个人研究,主要是围绕北宋京畿地区洪涝治理进行资料整理和部分章节的撰写。包弼德教授和CBDB访问学者对感兴趣的问题进行了提问和热烈讨论。