宋代学术传承知识图谱

作者: 海慈 彭悦

KVision实验室

  “吾国近年之学术,如考古、历史、文艺及思想史等,以世局激荡及外缘薰习之故,咸有显著之变迁。将来所止之境,今固未敢断论。惟可一言蔽之曰:宋代学术之复兴,或新宋学之建立是已。华夏民族之文化,历数千年之演进,造极于赵宋之世,后渐衰微,终必复振。”

  ——陈寅恪《邓广铭宋史职官志考证序》

1. 介绍

  "中国历史人物资料库"(CBDB)是由美国哈佛大学发起筹建的,包含从唐朝至清朝四十余万人的传记资料库。为进一步呈现和发掘这一开放资源的价值,我们尝试应用知识图谱实现对数据的展示和查询,从CBDB中抽取宋代人物之间的学术传承关系和部分亲属关系,构建了一个示例性的本体应用,共导入70万条RDF语义数据,利用开放源码relFinder提供动态的、可视化的历史知识探索与发现。

2. 成果

  原型系统访问地址:http://dh.kvlab.org/cbdb_kg

  功能示例(旭日图可视化本体结构):

NA 

  任意多个实体间的动态关系发现:

NA

3. 方法

    "宋代学术传承知识图谱"的构造有三个步骤:本体设计、数据生成、系统实现。

本体设计

  在CBDB的关系体系中,“师生关系”类包括10种关系,“学术交往”类包括30种关系。我们结合文献资料对此进行整合,聚焦”师承关系“,并定义其包含师生关系、传承关系、指教关系。在师承关系定义的基础上,考虑到宋代文人家族治学与社会学术发展的密切关系,我们又将亲属关系引入知识图谱。

  除人物类间关系外,知识图谱中还包括人地关系,如出生地、祖籍地;地地关系即政治区域划分等。

  最终生成的知识图谱中共包括5类、39个关系,包含628,909个三元组。

数据生成

NA

  数据由关系数据库中提取并转化为RDF数据,最终以可视化方式呈现,共经历了数据存储层、抽象建模层、关联层、应用层。各部分关系呈现如上图,此处不做赘述。

系统实现

  系统嵌入开源工具RelFinder通过Sparql端口实现对RDF的查询和可视化。该工具提供了对人物、地点、关系的组合查询,以可视化的方式展示查询结果,还可对检索结果中的类、联系进行多重过滤。主要功能如下:

 

  a. 支持多对象的关系查询:

  可以利用该工具实现对任意两个或多个实例间关系的查询,检索结果将显示查询到的所有直接与间接关系。例如,检索王安石与蔡京,发现蔡卞为二者关系网络的连接点。

NA

 

   b. 支持检索结果的筛选过滤:

  利用左侧查询框下的Filter by工具栏,可以依据关系链长度(反映直接关系或间接关系)、实例类型、关系类型、连通度(反映一个关系涉及多少查询目标实例)等四个指标筛选检索结果。

NA

 

  c. 支持检索结果的高亮显示:

  在检索结果页面,圆角矩形代表实例,矩形代表属性,带箭头的线段代表实例之间的关系。用户可以根据需求,选中相应实例,高亮关系链。

NA

4. 总结展望

  目前的数据范围为CBDB数据库中的宋代人物数据,关系限于学术传承关系和亲属关系。在下一步的研发中,我们将:

进一步探索CBDB中其他学术与社会关系的本体化和语义化;

引入更多通用本体,通过复用的方式更新本体的概念和关系,使CBDB向着关联数据的方向发展;

目前RelFinder工具仍有较多局限性。我们将尝试开发适用于CBDB知识浏览和知识发现的可视化查询界面以及在此基础上的其他应用。

5.  开发团队

设计开发:杨海慈

本体设计:彭悦

后台部署:陈润文

指导教师:王军

Kvision实验室微信公众号:

NA