从CBDB到TBDB:张素玢教授讲座纪要

张素玢

国立台湾师范大学

From CBDB to TBDB:Using the New Edition of Changhua Gazetteer as a Starting Point

Su-bing Chang

National Taiwan Normal University

 

PDF SLIDES          MP3 AUDIO RECORDING

 

2018年10月19日,哈佛大学费正清中心(Harvard Fairbank Center)访问学者、国立台湾师范大学教授、“台湾历史人物传记资料库”(TBDB,Taiwan Biographical Database)项目组主要成员的张素玢教授向“中国历代人物传记资料库”(CBDB)项目成员举办了题为“从CBDB到TBDB——以新修彰化县志为起点”的讲座。

20181019-0_lecture_image

 

TBDB的缘起

张教授首先介绍了TBDB项目的起源与发展。该项目是受到CBDB的启发,旨在建立一个囊括台湾古代和近现代历史人物的资料库并为使用者提供与之相关的分析工具和分析结果,以期能够通过这些资料,利用人物传记、社会网络分析(Social Network Analysis,SNA)、地理信息系统(Geographical Information System,GIS)等分析方法进一步还原台湾历史。出于资料来源和构建目的的差异,TBDB与CBDB主要具有以下不同之处:

 

 

CBDB

TBDB

时间

20世纪以前,8-15世纪为主(宋明资料尤多)

16世纪以后(重心在20世纪前后)

人物民族

汉族为主

汉族、台湾土著居民、外国人

社会流动

固着化

活泼化

社会阶层

官宦士人

士农工商、各行各业

资料来源

传记资料索引、正史列传、墓志铭、文学作品、书信、官方文书、其他资料库

史料、档案、志书、报纸、日记、书信、照片、私人文书、族谱、证书、户籍资料、人物鉴等

 

 

 

TBDB项目组始建于2016年8月,最初的核心成员包括5位历史学者和2位计算机技术人员。因台湾彰化县自清代以来,无论是在农业生产还是人口数量方面,都在台湾具有重要的地位,且项目组的主要成员同时也参与了新版彰化县志的纂修工作、对其资料来源和载录的历史人物有较为深入的了解,而彰化县志规范统一的文本结构也便于对其内容的电子化处理,因此TBDB决定从彰化县志中记录的历史人物开始,探索并构建其人物传记资料库,目前已经从中提取887位历史人物的资料。

 

TBDB的构建

在与会者对TBDB有了一个概括的认识之后,张素玢教授对TBDB的构建过程进行了介绍,并辅以具体示例进行演示说明。

由于TBDB着重于台湾历史人物资料,因此其原始资料主要源于以下几类:

  1. 地方志:如《彰化县志》;
  2. 现有台湾官职资料库:
    台湾总督府职员录系统(1896-1944);
    中华民国政府官职资料库(1911-);
  3. 人物名录传记:
    《台湾总督府职员录》、《台湾士商名鉴》、《台湾商工人名录》、《台湾实业名鉴》、《台湾名人传》、《台湾风云人物》、《台湾时人志》、《台湾医师名鉴》等;
  4. 公文档案:
    《台湾总督府公文类纂》、《台湾总督府专卖局档案》;
  5. 报刊:
    《府报》、《台湾日日新报》等;
  6. 日本时代台湾旧户籍簿:
    一般人民的基本资料,包括生卒年、婚姻、家族、住址、迁移、犯罪记录等。

 

TBDB系统的工作流程包括基础数据的录入、数据处理和终端服务输出三个层面。首先,是将基础文本数据电子化并规范化地录入数据库;其次,在数据处理层,对录入文本进行整理编码,然后使用SNA、GIS等工具对文本数据内容进行分析并将分析结果输出;最后,在终端服务层上,使用者可以通过检索系统对人物和文本进行检索,并且可以使用终端提供的分析工具,直接获得通过SNA、GIS等分析获得的结果。

20181019-1_fig1_workflow

 

TBDB系统的结构流程图

 

以在台湾近代史上曾经非常具有影响力的辜显荣(1866-1937)为例。辜显荣被昭和天皇敕选为贵族院议员,为台籍第一人,一度获得盐、鸦片、烟草的经销特权,曾担任过段祺瑞的顾问、并协助蒋介石镇压了1933年的闽变。对辜显荣进行社会网络分析,得到以下结果。可以看到与辜显荣社会关系较密切的人,包括亲属(辜岳甫、辜京生等)、具有政治交往关系的人(段祺瑞、蒋介石等)等,以及这些人与辜显荣之间社会联系的相对密切程度。

20181019-2_fig2_social-net

除了对人物个体进行分析,TBDB还可以利用其数据,从更宏观的层面上,对大量人物、社会团体及其之间的联系、中心性、接近性、中间性等关系、空间分布等进行分析研究。

20181019-3_fig3_social_groups

诗社、地点及参与者的关系

20181019-2_fig2_social-net-between

人际社会网络

20181019-4_fig4_social_groups_degree

中心性分析

20181019-fig5_spatial

人物地理分布

 

TBDB的未来

在讲座最后的部分,张素玢教授基于目前TBDB的进展和从CBDB借鉴到的经验,对TBDB的未来进行了展望,提出下一步TBDB的建设发展主要在以下四个方面:

  • 提高工具的质量。目前TBDB数据库还没有完全上线、投入使用,其所提供的分析工具还存在不足,部分功能和分析结果的展示有待提高;
  • 目前TBDB里主要是《彰化县志》的资料,与“台湾历史人物传记资料库”的目标还有一定距离,需要扩展数据库内容,充分利用其它地方志、历史人物辞典、人物日记等资料;
  • 应用人脸识别技术来深入发掘老照片中蕴含的信息;
  • 通过API与其他平台连接,增加平台间数据资料的联通流动性。

(纪要整理人 袁钰莹 哈佛大学地理分析中心访问学者)