工作論文

明代書信數字化研究的新嘗試——以哈佛大學 CSA 明代書信計劃爲例(陳士銀, 2023)

Automatic Biographical Information Extraction from Local Gazetteers with Bi-LSTM-CRF Model and BERT(LIU Zhou, WANG Hongsu, Peter Bol, 2022)

中国历代人物传记资料库(CBDB)对历史网络的结构化处理、记录与分析(傅君勱, 王宏甦, 2022)

中国历代人物传记资料库 (CBDB) 的历史、方法与未来 (包弼德, 王宏苏, 傅君勱, 陳松, 柳舟, 朱厚權, 2021)

從歷史記錄到結構化人物傳記數據: 中文材料的半自動處理方式(徐力恒, 王宏甦, 2019, 中文版徐陽譯)

知识图谱在数字人文中的应用研究(陈涛 刘炜 单蓉蓉 朱庆华, 2019)

Sentence segmentation for classical Chinese based on LSTM with radical embedding (韩旭,王宏甦,张三千,傅群超,刘军 2019)

Semi-Automating-the-Transformation-of-Chinese-Historical-Records-Into-Structured-Biographical-Data (徐力恒, 王宏甦, 2019)

人文数据库建设中人文学者何为——以《全宋文》墓志铭亲属信息提取为例(陈佩辉, 2018)

從全文到表格: 地方志職官資料的擷取( 彭維謙, 程卉, 陳詩沛, 2014)

A_regex_machine_yamangil_chen_bol.pdf

這是一篇 CBDB 計畫發表在 2012 Text as Data 研討會中的論文,講述 CBDB 發展的 Regex Machine,如何幫助了 CBDB 從大量歷史文本中擷取人物資訊、以納入 CBDB 資料庫。同樣的方法也可以幫助其他不諳電腦程式的人文學者,從文字資料中擷取需要的信息。

The Late Robert M. Hartwell "Chinese Historical Studies, Ltd." Software Project (Peter Bol, 1999)