合作機構
北美中國研究圖書館員明代人物資料數據工作小組(簡稱:北美圖書館員小組)
北美圖書館員小組主要負責CBDB明代人物資料數據挖掘的基礎建設工作,其中包括:
- 整理、準備和提供適於做人物數據挖掘的數字化版原始資料
- 全面、系統地建構明代官制樹狀圖以及與其上每一官署相對應的職官表
- 借助現代信息技術、建立眾包(crowdsourcing)系統,誠邀全球明代研究專家學者集思廣益,在賀凱(Charles O. Hucker)的《中國古代官名辭典》(A Dictionary of Official Titles in Imperial China)之基礎上,整理、編輯、出版優化完善的網絡免費版中英雙語《明代官名辭典》
北美圖書館員小組共有四名成員外加三名明代專家顧問組成, 分別是:
- 馬小鶴 哈佛燕京圖書館
- 薛昭彗 斯坦佛大學東亞圖書館
- 薛燕 加大伯克利東亞圖書館
- 張穎 加大爾灣分校(項目主持)
- 何義壯 (Martin Heijdra) 普林斯頓大學(項目專家顧問)
- 倪清茂 Thomas Nimick, 西點軍校 (項目專家顧問)
- 高壽仙, 北京行政學院 (項目專家顧問)
張穎的北美圖書館員小組在此項目下編輯的明代職官中英辭典 Chinese-English Dictionary of Ming Government Official Titles 下載鏈接如下:
https://escholarship.org/uc/item/2bz3v185
數據挖掘:自動提取中文文獻
中文文獻數據自動提取項目致力於向人文社科學者提供一種嶄新的技術,將流傳兩千多年的中文文獻一舉轉為結構化的數據。該項目將開發一個開源平台(Markus),向用戶提供精密的文獻挖掘技術用於處理各種史料及文學作品。用戶可以標記並提取人名、地名、時間、官名、任職地點、親屬等各種社會關係,以及其他內容。該平台的測試材料包括:跨度長達八百年的兩千餘部地方志,七到十三世紀間的約兩萬封信件以及五百部筆記。從測試材料中摘取的數據將用於拓展數據挖掘應用,並與線上開源資料庫中開放。
該項目的研究團隊来自多个大学,包括美國哈佛大學、英國伯明翰大學、台灣國立大學以及荷蘭萊頓大學魏希德(Hilde de Weerdt)教授領導的交流與帝國團隊。
哈佛大學的團隊即中國歷代人物傳記資料庫項目(CDBD),負責從中國人物傳記資料庫中抽取、清理
關於數據挖掘:自動提取中文文獻的更多信息,請看這裡。
MARKUS平台在這裡。
明清婦女著作
明清婦女著作數字化項目為麥吉爾大學與哈佛燕京學社的合作成果。該項目始於2003年,由專治中國古典詩詞與明清婦女著作的方秀潔教授主持,並由麥吉爾大學的數字化團隊協助,該團隊的領導為麥吉爾大學圖書館數位典藏項目前主任David McKnight教授(現任職於賓州大學)。
該項目由兩部分組成。第一部分計劃將哈佛燕京圖書館所藏全部明清婦女著作(共94種)數字化。最近的研究表明,印刷業與婦女的文學造詣在明清時期都達到了空前的水平。然而由於傳統中國對婦女的偏見,婦女作品常被忽視、邊緣化,乃至佚失;留存至今的作品則大多藏於中國主要圖書館的善本室,難以利用。該項目旨在將這些作品公諸於眾,以期有助於中國研究中晚近新興的一支──婦女歷史與文化的相關研究──之進行。
本項目的第二部分計劃由麥吉爾團隊執行,旨在建設一個可搜索的資料庫以提升這批資料的研究價值。其成果,明清婦女著作網站,於2005年夏上線。該資料庫包含五千多位女詩人及作家、一萬多首女詩人的作品,兩萬多份原始文件的掃描檔,及其他相關資料。該資料庫可以各種變項查詢,包括作者、詩詞名、詩詞形式、社會地位、地區等,有中文及漢語拼音。
中國歷代人物傳記資料庫與明清婦女著作在以下兩方面合作:第一,中國歷代人物傳記資料庫將納入明清婦女著作的資料,並為明清婦女著作資料庫中的所有人物建立一組永久ID。第二,兩計畫將建立系統互通性,以方便使用者查詢。
蘇黎世大學(University of Zurich)
China and the West: 1245-2000: Database hosted by the East Asia Seminar, University of Zuric
本計畫的涵蓋範圍為任何以文化、知識或宗教形式呈現的中國與西方的聯絡與交流資訊,主要包括傳教史、漢學史、遊記、使節紀錄、德文文學、哲學、藝術,與科學史。
"China and the West"計劃與中國歷代人物傳記資料庫在以下方面進行合作:
- 促進學術交流、增加現有資料庫之間的系統互通性,特別是CBDB與CWDB中的傳記資料;
- 合作翻譯CWDB資料庫之資料,側重於二手資料,但不排除一手資料;
- 建立 retrosinification領域內共同的研究活動,亦即增加 CWDB中各人物的姓名字號、居住地等;
- 提倡類似研究活動,使歐洲傳記資料庫包含 CWDB之內容;
- 互相支持發展有助於實現上述目標的學術活動。
個人提供之資料
中國歷代人物傳記資料庫亦歡迎個人以正式協議抑或非正式方式分享人物傳記資料。獲資料分享者允許之前提下,中國歷代人物傳記資料庫將透過同行評議流程發佈這些資料。當來自合作者資料可線上訪問,中國歷代人物傳記資料庫會與資料分享者建立機制使項目之間資料具備互操作性。
CHEN Yiyun 陳逸雲
https://sou-yun.cn/ https://cnkgraph.com/
搜韻網是陳逸雲先生的項目。該項目共收錄約110萬首古今詩詞作品,且集詩詞資料類平臺與詩詞工具類平臺於一體。對此項目感興趣之學者可透過「知识图谱cnkgraph 」網站及微信公眾號獲悉項目最新資訊及下載資料方式。
ZOU Jiajun 鄒嘉俊
https://scholarblogs.emory.edu/jiajunzou/
鄒嘉俊博士研究生正在領導一個基於科舉錄的明代科舉資料研究與可視化項目。當前該項目已收錄 33,000 位明代舉人。
Grace FONG 方秀潔
https://digital.library.mcgill.ca/mingqing/english/index.php
方秀潔教授是明清婦女著作項目的主任。隨着 2022 年 12 月更新,明清婦女著作項目已收集來自 7 個參與圖書館的 426 位婦女詩歌和其他著作。用戶可以搜索、瀏覽和閱讀共計 71,524 頁掃描書影。該數據庫當前收錄了 5240 位女性詩人與作家以及 2475 位男性。
請點選左欄參看更多資訊。