谁是数字人文的受益者?——台湾DADH 2016数字人文会议报道

 

陈静(南京大学艺术研究院)

 

(原载微信公众号《零壹Lab》2016年12月12日稿,这次转载时曾稍作编辑。)


       2009年至今,数位典藏与数位人文国际研讨会(DADH)在台湾已经连续举办了7年。作为亚洲地区最大的数字人文大会(台湾的译法为“数位人文”),DADH一路走来,每年都能保证按时召开,并保证演讲者的多样性和演讲内容的高质量,实属不易。且不论每年的耗时耗力的会议筹备组织工作,光是募集资金这沉重的任务就已经颇让组织方费神了。因此,当大会召集人项洁教授在开场致辞回顾中强调他在这7年历程中颇有感慨,也不令人感到意外。

(台大的项洁教授)

       应该说,DADH能多年来坚持举办,也与项洁教授个人的理想主义和坚持不懈有很大关系。项老师是国立台湾大学资讯工程系特聘教授,本专业是计算机信息科学,但因为在数字人文领域沉浸已久,兼任台大数位人文研究中心主任、台湾数位人文学会主席,以至于他身上多了儒雅文人气,而无传统意义上的理工技术宅的无存在感。

       项老师思想的深刻性某种程度上,也体现在了今年DADH的主题上:“数位学者,一个新兴领域的产生?”其意义正如会议简介所说,数字人文一方面日益兴盛,从学者开展教学、研究到机构开设学系和研究所,呈现愈演愈烈的繁荣景象。而且就其内部而言,也已逐渐发展出新的研究对象、议题和研究方法,某种意义上说,新形态的人文研究和数位研究已经出现了。但是否就可以凭此断定这已经是一门被认可的学科了呢?

       就我两天的参会体会而言,数字人文在这些年的发展中确实有了进一步的渗透的趋势:向更多学科渗透、向更深层问题渗透、向年轻人渗透。但一直困惑数字人文学者的问题,依旧存在。学科边界的不稳定和体制带来的限制,仍然让投身数字洪流中的中青年学者惴惴不安、如履薄冰。如何能在已经固化的学术生态中,开辟具有生命力和影响力的新领域,形成可提供丰富营养、具有良性新陈代谢系统的小生态环境,是数字人文学者以及整个数字人文社群面临的一个严肃问题。

 

“小数据”与“网络基础设施”

       此次会议有两组发言非常有意思,一组是项洁教授带领的台大团队,他们发表了最近一年来搭建的“DocuSky”文本处理系统。另一组是美国哈佛大学讲座教授、副教务长包弼德(Peter K. Bol)和“中国历代人物传记资料库”(CBDB)的项目经理王宏甦,他们除宣讲各自的内容外,也分别强调了“网络基础设施”(cyberinfrastructure)这个概念。这两组的内容恰恰触及了近几年来在数字人文领域中普遍被关注的一个问题——数字人文该走向何处?

       在过去的20多年间,英美和中国的数字人文领域应该说,都集中力量(时间与经费)在解决基础数据的问题,而解决的方式则是通过大量的数字化、OCR和建档案库。在这个过程中,我们看到了很多很有野心的大型的数字化项目,比如美国国会图书馆的数字化计划台湾的数位典藏计划、日本的Digital Japan等等。在大陆,各个图书馆都有类似计划推出。但在花费10多年的时间和巨额金钱过后,人文学者开始习惯用数据库查找资料以后,却依然觉得这些花钱建的数据库不能满足他们的研究需要。这又该怎么办?以个体学者兴趣为导向的学术性数据库逐渐增多。但现实与理想之间的差距在于,个人学者非常迫切地需要基础性的技术支持,减低技术门槛,让他们能尽快上手。

       这或许是项洁老师团队新开发的DocuSky应运而生的原因之一。DocuSky的背后是“小数据”的概念在支撑。其表达的观念在于,数字化后数据的生成,并不意味着数字人文项目的结束,而恰恰是其开始。正是学者的参与,亲自动手参与数据的处理、挖掘,才真正让数据具有它们应有的价值。而这种价值也正是数字人文项目的价值所在。另一方面,DocuSky 会给人文学者提供一系列的工具,使得人文学者不用陷入复杂又冗长的程式编写和调试过程,可以更好地使用已有工具快捷便利地进行研究。

       但另一个层面,特别是从大视野来看,已经开发的、正在开发的和计划开发的数字项目,都不得不面对的一个问题是存储和维护。正如媒介理论家基特勒所说,软件问题归根结底还是一个关于硬件的问题。数字项目寿命的长短很大程度上取决于后期的成本,很多项目由于后期无法继续运营,使得过去辛苦建设的成果无法再被任何研究者使用和参考。包弼德教授提出为中国文史研究建立“网络基础设施”,也主要出于这一考量。包老师所说的基础网络设施,主要指支持数据获取、数据存储、数据管理、数据整合、数据挖掘、数据可视化和其他计算与信息处理服务的研究环境。这种环境由分布在因特网环境下的诸多独立机构连接而成。其实在自然科学应用方面早就有这种环境,这套方案可以解决诸如高效地连接实验室、数据、计算机和人力,以此发现全新的科学理论和知识。包老师在数字人文领域提倡这种基础设施的建设,在笔者看来,正是试图解决个体学者层面无法解决的问题,其核心依赖的正是数字人文学者和项目所在的机构的联合和共享。在硬件、资源和人员上的合作和分享,避免资源的重复建设,会是从宏观上对数字人文进行布局的重要和必要策略。CBDB作为一个基础性的项目,提出这方面的构想道出了学界共同的需求。

       应该说,这两种策略的提出不仅彰显了两位数字人文领军人物的丰富经验、敏锐观察力和广泛的影响力,也反映中文数字人文走到今天面临的一个重要时刻,更多数字人文学者的加入与数字人文社群的联合已经迫在眉睫。


(CBDB项目经理讲解API对于建设网络基础设施的重要作用)

 

数据库建制与使用

       此次DADH会议的主题演讲还邀请到了美国加州大学洛杉矶分校讲座教授Christine L. Borgman教授。作为一位出版了250项作品的学者,Borgman教授在信息科学、计算机科学和传播学领域可谓声誉卓著。此次她演讲的题目是《资料、档案、中文佛典文献学:谈数位人文之挑战》,其主旨是通过对一个中文佛典文献学的案例,在更大的语境中,探讨资料在学术传播中的角色与定位。有意思的是,她从数据(data)出发,从如何将资料处理成为档案及数据的角度,探讨了数字人文中非常基础性的一个问题:学者如何积累基础数据。事实上,在信息爆炸的今日,做人文研究的学者在感受信息浪潮的同时,也体验着数据缺失之痛。出于商业目的开发的数据库并不能完全解决人文研究的需要,那人文学者该做什么?这些“知识基础设施”的建设实际上是非常脆弱的,其背后是大量的默默付出,而这些却因为很难在体制内得到认可,使得人文学者很容易产生挫败感。

       事实上,此次会议上的发言都可以从这两方面来看,即数据库的建制和使用。一方面,学者们意识到了建设数据库的需要,纷纷在探索建立以研究为导向和目的的小型数据库,另一方面,学者们在使用数据库开展研究的过程中,反过来对数据库的发展提出了自己的看法和见解。有意思的是,这种路径选择上的不同,也体现在演讲者的年龄分布上。中青年学者们往往更愿意尝试建立数据库,而资深学者们更倾向于从使用开始。当然,这并非一定。比如很多项目都是资深教授和青年学者的团队组成,专业也有历史、文学、统计、计算机及图书馆信息科学。比如DocuSky是项洁教授领导的团队,而参与者(和主题宣讲者)都为博士后、博士、博硕士生及青年研究助理。再比如宗教医疗数字平台小组中,来自法鼓文理学院的团队也是由教授、副教授和助理教授构成。近年非常活跃的CBDB团队也是由美国、大陆、台湾的资深教授领导管理,而团队又有中外年轻学者和研究生的参与。

       就数据库的使用而言,事实上,除了利用数据库进行资料搜集、挖掘和整理外,学者们也对数据库该如何建设、向什么方向发展提出了自己的看法。比如台湾大学历史学系特聘教授、文学院院长陈弱水教授就从自己多年的经验出发,提出文献资料库还是有很大改进的,希望能将数据库建设成为更便利、功效更大的研究工具。但从这个角度出发,也引发了另一层面的思考:数字人文是否仅仅是个数据库或者工具?如果从这个角度去思考,那数字人文学者始终将成为人文研究的边缘人群,数字人文研究也将无法摆脱工具化、技术论的角色。

 

 

教与学:谁是数字人文的受益者?

       上面谈及的问题,事实上在这些年有关数字人文的教学过程中也有所体现。比如台湾清华大学的祝平次教授所指出的,清华大学在近年来已经连续举办了数字人文方面的课程及训练营,但在内容安排和学生培养方面仍存在诸多问,使得他尤其期待不同学校之间的合作。而毕业于台湾政治大学,现任教于山东大学的邱伟云博士则以个人经历及所在团队的经验分享说,数字人文的学生培养在教学和就业方面存在着断层问题,尤其是在文科和理工科的领域交叉方面,该培养懂计算机的文科学生,还是懂文科的计算机生?或者是培养两者兼具的通才?但事实上,通才更多只是一种理想状态。正如目前正在CBDB项目访问研究,但有出席这次会议的台湾政治大学计算机系的刘昭麟教授所说,计算技术虽是数字人文教的重要部分,可是不应该期待把所有人文学者都变成厉害的计算技术专家。在跨领域的计算器科学教育方面,应该考虑不同人文学者的兴趣,以传播跨领域合作的背景知识为目标。如果每一个人文学者都得自己写程序才能做数位研究,这其实是计算器科学教育的失败。

       而与会青年学者的更大困惑在于,如何依赖数字人文的成果来获得体制的认可,从而能在成果认定和职称评定上得到体现。包弼德教授对此的看法是,英美也有类似的情况,但这个一定是整个社群的事情,个体学者们凭借自身之力是不能改变整个体制的。换句话说,如果让数字人文学者都去做堂吉诃德,这对整个数字人文领域而言,都将是一条不归路,更无法吸引年轻学生们投入其中。

       尽管此次会议中不少议题是老话题,但必须指出的是,参加此次大会的大陆学者较以前会议多了不少,包括有来自上海交通大学的赵思渊、来自南京大学的王涛和陈静、来自中国美院的王平等。这也算是此次会议的新气象,意味着两岸学者在数字人文方面交流的加强。