人文学科社会网络分析与社区发现

 CBDB Seminar

 December, 20, 2019

 

2019年12月20日中午12点,哈佛大学CBDB小组开展了讨论班。本次讨论班题目是人文学科社会网络分析与社区发现,由上海交通大学图书馆馆平台与技术支撑部主、燕京图书馆数字人文办公室访问馆员施晓华博士主讲。其主要研究方向为数字图书馆、机器学习方法、社会网络社区发现和计算机智能技术。

社会网络分析方法在国际上已经有了许多重要的理论与应用研究,产生了许多重要的成果,但在目前社会科学研究方面还有很大的开拓空间。本次报告中,施博士系统地介绍了网络分析的基本概念、发展历史、度量方法、主要工具及其在社会人文数据分析中的应用。在数字人文领域进行社会网络分析可以为人文科学中各种社会关系提供精确的量化分析,从而为构建理论模型和验证命题提供社会化例证,挖掘出更多隐含的社会关系和变化趋势。利用网络分析技术对人文特色资源进行分析和建模,关注的焦点是节点的获取与处理,关系和关系的模式确定,采用的方式和方法从概念上有别于传统的统计分析和数据处理方法,是数字人文技术在数字化资源应用和挖掘上的一种新的尝试。

施博士面对听众大多是人文社科背景,没有进行公式的推导演算,而是图文并茂、深入浅出地介绍了网络分析在人文学科领域(包括文学、历史等)的一些经典应用和案例;系统性介绍了数据预处理、量化分析、机器学习方法、用户画像及可视化所需要的技术和软件工具。

讲座的第二部分,主要介绍了社区发现技术,如何从一个复杂网络中自动发现有统计意义的社区。第三部分重点讲应用实践,介绍了其情报学文献合作网络、徽州契约文书网络的研究成果,并基于CBDB人物社交关系网络进行实验与共同分析

在报告中,施博士还介绍了上海交通大学在数字人文领域所做的重要工作。

在最后的总结中,施博士认为,数字人文具有显著的跨学科性,其目的是要超越一般人文计算的范畴,将计算机智能(人工智能)技术进行交叉、集成应用。同时,对于DH学生提出了三点建议:(1)学会SQL语言,跳出文本处理(Excel)的限制;(2)学习概率分布,会有好的数据模型,论文更精彩;(3)尝试掌握机器学习等AI的一些思路和方法。

数字人文是一种方法,它可以为传统的人文学科提供新的研究范式与新的学术视角;人文学科研究的需求与发展,才能有效发挥其主体性与能动性,用于观察、反思与评判技术手段成效。

报告结束后,CBDB小组成员、以及IQSS的多位师生纷纷提问,对施博士的报告表示出强烈兴趣,讨论热烈。报告会历时90分钟,在大家的掌声中顺利结束。

shi

Writer: Li Bin

Editor: Liu Yunou