您当前位置: 首页 > 史林春秋
 
史林春秋
史林春秋
 
文史动态
 
书讯|中华优秀传统文化普及读…
讲座预告丨陈志坚:大禹与越人…
中国考古学泰斗严文明去世,他…
郑嘉励全新力作《考古四记:田…
 
特别关注
 
上泗山歌
书讯|中华优秀传统文化普及读…
中日茶文化传播
民国沪杭帮会关系初探——以张…
史林春秋
 
史睿谈数字人文与现代文献学研究(一)
来源: 上海书评微信公众号  作者:李丹婕  日期:2020-08-27

640.webp.jpg

史睿(章静绘)



史睿博士供职于北京大学历史学系暨中国古代史研究中心,任中古史中心图书馆馆长,主要从事隋唐史、敦煌吐鲁番文献、中古礼俗法制史等领域的研究。专业研究之外,他还拥有丰富的图书馆工作经验,始终密切关注近年来文献数字化、数据库共享等技术的发展,持续思考数字人文和现代文献学的理论与方法。近日结集出版的《春明卜邻集》一书,即收入若干相关文章,《上海书评》借此机会,请他与大家分享自己关于数字人文、文献学以及书籍史等方面的研究心得,以促进学界对相关问题的关注与讨论。


数字人文是一个近年频繁见诸媒体的话题,也算是一个极具时代意味的名词,您刚出版的新书《春明卜邻集》中,有一组文章是针对数字人文的讨论,您如何理解这个命题? 


史睿:数字人文的研究,实际上是超越具体学科之上的思考,关注并思考人文学科现代转化过程中“索引”的作用与意义。当此媒介技术迭代时期,我们面对的问题是:应该如何继承人类社会记录与管理经验、知识、智慧的方案,如何结合新旧媒体优势实现全部人类知识的安全、平滑地媒体转移,人工智能在可预见的将来能在多大程度上帮助人类超越自身智力、体力和生命的局限,完成更伟大的学术工作,以及在这个历史过程中怎样避免知识利维坦的霸权,维护人文共和体的延续。

这让我想到《引得》丛书,是洪业先生与哈佛大学燕京学社在中国开办的引得编纂处耗时二十年编制的六十四种古籍索引,对于中国现代学术的建立意义重大。这关系到一个知识管理的关键词,就是学术检索。古代学者靠大量的背诵把知识储存在自己脑子里,但当知识数量过大,超过人的记忆能力时就很难处理与重组。这时就要依靠学术共同体的工作,将之有机规划组合。只有做了索引或者做了数据库以后,才能够超越个体的有限生命和记忆承受能力,实现对更多文献的掌握与处理。这个历程的开端就是当年在燕京大学、国立北平图书馆、中法汉学研究所里开展的那些索引编纂事业,也是今天学术检索延续下去的必经之路。


索引以及一切检索工具,本质上都是揭示人类知识内在关联的认知方式,而且完全符合人类的认识习惯。彻底研究索引的原理和特性,能给我们带来极大的启示。索引揭示的知识规则,是构建新媒体时代人类知识体系的基础,也是实现知识发现新方案的基础。索引具有三种功能:学术进阶的工具、知识发现的手段和学术评价的标准。传统的检索工具,其实是人类认知思维的外在表现。

索引有两种形态,分别代表了人类的两种认知形式,即知识扩展和模式识别。知识扩展又分为两种形式,其一是单向度的知识扩展模型,就是在同一个文献内部提出某些关键词制成索引,当读者在一个段落中发现其中一个关键词,可以经由索引扩展到本书其他段落、篇章中的同一词,这是个闭合循环的知识扩展模型;其二是开放性的知识扩展,就是读者在书中发现一个关键词,通过综合索引跳转至多种文献中与之相关的关键词,从而不断向外扩展。

在这个模型之上,如果把多个知识关联序列进行叠加,我们便掌握了一个新的认知形式,就是模式识别。不是说通过一个已知的关键词去找它在文献中出现的位置,而是根据某些边际条件探索某个关键词集,即获取位于一个相关知识序列中的知识集合。比如说,我们综合利用唐代的士族世系表、科举年表(登科录)、职官年表,探索士族出身的文士通过科举途径入仕和此后的升迁途径中较之寒门子弟有何优势,甚至结合士族郡望表进一步细致分析不同地域士族的升降与科举之间的关系。模式识别是学术研究更高级的思维过程。

知识扩展和模式识别都依赖于知识系统的有序性和关联性,由此形成的知识图谱,是有关联的、有序的知识集合。这个知识集合中,所有知识点都在一个相互关联的网络体系中,不是单个的珠子,而是固定在一串项链上,我们可以知道它的定位,知道它跟其他知识之间的关联。

知识图谱正是用以实现模式识别思维功能的方案,它由多个知识本体库和多个知识模型组成,把这些知识模型进行叠加以实现模式识别功能。知识图谱的综合架构有点像生物分子模型,任何一个知识点都能够在它的分子链上找到,而每个分子链跟其他的分子链之间还有一种关联,那么我们可以通过它的颜色、大小、方向来定位它到底是哪个具体的知识。我们看单独的知识点,它是海量中一个不确定的点,但当我们把不同来源的知识进行拼合的时候,其实它就变成了一个某种七巧板拼成的固定形状,每一个单块都是不可移动的,是互相关联从而互相限定的。那么,以往所有的问题、错误,包括误解,其实都可以在这个体系中再认识。

这种知识管理方案能够让我们把传统媒体中经验、知识和智慧,平滑地移入新媒体中,实现基于规则的方案和基于统计的方案的结合,也就是基于计算机技术的和基于专业领域知识的知识管理方案的完美结合,进而辅助人类更广阔、深入地认识主观世界和客观世界。

您在关注数字人文的同时,多年来也持续在进行文献学研究和文献学的理论思考,我们知道,去年3月,国家图书馆《文献》杂志编辑部曾邀请多名北京地区文献学界的青年学者,就文献学研究的相关问题展开交流和讨论,您发言的题目是“从传统文献研究到现代文献学的转型”,请您谈谈我们今天该如何看待文献学研究这项工作?

史睿:由《文献学青年谈》直接引发的一件事,就是国家图书馆出版社南江涛发起的“青年学者说文献学”系列访谈,连载于公众号“书目文献”。这项活动向数十位不同学科背景的青年学者提出文献学理论的追问,得到参与者的热烈回应。这个追问的意义在于不断提醒大家去思考文献学的理论问题,这比得到具体回答更有意义。
当下,文献学在名义上是不存在的,无论图书分类法还是学科分类表都没有“文献学”这个类名。名之不存的现象,真实反映了我们的学术实况:文献研究无处不在,各科均有,但是通性的文献学却虚无缥缈、不着痕迹。如你所提到的那篇发言中说到的,任何学科都需要有自己明晰的研究对象、概念体系、独特的研究方法和理论,然而目前文献学恰恰缺少这样的明晰定义与分野,不同学科背景的学者对于文献学也缺乏明确的共识。

从这一事实出发,我们甚至可以说中国学术界有文献研究,但没有通性的文献学。由于文献调查和研究是学术研究的基础,普遍存在于各个学科之中,所以因应各自学科需求的分科文献学在现代学科建立之初就相应建立了。于是我们在图书分类表和科学分类表上看到很多子学科类目,例如从属于历史学的“历史文献学”,从属于文学的“古典文献学”,从属于哲学的“哲学文献学”,从属于自然科学史的“科学文献学”,等等。这些子学科的基本属性是由其上位类学科决定的,如果强行将这些子学科组合起来,也不可能构成一个独立的“文献学”,关键就在于,各科文献学并不存在超越各个所属学科属性的文献学概念体系和明晰的学科分野。

目前国内的文献研究主要面向汉文印本典籍,非印刷文献如简帛文献、写本文献被归为出土文献,非书文献如历代公私文书等归入档案类,在收藏体系和教学体系中与印本文献分野清晰,相关研究往往被排除在主流之外,汉文以外的文献更是研究不足,外国文献则极少涉及,以上类别在现有文献学教材之中也没有分量。从学科分野上看,因为文献研究需要关涉文字学、语言学,以及一般文化史知识,乃至溯及哲学义理,于是就又将这些通通纳入文献学领域,这是典型的学科对象和边界不清。

从方法上看,以版本学为例,前辈学者赵万里先生开辟了版本学的科学体系,但此后因为众所周知的原因,他本人遭受迫害,学术也少有继承,反而是琉璃厂书贾式的版本学家成了主流,主导了观风望气的版本鉴定路子,仿佛没有一辈子的经验就不能靠近,将经验神秘化,变成无法归纳、不能传授的“功夫”。惟近年艾俊川、郭立暄、李开升等中青年学者突破旧式版本学习气,上承赵万里先生,逐步建立起科学的、可传授的版本学知识体系。


从学科构造上看,传统文献研究陷入古书琐碎知识的积累,互相之间的联系非常松散,通用性、体系性的学科理论和方法严重不足,跨文化、跨文明的文献研究又处于边缘,与思想史、文化史、文明史结合的研究更是寥寥无几,即使论及这些问题也多是空疏无当的,缺乏坚实的文献学论证。

从学科之间的关系上,文献学不仅要为人文研究各领域提供处理文献的基础方法,也要为其他学科提供以文献为主要对象的研究理路和学术启发,但是目前的问题是文献研究多数只是文献研究者自己的事业,对于其他学科殊少方法论的贡献,这是文献学处于“学科鄙视链”末端的重要原因之一。

我以为,文献学应当是以研究文本在不同载体上如何生产、使用、管理、流变为主要内容,它为我们提供有关人类记录知识的基本类型与方法,研究跨载体文本转移与人类文化、文明延续之间的关系,乃至文献本身的文化价值和文明意义。“青年学者说文献学”系列访谈中有不少与谈者将文献学比作数学,既有工具性又有学科性,我非常赞成这样的比喻,但需要注意的是,数学在工具性之外有其自身意义,尤其以数论领域为其皇冠之珠,对比数学,目前我们的文献学恰恰缺少自身的理论构建。重新定义文献学,或云为文献学辩护,非常易于催生文献学的问题意识,摆脱前近代的泛滥无归的研究模式,转化为现代的有清晰研究对象、研究方法和研究理论的学科门类。以上对于文献学定义的尝试肯定是非常不成熟、不完善的,之所以敢于提出来敦请学术界讨论,正是由于文献学非常迫切需要这样的理论建设。

您提到,文献学应当是以研究文本在不同载体上如何生产、使用、管理、流变为主要内容,我们尤其注意到“载体”一词,在数字技术浪潮的推动下,我们正身处一个文献载体迭代的历程当中,对此,您认为文献学正面临哪些问题,或者是说应给予哪些回应?

史睿:文献是知识、文本和物质媒介和结合,关于思想、言说和文献之间的关系,先哲早有深刻的思辨,如希腊哲人柏拉图的太阳之喻,中国哲人庄子的轮扁斫轮之说,很明显,思想大于言说,言说又大于文献,但是人事代谢,万载悠悠,古人的文献是我们认知自身思维与知识积累仅存的遗迹,我们需要从此着手以发掘全部知识和意义。这是文献学之所以具有基础性和通用性的原因。

我们目前处于文献载体转变的时代,有人号称纸本载体已经死亡,人类已经进入电子媒体时代。身处这样的时代,人文学者一方面享受新媒体技术的便捷,另一方面又深刻忧虑知识传承的巨大断裂。2000年盛夏,国家图书馆有件喜庆大事——电子目录检索系统开通。当时紫竹厅东侧目录检索室里满满的目录卡片柜变成了“无用之物”,作为青年馆员,我曾奉命亲手把数十个卡片柜搬到偏僻的走廊里,废置不用。这是一件颇具划时代意义的行为艺术,是无知而傲慢的现代图书馆技术对于目录学基本功能“即类求书,因书究学”(章学诚《校雠通义·互著》)的否定。今天,无论哪家图书馆都难觅目录卡片柜的踪影,馆方和用户都认为电子目录可以全面取代书本目录和卡片目录。短短二十年,目录体系已被MARC标准和库房架位管理代替,读者“即类求书,因书究学”的能力也随之严重退化。面对剧烈快速的媒体更新,我不仅和书籍史大师费弗尔(Lucien Febvre)和马尔坦(Henri-Jean Martin)一样担忧纸本书籍品种的大量丢失,更担忧的是,人类的知识管理方案与认知能力的丧失,以及随之而来的历史的系统性断裂。


能看到多远的过去,就能预见多远的未来,我们倒是不用回顾太远,非常幸运地及身得见如此深刻而剧烈的变化。由此可以预见,这次更彻底的知识载体迭代历程中,人类智慧必然丢失得更多更快,对此我们必须有所警醒。我也许不是合格的图书馆员,常怀杞人之忧;乐观的数字图书馆首席专家大概坐下都有千里良驹,不惧深渊在前。

人类社会不是单向度的线性发展,得失之间的利弊需要仔细衡量。在雕版印刷快速发展之际,苏东坡曾对青年学子处于日传万纸的环境中“束书不观,游谈无根”的状态浩叹不已,我们今天何尝不是如此呢?电子媒体确实带来了文献获取的便利和平权,但是陷入信息海洋中的人类是否比以往吸收并传承了更多的知识,且因此生发出更高的智慧呢?从知识有序性的方面来看,这个答案恐怕是否定的。

传统文献的体式以及由之构成的知识管理方案至今仍具有重要意义,人类处理文献有五六千年的经验,不能在新媒体取代旧媒体的时候通通放弃,反而应该积极将这些资源加以总结,结合电子媒体的优势,将之优先转化为新时代的知识管理体系。

知识管理体系方面,中国书籍分类法的创立时代与世界其他文明比较,大致同时。除此之外,我们对于世界文明的重要贡献之一,就是曹魏时代(公元三世纪)发明的以类书总结知识的办法,特征是分类合理而精密,吸收经史子集各类文献的内容,基本知识粒度小,查询方便。在这一知识体系下,从释义扩展到相关语词、文句、篇章,可以进阶学习,实现规范控制,互相参见,根据主题可以生成各类专题汇编,极易实现知识重聚和创新,经史子集各类文献都能由类书转化,也能以类书形式管理,善莫大焉。类书开创了崭新的知识管理方式,打通了所有学科,使得人类能够快速简明地掌握全部知识的概观,并由此深入探索各个知识门类,实现知识重组和再创造。与之相似的,还有各种具有明晰分类功能的传统典籍,例如各类正史、地志、政书、目录、谱录、字书、韵书等,而且从类书到上述各种分类编纂的传统典籍之间具有明确的对应关系,类书是总纲,而其他典籍都是类书的子类。五代后蜀冯继先《春秋名号归一图》即《春秋左传》的人名索引,具备现代索引的基本特征,换句话说,中国很早就有编纂单书索引或专题索引的做法,而且一直延续到近代。


我们注意到,这两种新颖的知识管理形式都是与文献载体更新同步的,类书的出现与纸本代替简帛大致同时,索引的出现与印本代替写本大致同时,两者的叠加,使得此后的魏晋南北朝和两宋时期文化发展取得重大成果。像我一开始就谈到的,索引增加了新的知识管理形式,是建立现代学术的基础。索引以有意义的关键词为单位,其知识粒度明显比书或者是篇章这样的粒度要细腻得多。有了索引,每个学者都可以共享编纂归纳的知识,每位用户都能超越个体的经验和能力获取更为详备的文献,做更多更精深的研究。所以研究人类文化和文明的传承,我们不仅要注意文献载体和技术的发展,更要重视知识管理体系的更新。对于这个课题的研究,文献学应当发挥作用。

刻本是宋代以降的主要文献形态,长期以来文献学研究形成了基于刻印本文献为主研究思路的路径依赖,您平时也涉及大量出土写本、碑铭石刻等文献,我们该如何看待媒材和文本之间的关系,以及,这方面的思考对于文献学研究的范式更新有何意义?

史睿:文献类型无论早晚,存留多寡,都平等地作为文献学的研究对象,不能因为某种文献类型留存较多,就以偏概全,把此种文献的研究理论和方法当作通性文献学的一般范式。面对不同的文献载体,我们既要关注它的物质特性和相关工艺过程,以及由此造成的文本内容的差异,文本跨媒体传播的原理,也要承认不同载体文献的统一性和延续性。

以往的研究,主要是依据文献上留存的文本和痕迹来认知文献载体物质性与工艺过程的相关问题,其实我们可以再推进一步,直接从文献生产的物质性入手。例如写本文献的载体特性,以往主要从图片所见痕迹入手,现在需要从纸张、毛笔、写本文物,以及落笔于纸的书写过程作为研究的起点;石刻文献的载体特性以往主要从拓本图片开始,如今则可以将碑石取材、刻工下刀的制作过程作为研究起点。同理,印本书籍的载体研究也要向前推进到纸张和刻版/排印工艺过程的研究,以求破解仅凭印本痕迹无法彻底解决的问题。


写本研究、石刻研究本身就是一门综合性的研究工作,需要跨写本学、金石学、考古学、文献学等诸多领域。尤其是写本文物、石刻文物和记录它们内容的再生文献之间的关系非常重要,但当下学者往往囿于专业领域,不能融会贯通,缺乏必要的基础和正确的方法。面对写本文物和石刻文物,我们各自的专业背景既可能是提出问题、有所发明的利器,也能是遮蔽我们学术视野的障碍,这需要我们时刻自警。



感谢原文作者及发布媒体为此文付出的辛劳,如有版权或其他方面的问题,请与我们联系。本文仅供参考,不代表杭州文史网观点

相关内容
“读什么书 如何读书”来夏新:书卷多情似故人 2024-04-03
观像|邓小南:“山水”之间“阅读”天下 2024-03-14
荣新江:去邓广铭先生家拜年的往事 2024-03-13
吴宗国先生纪念专栏|邓小南:​忆念吴宗国老师 2024-02-02
戴逸 | 治史入门:我的学术生涯 2024-01-25
 
Copyright@2015 www.hangchow.org All Rights Reserved 免责声明
本网站所刊登的信息和各种专栏资料, 未经协议授权,不得使用或转载
主办单位: 杭州文史研究会  地址:杭州市政协  电话/传真:0571-85100309