以个人学习经历浅谈当代佛教文献
作为佛学院学僧的我们,其获取佛教知识的方式除了通过传统的经论本文之外,当代的学术研究也是一种方式。且不管是传统的诵读经论还是学术研究方式,都会与各种经典文献打交道。
首先是作为宗教人的我们,经典的作用更多在于其读诵与供奉的意义。那么其经典内容的准确性是我们较为看重的一个参考指标。所以,我们通常会选择具有一定体量和制作检验的印经机构所流通的经典,如南京的金陵刻经处。这样才能在大规模流通的情况下,保持较高的文本准确性。
而通过学术研究模式来学习佛教这种方式,我们选择佛教文献的参考维度便增加了许多,如文献的版本差异、文献的年代顺序等等。因为历史中文献也存在迭代与层累,所以严格意义上,并没有一个绝对的“最好版本”,每个现存的文献都有他所承载的历史价值,都是可以被我们所使用和参考的。
本文通过自己在佛学院学习的经历,将使用和参考文献的具体情况进行一个简单的叙述,并对当代佛教文献存在的问题与未来展望进行讨论。
一、图册可作为文献的意义
在这学期的汉文佛教文献课上,方老师与我们讨论了“文献”的定义是什么。在课堂上,大家都畅谈了自己对于“文献”定义的看法,我也结合自己的学习经历进行一个“补充”。
本人在本科二年级阶段,开始自学佛教艺术史相关的内容。而佛教艺术史作为美术史的分支,对于历史图像的呈现是十分重视的。所以,在学习过程中,往往接触到最多的是通过照片记录的艺术图像,这些图像在拍照技术被发明之后被开始用于记录。这也是我认为照片、图册是可以被定义为“文献”的一点。而对于美术史来说,历史中所留存的美术图像,是需要用一种非文字媒介来进行记录与保存的。往往文字的描述是无法精确的传达出艺术图像的特点。甚至在某些方面,因为佛教艺术的空间特殊性,甚至照片这种形式的记录方式都无法将其全貌进行展现。
所以,个人认为图片以及图册是可以作为文献来参考的,而且图片的范畴也不仅仅只是实体性的图片,电子文件一样也可以被视为“文献”。虽然很多人认为作为电子文件的存在,其保存的可靠性是不如实体如纸质的。但是,其实我反而认为电子文件的图片文献具有更加的保存时间,其易复制性与稳定性以及快速传播性,是实体文献无法比例的。
此外,除了对于佛教艺术通过照片等这种平面方式进行记录以外。已当下的科技能力,是能够进行如3D扫描建立立体模型作为档案文件保存的。甚至如敦煌研究院使用VR技术对洞窟进行全景扫描的方式,也值的被重视和推广。不过这种方式更多的被称之为“数字化”保护,而非作为一种“文献”来进行看待。
因此,相较于纯文本文献能够进行有效且科学的数字化和结构组织,使其检索性等功能大大提升。而作为有着雕塑、壁画、浮雕等众多表现形式的艺术类文献,如何将其组织成一个文献库,并满足检索查询等基础功能,仍然是一件值得思考的事。
二、电子佛典的检索功能
关于电子佛典文献库的检索功能,这里以普遍最常用的CBeta为例,对其检索功能进行一个讨论。
###(一)常规检索功能
在本科毕业论文的写作期间,本人的选题是关于“带翼飞天”与“迦陵频伽”图像方向的内容。但是,如果只是单纯的从图像角度进行研究,也失去了我们作为宗教人的意义。所以,一开始我的想法是,在经典文献中,是否有关于“带翼飞天”和“迦陵频伽”形像的描述,然后将其与遗存的图像进行对比,试图找到相关的联系。
首先,我先使用“飞天”一词在Cbeta中进行检索。如果使用的是CBeta客户端来检索的话,其检索结果是无法按照如时代、译者之类的顺序进行排列的,只有在使用其网络版Cbeta时进行检索才具备这个功能。最后在现存经典中,找到了最早记载“飞天”一词的经典是西晋僧人竺法护所译的《普曜经》:
天王知心,飞天奉刀来,帝释受发则成沙门 。
通过联系这段经文的上下文,可以得知其经文大意:悉达多太子逾城之后来到森林中,欲剃发出家,此时帝释天领会了悉达多太子此时的发愿,飞至太子面前呈上剃刀,帮助太子完成剃发成为沙门。我们便可以推测出在这段经典中所出现的“飞天”一词,在此语境中可以有两种解释:一是作名词用,可以理解为帝释天所遣的眷属,为太子送来刀。二是作动词用,可以理解为帝释天(或眷属)从天上飞至太子前送刀。
然后再按照时间顺序,较《普曜经》稍晚由东晋僧人帛尸梨蜜多羅所译的《佛说灌顶经》中所出现的“飞天”:
飞天仙人以为庄严。众伎鼓乐铃钟之音。歌咏赞叹用为哀乐 。
在这部经典中首次出现了“飞天”与音乐以及庄严功能存在关联的记录。如果继续按照时间顺序往后看,其译出的经典中所出现的“飞天”一词,都与此段经典中所代表的含义并无太大差别了。但是,关于“飞天”一词的检索并没有结束,在整个检索结果中可以发现其实“飞天”一词的出现频率并不是很高,也才178处结果。显然,在古代文献中,负责歌舞伎乐职能的不仅仅是“飞天”。于是,通过使用相近词“诸天”、“天人”等也经常被使用。
(二)可视化功能的缺失
这时,电子佛典的一个功能缺失便显现出来了,那就是将检索整个文献库中某个关键词的出现频率,然后通过可视化的图表导出功能,使得检索结果更加直观。而目前只能手动进行统计与分析,这便存在人为误差与纰漏。
如这学期在学习阿毗达摩课程的时候,我们在做关于“数息观”的学习时,发现其有很多种相近翻译:安般念、安那般那念、数息、持息……但是我们要将其检索结果手工统计,并制作成如下表格:
(img)
这使得整个学习过程中,处理数据的耗时占了非常大的比重。所以本人认为这是电子佛教所应该具备的一个功能。通过预置算法与函数公式,将检索得到的结果,进行各种维度的展现,这样可以从更多角度来对经典文献进行学习和研究。
(三)高级检索功能的完善
在进行完对于“飞天”以及相关词义相关的检索工作之后,便继续检索关于“飞天”与“带翼”之间的联系。同样是使用CBeta进行检索,在系统中已经提前设置了通配符如“+”、“-”、“&”等,通过这些通配符规则,可以进行多个关键词的联合搜索,如相近、排除、或者等方式。除了上述的高级检索功能以外,在CBeta的网页版,可以更进一步定义其搜索规则,如间隔词数量等。以上的高级检索功能对于文献检索便已经可以满足需求了。
这也是相较于实体文献,提升检索效率的地方。
三、引入人工智能对于佛教文献的意义
在当下如果说什么技术是最火热、最前沿的,那么人工智能是可以排上号。而如果将人工智能引入到佛教文献中,在技术力的加持之下,或许可以使得佛教文献在某些方面超越传统检索方式。以下是我对于人工智慧在文本方面上运用的观察,以及引入佛教文献之后的利弊进行的思考与讨论。
###(一) 文本分析
因为人工智能极强的学习能力,本人认为可以通过使人工智慧学习古代汉语,并通过大量文本进行训练,强化其古代汉语阅读理解能力。再将其引入到佛教文献中,扫描词语,分析全文。
举一个例子,如通过学习某一位翻译家所翻译经典中所使用的词语以及翻译习惯,将其建立各自模型。而这些模型就可以被用来做很多事情,可以通过分析佚名经典中语言的使用习惯,比对模型来进行一个猜测与推理。或者是对于敦煌藏经洞文献的校录,可以通过人工智能的识别以及现有模型,将校录效率大大提升。
但是,即使在引入了人工智能,依然需要留有人工方式进行抽样核查并即是更正,不能盲目迷信人工智能的准确性。
(二)词义联想
在上文中,对Cbeta的高级检索功能进行了说明,虽然目前的高级检索功能以及能满足绝大部分检索需求了。但是如果对于一些想要查询的模糊概念与定义,这些高级规则便显得乏力。
同样,在基于人工智慧对于佛教经典强大文本分析的情况下,对于词义的把握便变得简单。这样,在遇到某些模糊概念需要查询时,通过人工智慧的词义联想与算法推荐,可以将检索精度逐渐缩小。
并且,如现在最流行的ChatGPT人工智能,它是通过对话这种方式来完成如搜索、写代码、概括文本等功能。那么如果以后的佛教文献检索功能可以异化出一个类似聊天机器人的存在,使用自然语言通过对话的方式来获取相关内容,便可以使得其佛教文献的使用门槛能得到进一步的降低。
(三)句读
这个功能其实已经部分被引入到Cbeta当中了。
在很多年前,给古文标点断句还被认为是电脑无法很好完成的任务,当时的自动标点算法错误率很高,并不具有实用价值。但是在现在,这个情况有了非常显著的改善。站在佛教文献整理的角度,本人认为人工智能所发挥的作用尚处于人机协作活动的范围,能够替代很多具有重复性质的标准化任务,比如录文、标点断句、专有名词标引。这些任务的训练数据也相对容易获得。对于那些不容易进行标准化、具有个人特色的创造性任务,比如专业领域的语言翻译,只要准备好充分的标注数据,人工智能也具有一定潜力。让使得人工智能得以发挥作用,必须依赖庞大的数据集用于迭代训练,同时也需要一个持续性的长期项目,成为其用武之地,否则人工智能只是一个精巧别致的玩偶。大藏经的整理正是人工智能的用武之地。
虽然使得整个整理工作具备了高效率,但是依然以目前的人工智能项目对于佛教文献的学习能力与进度,使其能完全交付并信任依然持观望态度。
以个人经历来举例,在本科学习《俱舍论》的时候,在新版本数据库的CBeta中,其《俱舍论》便已经通过人工智慧进行了句读。但是在我们学习的过程中,发现其句读与法师所讲的版本存在非常大的出入。而教授我们俱舍论的法师,又在国外学习梵语的基础,所以他对于梵文本《俱舍论》以及汉译《俱舍论》之间关联的把握是非常深刻的,这也是人工智能在当下所欠缺的。
不过,如果这个项目能够持续地推进下去,通过人工智能强大的学习能力。在以藏经中数量庞大的文本作为样本,只需要充足的时间,人工智慧必然会进化成为可靠的佛教文献的整理工具。
四、总结
以上便是本人通过自己在学习佛法的过程中,对于佛教文献尤其以Cbeta之类的电子佛典在使用过程中所产生的思考与讨论。