旧版网站入口

站内搜索

基于资料库的古籍计算机辅助版本校勘和编撰系统中期检查报告

2017年12月11日09:47来源:全国哲学社会科学工作办公室

一、 研究进展情况

1、课题开题与子课题进展情况

本课题的主要设计思想就是要在校勘学理论的指导下,充分利用计算机技术和计算机资源,为校勘这一专业性强,工作效率较低的传统人文学科服务,促进校勘学发展,为古籍的现代化作出贡献。

根据总体目标,本课题分立5个子课题进行研究,分别是:

子课题1:计算机辅助古籍版本梳理系统研究

子课题2:计算机辅助古籍版本校勘和编撰系统技术设计与实现

子课题3:计算机辅助古籍版本校勘资源库建设

子课题4:计算机古籍校勘自动编撰系统研究

子课题5:计算机辅助古籍版本校勘成果资料库建设

截至目前,5个子课题工作进展顺利,正在按计划逐步推进。

2、调查研究及学术交流情况

2015年12月在北京师范大学召开项目协调会,协调部署项目研究工作。

前往国内外有关高校研究部门调研、洽谈合作。与日本大东文化大学、越南汉喃研究院、韩国翻译院等科研单位建立了合作交流关系。派出两名学生前往日本交流,搜集材料。

3、学术会议与学术交流活动

2017年6月访问韩国檀国大学汉文教育研究所和檀国大学东洋研究院,作“中国古代字书的数字化整理与研究”专场报告,与韩国檀国大学签订了《韓國小學類漢籍圖書調查及整理》合作协议书,协议2018年合作出版《韓國小學類漢籍圖書目录》,并对重要文献版本专题校勘研究。

2017年1月参加在台湾高雄召开的“第七届漢字與漢字教育國際研討會”,并在大会作“计算机辅助古籍版本自动校勘”专题演讲报告。

开发的“古籍版本校勘软件系统(V1.1)”已经运用于硕士、博士论文研究中。建设完成“小学文献版本数据库”和“佛经异文数据库”。

2017年5月应邀分别访问渤海大学、内蒙古师范大学作专题学术报告两场。

4、成果推介与宣传

成果宣传推介不够,计划2017年底召开项目研讨会及中期成果发布会,推介“古籍版本校勘软件系统(V1.1)”试运行,并及时报送《工作简报》,向国家社科基金专刊投稿。

二、 研究成果情况

代表性成果1:计算机辅助古籍版本校勘系统V1.1版

该系统在分析和总结传统校勘工作模式的基础上,建立计算机处理模型,实现了校勘中最核心的对校功能。软件能够显性标注字符量差异、字符顺序差异、字符形体差异等异文类型,实现对误、衍、倒、脱四类现象等异文自动标注。

V1.1版具有如下几个功能模块:

1. 字符串自动比较功能:校勘前首先对底稿和一个校稿进行字符自动比较,记录衍、脱、异体信息;有多个校稿可依次和底稿进行字条自动比较。并支持删除字条自动比较结果功能,以解决误比操作。

2. 显示异文差异功能:即该系统能够准确地将不同版本的差异之处显示出来,高亮变色显示差异内容。并明显显示字符差异,分别标记出衍、脱、异体、字面差异等。不同版本之间的异体差异、字面差异通过不同颜色的连线区分。

3. 类型选择功能:提供校勘类型的快捷选择方式,例如:脱、衍、倒、异等二级下拉菜单。

4. 编辑功能:当出现多出异文时,需要对标注对象提供字符串编辑功能,用户可以拆分、删除问题、合并问题,既自设标注对象。

5. 按语标注功能:校勘的价值,除了显示异文以外,更重要的是体现在对这种差异的考证方面,所以,需要在相关异文提示的地方给出文本框,供使用者填写考证的过程及结论。简单来说就是加批注的功能。

目前古籍版本校勘系统V1.1版软件系统已运用到硕、博士课题研究中,社会影响力正在逐渐加大。

代表性成果2:论文“计算机辅助古籍版本校勘资源库建设浅议”

该论文在《图书馆理论与实践》期刊上发表。文章指出:计算机辅助古籍版本校勘是古籍整理出版数字化的一个重要举措。建设校勘资源库的根本目的在于为计算机辅助古籍版本校勘提供丰富可靠的数字化资源。资源库建设工作的主要内容包括设计资源库整体架构、确定资源库所要涵盖信息种类、研究资源库信息的采集标准与方法、资源库的数据信息加工以及验证评估资源库信息的效度等。文章指出:计算机辅助古籍版本校勘资源库所包含的资料信息种类较多,而且每种类型的资料数量也比较庞大。从资料来源上看,各种相关字典辞书是首要来

源,比如《古代汉语通假字大字典》《历代避讳字汇典》等。历代学者整理古籍时所撰写的校勘记,比如《佛经异文校勘记》《十三经注疏校勘记》《二十四史校勘记》等。

代表性成果3:中国历代小学类古籍书目数据库

通过对中国以及日本、台湾、韩国、美国等国家与地区的各大图书馆和高校图书馆的调研,该成果搜集了国内外现存中国历代小学类古籍书目8000多条,书种数3000多种,30个版本以上的有24种字书;20—30个版本的字书有32种;有3个版本以上的字书共714种。其中版本数最多的是东汉.许慎著《说文解字》,有100多个版本。该成果是目前国内外收中国小学类古籍字书最多的。该成果对汉语言文字学的学术研究、对古籍整理与校勘提供了最基础的参考文献。目前被硕、博士广泛使用。

代表性成果4:佛经异文资料库

该成果搜集了《大正新修大藏经》8982卷、《卍新纂续藏经》5066卷、《嘉兴大藏经》1659卷、《历代藏经补辑》972卷、《国家图书馆善本佛典》248卷、《汉译南传大藏经》元亨寺版 70册等,版本异文80多万条。以《长阿含经》为例,该书共计22卷,异文共计2692条,除去重复以及没有价值的异文之外,剩余共计1239条,平均每卷56条;单字异文885条,平均每卷40条。以此类推,仅《大正新修大藏经》8982卷就有50万条(去重后36万条)。该异文资料库对古籍版本校勘具有重要的参考价值。可提供校勘系统联机检索使用。

课题组供稿 

(责编:王瑶)