旧版网站入口

站内搜索

20世纪中国人物传记资源整理与数据库建设研究

2016年06月01日13:40

关于“全文数据库”等六个子项目的自评报告

以姜义华教授为首席专家的“20世纪中国人物传记资源整理与数据库建设研究”的国家社科基金重大项目,在向全国哲学社会科学规划办提交结项报告前,为检验历时五年来项目的最终研究成果,根据姜义华教授的意见,项目工作组分别于2015年10月17日和12月13日,特邀请复旦大学和校外的相关专家学者,在复旦大学光华楼历史系2001会议室,对所承担的数个子项目进行了自我评估。有的专家因出差在外,不能到现场发表自己的意见,即根据项目工作组发送给他们的电子版《评估报告书》,将认真撰写的书面《签定意见》签名后,打印扫描发送给项目工作组。

现将两次评估会的情况摘要报告如下:

一、对最终研究成果《数据库建设》的评估意见

评估会由本项目工作组负责人傅德华教授主持。姜义华教授首先代表本项目工作组向各位专家放弃周六(10月17日)休息时间,出席此次评估会表示衷心的谢意。

姜义华教授在致辞中说:“今天把大家请过来,非常感谢!现在大数据变得非常流行,运用越来越多,发展非常快,越下去越快。今天把复旦研究大数据的专家都请过来,虽然是社会科学,但人文科学方面的也放在里面。中国现在手机用户6.5亿,在全世界非常可观,因为下一步的发展,像第四次工业革命一样,实际上就是大数据互联网时代,它究竟带来什么,怎么发展数字化,大量东西都还属于未知数。但中国有这么庞大的一个数据库,世界每天都在运用,每天都在接触,将来新的一场世界革命、工业革命,我们这里只是做了很少一点点,人物传记虽然做了几万人,在整个中国近现代史上是一个很小很小的数字。数据库、大数据一来,普通老百姓会越来越多地进入到我们的研究范围里面,因为数据库处理这些问题就非常方便。我们现在选的近六万人,不可能每一个人都很完整,比如我要查周予同,“文革”中间批判他的文章那么多,现在去查我们基本上没有收集起来,所以都只能做一部分。《文汇报》也整个做成光盘,《新民晚报》也做成光盘,进展非常非常之快,我们现在只是做一个尝试和探索,因为花的力气比较大,做的除了国内之外,还在港台也收集到一批,还有日本、俄国、美国收集了一批,后面还要开专家评估会。今天第一次做专家评估,因为花了那么多力气把数据库建设起来。还是谢谢大家,把各位请过来,希望对我们的工作实事求是地给与批评,希望更多的人来运用这个数据库。”

本子项目负责人李旻讲师报告了最终研究成果《数据库建设》的工作情况。现将《全文数据库简介》摘要如下:

本项目根据2010年申报时向全国哲学社会科学规划办公室承诺的数据库应用需求,对原有复旦大学历史系资料室编纂、本项目第一子项目负责人傅德华教授主编的、上海辞书出版社2010年4月出版的《20世纪中国人物传记资料索引》(以下简称《世纪人物索引》)收录的5.8万人,传记资料20万篇(本)的元数据内容进行了扩充和规范化,改造为适应供中外学术界搜检篇名目录、作者、出版单位及出版时间,以及1949年前发表和出版的部分人物传记资料全文的数据库存储的结构设计。

本数据库不仅从内容上覆盖了原《世纪人物索引》所包含的专著、报纸、期刊、论文集等,条目上则涵盖了《世纪人物索引》中的全部信息,更重要的还将包含本项目新增的日本、俄罗斯、美国、港澳台的四个《20世纪中国人物传记资料的整理分析与研究》调研报告所搜集到,涉及2000个人物,约1.2万篇海外(包含港澳台)三种语言的《20世纪中国人物传记文献资料目录》。

本项目利用《世纪人物索引》一书作为20世纪中国人物传记的基本搜集范围,以《世纪人物索引》为基础增加全文内容,对《世纪人物索引》进行了数字化转换及导入,在此基础上根据项目建设的进展,有针对性地开展了数字化文献的搜集整理工作。在设计中,针对原《世纪人物索引》对传主信息的不足,在元数据中预留了相应结构,可在今后的数据库使用及改造过程中进行适当扩充。

本项目充分利用了现有国内已经建成的各种数字化资料库及电子图书馆,通过数据图像自动采集等方式,获取了大量的图像资料内容。1949年后的大陆各类出版物,已经通过这一搜集工作打下了非常好的基础,在进一步持续建设中,可较快地充实数据库中的全文内容。

现有的国内各类数字化资料库及电子图书馆,几乎全都是以图像形式存储相关资料的。本项目与众不同的地方主要表现在以下几个方面:

一是本项目必须对所搜集到的这些图像资料进行文字的识别和一定的整理,使其达到可检索、可利用的目的。

二是本项目解决了针对海量图像资料进行自动OCR的技术难题,设计了一个单节点日处理6000页以上的OCR后台服务系统,能够满足后续新增图像资料进行随后自动OCR的需求。自动化OCR技术可在很大程度上减少人工的投入。

三是项目利用WEB服务端技术及数据库技术,采用MVC模式构建了一个全文数据库的应用网站,并设计了良好的索引形式,以满足对于传记篇目信息以及传记全文信息的快速检索。

四是所建立的全文数据库的应用平台,提供了以图像/文本对照形式的文献引用,提供了经整理后的全文文本的可用性。

五是数据库还在内部实现了在线纠错、编辑的功能(暂未开放给外部使用者)。全文数据库平台建设于Windows系统上,部署管理相对简单,能够支持绝大多数主流浏览器,PDF格式的图像内容亦有便于利用。

截至2015年11月底,项目已经将搜集到的图像资料及整理全文内容导入数据库,对于未整理全文的图像资料,进行了自动OCR文字识别。全文数据库中涉及传记篇目为162781篇,传主55774人(尚有部分重复待整理合并)。篇目中,包含图像资料的有11283篇,计247970页。经整理过的全文文字内容及经自动OCR文字识别的内容分别为7074万字与1.8524亿字,合计有2.5亿以上的全文内容可供全文检索。

上述数据尚未包含“日本、俄罗斯、美国以及港澳台”四个子项目《调研报告》的内容。四个《调研报告》中的《20世纪中国人物传记文献资料目录》,将于2015年寒假利用招聘学生勤工助学即可将整理好的三种语言相互对应的中译文《文献资料目录》导入数据库,供中外学者与中文数据库一并查寻使用。届时它将成为目前国内外唯一,可在一个数据库中同时应用中文(含港澳台)、日文、俄文和英文四种语言,查找20世纪中国人物传记文献资料的数据库。本项目所取得的研究成果最重的学术价值和应用价值就在于此。

张计龙(复旦大学图书馆副馆长、文科数据中心副主任)评估意见:

一是对整个项目的评价,从一般的社科基金项目来说,做这么多的数据量,还能搞个平台出来,搞这样一个系统出来,我觉得应该是超出了正常的社会科学领域的项目。

这样的投入所达到的效果,技术平台和数据量,包括做的批处理的程序,这些代价都是挺高的,人文社科基金的经费不多,按照正常开发的话成本比较高,从这个角度来讲投入比较少,产出量很不错。

在做的时候遇到很多困难,那么多数据不是简单的投入,很多类似项目软件开发的费用高达数千万元,工作是收集纸本的资料,数字化扫描,然后做文字识别,里面的投入包括在线的标注、编辑等,投入很高,从这个角度来说这个项目很不容易。

二从改进建议来说,主要是从后期看需要继续投入,一个是版权控制,要分层考虑,对于没有版权问题的怎么处理,有版权问题的怎么处理,应该有一个策略,最好有一个怎么去引用,怎么说明,要有一个规范化的问题。第二个是编辑方面,怎么控制,这个有先例可以借鉴。第三个是元数据,因为你要检索,经得起使用,元数据处理的规范性,不需要去研究,已经有了比较成熟的规范,包括检索的框架,叫资源发现系统,已经把需求全部搞定,只要把程序设定好就可以了。元数据规范这一块还需要进一步处理,有可能需要再补充一些字段。

最后一点建议,因为经费支持有限,所以做的没有那么精细,会影响以后的使用,所以以后质量上还有进一步提高的余地。后继维护,硬件设备我们可以提供一些支持,如果要开放,版权问题要处理好,有限开放,合理利用,在系统方面要做进一步的改进,包括数据的规范方面,要代表复旦的水准。技术和设备上应该没什么问题,学校图书馆可以提供存储服务器的支持,但在内容建设方面需要项目组进一步达到开放的要求。

彭希哲(复旦大学发展研究院副院长、文科数据中心主任)评估意见:

我觉得姜老师的团队做了一件功德无量的事情,这个事情过去没有人做,是非常好的一件事情。从体量、涉及范围、传主将近六万传主,很不容易,是一项开创性的工作。从技术角度,我感觉他也有很多创新的地方,如OCR解读与检索,技术上本身也是有创新的。

不足之处:

第一,其本身有内在的创新地方,要把创新点讲得更清楚。第二,从数据库建设来说已经基本实现目标,建成以后怎么办?如果课题组继续存在,但又需要经费、人力,后续怎么更新,怎么修正,谁来监控,怎么保证质量?第三,原始图像的像素如果降低,因为要长久传下去,以后会觉得很可惜。

这一期聚焦在建设,如果后面还有的话,可以往怎么研究来发展。文献研究中间出现的频率有多高,在哪一年代多少,现在有专门软件做这个事情,在线的统计与分析,后期的研究可以做作者的地理信息系统,就是作者在哪里,什么年代出现在什么地点,从研究角度来说,如果检索能够进一步精细化,作者名,作者传记,作者出生地,哪一个年份出现多少人,这样对后期研究可以提供更多方便,数据库使用的价值会更高。

后期可以与学校图书馆和大数据学院合作。按照复旦对基础技术服务平台的设想,具体的日常管理可以交给图书馆,但你们要重点把内容把握好,整体移交都是没问题的。目前这个数据库挂在复旦校园网,以后是不是单独弄一个二级域名,让全世界都能来检索,不一定在复旦才能检索,要设一个二级域名,有很多技术上的东西。

熊月之(复旦大学历史系教授、复旦大学国际上海史研究中心主任)评估意见:

这个项目的价值不用讲,每次评都是众口一词的,从开始申请到后来两次追加,都是全票通过,得到的经费支持也是最高的,大家对这个项目都很期待。

第一,从读者的角度,我经常用知网、读秀、超星等,我如果在你这个网上查的东西,不如读秀的东西,那么我对你这个的价值就会怀疑。我的意思是我们现在有没有可能把读秀的东西链接到这里面来,当然你要得到读秀的授权,否则我想读秀的很多内容你肯定包括不了的,我作为用户的话,会进行比较。

第二呢,文献的识别不用太讲究,我认为可以这样做,一个是识别,第二个是粗识别,第三个是根本不识别。我要查某一个人,一查所有的数据都能出来,这个数字越多越好。我们如果能够包含人家已有的那些数据库的数据,当然是合法的,那就好了,还有内容是他们所没有的,他们的一些内容也是我们再搜集也搜集不全的,这样使用价值就比较高了。还有一个是修改问题,最好这个权力还是回过来,不能让他轻易修改,如果修改要提交,定期有人处理,否则同名同姓的话,修改的人弄错的话,相关资料就会混淆。

倪重匡(复旦大学计算机学院教授)评估意见:

这个数据库工作量很大,做得很辛苦,做了不少工作。一个是索引数字化,第二是在这个基础上搜集大批的材料,第三是进行处理,第四是检索的界面,第五是放到网上。这些工作有许多具体的东西要进行处理,我觉得做得很好。

问题和建议:第一是识别率方面需要进一步提高,尽可能对原始文献的污点进行处理,提高识别率。第二是关键字的查找需要标注,尽可能自动生成,增加模糊检索。第三,数据库中设计的OCR自动处理软件,大大提高了效率,如果能进一步精细化,形成一套规范的软件,可以进行商业运作

二、对子项目之二、三、四:“日本、港澳台、俄罗斯20世纪中国人物传记资料的整理分析与研究”调研报告的评估意见

本次评估会由本项目工作组负责人傅德华教授主持。姜义华教授首先代表本项目工作组向各位专家放弃周日(12月13日)休息时间,出席此次评估会表示衷心的谢意。

姜义华教授在致辞中说:“整个20世纪中国人物传记与数据库建设从一开始就找吴馆长来,当然大量工作是傅老师与资料室的几位具体在做,从搜集整理到数据输入都是找来一大帮学生帮忙,所以经费中劳务费占的比重相当大。数据库大量的工作一开始希望把国外的资料收集得多一点,但实际做的时候就知道工作量实在太大,而且困难太多,比如美国、欧洲,英文、法文等等,我们没有这个力量和经费去做,包括俄罗斯、日本以及港澳台,要做的比较完整困难都比较大,项目组到日本、俄罗斯寻求合作。真的要把传记资料收集得很完整实际上是办不到的,包括我们国内的现在做了六万多人,但是二十世纪中国人物传记远远超过这个数字,而且现在有大量的民间的人物,相关东西也很多。所以现在还是根据我们原来的《二十世纪中国人物传记资料索引》为基础,从目前数据库来说,基本上按照该书收录范围来做。实际上现在还有大量的档案资料,大量的个人相关的文献,没有办法全都收集进去,比如我们这儿吴景平老师做的宋子文的档案,这些档案都与他的传记资料有关,他单独做一个宋子文的数据库,如果做蒋介石的数据库,同样量非常大,所以我们这里传记资料还是比较确定的,包括一些自传、年谱或者别人写他的传记,每个人物的相关档案资料没办法做进去,所以题目。这个项目得到了国家社科基金委相关评审专家鼎力支持,由于工作量很大,资金方面经过两次增补总计240万,在社科基金中资助力度是比较大的。数据库的整理、输入让青苹果帮我们做都需要比较大的投入,部分是到国外、港澳台进行研讨,这么大一个投入,我们努力去完成。我们只能限定范围,否则数量太大,无法控制局面,那样就算投入再多,恐怕也未必能够真的全部完成。那个宋子文的档案,一个人物的数据库数量就很大,所以我们目前是按照个人写的传记,名为传记资料,收录的主要是别人写的相关传记。还有一点原来编人物传记资料的时候就有选择,例如文革中间批判文章就多得不得了,我们历史系的二周,当时报刊上批判周谷城、周予同的文章就非常多,但这些都没有收录。没有办法非常完整,大量的档案资料无法收进去,即使如此现在的数量也已经足够大了。所以现在的数据库只能说是框架搭起来了,是开放性的,不是最后完成的,我们讨论的一个问题是将来新的资料怎么补充进去,将来怎么与那些专项的数据库更好地联结在一起,这里作为一个切入口建立起更广泛的数据库,因为真正的大数据时代不是靠一个数据库解决所有问题,而是要联结。目前先放在复旦,简单的处理,以后可以放在上图,这样应用的范围更广泛。验收的时候是以开放的形式,后面的验收还要组织另外的专家去做,我们是初步的,自己请一些专家做评估,这次把二、三、四子项目合在一起做。”

傅德华教授代表项目工作组向各位专家汇报了所承担的“日本、港澳台、俄罗斯20世纪中国人物传记资料的整理分析与研究”三个子项目的调研情况,介绍了项目工作组的以后要做的工作,指出项目中还有很多不尽人意的地方,既有漏收,亦有搞错,还存在这样那样的问题,刚才姜老师也说了这只是一个初步的框架,怎么样做得更好,还有大量的工作等着我们去做,下面请各位专家提出宝贵的意见。

姜义华教授说:俄罗斯的部分我们本来想和俄罗斯历史学会合作,但现在俄罗斯管得非常严,必须是传主的家属亲自提出申请,然后才能看相关档案,比如某人档案那里有,但是必须由其子女或者其他亲属提出申请,然后亲自去查阅,这样就麻烦了,因为共产党和国民党有一大堆人的档案在那里,这个现在我们没办法做。包括我们请的俄罗斯专家也不是专门研究这些中国人物,所以他们收集的也不会非常完整。在这种情况下,现在完整的档案无法收集回来,必须由他们的家属提出申请并获得对方的批准。现在收集的俄罗斯关于中国人的传记很多是当代的,找俄国人选择传记,里面有他们对这些问题的认知,不像日本人,他们对中国的研究要细致得多。中俄之间五十年代关系好,相互研究很多,后来关系恶化之后,我们把俄国研究丢了,他们把中国研究也丢了,恢复关系以后,新的一批人和前面的一拨人就不一样了,这是俄罗斯研究目前的现状。

吴建中(上海图书馆馆长、研究员)评估意见:

感谢姜老师、傅老师和项目组做了大量工作,工作做的非常细,收的资料也非常多,不敢说全部收集,但是可以说尽可能收全,我相信傅老师已经做到了,我想讲一些综合方面的意见。

第一,既然是数据库,对一些字段要有非常明确的定义,比如说毛泽东、鲁迅有很多的别名,有名的人的别名我们知道,名气小的人的别名我们就不知道了,这需要我们事先做工作,既然是一个开放的数据库,要按照数据库元数据的规则,比如说传主,比如说相关人物,比如说事件,比如说他写的书,或者被写的传记,需要设计一个体系,在搜集过程中确定一个框架,比如说传主,他的生卒年月,因为同名同姓的也很多,定一个传主,以后标引的时候有一个限制,这样传主就比较明确,到了数据库以后编目更加精细。(姜老师:是的,这放在第一个子项目,也就是中国人物传记资源数据库里面去做。)在索引里面列参见条,越做越多,数据库开放以后变得更加规范,否则人家会说怎么一个人变成两个人了。这样的工作越往后,要公开的时候人家会更加挑剔。(傅老师:同名同姓的要分别考证)传主后面最好要有一个生卒年,这样就有限定了。后面这个工作量很大,但是还好处理,因为图书馆有标准档,笔名、别名全部在里面。

第二,涉及到内容的挖掘。我们只知道传主,书中内容不清楚,那就需要知道内容,然后才能进一步挖掘,否则里面可能有一个重要人物,可能某本书是讲蒋介石的,但是里面讲到了毛泽东,那就少了这一块。这是后面的内容挖掘,相关的子项目其实都是相互关联的,这就需要数据库来关联,在此之前如果能够把框架考虑好,可以事半功倍,否则割裂开来,变得分散了,关联以后就可以整合在一起,工作可能也会更好做一点。我这是挑剔性的,工作已经做得非常好了,大量的工作靠人力来做。

第三个建议,我讲的都是建议,不是批评,都做的相当好,姜老师、傅老师都是相当严谨的。另外的学者有相关资料,他看到这个数据库里面没有,能不能允许他把相关资料加上去?也就是说如果你开放了,别人有资料,也可以往里面加。要有一个审核机制,哪一个类别由谁审核,你提交后我要审核,然后才能进去。结项的时候要留一个口子,以后可以加上去。不能保证百分之百,但留下一种可能,你可以不断的上传资料,这就为后人的挑剔提供了解决办法。这就是一个平台,一个资源,有了这个平台,以后资源就向这儿走。这样对以后的继续建设有利。关于这个项目,做的非常好。

胡令远(复旦大学日本研究中心主任、教授)评估意见:

非常感谢姜老师和傅老师!这个项目对我们搞日本研究的人来说,是非常有帮助的,通过这样一个整理,接下来对我们的研究工作也有很大帮助。这个大题目是传记资料的整理与数据库的建设,子课题还有点不一样,我想根据傅老师讲的四个方面说一点自己的看法。

第一个方面,通过相关工具书整理中国人名,查找相关文献资料。其中列举的工具书还不太完整,做的时候不能说完全无遗漏,但不能有大的遗漏,这样工具书方面需要更全一点,回头我向傅老师列一个我们了解的工具书的名单作为参考。

第二个方面,从日本国立国会图书馆的网页上下载。这种方法比较经济有效,但京都方面还要多做一些工作,因为京都大学关于中国的研究以前比东京还要又优势,人物传记与他们做的中国研究是密不可分的,所以京都大学图书馆以及相关书库还需要做一些调查,那样才更加完整。如果要全部的收集,那个工作量大的无法估量,无法承担的。先筛选一遍,不要有大的遗漏就可以了。

第三个方面,通过外出调研查找日文传记文献资料。日本不少文献资料数字网络化搞得比较早,但也有比较保守的一面,有很多老先生不使用现在的计算机网络手段和工具,不少有代表性的文献还是要到日本去查找的,有些东西没有放到网上。作为传记资料,有一些内容可能有特别的考虑,没有放上去。所以到日本进行调研是一种非常好的方式。除了孙文纪念馆之外,还有其他一些图书馆,包括一些手写的资料,或者没有上网的资料,都可以作为一个关注点。没有上网的资料,可能是他们觉得比较珍贵或者不方便的,但是可能对我们非常有用。我们要知道这些信息,去日本调研之前准备一个清单,把要查找的内容列上去。除了前去调研,还可以委托在日本的学者帮助查找。

第四个方面,通过学术研讨会扩大影响。我觉得不完全是要扩大影响,举办研讨会是为了对我们的项目本身进行补充和研究,以便做的更加精细化,更高、更好。比如和日本的一些学者讨论相关问题,中国人物传记的定义,收录的范围,以及人物的选择标准等等,和日本人沟通这些问题就会比较有价值。

第五个方面,项目后续工作以及对项目的分析。目前可以通过收集到的资料进行分析与研究,收录的传主中政治人物占大多数,宗教的,艺术的,经济的,经济的比较少。日本所写中国人物传记,除了时代性,就是哪一个时期中日关系怎么样,比如文革时期,牵涉到的人物传记资料在日本的数量非常大。分析的时候一个是根据他们对中国的关心程度,在某些方面关心的深度怎么样,另外根据他们对不同专业的传主的关注,也可以了解日本对中国的关心的重点所在。现在没有看到分析的资料,结项的时候可以补充分析资料,以人物的类别或者专业的类别可以窥见日本在不同时期对中国的关注点,对以后我们的日本研究有何帮助。分析的时候可以请一些专家搞一个小型座谈会,其实就是分析研究。

杨 成(华东师范大学俄罗斯研究中心副主任、副教授)评估意见:

谢谢姜老师和傅老师。谈点自己的看法,这个项目工作量非常大,难度非常大,最难的可能在俄语这一块,有一些细节存在不少问题。问题不少的原因在于无论做翻译的还是进行处理的,不是谁的错,而是学科分化的问题,学科现在越来越细化,做区域研究的可能只做俄罗斯,但对国内的人物不见得了解。所以在处理过程当中就会出现一些细小的问题。比如很多姓名的翻译都是有问题的,不是规范化的做法,有些可能是同一个人,前后翻译的时候就出现偏差,看起来是两个人,实际上是同一个人。有的纯粹是语言训练不够的问题,这现在是一个通病,很多专业工作者翻译出来的东西错误很多,不是他语言不好,语言学的很好,但是他对专业的东西不懂,导致出现很多翻译的错误,类似情况在现当代文学翻译当中也有很多。最好请一位俄语系的老师一个个校对一下,因为这是有规范的,不能随便翻译,否则其他人查传记作者的时候,显示是很多人,但实际上可能是同一个人。我建议找人重新仔细校对一遍,从人名到具体的篇名,才会避免大的疏漏性的问题。我非常钦佩姜老师和傅老师,花费这么大精力做这个工作,而且工作量这么大,非常辛苦,非常困难,我提出的一些细节上的问题,像刚才吴老师讲的,做成一个开放的平台,有一个纠错或者修正的机制,可以随时补充。

提一个小问题,现在只有传主和条目,我在看的时候对立面的内容感兴趣,想知道俄国人是怎么写的,更期待看到原文,可能他们写的与中国人写的是不一样的,俄国人、日本人、美国人都在写某一个中国人,他们的立场与评价都不相同,对研究者来说就会比较关注这背后不同的话语反映出怎么样的认知,与各方国与国之间的关系、各方的研究方法、政治立场、时代背景等等有何关系,做数据库的时候除了条目之外,那些内容能否作为共享成为开放的一部分。

还有一个小建议,五十年代的时候相关内容比较多,九十年代以后也有不少,中国的一些小说包括推理小说被翻译过去,俄国人很喜欢看推理小说,一般来说翻译过去的时候会有一个译者序,里面会对作者的生平有一个比较详细的回顾,这部分应该也被收录进人物传记资料,所以不能仅仅与科学院的亚洲文献部合作,远东所、东方学所等从事具体中国研究的人可能会更熟悉情况,不能保证科学院亚洲研究部搜集了所有的文献,科学院的情报所也就是信息所搜集的资料也非常多,从沙俄时期开始就都有,后续可以考虑与他们也进行合作,覆盖面可以更广,他们不仅可以提供俄国人写的东西,还定期发布索引、摘要甚至原文等,把英文、德文、日文的东西汇集在一起,对于我们英国、美国、德国、日本的东西都是一种补充,从他们的视角可以有一些不同的文献来源,有可能对我们的工作有补充。如果将来继续做的话,我建议与他们也可以建立一种机制性的联系。

熊月之(复旦大学历史系教授、复旦大学国际上海史研究中心主任) 在发来的对三个子项目“日本、港澳台和俄罗斯20世纪中国人物传记资料的整理与分析调研报告”的《鉴定意见》中这样写道:

“以姜义华教授作为总项目首席专家的国家社科基金重大项目(10&ZD097)“20世纪中国人物传记资源整理与数据库建设研究”,自立项以来,一直在积极、稳妥地推进,我多次参加他们阶段性成果鉴定会。近期完成的三个子项目,即以金光耀教授作为子项目负责人的 “日本20世纪中国人物传记资料的整理分析与研究”,章清、吴建中教授作为子项目负责人的“港澳台20世纪中国人物传记资料的整理分析与研究”,金重远教授、刘军梅教授作为子项目负责人的 “俄罗斯20世纪中国人物传记资料的整理分析与研究”,均实施非常认真,内容相当丰富。这三个子项目的负责人,均为活跃在学术研究第一线的学者。金光耀、章清教授是复旦大学研究近现代史的著名学者,对于中外关系、中国近现代史造诣很深。吴建中教授是上海图书馆馆长,上海图书馆藏有相当丰富的港澳台人物传记资料。金重远教授是著名世界史专家,在从事本项目期间不幸去世,继任者刘军梅教授是著名俄罗斯问题专家。这三个子项目的实施,均得到国际、国内相关方面科研单位与专家的大力支持,课题组均曾到相关地方搜集资料,并与相关单位联合举行专题讨论会,包括在香港、台北、日本、俄罗斯。这使得课题组搜集的资料比较全面、实在,具有学术性。

从已经编入目录、收入数据库的资料看,“20世纪中国人物传记资源整理与数据库建设研究”的承担者,对于所承担的项目,高度负责,极其敬业,所搜集资料相当丰赡,数据库建设很为使用,质量优等,达到了当初设计的目标。”

刘 平(复旦大学历史系教授) 在他发来的对子项目之六:“美国的20世纪中国人物传记资料的整理分析与研究调研报告”的《鉴定书》中从以下五个方面,发表了自己的评估意见:

1、是否完成项目:吴景平教授领衔、傅德华教授具体分管的该调研报告,总字数1.4万余字,分为“项目工作组五年来的工作”、“本项目后续工作的打算”两个主体部分与两个附录,纵览其内容,可以说已经完成原先约定的任务。

2、研究内容和研究方法的创新:该项目的主题内容分为以下几个方面:首先全面系统地从英文书目查找与中美关系有关的中国人物传记资料文献目录,这是一项比较耗时耗力的工作;其次,该项目从中文书刊上搜检与中美关系有关的中国人物传记资料文献目录,搜罗比较全面;第三,组织学生从美国各大学图书馆网页或请学生直接到美国有关档案馆帮助查找,这项工作是对上面两项工作的拾遗补缺;第四,招募学生将查找的英文或中文文献资料互译成中英文;第五,将相关资料整理成文本文档。

从上述文献数据中得出有价值的分析论断,其方法是计量分析,该项目从中基本理清了“美国20世纪中国人物传记资料的整理分析”状况。本项目也提出了后续工作的打算,从中可以得知该项目最终将有质量上的保障。

3、学风、文风方面:纵观这份调研报告,各位作者学风严谨,工作勤恳,行文布局基本符合学术规范;文风方面,总体很好,但还有必要在语言文字上精雕细琢。

4、学术价值、应用价值或社会影响:该调研报告针对美国20世纪中国人物传记资料进行详细调查摸底,体现了较高的学术价值。至于社会影响,主要体现在一定程度上满足了公众对于该项目之资料性、工具性和公益性的要求。

5、有何不足或欠缺,以及修改、提高的具体意见和建议。1)该项目统计数据量大面广,即使目前做了许多工作,但依然是很不完整的(如美国学术界对毛泽东、周恩来等中国既往领导人的海量研究,如何处理这类难题,后续工作要仔细斟酌。2)该项目搜集资料来源的工具书尚不齐全,包括项目工作组成员傅德华教授参与主编的《150年中美关系史论著目录:1834--1900》(复旦大学出版社2005年)一书所收录的有关人物传记都被遗漏了;还有《剑桥中国晚清史》上下册、《剑桥中华民国史》上下册、《剑桥中华人民共和国史》上下册,其书后所附征引文献篇目均有大量的人物传记篇目,需要详加检索。3)向研究中美关系的专家学者征求意见也不够。4)从调研报告的撰写情况来看,其中还有不少技术性、文字性工作有待改进。这些缺陷都有待在后续工作中加以改进和完善。

以上是项目工作组对各个子项目自评后的整理摘要。专家组对本项目五年来所做的工作给予了一定的肯定,这是对项目的鼓励与鞭策,同时指出其中还存着不足之处,对需要改进和提高的地方提出了意见和建议,对研究中的难题提出了可供参考的解决办法,所有这些问题都有待项目工作组在后续工作中加以改进和完善。我们相信,通过全国规划办组织专家对本项目的评审鉴定一定会提出更多、更好的改进意见和建议,项目工作组将在后续工作中加大投入,争取有更大的收获,努力做好国家交给我们的这一造福中外学术界同仁的重大项目。

(课题组供稿)

(责编:李叶)