研究目的と概要 of 協調作業環境下での中世文書の網羅的収集による古文書学の再構築プロジェクト

研究の学術的背景

 1801年の塙保己一の建議により始まり、明治政府に継承された史料編纂事業は、1886年の地方史料調査の開始により大きく性格を変えることになった。地方に大量の古文書が伝来していることが認識されたからである。以来、今日の東京大学史料編纂所に至る前身機関は地方史料なかんづく古文書の調査に力を注ぎ、影写の技術により蓄積された複製はおおよそ21 万点に及ぶ。

 1901年に史料集の刊行を開始するに際しても、塙の構想を引き継いだ『大日本史料』とともに『大日本古文書』があわせて刊行された。『大日本古文書』は当初編年形式で編纂されたが、正倉院文書を主とする奈良時代古文書を刊行したところで編年を断念し、家わけ形式の編纂に切り替えた。家わけの形式も史料の伝来状況をそのまま伝えるものとして意味のあるものであるが、むしろ古文書の大量な存在と相次ぐ新発見が、編年方式を断念させたのである。

 しかし古文書を編年に配列して全体を把握したいという願望は抱き続けられ、史料編纂所長をつとめた竹内理三は独力で、『平安遺文』11巻、『鎌倉遺文』46巻を刊行した。独力でしかも紙媒体でこの事業に取り組んだのはかなりの冒険であり、従って誤りも漏れも相当な量にのぼるのであるが、しかし古文書の全体を掌握するための一つの基準が示されたことの意義は計り知れない。

 史料編纂所は1985年度より影写本収載古文書21万点の目録データベース化を試み、24年の歳月をかけて2008年度をもって当初の目標を達成した。しかし、影写本のみで古文書のすべてを網羅できるわけではなく、古文書の画像・釈文・目録等の情報を載せる媒体が多様になってきている。史料編纂所自体が1950年代以降、史料複製の方法を影写から撮影に移してきているし、また全国規模で進んだ自治体史の事業等により、史料編纂所以外により古文書調査の成果が膨大に蓄積された。しかしそれが多様であるだけに全体を掌握することが以前よりもさらに困難になってきている。そこで、史料編纂所では、影写本収載古文書全点の目録データベース化の次の課題として、多様な媒体上の古文書情報(データ化されていない古文書現物からデータ化することを含む)を集成して、古文書に関するナショナルユニオンカタログを構築することを計画し、2005年度より2008年度までを費やして、「日本古文書ユニオンカタログ」を構築した。このシステムではさまざまな媒体上の古文書情報を目録データとして網羅的に登録し、実体として同一の古文書に関するデータを統合するという方式をとっている。

 史料編纂所が影写本収載古文書の目録データベースの構築をはじめた頃は、目録データを扱うのが精一杯であったが、その後の電算機能力の向上により、フルテキストデータ、画像データが扱えるようになった。これに応じて、史料編纂所では1994年度より古文書フルテキストデータベースシステムを開発し、現在、『大日本古文書(家わけ)』『同(編年)』『平安遺文』『鎌倉遺文』を対象とするフルテキストデータベースをリリースしている。また1997年度以降、原本、影写本、謄写本等の史料画像のデジタル化を進め、一方で出版物版面画像もすべてデジタル化した。「日本古文書ユニオンカタログ」は、史料編纂所の提供する古文書関係のすべてのフルテキストデータベースと史料画像・版面画像データにリンクする仕組みを持っている。また、史料編纂所以外の機関から公開されているデータにリンクする仕組みも備えている。

 2006年度に史料編纂所に附設された前近代日本史情報国際センターは、国立情報学研究所よりの委託事業として「鎌倉遺文バーチャルラボラトリ」を立ち上げた。メディアウィキを利用して、『鎌倉遺文』全文データの修正・追加を協調作業環境において行うというシステムである。まだ試行段階であり、実運用のために検討すべき課題が多いが、特に、追加データを登録する仕組みとメディアウィキ上に蓄積された編集データをフルテキストデータベースに書き戻す仕組みについて追加開発が必要であり、運用ルールを検討し確立する必要を残している。

 以上を前提として、電算機とネットワークを駆使した古文書研究の方向を考えるならば、「日本古文書ユニオンカタログ」上のデータの精度を高めるとともに、そのすべての目録データに釈文データと画像データが対応している状態を実現し、それらのデータに関する修正・追加と、それらのデータにもとづく共同討議が、全地球規模の研究者に開かれた形で組織されることが課題であろう。
 しかし数十万件にのぼるすべてのデータについてそれを実現するのは、時間を要するというよりもほとんど永続運動になるので、本研究課題においては、それを実現するためのシステムを整備し、理想を実現するための道筋を示し、一定程度までの実現をはかることを目的とする。

画像 006.jpg

研究期間内に何をどこまで明らかにしようとするのか

a.1600年以前の古文書を対象として、古文書の所在情報、画像、釈文を共有し、文書名の付与・年代比定等の古文書利用のための基礎作業を共同で行い、文書の形態・様式・機能・伝来等々に関する古文書学上の議論を組織・集約する協調作業環境をネットワーク上のバーチャルオーガニゼーションとして構築する。

b.同オーガニゼーションの運用により、「日本古文書ユニオンカタログ」の網羅性の精度を上げ、『鎌倉遺文』データの修正・追加を推進する。
c.20 万件を確実に超え数十万件に及ぶことの予想される1600年以前古文書の全体について、文書名の検討と年代比定を進め、古文書学を帰納的に再構築する方向を示す。

当該分野における本研究の学術的な特色・独創的な点及び予想される結果と意義

a.数十万件に及ぶことが予想される古文書を網羅し編年に配列することは、100 年以上にわたって夢想されながら実現しなかった。東京大学史料編纂所が電算機を導入し20 数年の歳月をかけてようやく事業の枠組みを作り上げた。本研究はその枠組みを前提として本格的に事業に取り組むものであり、100 年を超える夢想を具体化するものである。

b.上記の事業は多くの研究者の協力によりはじめて可能であり、精度を上げることができる。本研究は、電算機とネットワークの利用により仮想研究空間での古文書研究を進めようとするものである。日本史分野において仮想研究空間が恒常的に運用され成果をあげている例はまだ少ないと思われる。本研究は「鎌倉遺文バーチャルラボラトリ」の経験を土台として、仮想研究空間構築に関する問題点の検討を積極的に行う。

c図書館・博物館等所蔵史料のデジタル化によるWEB公開が進んだが、それぞれが別個に公開されていて全体を通覧する便宜がない。機関ごとに構築するデータベース間の連携による共有資源化の動きもあるが、本研究はナショナルユニオンカタログそのものを協調作業環境において構築しようとするものである。