東京大学史料編纂所

HOME > 編纂・研究・公開 > 共同研究 > 史料デジタル収集の体系化に基づく歴史オントロジー構築の研究

研究種目名 基盤研究(S)
研究課題名 史料デジタル収集の体系化に基づく歴史オントロジー構築の研究(20222001)
研究期間 2008年度~2012年度
研究代表者 林 譲
研究目的 本研究の目的は、東京大学史料編纂所が長年にわたって蓄積した採訪史料フィルム等のデジタル化とデジタル撮影による史料収集の仕様を確立し、研究資源の高度情報化と共同利用をはかるとともに、サーバー空間内に構築するアーカイヴハブ(デジタル画像史料収蔵庫)をベースに画像とテキストの研究を進め、人物情報を機軸に時間・空間情報と結合した歴史知識を蓄積する歴史オントロジーの構築を行うことにある。すなわち、①戦後六〇年間にわたる史料収集の成果など、フィルムベースの史料画像を、フィルムの劣化状況や緊要度等に合わせ優先順位をつけてデジタル化する。②デジタル撮影(ボーンデジタル)による史料収集の仕様を確立し、収集史料へのメタデータの付与・アーカイヴハブへの格納・公開利用までの一貫したシステムを構築する。③アーカイヴハブのデジタル画像史料群をベースにして、画像研究とテキスト研究における先端的プロジェクトを推進し、人物情報を機軸に時間・空間情報を加えた知識情報の検索が可能なモジュールの開発研究を行なう。
研究実績の概要
  • 2012年度
  • 2011年度
  • 2010年度
  • 2009年度
  • 2008年度
【2012年度】
本研究の最終年度にあたる二〇一二年度において、以下の研究を推進するとともに、公開研究会を開催し成果を報告するなど、本研究を総括した。
①アーカイヴハブ(デジタル画像史料収蔵庫)構築の継続:アーカイヴハブには、東京大学史料編纂所が長年にわたり収集・蓄積した採訪史料マイクロフィルムからデジタル化した画像、及び前年度に策定したデジタル撮影(ボーンデジタル)による史料収集の仕様に基づいたデジタル撮影画像を、史料収集時の諸データ(所蔵者・所蔵機関、採訪年月日、史料群の名称など)とともにサーバー内にロケーションを決めて格納した。
②採訪マイクロフィルム等のデジタル画像の検索・閲覧方法:リール毎の検索が可能なマイクロフィルム簡易検索システムと、史料画像(文書)一点毎に付与したメタデータを検索し画像の表示が可能なHi-CAT Plus とがあるが、本年度において、採訪マイクロフィルム(国内)のほぼ全部にあたる四一八万コマ(八〇六一リール分)のデジタル画像化がほぼ終了し、終了分に関しては、簡易検索用目録を更新することにより簡易検索が可能の状態となった。また、既に四〇万コマ(七四九リール)分を登録しているHi-CAT Plus に、従来分とあわせて一一三七リール分を追加登録し、一点目録データ総計一〇〇万件余り(一八八六リール)の検索を可能とした。
③システム開発:本年度において、史料群の所蔵先(現在)の地域毎の検索(キーワード・都道府県・旧国郡)が可能な「史料所在地オントロジー検索システム」を開発・実装した。これは、本研究課題に掲げた歴史オントロジー構築の一環として、Hi-CAT Plusに搭載したデータのもつ史料所在地という地理情報をもとに、オントロジーの概念に基づいて体系的な定義(所在地カテゴリ)を設定し、このメタデータを検索対象とすることを通じて、より有意義な検索を目指した検索システムである。また、デジタル画像のサムネイル生成に伴って極度な遅延化が生じたアップロードツールに関して、より適切な改善を施した。
④先端プロジェクトの推進:アーカイヴハブのデジタル画像史料群を基盤にして、各研究課題に沿った画像とテキストの研究を進め、奈良文化財研究所システムとの連携をより一層推進し、秋田県公文書館との連携システムを実現した。
⑤史料デジタル化に関する確認作業の実施:収集史料のデジタル化と公開(原則イントラネット公開)に関して、史料編纂所内において確認作業を行なった。
⑥これまでの研究成果を広く公開するために、二〇一三年二月二八日に、東京大学史料編纂所大会議室を会場として、公開研究会『「S科研「史料デジタル収集の体系化に基づく歴史オントロジー構築の研究」の成果と課題』を開催した。内容は、林譲「S科研の課題と経過」、綱川歩美「デジタルデータ化の基礎と方法」、大内英範「Hi-CAT Plus の公開:セキュリティ、原本所蔵者との共有システム」、山田太造(人間文化研究機構)「デジタル化した収集史料の管理・検索システム」、横山伊徳「オントロジーの発想と史料所在知識の表現」、金子拓「S科研による史料のデジタル収集と調査研究・データベース化の成果」、太田研・三浦貴之(秋田県公文書館)「秋田県公文書館におけるデジタルアーカイブの取組み」、山家浩樹「史料デジタル収集の基準と方法」、保谷徹「S科研の今後の課題」である。その他、研究メンバーが、「ワークショップ ~Digital Archive Network の構築に向けて~」(七月二四日、札幌市中央図書館)、「第四四回ディジタル図書館ワークショップ」(二〇一三年三月一四日、九州大学附属図書館)等で成果を報告した。
⑦今後は、検索するための「一点目録」の作成が重要な課題となってくるが、必要数は東京大学史料編纂所報 第48号 2013年10月 ( 1 54 )約五八七四リールを数える。目録未入力の史料は、醍醐寺・仁和寺・薬師寺・西大寺・東大寺図書館・出雲大社近世史料などの大寺社、加賀前田・毛利・山内など大名家文書と末吉家・陽明文庫などの近世史料が多い。これらの残された課題の継承作業については、本科研の研究分担者であり、二〇一一・二〇一二年度の本所副所長(図書部長・技術部長兼務)保谷徹と同情報処理主幹山家浩樹の両人を中心として、検討が進められた。その結果、本科研の研究成果・研究事業・器材等を本所図書部(コンテンツ管理)と前近代日本史情報国際センター(システム・サーバ管理、目録入力作業)で継承することが決まった。
備考