東京大学史料編纂所

HOME > 編纂・研究・公開 > 共同研究 > 歴史知識情報のオープンデータ化にむけたスキームと情報利活用手法の再構築

研究種目名 基盤研究(A)
研究課題名 歴史知識情報のオープンデータ化にむけたスキームと情報利活用手法の再構築(26240049)
研究期間 2014 ~ 2018年度
研究代表者 久留島 典子
研究目的 史料編纂所歴史情報処理システム(SHIPS)は、構築開始から三〇年余を経て約三〇種の公開データベース(以下、DB)を擁するに至り、アクセス数は年間約400万件に達している。安定的な発展を重ねる一方、開発担当者の異動や研究組織の改編に伴い、維持・更新が困難となるDBも生じ、ともすると蓄積されたコンテンツが失われかねない事態が危惧されている。 こうした状況を踏まえて、本研究は、まずSHIPSを対象として、DBを含む情報システムの総合的な構造転換を図り、個別DBの消長・再編に左右されない、普遍的な知の蓄積・公開の在り方を追究することを目指している。 さらに同様の課題を抱える諸研究組織に対して一定の指針を示すと同時に、機関・組織の枠を越えた共有の知識ベースを構築し、暗黙知・経験知として蓄えてきた歴史情報の共有化・外在化に取り組むものである。
研究実績の概要
  • 2018年度
  • 2017年度
  • 2016年度
  • 2015年度
  • 2014年度
【2018年度】
 前年度に引き続きSHIPS が擁するDB 群から人物情報を抽出して、人物情報レポジトリへとデータ移行を進めた。他方、最終年度である当年度は、単にデータ蓄積を進めるのみならず、オープンデータ環境を見据えたレポジトリ機能の向上を実践した。蓄積データのRDF 化は前年度から着手してきたが、このRDF に対して、新たにデータ利用条件に関するライセンスを一括付与するための機能を設け、検索機能との連動性を担保した。レポジトリ検索システムにおいては、異体字検索を新規に実装するとともに、CreativeCommons ライセンスに対応したライセンスマークを表示する機能を新設した。加えて検索結果については、HTML やCSV に加えてJSON やTurtleといった機械可読な形式での出力を可能とする環境を整え、機械学習、AI、ビッグデータ処理といった新たな汎用的データ活用に対応する構造を整えたところである。
 SHIPS-DB 群から人物情報レポジトリへの参照・応答用API については、昨年度「統合型花押データベース」に実装したモジュールの運用を推進することで、実践的な検証を行った。同DB の入力支援を強化するとともに、新たに生成された人物データをレポジトリに回収する構造を整えたことにより、今後、他DB へと機能拡張する道筋を確認することができた。地理情報レポジトリについては、大きな改変を加えることが叶わなかったが、昨年度開発した外部参照用API の運用が順調に推移し、国立歴史民俗博物館の「荘園データベース」との安定的な連携を維持することができた。こうした経験をふまえ、外部参照用API の機能を人物情報レポジトリに拡張するための検討・実験を行った。
備考