東京大学史料編纂所

研究種目名 若手研究(B)
研究課題名 テキストマイニング分析による史学的知識抽出に関する研究(26730167)
研究期間 2014年度 ~ 2017年度
研究代表者 山田 太造
研究目的 本研究では日本史額研究における研究過程支援のため、史料目録・テキストから史学的知識を抽出し、知識間・知識─史料間・史料間などの関係を明確にしながら、内在する史学的知識・暗黙知を外在化する研究を行うため、特に(1)史学的知識の抽出・蓄積、(2)史学的知識間、史学的知識─史料間、史料館の関連性の検出、(3)知識表現・関連表現とそれらを用いた検索手法の確立を解決する。
研究実績の概要
  • 2016年度
  • 2015年度
  • 2014年度
【2016年度】
 平成二十七年度までに史学研究者が研究過程で蓄積してきた史学的知識、 特に人名および時間に着目した調査・分析を進め、それを深化させてきた。 (1)および(3)について古記録等のテキストや家系図類や任免記録類も 対象として人名およびそれに関連する史学的知識の蓄積し、セマンティック ウェブの技術を応用しながらデザインを進めてきた。
 平成二十八年度は、(1)について天正期以外へ適用するなどによりさら に深化させた。さらに、これまで進めてきたセマンティックウェブ技術、具 体的にはRDFを用いた知識表現およびその蓄積方法を適用し、蓄積してき た人名の関連を抽出してきた。(3)については蓄積した史学的知識に対す るセマンティックウェブ技術を用いた検索方式、具体的にはSPARQLを用 いた検索手法を提案し、さらにそれをプロトタイピングしたウェブシステム 上にて適用するなど、さらなる深化に努めた。(2)について、時代・性格 の異なる史料群を対象とすることで知識等の関連を検出するため、系図類や 任免記録等を史学研究者とともに性格や史学研究における利用等について洗 い出しを行い、史料―史学的知識間の関連について検討を進めた。
 これまでの研究成果を人文科学とコンピュータシンポジウム「じんもんこ ん2016」や国際会議Digital Humanities 2016などで発表した。
備考