シンポジウム概要

情報技術の発展により、AI・機械学習の高度利活用といったデータ駆動型社会の時代が始まっています。「データ」が「石油」に相当する社会インフラとして位置づけられる状況は、人文社会科学の研究のあり方とも大きくかかわっています。

本シンポジウムでは、人文・社会科学における「データ」とそのインフラ化についての実践的な取り組みに焦点をあて、それらがもたらす影響や研究を取り巻く条件の変化などの課題について議論します。


令和3年10月29日(金)13:00-15:00

ZOOMウェビナーによるオンライン配信

 ※下記の申込フォームからご登録いただいた方に、ZOOM参加のURLをお送りいたします。

申込フォーム

【お申し込み受付期間】 2021年10月25日(月)迄

上へ戻る

Program

司会 尾上 陽介 東京大学史料編纂所 副所長

13:00~13:05
齊藤 延人 東京大学理事・副学長(研究担当)

13:05~13:30

人文学・社会科学データインフラストラクチャー構築推進事業における一橋大学の取り組みについて

田中 雅行 一橋大学経済研究所 准教授

一橋大学では、学術研究者に広く提供することにより、日本経済を中心とする人文・社会科学研究の向上に寄与することを目的に、社会科学統計に関する情報の収集・整理に積極的に取り組んできた。古くは、経済研究所に設置された日本経済統計文献センターに始まり、社会科学統計や歴史統計資料の収集・保管・提供を行うとともに、所蔵資料のデータベース化にも早くから取り組んできた.。公的統計との関わりも古く、政府統計ミクロデータの提供・利用促進にも長年携わってきた。

こうした実績により、2018年度からは日本学術振興会が取り組んでいる「人文学・社会科学データインフラストラクチャー構築推進事業」(以下、「データインフラ事業」)の一拠点に認定され、公的統計分野での強みを生かしたデータアーカイブの構築及び基盤の整備に取り組んでいる。

公的統計分野におけるデータアーカイブ構築は、調査を実施する政府機関側において、e-Statへの結果表の集約や二次利用におけるミクロデータの提供機能の集約などが進められており、政府が掲げる統計データ提供のワンストップサービスがある程度実現している。しかし、1990年代やそれ以前の古い調査結果には、未だデータ化が手つかずであったり、後回しにされているものも多い。

一橋大学は、政府機関と連携して政府統計ミクロデータの二次利用促進に取り組んできた立場や古くから歴史統計資料の収集を行ってきた実績から、日本における代表的な総合統計書である『日本統計年鑑』の明治期刊行分に遡ってのデータベース化や『長期経済統計』などの歴史統計データベースのアーカイブ化を中心に取り組んでいる。

これらの取組は、政府が進める公的統計分野におけるデータアーカイブ構築を学術機関側からカバーする取り組みでもあり、データインフラ事業が掲げる人文学・社会学に係るデータを分野や国を超えて共有・利活用する総合的な基盤の構築に即したものであるといえる。

本報告では、一橋大学がデータインフラ事業において行っている、これらデータ基盤強化の取り組みについて紹介する。

Profile

1967年生まれ。旧総務庁統計センターに入庁後、統計調査の実務家として総務省統計局を中心に調査の企画・実施、公表、集計等公的統計業務全般に携わる。2019年より一橋大学経済研究所准教授。公的統計の二次利用推進に取り組む。


13:30~13:55

社会科学におけるデータ共有と二次分析

三輪 哲 東京大学社会科学研究所 教授

オープンサイエンスの重要性が広く知られるようになったのは比較的最近のことである。しかし、実際のところ、研究データを保管・整備・公開する動きは、社会科学でも数十年前から取り組まれてきている。本報告では、東大社研附属社会調査・データアーカイブ研究センター(以下、CSRDA)の事業展開を中心に、日本におけるデータ共有の状況を概観するとともに、公開されたデータの研究利用の事例を紹介して、今日そして近い将来の二次分析研究の可能性について議論を行う。

社会科学では、社会調査によってデータを蒐集することが多い。多様な社会調査のなかでも、定量的調査法によって得られる数量的データにかんして、日本でも公開や共有が進められるようになってきている。公開にあたっては、メタデータすなわち調査の特徴を記述したデータと、個票データと呼ばれる質問紙への回答を記録した生データの、両方を整備することが必須の条件となる。CSRDAでは、寄託されたデータにかんして、地道に報告書から抜粋してメタデータを作成することや、生データのエラーチェック、集計表の再現性確認、匿名化処理をおこなったうえで、公開する個票データを整備している。

公開されたデータに対しては、複数のアクセス方法がある。CSRDAウェブサイト内のSSJDA Directシステムでは、データの検索、メタデータの閲覧のほか、データの利用申請もできる。また、同サイトにてオンライン集計も可能である。そのほかに、CSRDAの公開データは、人文学・社会科学総合データカタログ(JDCat)、CiNii Researchにも登載されており、それらからアクセスすることもできる。

公開されたデータを利活用した再分析に基づく研究を、二次分析という。CSRDAでは、二次分析の促進のために、次の取り組みをおこなっている。第1に、二次分析研究会の開催である。これは、共通のデータを用いた共同研究の機会を設けたことを意味する。第2に、計量分析セミナーの実施である。こちらにより、若手や大学院生が計量分析の技法を学ぶ場を提供している。こうして、公開されたデータの有効活用を進める試みも継続的におこなっている。

さらなるデータ共有を進めるために、またいっそう優れた二次分析研究をおこなうためには、何が必要なのか。CSRDAの課題を省みつつ、来たるべき未来を見据えて、議論をおこないたい。

Profile

1972年静岡県生まれ。東北大学大学院文学研究科博士課程修了。東京大学社会科学研究所助手、同助教授、東北大学教育学部准教授を経て、2017年4月より東京大学社会科学研究所教授。専門は、社会学(社会調査、社会階層論)。


13:55~14:20

デジタル化された日本史研究資源のゆくえ

山田 太造 東京大学史料編纂所 准教授

「21世紀の石油」とも称される「データ」の存在への着目は高まり、情報社会を動かす基本的な資源として認識され、客観的データに基づく意思決定を行うデータ駆動型社会への取り組みが注目されている。「科学技術・イノベーション基本法」や「第6期科学技術・イノベーション基本計画」では、人文・社会科学の研究データの共有・利活⽤について言及され、データプラットフォームの強化など、他の分野におけるそれと遜色なく、かつ、早急な整備が求められている。日本学術振興会は、人文科学・社会科学研究に係るデータを分野や国を超えて共有・利活用する総合的なシステムを構築することを目的として「人文学・社会科学データインフラストラクチャー構築推進事業」を開始した。

東京大学史料編纂所(以下、史料編纂所)は、組織的かつ系統的な前近代日本史史料調査・収集を約140年間にわたり、継続的に行ってきた。当初は影写本・謄写本・写真帳などの複製史料として蓄積し、 1970年頃から本格的にマイクロカメラ撮影を、2010年頃よりデジタルカメラによる撮影を実施してきた。結果として、2,000万件を超えるデジタル画像を提供する日本史史料コレクションを提供するに至り、これらを公開することで研究者間での共有を可能にし、日本史学の発展や深化に大きく寄与してきた。

史料のデジタル化では、デジタル化手法だけではなく、画像の管理・画像公開までの工程管理・利用条件といった研究データ管理が必要であり、さらに永続性の確保の課題もある。また、画像公開においても研究者間で共有可能な形式の検討が必要である。

本報告では、人文科学、特に日本史学・史料学を取り巻く研究環境の急速な変化、および研究データとしての史料画像の管理・共有の課題に対し、史料編纂所が推し進めている日本史史料を研究資源とした歴史研究データ基盤構築の状況について具体的な取組内容を示すとともに、この基盤整備における課題について議論する。

Profile

1977年3月生まれ。博士(情報学)。国立情報学研究所特任研究員、東京大学史料編纂所特任助教、人間文化研究機構本部特任助教、東京大学史料編纂所助教を経て2020年より同所准教授。専門はデータ工学/歴史情報学。


14:20~14:55
ディスカッサント 箱石 大 東京大学史料編纂所 教授

14:55~15:00
本郷 恵子 東京大学史料編纂所 所長

上へ戻る

ZOOM参加にあたって

上へ戻る

【お問い合わせ先】

東京大学史料編纂所総務チーム

 TEL:(03)5841-5997(平日10:00~17:00)
 Email : jim1@hi.u-tokyo.ac.jp

上へ戻る