東京大学文書館デジタル・アーカイブの運用―学内ポータルとの連携を中心に―

東京大学文書館
助教 元ナミ

1.はじめに
  東京大学には、日本の高等教育の黎明期以来、長い歴史の中で蓄積されてきた多様な学術資産が存在する。東京大学文書館(以下、文書館)には、大学の運営や教育・研究活動の過程で作成・取得された文書に加え、元教員や学生団体等から受け入れた、大学史・教育史の研究に資する歴史的資料が多数所蔵されており、これらは広く公開されている。
  一方、大学を構成する学部、大学院、その他本学の組織においても、希少な文書資料や貴重資料、研究成果等が独自に保存・管理され、学術的・社会的に重要な史資料として継承されてきた。近年では、これらの学術資産をデジタル化し、公開および活用を推進する動きが広がっている。
  東京大学では、2017年度より、学内に点在する学術資産を体系的に把握し、デジタルアーカイブとして公開・活用することを目的として、「東京大学デジタルアーカイブズ構築事業」[1](以下、東京大学DA構築事業)を推進してきた。本事業では、各組織が個別に進めてきたデジタルアーカイブの取組を尊重しつつ、それらを横断的に案内するための共通基盤の整備が進められている。その成果の一つが、東京大学デジタルアーカイブポータル[2] (以下、ポータル)である。
  文書館においては、所蔵する特定歴史公文書等および歴史資料等を対象に、利用者のアクセス向上を目的としたデジタル化を進めるとともに、目録検索およびデジタル画像等をオンラインで提供するため、「東京大学文書館デジタル・アーカイブ」[3](以後、文書館DA)を構築・運用している。本稿では、文書館DAの運用とポータルとの連携について、実務の観点から整理する。

2.東京大学文書館におけるデジタルアーカイブの運用
2.1 システムの構成と運用方針
  2015年に公表された「東京大学ビジョン2020」[4]において、学術資産のアーカイブ構築と公開を推進する方針が示された。2016年には東京大学学術資産等アーカイブズ委員会が設置され、学内MLA(博物館・図書館・文書館)機関等が連携して、学術資産のデジタル化と公開に向けた全学的な取組が進められてきた[5]。
  文書館は設立当初より、所蔵資料の公開を目的とするデジタルアーカイブの構築を進めており、こうした全学的な動きとも方向性を共有しつつ文書館DAの構想を具体化してきた。その実現のため、限られた予算および人的資源のもとでも所蔵資料の目録情報およびデジタル画像等を継続的に公開でき、かつ特定のベンダーや環境に依存しない運用を可能とするため、オープンソースソフトウェアであるOmeka S[6]を基盤としている。
  本システムは2017年10月にベータ版を公開し、試行的な運用および機能検証を経て、2018年8月に本公開を開始した。公開後も、利用状況を踏まえながらシステム環境の見直しや機能調整を行い、改善を重ねてきた。現在は、デジタル画像等とメタデータを統合的に管理・公開する仕組みとして運用されている[7]。

画像1 東京大学文書館デジタル・アーカイブ上で検索された資料の表示例[8]

2.2 目録情報およびデジタル画像の提供
  文書館DAでは、文書館の所蔵資料について、資料群の階層情報を保持した目録検索が可能である。利用者が資料全体の構成を把握しつつ個々の資料を参照できるよう、資料整理および目録作成の過程においてこの点を重視している。
  目録データは、ISAD(G)等の国際的な記述標準に可能な限り準拠して作成している。また、学内外での利活用や外部システムとの連携を見据え、RDF/XMLやJSON-LDなど複数の形式によるデータ提供を行っている。その一環として、Omeka S向けに当館がカスタマイズのうえ外注により作成したモジュールをオープンソースとして公開し、同様の環境でデジタルアーカイブを構築するための情報提供を行っている[9]。
  一部の資料については、アイテム単位または件単位のデジタル画像等の閲覧を提供している。公開している画像は、原資料の保存に配慮しつつ、利用者のアクセス性を高めることを目的として作成したものである。
  デジタル化作業は、東京大学DA構築事業の支援を受けて実施されたものも多いが、文書館の日常業務としても継続している。対象資料の選定にあたっては、学術的価値、利用状況、保存状態、権利関係等を総合的に考慮し、館内で検討を行っている。具体的には、明治期から昭和戦前期にかけて作成された政府省庁および学内の往復文書、利用の多い個人資料、古写真などを中心に、段階的にデジタル化と公開を進めている。
  文書館では、資料の形態や状態に応じて、撮影またはスキャンを使い分け、原資料への負荷を抑えることを優先している。館内で対応可能なものについては職員が作業を行う場合もあるが、主として外部事業者への委託を併用している。
  また、文書館DAにおけるデジタル画像等の公開にあたっては、資料の内容および文書館利用審査基準を踏まえ、必要な箇所についてはマスキング処理を施すなどの対応を行っている。

2.3 日常的な運用と公開後の対応
  文書館DAの運用は、主として文書館デジタルアーカイブ部門が担当している。文書館では、資料目録データを館員が随時編集できる環境を整えている。また、資料整理の過程で作成・修正される目録データを日常的に管理している。館員は、スプレッドシート上でデータを修正できるほか、Omeka S上でも目録データを直接修正することができる。
  一方、デジタルアーカイブ部門は、データの公開と統括を担い、Omeka Sのインポート機能による定期的な登録・更新、記述内容の確認・修正、問い合わせ対応などを行っている。あわせて、運用過程で生じる課題についても、継続的に見直しや調整を行っている。

3.東京大学文書館デジタル・アーカイブと東京大学デジタルアーカイブポータルの連携
3.1 東京大学デジタルアーカイブポータルの概要
  ポータルは、文書館を含む学内各組織が公開している学術資産を横断的に案内し、利用者が資料の存在を発見するための入口として整備されてきた。各組織が構築・運用してきたデジタルアーカイブのメタデータを収集し、統合的な検索環境を提供することで、学内に分散する学術資産の可視性向上を目的としている[10]。

画像2 東京大学デジタルアーカイブポータル上で検索された文書館資料の表示例[11]

  このポータルは、個別機関の公開サイトを置き換えるものではなく、資料の所在を示し、元の公開サイトへ利用者を誘導するための仕組みとして整備されている。こうした考え方は、事業開始当初から学内で共有されてきた[12]。
  あわせて、一部のコレクションは、画像の効果的・効率的な共有を可能とする国際的な枠組みである IIIF(International Image Interoperability Framework)を用いた公開が行われているほか、一部のテキスト資料については、人文学資料のマークアップのためのガイドラインである TEI(Text Encoding Initiative)に基づく公開が進められている。さらに、LOD(Linked Open Data)によるデータ公開を通じて、単なる閲覧提供にとどまらず、第三者や計算機によるデータ利活用を支援している[13]。

3.2 文書館デジタル・アーカイブとの関係
  文書館DAとポータルは、資料の保存・管理と資料発見の機能を分担する形で連携している。
  文書館DAは、文書館が所蔵する資料群を対象として、その形成過程や作成背景を踏まえたアーカイブズ記述を行い、階層別の目録情報とデジタル画像等を保存・管理しつつ公開する基盤である。文書館では、デジタルアーカイブ構築の初期段階から、資料群全体の記述を重視し、作成者との関係や来歴を示すことができるよう、アーカイブズ記述を整備してきた[14]。
  一方、ポータルは各組織のデジタルアーカイブからOAI-PMHを通じてメタデータを収集し、横断的な検索環境を提供する仕組みである。ポータルは収集したメタデータを表示することで、利用者が資料の目録情報や画像を閲覧できる環境を提供している。
  文書館DAでは、ポータルによる収集を想定したメタデータを整備し、外部から取得可能な形で提供している。各資料の記述情報やデジタル画像等には識別子を付与しており、ポータルはそれらを参照することで資料の所在を示している。この構成により、各部局の個別運用を維持しつつ、過度な負担をかけることなく連携を実現している。

画像3 東京大学デジタルアーカイブズ構築事業の概略図[15]

3.3 連携による効果と実務上の課題
  ポータルとの連携により、文書館DAの資料は、他の組織等が公開する学術資産と並列的に検索・参照されるようになった。これにより、利用者は文書館DAや学内に散在する研究資源情報を個別に検索する手間を省き、ポータルを通じて関連資料を横断的に検索できるようになった。さらに、ポータル上で資料の存在を確認し、文書館DAへ移動することで、詳細な目録情報やデジタル画像等にアクセスできる。その結果、関心に応じた資料の発見が容易となり、文書館資料の利用にもつながっている。
  一方で、文書館DAにおけるデジタル画像等の作成およびメタデータの提供は、文書館独自の継続的な取組に加え、東京大学DA構築事業の支援を受けて進められてきた。文書館では、事業全体との連携を図るため、画像公開条件やメタデータの提供方法を整理し、一定の品質基準のもとで運用を行っている。
  しかし、文書館DAで整備してきたアーカイブズ記述は、ポータルの表示項目とは一致していない。ポータルはアイテム単位でメタデータを収集するため、文書館DAのアイテムがどの資料群(フォンドやシリーズ)に属するかを示す情報は表示されない。また、文書館の主要なメタデータは、ポータルでは「内容記述」(dcterms:description)という一つの項目にまとめて表示される。その結果、各メタデータ項目はポータルではテキストとして提示され、文書館DAの項目構成は反映されていない。さらに、ポータルでは文書館資料が一律に「図書」として処理され、「公文書」等の区分にも対応していない。

画像4 同一資料に関する文書館の目録情報(左)とポータルの目録情報(右)の表示例(抜粋)」[16]

  このような表示上の差異は、記述方針や資料類型の表現方法の違いに起因するものである。今後は、ジャパンサーチとの連携も視野に入れつつ、文書館の記述方針との整合性および資料類型の適切な表現方法について検討を重ねる必要がある。
  また、ポータルの整備が進んだことより、大学が所蔵する資料はすべてデジタル化されているとの理解が利用者の間に生じる場合もある。ポータルは資料探索を支援する仕組みである一方、公開範囲の実態とは必ずしも一致しない。そのため、文書館では資料の公開状況やデジタル化の進捗について説明を行いながら、個別に対応している。

4.おわりに
  本稿では、文書館における文書館DAの運用とポータルとの連携について紹介した。
  文書館DAとポータルの連携は、学内に分散する学術資産情報を並列的に検索できる環境を形成する一方で、資料群の階層構造や記述項目が十分に反映されないという課題も生じている。これらの差異は、単なる表示形式の違いにとどまらず、アーカイブズ記述の構造とポータルのデータ収集仕様との関係に由来するものである。
  文書館は、これまで整備してきた目録情報や各種の記述データに加え、デジタル画像等についても段階的な公開を進めている。限られた人的・財政的資源のもとでこれらの取組を継続してきたことは、文書館DAの運用における重要な成果の一つである。
  今後は、既存の記述資源を基盤としつつ、ポータルとの連携を前提とした資料整理のあり方について、実務の中で検討を重ねていくことが求められる。その際には、国際的な動向や外部基盤との連携を参照しながらも、文書館の実情に即した形で取り入れていく姿勢が重要である。
  本稿で整理した検討過程は特定機関における一事例ではあるが、実務に根ざしたデジタルアーカイブとポータル連携の関係を考える際の一つの参照事例となる。

[1]東京大学附属図書館「東京大学デジタルアーカイブズ構築事業について」(https://www.lib.u-tokyo.ac.jp/ja/library/contents/archives-top。参照2026-01-22)
[2]東京大学デジタルアーカイブポータル https://da.dl.itc.u-tokyo.ac.jp/portal/。
[3]東京大学文書館デジタル・アーカイブ https://uta.u-tokyo.ac.jp/uta/s/da/page/home
[4]「東京大学ビジョン2020」(https://www.u-tokyo.ac.jp/ja/about/president/b01_vision2020.html。参照2026-01-22)
[5]中村覚「東京大学デジタルアーカイブズ構築事業における学術資産の利活用に向けた取り組み」『東北大学史料館だより』No.29、2018年9月、pp.2–3.
[6]Omeka S, https://omeka.org/s/
[7]詳細については、過去の「東京大学文書館ニュース」を参照されたい。(https://www.u-tokyo.ac.jp/adm/history/03_02_j.html。参照2026-01-22)
[8]東京大学文書館所蔵『文部省往復 明治十年分』(参照コード:S0001/Mo023)。文書館DAにおける当該資料の目録情報およびデジタル画像表示例。(https://uta.u-tokyo.ac.jp/uta/s/da/document/96cf61199e0d606d356681952b992dcb。参照2026-01-22)
[9]東京大学文書館では、文書館デジタルアーカイブの構築・運用に関連するモジュールや技術情報をGitHubにおいて公開している。(https://github.com/utarchives、accessed 2026-01-22)
[10]中村覚「東京大学デジタルアーカイブズ構築事業の進捗状況」『第2回東京大学学術資産アーカイブ化推進室主催セミナーかわいい子には旅をさせよ ― デジタルアーカイブとオープンデータ ―』報告資料、2018年11月22日。(https://repository.dl.itc.u-tokyo.ac.jp/records/51354。参照2026-01-22)
[11]画像1(前掲8)で示した東京大学文書館デジタル・アーカイブ上の表示例と同一資料である、東京大学文書館所蔵『文部省往復 明治十年分』(参照コード:S0001/Mo023)について、東京大学デジタルアーカイブポータル上で検索・表示された資料情報の例。(https://da.dl.itc.u-tokyo.ac.jp/portal/assets/dccf4e96-3046-40e9-80df-ae6037abc0a8?pos=1。参照2026-01-22)
[12]情報システム部情報基盤課学術情報チームデジタル・ライブラリ担当「東京大学学術資産等 アーカイブズポータル紹介」『第3回東京大学学術資産アーカイブ化推進室主催セミナー東京大学デジタル万華鏡 ― デジタルアーカイブズ構築事業の成果紹介とこれからの活用を考える ―』2019年11月29日。(https://repository.dl.itc.u-tokyo.ac.jp/records/53797。参照2026-01-22);斉藤涼(東京大学情報システム部)「東京大学デジタルアーカイブズ構築事業の紹介」『第7回東京大学学術資産アーカイブ化推進室主催セミナー デジタルアーカイブズ構築事業の成果紹介とこれからの活用を考える』2023年12月13日。(https://repository.dl.itc.u-tokyo.ac.jp/records/2008420。参照2026-01-22)
[13]前掲5)。
[14]宮本隆史「組織のデジタルアーカイブ構築の課題と解決に向けた一考察:東京大学文書館デジタルアーカイブの事例より」『東北大学史料館だより』No.29、2018年9月、pp.4–5.
[15]前掲12、斉藤(2023)。
[16] 東京大学文書館所蔵『文部省往復』(参照コード:S0001)。資料群最上位記述について、文書館DA上の表示例と、同一資料をポータル上で検索・表示した例とを並列して示したものである。文書館DA(https://uta.u-tokyo.ac.jp/uta/s/da/document/6c8f9acc3b4a1a0e8ca33196721fca2d。参照2026-01-22);ポータル(https://da.dl.itc.u-tokyo.ac.jp/portal/assets/8928fce6-631e-4bf4-bd4d-2112587a40a4。参照2026-01-22)