令和7年度アーカイブズ研修Ⅱ3班グループ報告
~電子公文書受入れ時におけるフォーマット把握について~

滋賀県立公文書館 岡本和己

1 はじめに
  本稿は、令和8年2月に開催されたアーカイブズ研修Ⅱにおけるグループ討論において行われた、3班の討論概要を報告するものである。本班は「電子公文書の受入れ」に関心を寄せる次の7名で構成される。
  小宮山敏和(独立行政法人国立公文書館)、山本亜子(国立大学法人神戸大学大学文書史料室)、森田麻以(埼玉県立文書館)、岡本和己(滋賀県立公文書館)、砂川佳子(和歌山県立文書館)、與那覇孝子(沖縄県公文書館)、清水博美(郡山市歴史情報博物館)。
  班員は全員が非現用文書を扱う公文書館等の職員である。所属する館の電子公文書の受入れ実績は、受入れを実施している館、一部受入れを開始している館、数年後の受入れ開始を目指す館など様々であった。
  議論の開始にあたり、まず各館のシステム整備状況を共有した。特に電子公文書に関する問題は、導入しているシステムの種類とも大きく関連するため、各機関が保有する現用・非現用システムの特徴(独自開発かパッケージかなど)についても把握した。
  その結果、自治体や機関ごとに整備状況や構成が大きく異なることが判明した。独自開発や既存パッケージのカスタマイズ事例が多い一方、専用システムを持たず、検索機能や受入れ・公開機能で課題を抱えている館も少なくなかった。

2 課題の洗い出しと討論テーマの設定
  次に、各館の抱える課題や、国立公文書館の『電子公文書の作成・保存・利用ガイドブック 後編~受入れから利用まで~』(令和7年4月、5~6頁)で取り上げられている受入れ後の電子公文書の確認事項(媒体、ウィルスチェック、フォーマット把握、メタデータ、再生確認)に関する問題意識を確認した。その結果、多くの館が特に電子文書と紙文書の併用決裁の問題及びフォーマットの把握に強い課題感を示していることが明らかになった。
  (1) 電子文書と紙文書の併用決裁
  電子文書と紙文書の併用決裁は多様な運用例がある。例えば決裁はシステム上で行うが紙文書が添付される場合や、システム上では電子文書のみだが写しの紙文書がファイルに綴じられている場合など、様々なパターンがある。
  既に電子公文書の受入れを行っている館からは、システム登録情報と紙文書との突き合わせや整理がうまく進まない事例が報告された。また、受入れ検討中の館からは、こうした併用に関する不安の声も寄せられた。現在のところ、このような併用決裁に対する整理方法を確立している館はなく、紙文書が存在しない、あるいは紙文書のみが存在して電子文書がないといった事例も生じている。
  また、紙文書に付随している電磁的記録についても話題に上った。これらに対しては、複製物を作成し閲覧に供しているという館もあるが、多くの館では現状のまま保存するのみにとどまり、実態を把握していない館も少なからずあった。
  (2) フォーマット把握
  フォーマット把握を実施している館からは、標準的フォーマット対応の不十分さや、作成側(移管元)での意識醸成不足が指摘された。一方、未実施または検討段階の館では、把握方法の具体化や非標準的フォーマットの変換に対する不安が顕著であった。
  このほか、現在CD-Rでの移管を実施しているが、移管元より普段使わない媒体であるため変更を希望する声があるといった受入れ媒体に関する課題やシステム面の課題も報告された。また、電子公文書の受入れ経験がない公文書館等の場合、電子公文書の受入れに係る業務の全体像がつかめず、課題自体が把握できていないことが課題であり、今後の受入れに向けて、実施の方針や具体的な進め方について未だ定まらない状況も確認された。

3 討論テーマ:フォーマット把握
  上記の議論を踏まえ、本班では電子公文書の受入れ経験がない公文書館等でも関心の高かった、電子公文書の受入れ時におけるフォーマット把握を討論テーマとして選定した。
  将来にわたり文書の見読性を確保するためには、長期保存に適したフォーマットでの移管が求められる。よって、受入れ時にファイル形式を正確に把握することが重要であり、適したフォーマットでない場合は変換する必要がある。
  では、受入れに適したフォーマットとは何か。国により長期保存のリスクが低いフォーマットが標準的フォーマットとして定められている。文書作成・表計算・プレゼンテーションのファイルではPDF/A-1やWord 2007以降のMicrosoft Office形式が挙げられている。
  本班討論では、「PDF/Aが理想か」「最新のWordやExcelが適当か」という点も議論された。PDFはテキスト情報の保持が可能である一方、WordやExcelは編集履歴等も保存できる。しかし、履歴は文書作成者も意識していない情報である場合が多く、残す必要はあまりないとの考えに至った。また、WordやExcelは意図しない変更が起きやすいとの指摘もあった。これらの議論の末、本班では可能なものはPDF/Aとするのが良いという結論に達した。
  次に、フォーマット把握に係る現状を共有した。
  フォーマット把握に用いられる手法は、イギリス国立公文書館が開発したオープンソースツール、DROID(Digital Record Object IDentification)を活用する例があるほか、移管時に現用システムから出力されるメタデータの利用、人的にファイルの拡張子や内容を確認する方法、またWindowsのファイル一覧表示機能を使った方法などが班員から報告された。国立公文書館において採用されているDROIDでは、フォーマットのみならずバージョンまで確認できる上に、同時にハッシュ値の確認も行うことができる。
  また、実際に移管されている電子公文書のフォーマットは、標準的フォーマットに限らず、多種多様であることも報告された。例えば、古い形式のMicrosoft Office(.xls、.docなど)、一太郎の文書ファイル、映像・音声ファイル、WebデータであるHTML形式のファイル、またAccessのようなデータベースソフトウェア関連のファイルを含むこともある。さらに状況を困難にしているのが、どのようなフォーマットが移管文書の中に含まれているのかが、移管時まで明確に把握できない点である。
  現状の対応としては、例えば国では、標準的フォーマット以外の電子公文書は、原則として、移管元に対して「標準的フォーマット」に変換することを求めている。しかしながら、変換できないファイルはそのまま保存されることもある。また、ファイル形式が特殊で開くことすら困難な場合もあり、内容確認が事実上不可能なケースもまれに散見される。

4 解決策の提案
  上記の課題と現状を踏まえ討論した結果、本班からは以下3点の解決策を提案する。
  (1) 現用側システムの改修
  フォーマット把握は受入れに必須の工程ではあるが、毎回人手で確認・操作することは負担が大きい。したがって、なるべく自動化された仕組みを導入することが望ましい。
  例えば、現用側システムでのファイル登録時に標準的フォーマット以外のファイルのアップロードを制限することや、アップロードを許可する場合は、標準的フォーマット(PDF/A)に自動変換して保存する機能を持たせることが考えられる。
  PDF/Aへの自動変換は既に2館で実施(内1館は保存年限が20年以上の文書のみ)されており、実際に変換されたPDF/Aの視認性も確認されている。システム上でのPDF/Aへの自動変換については、Excelファイル等の場合、大きな表が分割されるなどといった作成者が意図しない表示になってしまうリスクも指摘された。しかし、システム上で自動変換した方が、変換過程に公文書館側の判断や意図が介在せず、原本性の観点では望ましいという見方もできる。
  これらシステムの整備により、受入れ時の負荷軽減とフォーマット統制を同時に実現可能であると考える。
  (2) 移管元への変換依頼
  システムの改修は時間や予算などの問題で即時対応が難しい場合がある。その場合は、移管元に対し標準的フォーマットへの変換を求めることが重要である。標準的フォーマットの利用メリットや保存に適したフォーマット選定の重要性を丁寧に説明し、作成段階からの意識向上を図ることも重要である。これにより、将来的には異なるフォーマット混在の問題を根本的に減らすことができる。なお、原本性を保つため、変換は移管元で実施すべきだという共通認識も得られた。
  (3)特殊フォーマットへの個別対応
  現用側システムでの制御や移管元への変換依頼が原則であるが、変換や修正が不可能なファイルも存在する。そうした場合は、電子データ以外の媒体、例えば紙媒体での保存や別の方法を検討せざるを得ない。これら個別のケースに対しては、関係部署と連携し、柔軟かつ適切に対応する必要がある。

5 おわりに
  現時点で移管されている電子公文書は数年前から十数年前に作成されたものである。今回提案した解決策は、これらの現在移管されてきている電子公文書への対応であるが、根本的な解決のためには作成段階での対応、さらにはその前段階からの取組が不可欠である。
  つまり、移管元に対して標準的フォーマットでの作成及び移管を促す周知徹底や、現用文書管理システムの開発段階から公文書館が積極的に関わっていく連携体制の構築が、将来的な電子公文書受入れの円滑化に大きく寄与すると考える。
  また、現用と非現用の連携のみならず、国や自治体間における情報共有や事例共有も重要である。電子公文書に係る方針や基準だけでなく、「この非標準的フォーマットはこの標準的フォーマットに変換可能である」といった現場の知見を共有することも望ましい。
  今回の3班の討論では、電子公文書受入れにおけるフォーマット把握の課題が改めて明らかになり、その解決に向けた具体的な方向性を共有することができた。電子公文書を専門的に担当する職員が限られている館も多いなか、このように多様な立場からの意見交換の場を設けていただいたことに深く感謝申し上げる。今後もこうした貴重な場が継続され、各館の日々の運営に役立つ示唆が広く伝わることを心から願っている。