【令和5年度アーカイブズ研修Ⅱ特集】
電子公文書等に係る最新の動向

西南学院大学情報処理センター
新原 俊樹

1.はじめに
  2000年以降、インターネットへの常時接続が一般化すると、行政機関においても職員に1人1台のパソコンが割り当てられるようになり、日常業務の中で電子ファイル(以下、「ファイル」)が数多く作成され、これらの保存場所としてファイルサーバや共有フォルダ(以下、「共有フォルダ」)が活用されてきた。一方、行政文書としての正本・原本を紙文書とする時期はその後も続き、これら紙文書を綴じたフォルダが「行政文書ファイル」として管理されてきた。
  こうしたなか、2016~2017年の「南スーダン日報問題」「森友学園問題」「加計学園問題」において国の文書管理体制が厳しく問われ、これを受けて各行政機関の行政文書管理規則が改正された。これにより、個人資料と行政文書の分離の徹底、文書の保存期間の判断基準の明確化、行政文書ファイル管理簿による保存期間1年以上の文書の管理が義務付けられた。また、電子公文書の管理についても、「行政文書の電子的管理についての基本的な方針」(2019年、内閣総理大臣決定[1])や、「デジタル化への対応に関する公文書管理課長通知」(2022年、内閣府[2])が出され、共有フォルダ内に置かれたファイルの管理方法について新たな方針が示された。
  政府の新方針において、従来の「共有フォルダ」は、個人資料を置くための「個人用フォルダ」、組織として検討段階に入った文書を置く「検討中フォルダ」、組織として意思決定がなされた後の行政文書の正本・原本を保管する「記録用フォルダ」の3つに区分され、さらに記録用フォルダの構成を行政文書ファイル管理簿の大分類~小分類の構成に一致させて管理することが求められている(図1)。特に、「検討中フォルダ」にはこれまで「共有フォルダ」にあったファイルの大半が残されており、今後は「記録用フォルダ」との連続性も考慮しながら、組織として円滑に文書を共有・継承できる環境を構築していかなければならない。
  本稿では、組織としての文書の共有が始まる「検討中フォルダ」(以下、この検討中フォルダを従来の表現に合わせて「共有フォルダ」と呼ぶ)に注目し、この中にファイルの形式で置かれている電子公文書をどのように管理していくべきか、調査結果を基に解説・提案する。

図1 政府の新方針に基づく電子公文書管理の変化

図1 政府の新方針に基づく電子公文書管理の変化


2.共有フォルダの利用に関するアンケート調査
  まず、これまで共有フォルダ内でファイルがどのように扱われ、また、これに対して利用者はどのように感じているのか把握するため、実際に共有フォルダを利用している組織(国の行政機関の地方支分部局)を事例として、共有フォルダの利便性に関するアンケート調査を行った[3]。アンケートでは、共有フォルダを利用する際に直面すると考えられる6つの場面を提示し、各場面について感じる不満の度合いを多肢選択式で回答してもらった。有効回答(55人)の集計結果(図2)を見ると、場面2と場面5はいずれも共有フォルダ内から1つの最適なファイル(又は1か所の最適な保存場所)を捜索するというよく似た操作を行う場面であるが、場面2に対する不満が最も大きかったのに対し、場面5に対する不満は最も小さかった。この差が生じる原因として、場面2では目的のファイルを特定するまで作業を終了できないのに対し、場面5では最適な保存場所を特定できなくても別の場所にファイルを保存して作業を終了することができるという違いがあるためだと考えられる。この結果は、回答者の多くが、共有フォルダ内に新たにファイルを保存する際、最適な保存場所を探す作業にあまり労力をかけておらず、別の適当な場所にファイルを保存している実態を表している。しかし、最適でない場所に安易にファイルを保存する行為によって、別の利用者にとって新たな場面2の状況が生み出されていることに注意しなければならない。
  また、各選択肢に点数を与え、回答者別に6つの場面に対する不満の度合いの平均を算出した結果、平均点が高い者(多くの場面で不満を感じている者)と低い者(どの場面でもそれほど不満を感じていない者)が同程度となり、同じ共有フォルダに対して強い不満を感じる者とほとんど不満を感じない者が共存していることも判明した。

92_02_02_図2_共有フォルダ利用時の各場面で感じる不満の度合い

図2 共有フォルダ利用時の各場面で感じる不満の度合い[3]


3.共有フォルダの構造と時間変化の可視化
  次に、共有フォルダ内のファイルの属性情報(種類、作成日時、最終更新日時など)を元に、その利用実態の把握を試みた。図3は、ある部局で利用されている共有フォルダ内で保存されたファイル数を四半期別に集計した結果である[4]。左軸(棒グラフ)は四半期毎に作成されたファイル数を示し、右軸(折れ線グラフ)は累積のファイル数を示している。2009年頃から四半期毎のファイル数が増え、累積ファイル数の増加ペースも上がっている。それまでは、ハードディスク(HDD)の容量に制約があり、利用者が定期的にフォルダ内を点検して不要なファイルを削除しなければならなかったが、HDDの最大容量が1TB(2007年)、2TB(2009年)、2011年(4TB)と増加して制約がなくなったことで、共有フォルダ内のファイルは増加の一途を辿っている。
  この部局内の5人が利用する共有フォルダ(ファイル総数137,593個)を事例にして、その構造と時間変化の様子を可視化したものを図4に示す[5]。図4の中心部から放射状に伸びる個々の白線(枝)が親フォルダと子フォルダの関係を表し、枝の先に現れる点(葉)が個々のファイルに対応している。新たに保存されたファイルは、利用期間中は緑色を示すが、最終更新日を過ぎると徐々に赤く色づき、1年経過後に灰色に変色する。10年程度の時間変化の中で特筆すべきは、共有フォルダ内のファイルは絶えず増え続ける一方、最新の時点でほとんどのファイルが灰色になっており、多くが再利用されないまま放置されている状態である。利用されていないこれらのファイルやフォルダが、必要とされているファイルの検索の妨げにならないように、フォルダの構成やファイルの配置を検討する必要がある。

92_02_03_図3_共有フォルダ内のファイル数の推移の事例

図3 共有フォルダ内のファイル数の推移の事例[4]

92_02_04_図4_共有フォルダの構造と時間変化の可視化事例

図4 共有フォルダの構造と時間変化の可視化事例[5]


4.共有フォルダ内のファイル管理の考え方
  これまでのアプローチで明らかになった事実を踏まえ、共有フォルダ内のファイル管理の考え方を2つ提案する[3]。まず、アンケート調査の結果から、同じ状態の共有フォルダ対する不満の度合いが利用者によって異なることがわかった。このため、フォルダの共用人数が増えるほどフォルダ構成やファイルの分類体系に関する合意形成は取りづらくなり、ファイルの移動や不要なファイルの削除などの整理がしづらくなる。したがって、共有フォルダ内であっても、各ファイルの共有範囲は明確にする(限定する)ことを第一に考えたい。具体的には、日常的に同じ業務を進める2,3人程度の業務グループの単位までフォルダを区切り、少人数で各グループのフォルダを管理させる。これにより、他のグループのファイルが自然に隠れるほか、一つのフォルダの共用人数が減るため、ファイル管理が行いやすくなる。
  次に、共有フォルダの構造と時間変化の可視化から、直近の時点でファイルの多くが利用されていない実状が明らかになった。ただし、行政文書を保管する検討中フォルダ内では、これらのファイルを安易に削除することはできない。そこで、利用されていないファイルが必要なファイルの検索の妨げにならないように、時間の経過とともに隠れるしくみが必要である。これを実現するための2つのルールを提案する。1つ目のルールは、「新たにファイルを保存する際には、ファイルの重要度に応じて、一時仮置き用のフォルダ(tmpフォルダ)や期間別の雑件フォルダの下に時系列に並べて保存する」こととする。tmpフォルダに保存されたものは、一定期間の経過後に不要フォルダ(oldフォルダ)に移し、さらに一定期間が経過した後、適時にoldフォルダ内から廃棄していく。一方、期間別雑件フォルダ内にファイルが蓄積されていくと、期間を跨ぐほどの大きな案件や期間中に何度も繰り返し参照する案件については、ファイルの検索が徐々に困難になる。こうした状況になった案件のみ、2つ目のルールとして、「期間別雑件フォルダから取り出し、別に作成する案件別フォルダに移動させることができる」こととする。2つのルールに基づくファイルの保存の流れを図5に示す。これらのルールに従うことで、重要度の低いファイルはtmpフォルダとoldフォルダを経て一定期間後に廃棄され、重要度の高いファイルも、利用頻度が低下したものは過去の期間別雑件フォルダ内に格納(退避)される。こうして、共有フォルダの最上位には利用頻度の高い重要な案件のフォルダのみが抽出され、不要なファイルや古いファイルに妨げられることなく、必要なものを容易に特定できる環境が構築される。

92_02_05_図5_新たにファイルを保存する際の2つのルール

図5 新たにファイルを保存する際の2つのルール[3]


5.ファイルに付与する名称の重要性
  共有フォルダ内のファイル管理と同様に重視したいのが、新規作成ファイルに付与する名称である。ファイルの保存場所を決める際の検討が不足しているように、ファイルにどのような名称を付与するかについても全般的に検討が足りていない。ある地方公共団体において、保存期間が満了となった文書の評価選別作業の効率化を目指した調査事例[6]では、新たに評価選別の対象となった文書と、当該機関において過去5年間に評価選別を行った文書を比較し、そのタイトルから内容が同一であると判断した文書の選別結果を参照する手法を考案した。しかし、同手法で評価選別の自動判定を試みた結果、全体の4割強の文書については、同一と判断されるものが過去5年間の文書の中から見つからず、自動判定することができなかった。この原因として、タイトルに基づく文書の同一判定の手法にも課題はあったが、同じ案件にもかかわらず名称が統一されていないファイルが多いという実状もあった。共有フォルダ内のファイル管理を円滑に行うためには、新規作成ファイルへの命名に際して、内容を的確に表現しつつ他のファイルとも整合の取れた適切な名称を付与することが肝要である。
  新規作成ファイルへの命名に際して、自然言語モデルを用いて最適な名称を提案するシステムの開発事例を紹介する[7]。同システムでは、既存の各ファイルに対して、自然言語モデルの一つであるBERT(Bidirectional Encoder Representations from Transformers)を用いて、その名称が持つ意味も含んだ数値情報としてのベクトルをあらかじめ算出し、データベースに蓄積しておく。次に、新たに作成したファイルの名称の候補をシステムに入力すると、候補として入力された文字列からも同様にベクトルを算出する。新たに算出したベクトルとデータベース内のベクトルを総当たりで比較し、値がよく似たベクトルに対応するタイトルをファイル名の候補として提案するものである。新規ファイルに命名する際の吟味が十分になされていない実状においては、こうした補助機能により、適切なファイル名の付与を支援することが求められる。

6.おわりに
  公文書館等においては、本来業務である歴史的公文書等の受け入れだけでなく、電子化が進む現用文書の管理のあり方について各部局から相談を受けるケースも増えている。現用の電子公文書の管理、特に、組織としての文書の共有が始まる「検討中フォルダ」内においてファイルの管理を円滑に進めていくにあたり、本稿の知見が参考となれば幸いである。

〔注〕
[1]内閣総理大臣決定,行政文書の電子的管理についての基本的な方針,https://www8.cao.go.jp/chosei/koubun/densi/kihonntekihousin.pdf
[2]内閣府大臣官房公文書管理課,デジタル化への対応に関する公文書管理課長通知,https://www8.cao.go.jp/chosei/koubun/densi/tsuchi2.pdf
[3]新原俊樹,共有フォルダ内の電子ファイルを廃棄・選別するための支援機能の提案,レコード・マネジメント,73,pp.60-71,2017,https://doi.org/10.20704/rmsj.73.0_60
[4]新原俊樹,組織内での知識の円滑な共有・継承のための文書管理手法に関する研究,九州大学大学院統合新領域学府ライブラリーサイエンス専攻博士論文,2020,https://catalog.lib.kyushu-u.ac.jp/opac_download_md/4060247/ifs0056.pdf
[5]新原俊樹,共有フォルダ内の電子ファイル格納状況と時間変化の可視化,figshare,https://doi.org/10.6084/m9.figshare.25656477.v1
[6]新原俊樹,機械学習を用いた行政文書の第一次選別機能の開発と性能評価,レコード・マネジメント,85,pp.54-65,2023.
https://doi.org/10.20704/rmsj.85.0_54
[7]新原俊樹,内山英昭,清水敏之,甲斐尚人,自然言語処理モデルを用いた行政文書の同一判定に係るしきい値の調査,日本情報ディレクトリ学会誌,22,2024 (印刷中).