国立公文書館 統括公文書専門官室
公文書専門官 渡辺悦子
はじめに
国際公文書館会議(International Council on Archives、ICA)は、同会議のプログラム委員会[1]の資金提供により、全8回のオンライン・チュートリアルシリーズ、「AIとアーカイブズ実務(AI and Archival Practice)」を作成、ICAのウェブサイトで公開[2]している。本シリーズはICA前会長でICAフェロー(2026年現在)であるDavid Fricker氏をリーダーに作られたものであり、本誌第97号及び98号で第1回から第5回までを紹介してきた[3]。
本稿は本連載の最終回として、第6回「AIと倫理、人権」、第7回「AIとアーカイブズの利用促進」、第8回「AIの専門知識の維持」を紹介する。
1. 第6回:AIと倫理、人権(AI, Ethics and Human Rights)
1-1. セッションの概要とスピーカー
ラテンアメリカ・アーキビスト協会の情報アクセスと透明性に関する作業部会メンバーであるClaudia Escoto氏を司会に、国連教育科学文化機関(ユネスコ)メキシコ事務所コミュニケーション情報局担当官のViridiana García Marignón氏とメキシコ・サイバーセキュリティ・デジタル法学会会長のErnesto Ibarra Sanchez氏をむかえたセッションである。セッション後には、Fricker氏を司会に、シンガポール国立公文書館のKit Geok氏、ポルトガル・コインブラ大学情報学教授のMoises Rockembach氏、スペイン・ジローナ州公文書館のLluis-Esteve Casellas氏が登壇してのクロージングセッションがある。
1-2. Marignón氏とIbarra氏のセッション
まずMarignón氏は、AIは分類や記述など反復的作業の自動化、データ分析や検索の高度化を通じて業務を支援し得るものであり、多言語翻訳、特に先住民言語への対応[4]の取組によって、これまでアクセスが困難であった人々にも知識や情報への道を開き、記録遺産へのアクセスの「民主化」に寄与する可能性があると述べる。一方で、アルゴリズムの学習過程やデータの質に内在するバイアスが、差別や排除を再生産する危険性を指摘し、継続的な人材育成や資源確保とあわせて、人権を損なわないための倫理的配慮が不可欠であるとしている。
続いてIbarra氏は、AIは人間の能力や知識へのアクセスを拡張し得る一方で、不適切に利用された場合には深刻な人権侵害をもたらし得ると指摘する。記録は人間の尊厳と不可分であり、その保存と利用が人権を保障する基盤であるからこそ、AIの誤用は重大なリスクを伴うという。特に、アルゴリズムの設計不良や低品質なデータ、検証・監査の欠如は、情報へのアクセスの歪みや誤認を長期間放置する危険があると警告している。こうしたリスクに対し、AI導入の構想段階から人権への影響を主な判断軸とし、AIのライフサイクル(開発・導入→運用→評価・見直し→改修)全体を通じた継続的な検証が不可欠だと述べ、近年成立した欧州のAI法[5]が採用する「リスクベース・アプローチ」は、アーカイブズ専門職にとっても重要な参照枠になるとしている。そして、AIをアーカイブズ業務に適用する方針を構想する際には、①人権を中核に据えた倫理原則、②各国の法制度に基づく法令、③データ管理や情報セキュリティ等に関する国際標準化機構(ISO)などの国際規格を含む技術的標準、という三つの要素を組み合わせて考えることが不可欠だとする。
こうした倫理や人権に関する課題に対応する国際的枠組みとして、Marignón氏は、ユネスコが2021年に採択した「人工知能の倫理に関する勧告[6]」を紹介している。この勧告は、AIの開発・利用が(1)人権と人間の尊厳の尊重、(2)社会と環境の持続可能性、(3)多様性と包摂性、(4)平和で公正な社会の実現という四つの基本的価値に基づくべきことを明確にしており、アーカイブズ分野にも直接関わると説明する。あわせて、個人データ保護やサイバーセキュリティへの配慮、ジェンダーバイアスへの対応などを含む関連ガイドラインの活用を勧めている。さらに、国や地域ごとにアクセス環境やリソース、課題は異なるため、国際的枠組みを参照しつつも、各国・地域の実情に即した指針や政策を策定する必要があると指摘し、特にアーカイブズ分野では、専門職同士のネットワークを活用して、能力開発や資源不足を補い合いながら、段階的にAI活用の道筋を描くことが重要であるとまとめている。
1-3. クロージングセッション
まず、Casellas氏が、Marignón氏とIbarra氏のセッションより、「AIによるアクセスの民主化」と「AI利用と管理・検証」の2点が重要と感じたとし、AI導入には、事前の検討だけでなく、導入後の監査や評価が不可欠であり、そのためには多分野・多職種による協働が必要だと指摘している。また、公開されている画像や音声、テキストが機械学習等に大量利用され得る点に触れ、公開と(AIの学習等を含む想定外の再利用に対する)利用管理のバランスという新たな課題も提起している。
Geok氏は、AIへの信頼を築くためには、精度や安全性、説明責任といった原則が重要であり、これはアーカイブズが従来重視してきた真正性や信頼性の問題と重なるとする。また、「民主化」の点では、記録に含まれる当事者など、意思決定に関与しない人々への間接的影響にも注意が必要であり、技術以前にアクセス自体が制限されている人々の存在にも目を向けるべきとする。
Rockembach氏は、AIによる保存プロセスの自動化や多言語対応を通じて記録へのアクセスが拡大する可能性を評価する一方で、バイアスや情報の歪みのリスクから、データの多様性と品質を確保しなければ人権や記録の真正性を損なう恐れがあることをあらためて指摘している。
最後にFricker氏は、AIがもたらす機会とリスクの双方を整理しつつ、技術がグローバルに使われる一方で、人権への影響は地域や文化によって異なるため、ローカルな文脈を考慮する必要があること、AIの影響は数年単位での継続的な監査と評価が重要との視点が新鮮だったとし、議論を締めくくっている
2. 第7回:AIとアーカイブズの利用促進(Using AI to Promote the Archives)
2-1.セッションの概要とゲストスピーカー
David Fricker氏を司会に、AIインフラ企業であるGroq[7]の上級ソフトウェア・エンジニアのTim Sears氏を招いてのセッションである。クロージングセッションでは、第6回にも登壇したClaudia Escoto氏とMoises Rockembach氏に加え、インドCEPT大学アーカイブズの助教のSaman Quraishi氏、ガボン・ドキュメンタリスト協会(ADG)の元会長のEstelle Obe氏がコメントしている。
2‐2. Sears氏のセッション
本セッションは、生成AI[8]、特に大規模言語モデル[9](Large Language Model、以下LLM)を用いたアーカイブズの利用促進とアーカイブズ記述におけるAIの可能性と課題に焦点がおかれる。
セッションの前半では、アーカイブズ記述におけるAI活用として、メタデータ生成が取り上げられる。記述とは資料の来歴や背景といったコンテクストを示し、利用者が記録の意味を理解するための基盤となるとのFricker氏の説明を受け、Sears氏は、LLMは大量のテキストから要点を抽出し、説明文や要約を生成することを得意としており、外部データを参照する仕組み(Retrieval-Augmented Generation、検索拡張生成、以下RAG[10])と組み合わせることで、既存のアーカイブズ資料をもとにした柔軟な記述支援が可能になるとする。また、テキストだけでなく画像を入力して説明文を生成するなど、複数の情報形式(モダリティ)を扱える点も、今後のアーカイブズの記述の実務において活用され得ると指摘する。
続いて、Fricker氏より、センシティブな内容や文化的多様性への対応をめぐり、立場によって解釈が分かれる資料をAIがどのように扱うかが課題として挙げられる。それに対し、Sears氏は、現代の文脈や多様な価値観を踏まえて提示の仕方を工夫することが重要とし、AIをそうした説明や語り分けを柔軟に行うための道具として位置づけ、価値判断の多くはモデルの学習段階で設計されるべきとする。また、事実関係を抽出するモデルと、文化的・倫理的配慮の観点から内容を検証・調整するモデルを組み合わせるといった、複数のモデルを組み合わせた役割分担や、人間による方針策定と監督のもとでの反復的な改善によって、実際の運用に耐える仕組みを構築できる可能性や、社会的価値観が変化する中で、記述を固定せず更新し続けられる点は、AI活用のメリットになると指摘する。
セッション後半は、アーカイブズの「意味をつくる(sense-making)」行為を支援する具体例として、音声対話型AI(Vapi[11])によるデモンストレーションとなる。例えばオーストラリア国立公文書館のウェブサイト上のテキストをそのまま入力するだけで、来館者の質問に応答する音声チャットボットが短時間で構築できることが示され、AIがアーカイブズ利用の入口として機能し得るとし、このような対話型AIは、視覚障害者を含む多様な利用者にとってアクセシビリティを高める手段にもなることが言及されている。最後に、AI活用のコストは従来ほど高くなく、試作レベルであればごく低予算から始められることが紹介され、まずは小規模な実証や試行を通じて可能性を探ること、さらに外部の開発者やコミュニティと協働することで多様な発想や応用が生まれるとし、反復的な試行と改善こそがAI活用を前進させる鍵であるとのSears氏の助言で締めくくられた。
2‐3. クロージングセッション
各コメンテーターからの所感として、まずEscoto氏は、音声を含む対話型AIが、利用者をより自然な形でアーカイブズ資料に導き、発信力の強化につながる可能性を評価している。Rockembach氏は、RAGの活用により、機関固有の情報に基づいた正確な応答が可能となり、生成AIの弱点である誤情報やもっともらしい情報[12] の抑制に寄与すると指摘している。Obe氏は、AIが日常的な業務を補助し、記述や探索を含む実務の業務効率の向上につながることに言及する。最後にQuraishi氏は、LLMとRAGを組み合わせることで、アーカイブズの可視性を高め、より多くの利用者に情報を届けられること、低コストで概念実証が可能な点を踏まえ、地域差やリソースに制約のある環境でも実験的に活用できること、実証や実験を通じて自館の文脈に即したAI活用を継続的に探ることの重要性を述べている。
3. 第8回:AIの専門知識の維持(Maintaining a Professional Knowledge of AI)
3-1.セッションの概要とゲストスピーカー
本セッションは、(1)英国ラフバラー大学コミュニケーション・メディア学科教授のLise Jaillant氏とイタリア・ボローニャ大学古典文献学及びイタリア学教授のGiovanni Colavizza氏へのインタビュー、(2)カナダのブリティッシュ・コロンビア大学助教でInterPARRES Trust AI[13]プロジェクトに取り組むRichard Arias Hernandez氏へのインタビュー、(3)本ビデオシリーズを通じて登壇するポルトガル・コインブラ大学情報学部教授のMoises Rockembach氏へのインタビューの、3つのセッションで構成される。本ビデオシリーズの最終回である。
3‐2. Lise JaillantとGiovanni Colavizza氏のセッション
Jaillant氏は、まず、AIはもはや「選択肢」ではなく、アーカイブズ機関と利用者双方にとっての「必需品」になったと述べる。英国のCOVID-19調査で明らかになったメッセージ削除問題[14]は、非公式ツール上の記録が記録管理の対象として十分に把握されていなかったことを示す事例であり、デジタル記録が公式な管理枠組みの外に大量に蓄積する状況そのものが、現代のアーカイブズにとって重大な課題であるとする。こうした状況のもとでは、人手だけで全体を把握することは不可能であり、機械的処理による手法(computational approach)の導入は現実的対応であるとする。一方で、保存・廃棄の判断を機械に委ねることには本質的なリスクがあり、判断主体は常に人間でなければならないとし、AI時代における専門知とは、技術を使うことではなく、その前提・限界・誤りを理解したうえで責任を保持し続ける力にあるとしている。
Colavizza氏は、AIがアーカイブズを「記録」ではなく「データ」として扱う傾向を加速させる点に強い懸念を示している。全文検索や自動抽出は利便性を高める一方、記録が本来もつ作成のコンテクスト、組織構造や関連性を不可視化し、利用者にも専門職にも誤解を生じさせる可能性があるという。問題は技術そのものではなく、それを無批判に導入することにあるとし、成功の条件として、外部委託に依存するのではなく内部に判断力を持つことであり、アーキビストがデータセットの設計、業務に即したベンチマークの設定、AIを使ったプロセスに関与できる能力を持つ必要があるとする。そして、AIは完全自動化ではなく、専門職を補強する形で使われるべきであり、その前提を保てるかどうかが、今後の専門職の存立を左右すると述べている。
3-3. Richard Arias Hernandez氏のセッション
Hernandez氏は、InterPARES Trust AIにおける研究の一環で、機械学習を実際に試行してきたアーキビストへの調査を通じ、AI時代の専門能力がどのように形成されているかを検討している。初期の事例では、固有表現抽出や自然言語処理など特定技術への試行が中心であったが、近年は、機械学習が既存の業務システムに組み込まれ、必ずしもプログラムのコーディング能力を前提としない利用形態も増えており、アーカイブズ原理を踏まえつつ「モデルの結果を評価すること」の重要性や、他分野と協働する能力が必要とされていることが明らかになったという。また法制度や組織環境によって専門職の関与の仕方は大きく異なっていることを指摘する。こうした認識のもと、InterPARESでは、AIを使ったプロセスそのものに関与し、判断や説明責任を担える力を育成することを目的とした学習モジュール[15]の開発を進めているという。最後に、6~8か月で陳腐化するような急速に変化するAI関連の技術環境のもとでは、「これさえ身につければよい」という固定的な能力は存在せず、「何に対して批判的であるべきか」を問題としていくべきと締めくくっている。
3-4. Moises Rockembach氏のセッション
Rockembach氏も、InterPARES Trust AIにおいて、記録管理者とアーキビストを対象とした調査を通じ、AI導入を阻む要因とAIリテラシーの課題を明らかにしている。調査では、AI活用が進まない理由として、(1)AIに関する知識・能力の不足、(2)AIを適用できる十分なデジタル資料の量の欠如、(3)AIの出力に対する信頼性への不安、(4)既存の記録管理システムとの未統合、(5)財政的・人的リソースの不足、という五つの主要な障壁が抽出されたという。特に、生成AIの「もっともらしい誤り」や、組織の承認を得ないツール利用(いわゆるシャドーIT[16]やBYOAI[17] )は、説明責任や倫理面での新たなリスクを生んでいると指摘する。これらは、AIがすでに現場で使われているにもかかわらず、組織として統制・評価できていない状況を示している。よって、問題は単なる技術不足ではなく、AIリテラシー、データ品質、ガバナンスが結びついていない点にあるとし、個々の組織の制約を前提としつつ、共有インフラや実践コミュニティを通じた知識共有、国際的な協力によって人材・経験を補完する必要性を述べる。また、こうした発言を受け、Fricker氏は、ICAのような国際組織がその結節点となる可能性に言及している。
3-5. クロージングセッション
Fricker氏とRockembach氏によるクロージングセッションでは、Rockembach氏がまず、三つのセッションがInterPARESの調査で明らかになったAI導入の障壁と強く対応していると整理する。具体的には、知識・技能の不足、デジタル化の遅れ、AI技術の信頼性、既存システムとの統合の難しさといった点が、各登壇者の議論に共通して現れていたと述べている。これを受けてFricker氏は、Jaillant氏が示した「AI導入は不可避であり、理解に向けて踏み出す必要がある」という姿勢、Colavizza氏による「AI適用において記録のコンテクストを失ってはならない」という警鐘、そしてHernandez氏が指摘した「利用環境によって専門職に求められるAIへの関与の仕方の異なり」という各氏のインタビューにおける重要な点を整理し、専門能力開発の方向性を示したことを評価している。
Fricker氏、Rockembach氏両氏ともに、組織として導入するAIツールの利用可能性とシャドーIT等のリスクとの緊張関係を踏まえつつ、いずれの環境においても、基礎的なAI理解を前提とした専門職の関与が不可欠である点で一致し、AI活用に向けた能力向上の必要性に言及し、議論を締めくくっている。
4.おわりに
本シリーズは、アーカイブズ分野におけるAI活用の、2024年時点における到達点と課題を可視化する試みと言える。検索や記述、アクセス支援などの一部の業務では、AIが実務を補助し得る段階に到達しつつある一方で、倫理・人権といった領域では、慎重な検討と原則の共有が先行している状況が浮き彫りになっている。印象的なのは、AIが「人の判断を置き換える存在」としてではなく、専門職の判断を支え、問いを可視化する補助的な手段として繰り返し位置づけられている点である。AIの導入は、効率化や利便性の向上をもたらす可能性を持つ一方で、記録の真正性、説明責任、人権への配慮といった、アーカイブズ実務の根幹に関わる課題を改めて照らし出すものとなっている。
本シリーズを通じて示されたのは、AI活用の成否は、技術そのものよりもそれを扱う専門職の知識、姿勢、そして組織としての体制に大きく依存するという点である。AIはこれから、「避けて通れない技術」となっていくこと、AIと共にあるアーカイブズの姿は、今後の実践と経験の積み重ねの中で、段階的に形づくられていくことが予想される。AIをめぐる問いと学びをアーカイブズ関係者で共有し続けること自体が、今後のアーカイブズ実務にとって重要となることが感じられるビデオシリーズである。本連載は広範な議論の一部を要約したものにすぎない。アーカイブズ実務におけるAI導入に関心のお持ちの方は、ぜひ本編をご覧いただくことをお勧めする。
[1]Programme Commission(PCOM)は、専門的・技術的プログラムやICA主催の国際会議、専門家グループの運営、専門家プロジェクトへの資金提供といった活動を統括する機関。ICA副会長(Vice President Programme)が委員長を務める。:About the Programme Commission: https://www.ica.org/programme-commission/about-programme-commission/ (access: 2026年1月19日)
[2]ICAウェブサイト:https://www.ica.org/resource/ai-and-archival-practice-on-line-tutorials/ (access: 2026年1月19日)
[3]第97号(令和7年8月29日)「国際公文書館会議(ICA)PCOMプロジェクト「AIとアーカイブズ実務」チュートリアル #01:「第1回:AIと評価選別」「第2回:AIとデジタル保存」(https://www.archives.go.jp/publication/archives/no097/17408)、及び第98号(令和7年11月28日)「国際公文書館会議(ICA)PCOMプロジェクト「AIとアーカイブズ実務」チュートリアル
#02:「第3回:研究とアクセスを支援するAI」「第4回:AIとアーカイブズ記述」「第5回:AIと写真アーカイブズ」(https://www.archives.go.jp/publication/archives/no098/17687)
[4]メキシコの場合、スペイン語に加え、先住民族の言語等68の言語が存在しており、これら言語への翻訳の取組により、技術的イニシアチブを結び付ける可能性が言及されている。
[5]EU理事会及び欧州議会による審議と交渉を経て、2024年5月に成立、同年8月施行。欧州連合日本政府代表部によるEU AI法の概要:https://www.kantei.go.jp/jp/singi/titeki2/ai_kentoukai/gijisidai/dai8/sanko12.pdf (access: 2026年1月19日)
[6]人工知能の倫理に関する勧告: Recommendation on the Ethics of Artificial Intelligence(ユネスコwebサイト:https://unesdoc.unesco.org/ark:/48223/pf0000381137 ) 日本語版は文部科学省のサイト参照:https://www.mext.go.jp/unesco/009/1411026_00004.htm (access: 2026年1月19日)
[7]Groq: https://groq.com/。 Sears氏によれば、Groqは大規模言語モデルの開発ではなく、学習済みモデルを高速に動かす「推論(inference)」に特化したAIインフラ企業であり、独自のLPU(Language Processing Unit)によって、リアルタイム推論の速度は業界一位を誇るという。
[8]テキスト、画像、音声などを自律的に生成できるAI技術の総称。総務省情報通信白書(令和6年版)より:https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r06/html/nd131210.html (access: 2026年1月19日)
[9]第97号「国際公文書館会議(ICA)PCOMプロジェクト「AIとアーカイブズ実務」チュートリアル #01の注17参照。
[10]第97号「国際公文書館会議(ICA)PCOMプロジェクト「AIとアーカイブズ実務」チュートリアル #01の注18参照。
[11]Vapi: https//vapi.ai (access: 2026年1月19日)
[12]ハルシネーション(幻覚)とも言われる。総務省令和6年版情報通信白書「第1節 1 生成AIが抱える課題」よりhttps://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r06/html/nd141100.html (access: 2026年1月19日)
[13]第97号「国際公文書館会議(ICA)PCOMプロジェクト「AIとアーカイブズ実務」チュートリアル #01の注21参照。
[14]英国のCOVID-19調査において、政府関係者によるパンデミック対応に関するWhatsApp上のやり取りが削除されたり、失われたりしたことが判明したもの。たとえば、以下のGuardian記事参照:” Boris Johnson faces tough questions at Covid inquiry over handling of pandemic”(2023年12月6日付) https://www.theguardian.com/politics/2023/dec/05/many-of-boris-johnsons-whatsapps-cannot-be-retrieved-for-covid-inquiry (access: 2026年1月19日)
[15]InterPARES Trust AIのwebサイトに、2026年1月現在Module 1~4が公開されている。同webサイトのResearch Dissemination => Education => Curriculum Materialsを参照のこと。https://interparestrustai.org/trust/research_dissemination (access: 2026年1月19日)
[16]シャドーITは、組織のIT部門や管理部門が把握・承認していないまま、職員が業務で使っているITツールやサービスのこと。
[17]BYOAIは、Bring Your Own AIの略で、組織が用意・承認していないAIツールを、職員が個人判断で業務に使うこと。
