デジタル保存連合によるデジタル保存スキルの普及にかかる取組について

国立公文書館 統括公文書専門官室
公文書専門官 渡辺 悦子

はじめに
  デジタル保存連合(Digital Preservation Coalition、以下DPC)は、デジタル保存を行う様々な機関が参加する、イギリスを拠点とした国際的な非営利団体である。2002年に設立されてから、参加機関同士での専門知識の共有を図るだけでなく、調査や研究を踏まえたデジタル保存のグッドプラクティスを幅広く社会に普及にさせることにも努めている。本稿は、こうしたDPCの近年の取組のうち、オンライン研修「Novice to Know-How」プログラムと、組織のデジタル保存能力を評価するためのツール「DPCラピッド・アセスメントモデル」の紹介を行うものである。

1.デジタル保存連合とは
  「デジタル保存」とは、「デジタル資料(digital materials)を、必要な期間、継続的にアクセスできるよう管理する一連の活動」と定義される[1]。DPCは、デジタル資産の保存にかかる戦略的、文化的、技術的課題への関心を高め、その長期的保存・利用に努めることを目的に活動する会員制の組織である[2]。
  DPCが設立された2002年は、デジタル技術が急激に進歩し始めるなか、保存媒体の陳腐化[3]や劣化等によりデジタル形式で保存される膨大な情報が将来的にアクセス不能になる、いわゆる「Digital Dark Age」への危機感が急速に高まりはじめた時期[4]に当たる。DPCはイギリス・アイルランドの諸機関が立ち上げたもので、2020年現在、イギリス、アメリカ、カナダ、オーストラリアなどの各国立公文書館や国立図書館、イェール大学等の研究機関の図書館、ひいては国連本部などの国際機関等、準会員を含め100以上の機関が加盟している。主な活動は、会員間の知識共有(会員向け講座やワークショップの開催)のほか、参加機関における調査や実務的教訓から開発された様々な手引き[5]の提供などである。

2.デジタル保存にかかる初心者向けオンライン研修プログラムについて
  本章では、2020年4月から提供が開始されているDPCのオンライン研修プログラムについて、開発の経緯及び研修の概要、内容について報告する。

2.1 イギリス国立公文書館 “Plugged in, Powered up”戦略
  イギリス国立公文書館は、2011年以降、公立、民間を問わず、国内[6]のアーカイブズ・セクター全体のリーダーシップをとる役割を担っている。記録作成・管理のデジタル化が社会全体で進む現在、アーカイブズにおける当該分野のスキル向上が差し迫った課題となっていることはイギリスも同様で、その認識から、同館は2019年、イギリス高等教育機関の研究等におけるデジタル技術向上や課題に取り組む団体Jisc[7]との共同により、国内の300人のアーカイブズ分野の専門職に対し調査を実施した。その結果、デジタル保存にかかる必要なスキルがあると答えたのは3分の1で、59%が自機関にデジタル保存に関する戦略がないと答え、また保存システムの構築に当たり適切に判断できる自信があると答えた管理者は18%にとどまった[8]。
  これを受け、イギリスの記録を確実に保存していかなければならない専門職として課題に対処できないという危機感のもと、同館は国内のアーカイブズ・セクターのデジタル記録の保存と利用にかかる技術の底上げを図るための取組をまとめた「Plugged in, Powered up」戦略[9]を策定した。その一環で、デジタル保存の基礎的スキルを身に着けるためのオンライン研修プログラムの開発を、同館も加盟するDPCに委託することとなったのである。

2.2 オンライン研修「Novice to Know-How」の概要
  DPCによる「初心者のためのデジタル保存スキル(Novice to Know-How: Digital Preservation Skills for Beginners)」は、無料で提供される、独習型のオンライン研修[10]である。
  プログラムは以下の6課程で構成され、受講時間は約11時間と設定されている。
第1課:デジタル保存にあたって
第2課:ファイル、ファイルフォーマット、ビット列保存
第3課:DROIDを使用する
第4課:デジタルコンテンツの選別と移管
第5課:デジタルコンテンツの取込み
第6課:デジタルコンテンツの保存
  各課は、3~5つの講義で構成される。それぞれビデオやスライドを教材とし、ツール・デモ等を交えて行われ、各パートが修了するごとに内容確認の小テストがある。
  研修は、毎月1回実施され、月ごとに受講者の募集が行われている[11]。希望する月の登録が認められると、DPCが各受講者のためにアカウントを作成してくれる。受講者は、受講月の初日に送付される専用ページのURLにアクセスをして受講を開始する(当該ページには、受講月の1日から28日間のみアクセス可能となるため、期間内で受講する必要がある)。イギリス国立公文書館の資金提供により開発されたプログラムという性格から、初年度である2020年は、イギリス国内のアーカイブズ機関に175席、DPC加盟機関に115席(各機関3名まで)の枠が優先的に与えられ、これ以外の希望者及び国外の非加盟機関からの受講希望者は、席に残余がある場合のみ受講が可能となっている[12]。
  以下は、2020年9月に筆者が残余席の枠で本研修を受講する機会を得たことによる、本研修内容の報告である。
“Novice to Know-How” 研修のイラスト Image produced by digitalbevaring.dk and Jørgen Stamp, shared under CC BY 2.5 Denmark licence

“Novice to Know-How” 研修のイラスト Image produced by digitalbevaring.dk and Jørgen Stamp, shared under CC BY 2.5 Denmark licence

2.2.1 第1課:デジタル保存にあたって[13]
  デジタル保存の必要性と、実施するにあたっての基本的な考え方が説明される課である。
  保存されている媒体、再生のためのハードウェアとソフトウェアを必要とするデジタル情報に対して、刻々と変化する技術に対応しながら、必要な期間の保存とアクセスを保証するには、組織とその担当者は常に継続的な管理が求められる。よって、デジタル保存とは、継続的な一連の管理された活動であると定義される。
  こうしたデジタル保存を成功させるための様々な「モデル」が紹介されるが、本研修では、
組織(保存のための方針と戦略、手続きや、プロセス管理とリスク管理、人的配備)
技術(データを保存するストレージ、管理のためのシステムやツール、セキュリティ)
リソース(業務計画、費用、必要な資金、継続性、スタッフのスキル)
の3つの分野がそろうことをもって、デジタル保存が支えられるとする、3本足の椅子(3 legs of a stool)」モデルを取り上げ、(1)必要性の「認識」→(2)「活動」の開始→(3)途切れなく「継続」する作業→(4)それら作業の「制度化」→(5)「組織内を横断」した協力体制の構築、という5段階の発展を踏まえていくことが説明される。その上で、デジタル保存とは、技術だけでなく組織としてのカルチャーの問題であり、保存システムを構築して終わるものではないこと、組織にとって十分なこと(good enough)は何かを見極め、小さなところから始めることが大切であるとされる。

2.2.2 第2課:ファイル、ファイルフォーマット、ビット列保存[14]
  デジタル保存の実務に入る前に、保存しようとしているデジタル・ファイルとは何かを理解するための課である。
  デジタル・ファイルは、「0」と「1」の2進法で表現されるデータ(バイナリデータ)によって構成される[15]。デジタル情報は、こうしたバイナリデータの情報がソフトウェアによってコンピュータ上に表示(レンダリング)[16]されることにより、人間が認識できるようになる。「ファイル」とはバイナリデータの集合体であり、デジタルコンテンツとは、こうした単体又は複数のファイルが、ソフトウェアによってコンピュータ上に表示され、人が情報として利用できる状態にあるものをいう。本研修では、この0と1のビットの連なりの保存=ビット列保存をデジタル保存の基本とする[17]。
  ビット列保存とともに重要なのは、デジタルコンテンツのアクセス性や使用性(正しくレンダリングされ、コンテンツを読み又は視聴できるかどうか)にかかる保存で、これをコンテンツ保存という。「ファイルフォーマット」は、バイナリデータを標準化してコンピュータに保存また表示させるための形式のことであり、その仕様(specification)に係る情報は、コンテンツ保存のプロセスにとって不可欠[18]なものである。そのため、保存に当たってはJPEGやPDFといった、仕様が公開されている=オープンなファイルフォーマットでの保存が望ましい[19]。
  ビット列保存のリスクは、媒体の陳腐化や劣化・損傷、自然災害や人の手による過失・故意によるダメージがあげられる。リスク軽減のため、ビット列保存では、(1)データを複数作成し、(2)地理的に異なる場所に、(3)異なる技術で保存すること、また、データに変更やダメージが加わっていないことを確認するために、「完全性チェック(integrity check)」(後述)を定期的に行う必要がある。

2.2.3 第3課:DROIDを使用する[20]
  イギリス国立公文書館のデジタル保存部が開発したDROID[21]と呼ばれるソフトウェアの使い方を学ぶ課である。DROIDは、デジタル保存のプロセスで必須となる、「特徴づけ(characterization)」と「完全性チェック(integrity check)」を自動で行うことができるツールである。
  「特徴づけ」は、デジタル保存を実施するデジタルコンテンツを理解するプロセスであり、構成されるファイル数、サイズ、ファイルフォーマット、作成日、最終更新日や暗号化されたコンテンツの有無等の情報を特定する作業をさす。
  「完全性チェック」は、デジタルコンテンツが改変やダメージを受けていないかを確認するための作業で、入力されたデータをもとに特定の長さの値(文字列)を生成するハッシュ関数を利用した「チェックサム」を使って行われる。チェックサムは、同じデータに対し同一のハッシュ値(文字列)を生成するが、内容に少しでも変更が加えられれば、異なるハッシュ値(文字列)を出す。完全性チェックは、このチェックサムの性質を使って、デジタルコンテンツの移動の前後や、一定の保存期間を経る等の後に、生成したチェックサムを比較し、元のデータと変化がないかを確認するものである。
  DROIDは、ファイルの拡張子等の分析によって、保存対象となるデータコンテンツの特徴づけを行い、デジタル保存に必要となる18種類[22]のメタデータを自動的に抽出するほか、完全性チェックのためのチェックサムも生成できる。その実用性から、DROIDは世界各国の機関のデジタル保存システムに導入されている。

2.2.4 第4課:デジタルコンテンツの選別と移管[23]
  イギリス国立公文書館が示すデジタル保存のワークフロー[24]は、「選別と移管」→「取込み」→「保存」→「アクセス」、の4段階を取っているが、本オンライン研修では「保存」までを扱うとされる。本課はその最初のステップについて学ぶものである。
  デジタルコンテンツの選別に当たっての課題は、個人からの寄贈や親組織からの定期的移管など受入れ方法によって異なる部分もあるが、法的なもの(受け入れるにあたっての著作権や所有権等の整理、個人情報や機密データの有無の整理等)と技術的なもの(ウィルスやマルウェアの感染といった安全性、コンテンツが保存される記録媒体やファイル形式の種別、サイズ、必要なメタデータや文書の有無)に大別される。そのため、組織レベルの取組(法やルールの整備)が必要となるプロセスでもある。
  移管の準備段階では、移管するコンテンツの情報をまとめたリスト(マニフェストファイル)を作成[25]するほか、ウィルス・チェックが行われることが望ましい。移管には、コンテンツが保存された記録媒体を物理的に移動させる方法、FTP(ファイル転送プロトコル)を利用する方法、オンラインのストレージ・サービスを利用する方法等がある。

2.2.5 第5課:デジタルコンテンツの取込み[26]
  移管されたデジタルコンテンツを組織の保存システムに取り込むための一連のプロセスを説明する講義である。基礎レベルで行うことは、ビット列保存を確保するためのオリジナル・データの複製、ウィルス・チェック、完全性チェック、そして必要なメタデータと文書の作成、の4点である[27]。これら取込みのプロセスは、文書化しておくことが有効とされる。
  デジタルコンテンツを取り込むための適切な作業環境(workstation)の構築において、基礎レベルで推奨されるハードウェアは、必要な容量のストレージをもったコンピュータ(ウィルス感染のリスクを避けるため、ネットワークからは独立)、データを読み込むためのメディア・リーダー、そしてデータ書き込み防止装置(write blocker)[28]とされる。また作業環境に入れておくべき初歩的なソフトウェアとして、元データの複製を記録するもの(複製データがオリジナルと同一であるチェック機能が付いたもの)、ウィルス・チェック、完全性チェック、そしてキャラクタリゼーションの、4つが推奨されている。
  次いで、デジタルコンテンツの発見、特徴、表示性、真正性を長期にわたって維持するためのメタデータをとり、デジタルコンテンツに関する情報が記載された文書(ソフトウェアのマニュアルやユーザーガイドなど)と合わせて、セットで保存する必要性が説明される。メタデータは、管理しやすい範囲の必要最低限の項目数にとどめるようにする。また、キャラクタリゼーション・ツールを使って生成できるファイル・レベル(形式やサイズ、チェックサム等)の情報をリスト化した「検証マニフェストファイル(Verifiable File Manifest)」と、デジタルコンテンツにかかる俯瞰的な情報(移管元、権利関係、所有権、リスク管理、保存期間等)の情報をまとめた「デジタル資産登録簿(Digital Asset Register)」という、異なる2つのレベルのメタデータ管理を行うアプローチが推奨されている。なお、デジタル資産管理簿は、保存にかかる決定に必要な情報を一カ所にまとめておくものであり、組織の誰もがアクセスできるようにしておくことが大切とする。

2.2.6 第6課:デジタルコンテンツの保存[29]
  最後は、デジタルコンテンツの保存をいかに確保するかについての講義である。
  デジタルコンテンツが保存されるストレージの選択は、それぞれの記録媒体の特徴とリスクを踏まえ、実用性とコストのバランスにおいて検討しなければならない。リスクの軽減には、データ複製定期的なストレージ・システムの更改及び完全性チェックが必要であり、様々なストレージ技術・媒体をあわせて使うことが有利に働くと考えられている。
  主なストレージの種類は、アクセスのスピードが利点のハードドライブ(ただし高コスト)、低コストの磁気テープ(ただしスピードは遅い)、さらに低コストのクラウド・ストレージ(ただしハードウェアのリフレッシュ等の保存管理環境はプロバイダ任せで不透明)があげられる。デジタル保存では、数千年もつとうたわれるようなチタン製ディスク等の新来の技術ではなく、比較的寿命の短い記録媒体が使用されるが、これは保存の確実性が実証されているからに他ならない。各媒体の不完全な部分をふまえ、最適なアプローチとして、3つ程度の異なるタイプのストレージ(手元にアクセスのスピードが速いハードディスク、遠隔地に保存用の磁気テープ、確実を期すためにクラウド・ストレージ)にそれぞれコピーを置くことが例示される。なお、システムの構築に当たってIT技術者と話す際は、それぞれが業務上で問題としていることは異なり、同じ用語でも意図するものが異なる場合があることを踏まえ、互いのベストなコミュニケーション方法を考える必要があるとする。

DPC RAMの ‘ram’ には「羊」の意味があり、同モデルのページや開催されるワークショップ等では羊のイラストがたびたび登場する。 Image produced by DPC, shared under a CC-BY-NC 4.0

DPC RAMの ‘ram’ には「羊」の意味があり、同モデルのページや開催されるワークショップ等では羊のイラストがたびたび登場する。
Image produced by DPC, shared under a CC-BY-NC 4.0

3.DPCラピッド・アセスメントモデルについて

3.1 DPC RAMの概要
  DPCラピッド[30]・アセスメントモデル(Rapid Assessment Model、以下DPC RAM)[31]は、2019年9月に公開された、組織がデジタル保存を行うに当たっての体制や技術、機能における成熟度の評価を行うための基準を示し、自己評価できるよう開発されたツールである。イギリス国内で長くデジタル保存に携わるエイドリアン・ブラウン氏による「デジタル保存成熟度モデル」[32]をもとに、DPC加盟機関がテストと改善を繰り返して作り上げられたもので、評価を行う組織の規模や戦略、それぞれが課題をどう解決しようとしているかに依らず、能力診断ができる仕組みになっている[33]。
  本モデルにおける評価基準の要素は11[34]あり、「組織レベルの能力」と「サービスレベル(=運用・技術レベル)の能力」に大きく分かれている。また、各要素は、「0- 最低限認識している(Minimal awareness)」「1- 認識している(Awareness)」「2- 取り組まれている(Basic)」「3- 管理されている(Managed)」「4- 最適化されている(Optimized)」の5段階で評価[35]する形式をとる。「0-」「1-」は認識や理解の有無にすぎず、「2- 取り組まれている(Basic)」においてはじめて、「基本的プロセスが実現」しているかどうかの基準が示されるものとなっている。以下、モデルの概略を説明する。

3.2 組織レベルの能力
  「A- 組織的活力」「B- 方針と戦略」「C- 法的基盤」「D- IT能力」「E- 継続的改善」「F- コミュニティ」の6つの要素で構成される。組織としての体制や保存方針/戦略の立て方、デジタルコンテンツの受入れ/利用提供にあたっての法的手続き、技術基盤の整備といった、組織的な枠組みを構築するにあたっての評価基準を、事例を加えつつ示すもので、同時にレベルアップの方向性が順序を追って理解できるよう工夫されている。中でも「F- コミュニティ」の項目が設けられていることは重要で、規模が小さくスタッフ数などが限られている機関の場合、新しい技術等に係る情報交換の機会が限られる傾向にあるため、積極的に機関の外のコミュニティとの対話を持ち続けることが、デジタル保存にとって必要な要素であることがうかがえる[36]。

3.3 サービスレベルの能力
  「G- 取得、移管、取込み」「H- ビット列保存」「I- コンテンツ保存」「J- メタデータ管理」「K- 発見とアクセス」の5つの要素で構成され、技術的な成熟度基準を示す項目や事例で構成される。
  G~Jの各要素「2-」レベルの評価事例を以下一覧にまとめてみると、前章で紹介した「Novice to Know-How」研修で基本的スキルとして知識が得られるものとなっていることがわかるのではないだろうか。

【G~J要素における「2- 取り組まれている」レベルと評価される基準事例の一覧】
G- 取得、移管、取込み ・受入れと取込みのプロセスが文書化されている
・受入れと取込みをサポートするツールがある
・専用かつ安全性の高い作業空間が準備されている、等
   
H- ビット列保存 ・専用のストレージが準備されている
・データ複製(replication、データを複製し異なるシステムに分散保存すること)がバックアップ管理に基づいている
・すべてのコンテンツのチェックサムが生成されている、等
   
I- コンテンツ保存 ・ファイル形式が特定されている
・コンテンツの「特徴づけ」がなされている
   
J- メタデータ管理 ・コンテンツがデジタル資産登録簿に記述されている
・コンテンツとともにメタデータと文書が保管・保存されている
・基本的な保存メタデータ(=検証マニフェストファイル)がアイテムレベルで取り込まれている、等
   

  なお、オンライン研修では、デジタル保存ワークフローにおける「保存」までを扱っていたが、DPC RAMでは「アクセス」までを含む。「K- 発見とアクセス」では、ユーザーに対し、機関が保存する基本的なコンテンツの発見とアクセスの仕組みを実現させることがあげられている。

  DPCでは、現在、様々なデジタル保存のグッドプラクティスにかかる刊行物の多言語化に取り組んでいる。本DPC RAMの日本語版作成にあたっては、国立公文書館も協力した。同日本語版は以下のサイトよりダウンロード可能である:https://www.dpconline.org/docs/miscellaneous/our-work/dpc-ram/2388-dpc-ram-japanese-revised/file

おわりに
  以上、DPCによるデジタル保存スキルの普及の取組として、オンライン研修プログラム「Novice to Know-How」と、組織のデジタル保存の成熟度を評価するためのツール「DPC RAM」を見てきた。基礎的プロセスとスキルを身に着けるオンライン研修と、自組織の現状を理解しその保存能力を向上させる手引となるDPC RAMは、様々なデジタルコンテンツにあふれる現在の社会を記録していかなければならない専門職には、大きなサポートとなるだろう。デジタル保存にかかる取組は日本でも広がりつつあり、国際的な動向と併せて、今後も積極的な情報提供を行っていきたいと考えている。

〔注記〕
[1] DPCデジタル保存ハンドブック「Glossary(用語集)」より:https://www.dpconline.org/handbook/glossary#D (Access: 2020/10/16)
[2] DPCのwebサイト「About the Digital Preservation Coalition」より:https://www.dpconline.org/about (Access: 2020/10/16)
[3] 技術の進歩により、ある形式の記録媒体を再生する機器がなくなり再生できなくなってしまうこと。フロッピーディスクやビデオテープなどがその例。
[4] Kuny, T(1997), “A Digital Dark Ages?: Challenges in the Preservation of Electronic Information” (第63回IFLA大会ワークショップ:http://archive.ifla.org/IV/ifla63/63kuny1.pdf, Access: 2020/10/16)
[5] 「デジタル保存ハンドブック」Digital Preservation Handbook: https://www.dpconline.org/handbook (Access: 2020/10/16) や、デジタル保存にかかる方針の作成にあたっての各種ツールキットDigital Preservation Policy Toolkit:https://www.dpconline.org/digipres/implement-digipres/policy-toolkit (Access: 2020/10/16)等。
[6] 図書館、博物館、文書館の協力関係を促進し、政府に助言を行う独立機関であったイングランドMLA評議会が2011年廃止され、その機能が博物館、図書館についてはイングランド・アート評議会に、文書館についてはイギリス国立公文書館に移されたことによるもので、正確にはイングランド国内のアーカイブズ・セクターのリーダーシップをとるものである。拙稿「イギリス国立公文書館の連携事業」より(情報誌『アーカイブズ』54号参照:https://www.archives.go.jp/publication/archives/wp-content/uploads/2015/03/acv_54_p50.pdf, Access: 2020/10/16)。
[7] Jiscはその母体となる計算機委員会(Computer Board)が1966年に設立、1976年にJoint network team (JNT)として全国組織となった後、1993年、JISC(合同情報システム委員会Joint Information Systems Committee)となる。2012年以降、その名称を「Jisc」としている。https://www.jisc.ac.uk/ (Access: 2020/10/16)
[8] イギリス国立公文書館 “Plugged In, Powered Up Strategy” p.5 (https://www.nationalarchives.gov.uk/documents/archives/digital-capacity-building-strategy.pdf, Access: 2020/10/16)
[9] Plugged in, powered upは「コンセントを差し込み、電流を流す」ことを意味する。同戦略については、イギリス国立公文書館webサイト「Plugged In, Powered Up」ページを参照:https://www.nationalarchives.gov.uk/archives-sector/projects-and-programmes/plugged-in-powered-up/ (Access: 2020/10/16)
[10] DPCのwebサイト「Novice to Know-How: Digital Preservation Skills for Beginners」:https://www.dpconline.org/digipres/train-your-staff/n2kh-online-training (Access: 2020/10/16)
[11] 登録は、以下のページから行える:https://www.dpconline.org/digipres/train-your-staff/n2kh-online-training (Access: 2020/10/16)
[12] なお、国外の非加盟機関の希望者が受講する場合は、まず順番待ちリストに登録する必要がある。
[13] “Introduction to Digital Preservation”。「1. デジタル保存はなぜ必要か」「2. デジタル保存とは何か」「3. DPCラピッド・アセスメントモデルをとおして見るデジタル保存」の3講義で構成される。
[14] “Files, Files Formats, and Bitstream Preservation”。「1. ファイルとファイルフォーマット」「2. ファイルフォーマットとデジタル保存」「3. ビット列保存について」「4. ワークフローについて」「5. 完全性チェックとは」の5講義で構成される。
[15] 0もしくは1の一つ一つがビット(bit)であり、0と1が8つ集まったものがバイト(byte)と呼ばれる。例えば、半角の英数字は、1バイト=8つ0と1の組み合わせで表現/保存される(対して、日本語は仮名が漢字を表現するのに2バイト=16ビット以上を必要とする)。このような文字に関するバイナリデータは、ASCIIやUTF-8といった「文字コード」によって標準化されている。
[16] 例えば、文字コードであるASCIIコードの「a」はバイナリデータでは「01100001」で表現される。ASCIIコードをレンダリングできるソフトウェアが搭載されたコンピュータ上では、当該ソフトウェアによってこの「01100001」を「a」と表示するということ。
[17] ビット列保存に対し、ユーザ・エクスペリエンス等を含めた情報の保存であるコンテンツ保存があり、本研修では区別されている。
[18] なお、ファイルフォーマットが仕様とあっているかを確かめるプロセスをバリデーション(validation)という。これにより、当該ファイルフォーマットがメタデータや機能をサポートしているかの把握が可能となる。
[19] 逆に、例えば画像編集ソフトPhotoshopやIllustratorで作成されるpsd形式やai形式のファイルは当該ソフトウェア上でしか開くことができず、仕様が公開されていないため、Photoshopを提供する企業(Adobe社)が存在する限りにおいてのみアクセスが保証された状態であるということ。なお、組織がデジタル保存を行うにあたって、移管元や個人の寄贈者などに示せるよう、保存に望ましいファイルフォーマットをまとめておくことが推奨されている。
[20] 「1. DROIDとは何か」「2. DROIDのダウンロードとセットアップ」「3.DROIDでプロファイルを作成する」「4. DROIDを動かし、データをエキスポートする」「5. DROIDレポートを作成する」の5講義で構成され、実際にツールを動かす作業を行うものとなっている。
[21] Digital Record Object Identification。DROIDがデジタルコンテンツのファイルフォーマットを特定する際には、同じくイギリス国立公文書館によって維持管理される、各種ファイルフォーマットのデータベース”PRONOM”のデータが使われている。なお、DROIDは以下のページより無料でダウンロード可能:https://www.nationalarchives.gov.uk/information-management/manage-information/policy-process/digital-continuity/file-profiling-tool-droid/ (Access: 2020/10/16)
[22] ID、上位レベルのID(parent ID)、URI、ファイルパス、ファイル名、(ファイル形式の)特定に当たっての手段(シグネチャ、コンテナシグネチャ、拡張子など)、ステータス、ファイルサイズ、種別(ファイル、フォルダ、コンテナ等)、ファイル拡張子、最終更新日、拡張子非適合の警告、ハッシュ、ファイル形式数、PRONOMにおけるファイル形式識別子、メディアタイプ(MIMEタイプ)、ファイル形式名、ファイル形式バージョンの18種。DROIDユーザーガイドp.9 より:https://www.nationalarchives.gov.uk/documents/information-management/droid-user-guide.pdf (Access: 2020/10/16)
[23] “Select and Transfer Digital Content”。「1. デジタルコンテンツを選別する」「2. 組織外のコンテンツ預託者と交渉する」「3. 組織内のコンテンツ作成者と交渉する」「4. デジタルコンテンツを移管する」の4講義で構成される。
[24] イギリス国立公文書館によるPlugged in Powered Upプログラムの一環で、同館により策定されたデジタル保存のワークフローのこと(https://www.nationalarchives.gov.uk/archives-sector/projects-and-programmes/plugged-in-powered-up/digital-preservation-workflows/ Access: 2020/10/16)。1. 選別と移管 → 2. 取込み →3. 保存 → 4.アクセスの4つに大別され、各プロセスはさらに5から6のプロセスに分割され、詳述される。
[25] コンテンツのメタデータに加え、チェックサムの情報が含まれていることが望ましいとされる。
[26] “Ingesting Digital Content”。「1. コンテンツ取込みの環境を立ち上げる」「2. デジタル保存のためのメタデータ」「3. ファイル・マニフェストを作成する」「4. デジタル資産登録簿を作成する」「5. チェックサムを作成するツールCorzのデモンストレーション」の5講義で構成される。
[27] さらにこのプロセスを発展させる場合は、(1)コンテンツの選別(appraisal)、(2)ファイルフォーマットのバリデーション及び分析、(3)機密情報のマスキング、(4)ファイルフォーマットのマイグレーション、(5)コンテンツ保存のためのパッケージ化が加わるとする。
[28] これを通じて読み込んだファイルは書き込みができなくなる機能を持った装置。USB形式のもの等が市販されている。
[29] “Preserving Digital Content”。「1. データ・ストレージとデジタル保存」「2. ストレージの主なタイプ」「3. IT技術者と話す」の3講義で構成される。
[30] “rapid”は迅速、すばやいことを意味する英語。IT分野等でラピッド・アプリケーション開発やラピッド・サイバー攻撃など、カタカナ語で使用されることが多いため、カタカナ表記とした。
[31] DPCのwebサイトよりダウンロード可能:https://www.dpconline.org/digipres/implement-digipres/dpc-ram (Access: 2020/10/16)
[32] A. Brown (2013) “Practical Digital Preservation: A How-To Guide for Organizations of Any Size”, Facet Publishing, pp.86-91
[33] DPC RAM、“Overview” “Origins and Acknowledgements”より:https://www.dpconline.org/docs/miscellaneous/our-work/dpc-ram/2006-dpc-ram-v-1-0/file (Access: 2020/10/16)
[34] なお、A.ブラウン氏による成熟度モデルの段階では、「A- 組織的活力」「B- ステークホルダーとの関係」「C- 法的基盤」「D- 方針の枠組み」「E- 取得と取込み」「F- ビット列保存」「G- 論理的(logical)な保存」「H- メタデータ管理」「I- 普及」「J- 技術的インフラ」の10項目であった(著書は、注31参照)。
[35] なお、5段階の評価において、「2- 取り組まれている」以降、基準のレベルが箇条書きで示されているが、これはチェックリストではなくあくまで説明のための例示にすぎないと断り書きがある。
[36] 日本国内にはデジタル保存にかかるコミュニティはまだ多いとは言えず、国内におけるこうしたコミュニティの構築が望まれるところである。