catch-img

デジタル資料を長期保存するために知っておきたいPREMISとは?

デジタル全盛の今、世の中では日々膨大なデジタル資料が生み出されています。

しかし、これらのデジタル資料について10年後、100年後も変わらず使えることをどうやって保証できるでしょうか?

このデジタル資料の長期的な利用や保存の難題を解決するために、図書館や博物館といったアーカイブ機関が頼りにすべきなのが、デジタル資料の長期保存のために必要なメタデータを定義した保存メタデータ国際標準であるPREMIS(プレミス)です。

The Library of Congress(米国議会図書館)のPREMISホームページ
https://www.loc.gov/standards/premis/

PREMISは現在米国議会図書館が活動を支援しており、このPREMISの概説書「Understanding PREMIS(PREMISを理解する)」について、2025年6月に国立国会図書館が日本語訳を公開しました。

Understanding PREMIS(PREMISを理解する)の日本語訳(国立国会図書館サイトより)
https://www.ndl.go.jp/jp/dlib/standards/translation/index.html#PREMIS

専門用語も多く、かなり難解な文章であるPREMISの原文を、初心者でも理解しやすいように作成された概説書の日本語訳の公開によって、日本国内でのPREMISの理解と促進が期待されます。

デジタル資料の利用・保存を行っている、もしくはこれから長期保存を検討したい方々にとって、PREMISは知っておいて損はないものとなります。
今回、PREMISとは何か、要点をまとめましたのでご紹介します。

目次[非表示]

  1. PREMISとは? デジタル資料の長期保存に必要な保存メタデータとは?
    1. 1.PREMISとは?
    2. 2.保存メタデータが果たす3つの役割
  2. PREMISのデータモデル:デジタル保存の4つの柱
    1. PREMISにおける4つの構成要素(エンティティ)
  3. 保存を確実にするために必要となる重要な概念
  4. PREMISの活用シーン
  5. まとめ
  6. 参考URL

PREMISとは? デジタル資料の長期保存に必要な保存メタデータとは?

1.PREMISとは?

PREMISは、デジタル資料の長期保存のための中核(コア)となるメタデータ要素を定義する国際標準であり、図書館や博物館といったアーカイブ機関におけるデジタル資料の長期的な利用を保証するための目的で開発されました。

PREMISは「PREservation Metadata: Implementation Strategies(保存メタデータ:実装戦略)」の頭文字をとった略語で、元々は2003年から2005年に活動した国際的なワーキンググループの名称でしたが、現在はデータ辞書、XMLスキーマ及び米国議会図書館が支援するPREMIS編集委員会の活動全体を指すことが一般的です。

PREservation Metadata(保存メタデータ)とは、デジタル資料の長期的なアクセスと利用を保証するための情報であり、デジタルオブジェクトが将来にわたってアクセス可能、利用可能、かつ信頼できる状態を維持するために必要不可欠なメタデータとなります。

≪参考≫主なメタデータ標準の役割と特徴

役割

特徴

できること

Dublin Core

(ダブリンコア)

デジタルリソースの基本的な記述メタデータ。(著作者、タイトル、作成日など)

オープンなメタデータ語彙のセット。基本的な記述を共通の認識に基づいて行う。

リソースの基本的な情報が記述され、特定と検索が可能となる。

IIIF

(トリプルアイエフ)

デジタルコンテンツ(歴史的文書や美術品など)画像を共有し、表示するためのメタデータ形式

高画質な画像ビューア、注釈機能、ズーム機能などを標準化し、世界中の機関が画像データを効率的に共有・利用できる。

画像データが効率的に共有され、高度なビューア機能を通じて利用できる。

PREMIS

(プレミス)

デジタルリソースの長期保存に不可欠な管理情報メタデータを記述する。

リソースのライフサイクル全体にわたる技術的な情報(作成、変更、利用、移動の記録や、管理権限、ハッシュ値など)のデータを記述。

リソースの完全性や真正性を保証するための管理情報が記録され、長期保存が実現される。

また、PREMISでは、保存メタデータの中核となる要素のセットのみを定義しており、リポジトリが必要とするすべてのメタデータを定義しているわけではありません。

ほとんどのリポジトリで共通して必要とされる「小さな中核部分」のみを定義しているという点がPREMISの特徴として挙げられます。

※ PREMISの対象外となるメタデータの例

 ・フォーマット固有のメタデータ、実装時固有のメタデータや運用ルール。

 ・記述メタデータ(MARC, MODS, Dublin Coreなど既存の標準があるため)。

 ・メディアやハードウェアに関する詳細情報、 エージェントや権利に関する広範囲な情報(識別に必要な情報は除く)。

2.保存メタデータが果たす3つの役割

では、なぜデジタル資料を長期保存するために、保存メタデータが必要なのでしょうか。

その理由は、デジタル情報の真正性と将来の利用可能性を保証するためです。

①真正性の証明(デジタル来歴の管理)

デジタル情報が誤って変更などされていないかを検証するために、チェックサム情報をメタデータとして保存します。

また、保存戦略(マイグレーションなど)によってオリジナルの情報資源が変更された場合でも、そのデジタル来歴(保管の連鎖と許可された変更の履歴)を記録することで、真正性が担保されます。

②将来のマイグレーションやエミュレーションの実行

ファイルフォーマットが旧式化し、現在のソフトウェアやアプリケーションで開けなくなった場合、マイグレーションやエミュレーションが必要になります。

これを実行するためには、オリジナルのファイルフォーマットや、それを開くためのハードウェア、ソフトウェア環境に関するメタデータが不可欠です。

③メディア管理と復元支援

保存メディアの型式、年代、ファイルの最終更新日などを記録することで、メディアが破損したり旧式化したりした場合のデータ復元を支援します。

PREMISのデータモデル:デジタル保存の4つの柱

PREMISデータ辞書(第3版)では、デジタル保存プロセスにおいて記述すべき内容を明確にするために、4種類の構成要素(エンティティ)が定義されています。

これが、デジタル保存の「4つの柱」です。

PREMISにおける4つの構成要素(エンティティ)
①オブジェクト (Objects)

・保存リポジトリ内で実際に管理されるデジタルアイテムそのもの。

・ファイル(PDFやJPEG)の他、ビットストリーム、表現(ファイル群)、知的エンティティ(概念的なコンテンツ)。

・一意の識別子、サイズ、フォーマット、チェックサム(不変性情報)。

②イベント (Events)

・オブジェクトに影響を及ぼす活動に関する情報(履歴)。

・イベントのタイプ(作成、取込み、マイグレーション、検証など)、発生日時、結果、関連したエージェント。

③エージェント (Agents)

・イベント、権利文書、または環境に関わる個人、組織、アプリケーション、またはハードウェア。

・識別に必要な最小限の情報(識別子、名称、タイプ、バージョン)。

④権利 (Rights)

・リポジトリがオブジェクトを保存するために必要なこと(複製作成など)を実行できるように、保存に直接関係する権利や許諾に関する情報。

・権利を主張する根拠(著作権、ライセンス、法律など)、容認される活動、制限事項。

保存を確実にするために必要となる重要な概念

PREMISは、デジタルオブジェクトが遠い未来でも使えるようにするために、特に重要な情報を記録することを管理者に求めています。

特に次の2つの要素について記録が必要な重要な概念となります。

①重要属性(Significant Properties)

保存活動を通して維持する必要があるオブジェクトの特性。

例えば、文書ファイルにおいて、単に文字や画像だけでなく、フォントやその他の「見た目」上の特徴も維持すべきかを検討し、それを記録します。

②制約事項(Inhibitors)

オブジェクトへのアクセス、利用、マイグレーションを制限するための特徴です。

パスワード保護や暗号化などがこれに該当します。

制約事項がある場合、リポジトリソフトウェアがそれを特定できないこともあるため、記録しておく必要があります。

PREMISの活用シーン

PREMISの主な用途は、システムの設計や評価、データ交換の際の共通言語として使用できます。具体的には次のとおりです。

①システムの評価と設計

保存リポジトリのシステム設計を行う際、PREMISは記録しておくべき情報のガイドラインとして使用できます。

また、新しい保存システムを導入する際には、PREMISをチェックリストとして使用することで、候補となるシステムが情報資源を長期保存できる能力を持つかを評価することが可能です。

②データ交換の共通言語

リポジトリシステムを移行したり、サードパーティの保存システムを利用したりする場合、保存しているデジタル情報を他のシステムが取り込めるように出力する必要が生じます。

このデータ交換の目的でPREMISのXMLスキーマを使用すると、出力側と入力側の両方のシステムが理解できる共通のデータ要素のセットを作成できます。

まとめ

この記事では、保存メタデータの国際標準であるPREMISについて紹介いたしました。

PREMISを理解し適切に実装することが、貴重なデジタル資料を確実に未来へ引き継ぐための鍵となります。

今回、国立国会図書館よりPREMIS概説書の日本語訳が公開されたことによって、PREMISについての理解が日本国内の図書館等アーカイブ機関の関係者に広がり、デジタル資料の長期保存が促進されることが期待されます。

ただ、専門用語も多く内容も複雑なため、多くの人にとっては深く理解するのが難しいのも事実です。

概説書にも記載がありますが、PREMISを詳細に理解すべき人は、機関リポジトリや保存システムの実装や評価を行う人に限定され、実際にデジタル化作業を行う人などは概要を知っておくだけで十分であるとされています。

ですので、今回の記事を読んでいただいたことで、ぼんやりとでもPREMISについて知っていただけたのであれば幸いです。

参考URL

The Library of Congress(米国議会図書館)のPREMISホームページ
https://www.loc.gov/standards/premis/

Understanding PREMIS(PREMISを理解する)の日本語訳(国立国会図書館サイト)
https://www.ndl.go.jp/jp/dlib/standards/translation/index.html#PREMIS

ご質問など無料相談会の申し込みはこちら↓↓

マイクロフィルムのデジタル化やデジタルアーカイブシステムに関するホワイトペーパーはこちら↓↓

Kudou
Kudou
ニチマイの営業担当です。デジアカサイトでは少しでもみなさまのお役に立てるような情報を発信していきたいと思っています。デジタルアーカイブの知識をこれからも日々勉強してまいります。