デジタルアーカイブにおけるメタデータ作成
メタデータの作成はデジタルアーカイブに取り組む上でのスタート地点と言っても過言ではありません。
今回はメタデータの作成方法や留意点などについてご紹介します。
メタデータとはなにか?
メタデータとは、資料を特定するために資料に紐づけた情報です。
資料が作成された年代や作成者、形状、保管場所、資料の内容説明などの情報を与えてあげることで、
資料の管理者は保有資料が一覧化されて全体を把握することができ、同時に目録的な役割も果たします。
そして利用者は、閲覧・利用したい資料を特定することが可能になります。
つまりメタデータを充実させることは、管理面での機能が高まるだけでなく、資料の利便性の向上を通じた利用促進にもつながります。
昨今DXの流れから、デジタルアーカイブを始めていきたいというお客様からのご相談が増えていますが、始めるにあたって悩みの多くは、
どんな資料が・どこに・どんな状態で・どのくらいの量があるかわからない、といったものです。
メタデータを作成することで保有している資料が一覧化され、全体を把握することができるため、こうした悩みの大半は解決します。
そうした意味でもメタデータの作成は、デジタルアーカイブを始める際の起点と言っても過言ではないでしょう。
メタデータの項目
メタデータに対して設定する項目は、デジタルアーカイブの対象となる資料によって異なるところがありますが、内閣府知的財産戦略推進事務局によって策定された『デジタルアーカイブの構築・共有・活用ガイドライン』においては、必須項目として次のような項目が示されています。
・タイトル(ラベル)
・作者(人物)
・日付(時代)
・場所
・管理番号(表内で重複しない恒久的な識別子)
参照元
関係省庁等連絡会・実務者協議会(事務局:内閣府知的財産戦略推進事務局)
『デジタルアーカイブの構築・共有・活用ガイドライン』
https://www.kantei.go.jp/jp/singi/titeki2/digitalarchive_kyougikai/guideline.pdf
また、メタデータの国際標準(ISO15836)としてDublin Core(ダブリンコア)があります。
Dublin Core は1990年代中頃から、インターネット上の情報資源の発見を目的として開発が進められたメタデータ記述項目で、2003年に国際標準として定められました。2005年には国内標準(JIS X 0836)としても規格化されました。
Dublin Coreで定めている基本的な項目は次の通りです。
参照元
国立国会図書館ダブリンコアメタデータ記述(DC-NDL)解説
https://www.ndl.go.jp/jp/dlib/standards/meta/about_dcndl.html
こうした標準を参考にすることで、網羅的になるとともに外部機関とのデータのやりとりや連携が円滑になります。
そうはいっても社内など限られた範囲で利用するような場合は、「管理面」「共有性」「検索性」などの観点で、自分の組織にとって有効な項目を任意に設定するのがよいでしょう。
メタデータ作成時に留意すべきこと
先述の『デジタルアーカイブの構築・共有・活用ガイドライン』では次のようなことが示されています。
■不正確な情報は載せない
作者や日付、場所についての項目は、曖昧な場合は不明でもよいということが示されています。
■ 分野によって、メタデータ項目の意味する情報が異なる場合がある
例えば(紙の)資料であれば「作成者」「作成年」となるところ、著書であれば「著者」「出版年」、美術品などであれば「作者」「作成時代」といった項目名称になります。
■ シンプルで一貫した記述がよい
特に共有・公開 を目的とするメタデータは、基本的には複雑にせずシンプルにするのがよいと記されています。
■ 不変的な項目を選択する
可能な限り、時間の経過によって変化しないものをメタデータの必 須項目として選びつつ、継続的にメンテナンスしていくことが求められると記されています。
メタデータの入力手順
大まかにメタデータの入力手順は次のようになります。
■入力ルールを決める
メタデータを作成するにあたってはまず、仕様を決めなければなりません。
メタデータの項目の他、入力に関する規則を決めておくことが必要です。
具体的にはDublin Coreでいえば「日付」を西暦とするか和暦とするかということや、
「記録形式」(資料のサイズ)の単位をmmとするかcmとするか、
「資料の種類」(書籍、フィルム、巻物など)についてあらかじめ種類を設定する場合、どのような選択肢を用意しておくか、などです。
こうしたことについてあらかじめ取り決めをしておかないと、表記ゆれが生じてしまいデータとして使えないになってしまいます。
■メタデータを入力する
こうしたルールを決めたら実際に資料の現物にあたりながらメタデータを入力していきます。デジタル化された資料のデータがある場合はそのデータを参照する方が効率的ですし、資料の破損・汚損のリスクも軽減できます。しかし(後述しますが)メタデータを作成して資料を一覧化してから、デジタル化が必要な資料を絞り込んだほうが費用面において有効です。
■チェックする
入力が終わったら完成ではありません。正確に入れられたかどうかをチェックする必要があります。
当社のような入力の専門業者ではベリファイという入力方式でデータの正確性を高めます。2名の入力者が入力したデータを突合して、差異があった箇所をチェック・修正するといった手順です。ただそうした人員や機材を自前で調達するのは困難であることが多いため、
資料とデータを照合しながら間違いがないかどうかを検査してもよいでしょう。
検査結果におけるエラーのパターンとしては、次のようなものが考えられます。
・文字の間違い
・入力漏れ(資料はあるがメタデータがない)
・資料が収納されている封筒などに記載されている情報(日付など)と資料の現物に記載されている情報が異なる
このような入力やチェックには膨大な工数がかかります。
メタデータ入力は当社にご依頼ください。
資料ごとの特性を生かし、経験豊富なオペレーターによりお客様のメタデータ記述規則等に遵守して作業を行います。また古文書や貴重書で使用されている旧字体、異体字の置き換えなどを含む幅広い入力業務をさせていただきます。入力データの精度は、入力部門によるベリファイのほかに画像検査部門等の他部門による、論理チェックや目視による検査を行うことにより高品質なデータを作成いたします。
メタデータからデジタル化する資料を選定する
デジタルアーカイブの構築に向け、メタデータを入力した資料からデジタル化する資料を選定します。
選定方法として、国立国会図書館の『資料デジタル化の手引き』では次のように示されています。
「所蔵資料の特性、劣化状況、利用者ニーズ、書誌データの整備状況、予算などを総
合的に勘案し、優先順位に基づき、選定する。」
参照元
『国立国会図書館資料デジタル化の手引き』
https://www.ndl.go.jp/jp/preservation/digitization/digitalguide2011.pdf
資料のデジタル化には、量にもよりますが比較的大きな費用が発生しますので、メタデータを作成した資料は全てデジタル化するということではなく、
上記のような基準からデジタル化すべき資料を絞り込むことが大切です。
また、デジタル化の費用の見積もり方に関してはこちらの記事をご参照ください。
まとめ
■メタデータを作成することで保有している資料が一覧化され、全体を把握することができ、資料の目録的な役割を果たす。
■メタデータの項目にはDublin Coreなどの標準もあるが、組織にとって有効な項目を任意に設定してもよい。
■メタデータの作成に際しては正確性や一貫性などに留意する。
■メタデータの入力仕様はあらかじめ取り決めておく。
■メタデータ入力後は、正確性を確保するためきちんと検査する。
■メタデータ作成後、デジタル化する資料は必要性を踏まえて絞り込む。
機材や人員、ノウハウなどを内部で確保するのが難しい場合は、当社にお任せください。