デジタル化したコンテンツの発見はメタデータがキーとなる
コンテンツを管理するためのメタデータをみなさまどのように管理されていますでしょうか。このサイトでもメタデータについては何度か取り上げられてきました。今回は、メタデータの中でも主題に関する項目について考えてみたいと思います。
目次[非表示]
コンテンツの管理にはメタデータが必要である
多くの資料館では、文書資料や、写真・映像資料、博物資料などのコンテンツを管理するためにメタデータを作成していることと思います。
このメタデータは、デジタル化を依頼するにあたっても、デジタル化の計画を立てたり、対象資料のリストアップなどに使用されます。また、デジタル化事業者と発注者である資料館の間の納品チェックリストともなります。
※以下の記事の、デジタル化を依頼する際の資料の選定について「メタデータからデジタル化する資料を選定する」に詳しく書かれています。
デジタル化した資料とメタデータの関係性
このようにデジタル化される前もメタデータは必要ですが、デジタル化したファイルを管理するためにもメタデータが必要となります。
メタデータ、デジタル化ファイル、コンテンツ資料(原本)は、1セットになって管理されます。
メタデータの3つの目的
ここでメタデータの目的について、確認してみましょう。
メタデータには、コンテンツを所有している館がそれを管理する目的、利用者にコンテンツを発見してもらう目的、データを外部と共有するなど流通する目的があります。
管理目的
所有している館がそのコンテンツを管理する目的
発見目的
デジタルアーカイブの利用者などに発見される目的
流通目的
他館などどデータを共有する目的
メタデータの各項目は上記の目的の間で重複している場合も、単一の目的に該当する場合もあります。
例えば、コンテンツの作成年は、所有館も利用者も他館も必要なものとなり、この3つの目的全てを満たす項目ですが、コンテンツの受入年は特に所有館だけが必要な項目になります。
これら3つの目的の中で「発見目的」に深く関連する主題に係るメタデータ項目について、見ていきたいと思います。
発見されるためには主題に係るメタデータが特に重要
資料が発見されるためには、その主題(内容)を示す項目が特に有効となります。その資料の主題を示すことで、資料の内容を利用者が推測することができるようになり、資料が発見されやすくなります。
主題を示すメタデータ項目は具体的に何を指すのでしょうか。
NDLのメタデータ流通ガイドラインによると「件名・分類」、「空間的範囲」と「時間的範囲」の項目が該当するとのことです。ここでは特に「件名・分類」の「件名」について見ていきたいと思います。
キーワードと件名の違いとは
ここで「キーワード」という言葉も件名と同義で使われることもありますので、その違いをはっきりとしておきたいと思います。
キーワードは、件名も含めて言葉での検索ワードであることを示します。つまり、資料のタイトルや作成者、作成機関、内容、注記、件名などの一部となります。
一方、件名はその資料の主題を表す言葉になります。タイトルに含まれていなくても、件名が付与されていれば資料を探す手掛かりになり得ます。
例えば、「イシューからはじめよ」という本があります。これは有名な本ですし、ビジネス書のところにあるので本屋さんや図書館に行けば(本の置き場所が分類を表しているので)本の内容を少しでも推測できると思います。しかし、この本のタイトルだけから内容を推測するのはとても難しいのではないしょうか。
実際、NDLサーチで確認するとこの本は、問題解決、ファシリテーター、ネットワーク手法などの件名が付けられています。こうして件名は、タイトルから推測できない主題を推測する手助けとなります。
件名標目表などの利用
件名は、資料の内容から自由に用語を切り出すよりは、統制語彙を使用した方がよいとされています。
この統制語彙とは、件名として使用する用語を予め定義したものとなります。用語を統制することによって、管理者と利用者をつなぎ、資料を発見しやすくします。
例えば、コンピューターについての主題を扱った資料があり、この資料内では「電子計算機」という言葉が使われています。もし件名標目表などの統制語のリストでは「電子計算機」ではなく「コンピューター」としてある場合には「コンピューター」と件名を付与します。これで、利用者は、件名標目表に示された用語で検索することによって資料を発見することができます。
統制語彙となる件名標目表などは公的機関が作成されている標準的なものがあり、各資料館によって、取扱う分野や資料の形態(図書なのか、博物資料なのか?)によって使用する件名標目表を選択しています。
標準的なものが使用できず、その館独自のコレクションの語彙を管理するような場合は以下の点に注意します。
・語彙の示す範囲を明らかにする。
・利用者のイメージを明確にする。(誰か?、どんな目的(業務)で使用するのか、利用者の役割は?)
・誰が語彙の設定や管理に責任を持つのか。
・類似の語彙リストはあるのか。(別の範囲であるが以前に同組織で作成した、既定語彙リストで参考にできるものがある)
上記のように統制語彙を検討することはとても重要ですが、あまり検討しすぎて先に進まないこともあり得るため、不完全でも折り合いをつけて、件名を付与することをおすすめします。
資料を探す研究者やリサーチャーは、一つの検索語だけではなく、言い換えをした検索語を試したり、あらゆる方法で資料を探そうとします。全くヒントがないのと、ヒントとなるようなものを残しておくのは資料の発見については大きな差となって表れます。
ハッシュタグの考え方
最近のデジタルアーカイブでは利用者参加型が増えているようです。特に自治体などが主催する地域のデジタルアーカイブにそういったものが採用され始めており、地域の写真や資料を住民たちがアップロードしたりできるような仕組みもできてきています。
みんなで情報をアップロードしていく。。
それは、SNSに近い形になります。
SNSには、ハッシュタグを付けるという考え方があります。ハッシュタグはキーワードやトピックを分類するタグです。見つけてもらいたいハッシュタグを付けることによって、より多くの利用者にアップロードした投稿を見てもらうことができます。
X(旧Twtter)などでは、ハッシュタグは投稿者が自由に付けることができます。それは、統制語彙の中から選ぶ訳ではありません。そのため、統制は取れずに同義語や、「祭り」と「祭」、「まつり」のように表記が異なるものが乱立するいう問題は発生しますが、利用者目線でタグが付与されていき、管理者側の件名付与の工数がかからないというメリットもあると思います。
利用者がそれぞれ件名を付けることになるため、統制されたもののように階層構造や基本語や派生語などが示す構造的があるわけではありませんが、利用者にとってなじみのある言葉が選ばれるという利点があります。
SNSのように参加する利用者がハッシュタグをつけるように件名を付けていくようなことも今後は増えていくのかもしれません。
まとめ
今回は、メタデータの中でも特に主題を表す件名について考えてみました。
デジタル化した資料の利活用のためには、特に主題を表す件名が有効となります。件名は、できれば標準的な統制語リストを使用することをお勧めしますが、そうでなくとも、利用者の発見に繋げることが期待されるため、件名の付与をお勧めします。
※参考サイト
メタデータ流通ガイドライン