catch-img

Web公開フォーマットは何にすればいいの?

インターネット上に公開されているファイル形式で、一般的によく知られているものはPDFファイルではないでしょうか。
今回は、利用の視点からそのPDFファイルを含めた公開用のフォーマットについて考えてみたいと思います。

目次[非表示]

  1. 複数ページものの資料の公開
  2. 資料デジタル化からPDFファイルはどうやって作られる? 
  3. スキャン画像で作成されたPDFの大きさ
  4. デジタルアーカイブシステムのビュアーにページ管理を任せる
  5. 利用用途やシステムの要件によってフォーマットは選択される
  6. デジアカでできること
  7. まとめ

複数ページものの資料の公開

図書、雑誌、パンフレットなど複数ページある資料の公開では、ページ管理を行う必要があります。
デジタル化はページ毎や見開き毎に1コマずつ行われますが、これらをまとめて1冊であるように見せたり、前のページや次のページへの移動がスムーズに行えるように関連付ける必要があります。

資料デジタル化からPDFファイルはどうやって作られる? 

ここで、複数ページから成る資料は、どのような工程を経てPDFファイルとなるのかを辿ってみたいと思います。
一般的に1つの資料がデジタル化される場合、以下のような工程になります。


デジタル化の工程

・対象資料の確認
資料のページ数、大きさ、傷みがあるかなどの調査を行います。


・デジタル化
資料を1コマずつ(1ページまたは見開きページ)スキャニングします。

・原資料との検査
原資料との突合わせて検査を行います。

・成果物の作成
ここからは、原資料を離れてデジタル化されたデータそのものを扱います。
多くの冊子体形式の資料は見開きで1コマずつデジタル化されます。
この1コマのデータを保存用画像と利活用のための画像に加工して、成果物を作成します。

・納品前検査
成果物の検査を行います。

PDFファイルは、利活用を見据えたデータ形式の1つです。
「成果物の作成」工程で、1コマずつ撮影された画像をまとめてPDFファイルにします。
PDFファイルの良さは1つのファイルの中で完結できる点です。AdobeReaderなどのビュアーでファイルを読み込むことで撮影された画像は正しいページ順番で表示されます。

スキャン画像で作成されたPDFの大きさ

PDFファイルは、一つのファイルに全部のページがまとめられています。それゆえに1つのファイルがとても大きく重くなってしまうことがあります。
OfficeソフトなどからPDFファイルを作成する場合のサイズとは異なり、資料をスキャニングして作成したPDFファイルは、かなり大きくなってしまいます。
 
参考値ではありますが、もしA4サイズの文書があり、OfficeソフトからPDFファイルを作成した場合は、1ページあたり20kバイトほどになります。これが100ページであれば、2000kバイトとなり1.9Mバイトのサイズとなります。
一方で、同じA4サイズの文書で紙からスキャニングを行いPDFファイルを作成した場合は、圧縮をかけたとしても1ページ1Mバイトほどとなり、100ページあれば100Mバイトになります。

電子データと紙からPDFを作成した場合の容量比較

実際の過去文献を公開しているようなデジタルアーカイブシステムで、100ページ以上の100Mバイトや200MバイトのPDFファイルをダウンロードできるようになっているものも多いと思います。
 
PDFファイルは、1つのファイルで完結するため、便利なものですが、資料をスキャニングして作成する場合は、前述のように1ファイルあたりのファイルサイズが大きくなり、Web上で閲覧するには重たいという難点があります。

デジタルアーカイブシステムのビュアーにページ管理を任せる

デジタルアーカイブシステムの多くは、PDFファイルはコンテンツとして登録できますが、複数のJPEGファイルを1つのまとまりとして見せる、つまり、ページ管理の可能なビュアーを持っています。
 
ページ数があり容量の大きいPDFファイルをWeb上で送るのではなく、画像1コマずつ展開してくため、1度に送られる量が少なく画面展開が早いことが利点です。
 
利用者にとって使いやすいのは、閲覧するときはデジタルアーカイブシステムのビュアーでページ展開を高速に閲覧し、ダウンロードしたものを手元に置きたいときにはPDFファイルというパターンがベストであると思います。

利用用途やシステムの要件によってフォーマットは選択される

大判の地図資料などの場合は、大きな画像そのものを1ファイルWeb上に公開すると容量が大きすぎて表示に支障を来たすことがあります。その場合は大判資料専用の高精細ビュアーを使用することにより、スムーズに画像を閲覧するできるようになります。

地図や絵図、絵巻物などの資料にこういったビュアーはお勧めです。

画像ファイルはビュアーに合わせて作成いたします。


※画像フォーマットについて、わかりやすくまとめたホワイトペーパーはこちら!

  WP03_【ホワイトペーパー】画像フォーマットの疑問丸分かりガイド 資料の管理や保存において、昨今関心が寄せられているのが“デジタル化”です。 デジタル化は資料情報をより良い状態で保存し、利活用を容易にします。また、保管・保存スペースを節約できるだけでなく、遠隔での利用も可能になるため、あらゆる分野や業界で広く活用されはじめています。 資料のデジタル化には、その内容を全文テキスト化する側面と原資料を忠実に画像化する側面がありますが、本書では、後者の実施をに検討する方々から、必ずといってよいほど挙げられるファイルフォーマットや容量に関する疑問とその解決策について解説します。 デジアカ


※参考記事:デジタルファイルのフォーマットについて説明しています。

  デジタル画像のファイルフォーマットとは 画像データ化の際は、保存と活用を意識した最適な画像ファイルフォーマットを選択しましょう。 デジアカ

デジアカでできること

事前にお客様の利用用途をお伺いし、最適なファイル形式やビュアーで成果物を納品いたします。

・適切なファイル形式やビュアーの選定
・RichFlame(図書などの冊子体に適したページ管理のできる高性能ビュアー)
・RichZoom(大判資料に適した高精細ビュアー)
・PDFファイル形式ほか

他社製品を含めて、お客様に合わせたデジタルアーカイブ製品を提案いたします。
・デジタルアーカイブシステムの選定

下の図はビュアー例となります。

左上:RichFlame(複数ページ用) 左下:RichZoom(大判資料用)  右上:PDF

まとめ

資料のタイプや利用目的を鑑みて、公開フォーマットを閲覧に使用するビューアーと合わせて検討しましょう。


・参考記事

  デジタル画像のファイルフォーマットとは 画像データ化の際は、保存と活用を意識した最適な画像ファイルフォーマットを選択しましょう。 デジアカ
  WP03_【ホワイトペーパー】画像フォーマットの疑問丸分かりガイド 資料の管理や保存において、昨今関心が寄せられているのが“デジタル化”です。 デジタル化は資料情報をより良い状態で保存し、利活用を容易にします。また、保管・保存スペースを節約できるだけでなく、遠隔での利用も可能になるため、あらゆる分野や業界で広く活用されはじめています。 資料のデジタル化には、その内容を全文テキスト化する側面と原資料を忠実に画像化する側面がありますが、本書では、後者の実施をに検討する方々から、必ずといってよいほど挙げられるファイルフォーマットや容量に関する疑問とその解決策について解説します。 デジアカ


・参考URL
国立国会図書館資料デジタル化の手引 国立国会図書館

http://www.ndl.go.jp/jp/preservation/digitization/guide.html





Ishikawa
Ishikawa
デジアカサイト運営を担当しています。みなさまのお役に立てるサイトになりますように、日々積み重ねていきたいと思いますのでよろしくお願いします。 また、文書管理コンサルも担当しており、現用文書からアーカイブまでの興味深く携わらせていただいております。