catch-img

どこをみればいいの?確認すべきサンプルデータのポイントとは。

資料のデジタル化を検討する際や、実際にデジタル化を行う前は

「この資料をデジタル化したらどんな見栄えになるのかな?」

「この文字は読めるようになるかな?」

「データの大きさはどのくらいになるかな?」などなど 色々と不安や課題が出てくると思います。

その解決の一つとして、デジタル化を依頼する委託業者さんに、サンプル画像を作ってもらい、事前に画像を確認する方法があります。

しかし実際にサンプルデータを受け取っても、どこをみて何を確認すればよいか迷ってしまうことがあるかもしれません。

そこで、今回はサンプルデータの確認すべきポイントをまとめてみました。

目次[非表示]

  1. 1.文字の判読性
  2. 2.色の再現性
  3. 3.トリミング範囲、資料の傾き
  4. 4.データ容量
  5. まとめ
  6. 参考URL

資料のデジタル化を行う際には、対象資料を正しく安全にデジタル化するために「仕様書」を作成して、デジタル化の際に重要となるポイントを委託業者さんに提示することになると思います。

正しい仕様書に基づき正しくデジタル化が行われれば問題ありませんが、仕様書の内容が正しく委託業者さんに伝わっているか、また仕様書の記載の方法に誤りがないか、実際にデジタル化を行ってみないと分からない部分も多くあったりします。

実際の作業が進んで委託業者さんが仕様書通りに作業できない、もしくは仕様書の記載内容に誤りがあり欲しかったデジタルデータができなかった、といったことになったら大変です。

そのため作業前にサンプルデータを委託業者さんに作製してもらうことにより、委託業者さんの実施能力や仕様書の記載内容に不備がないか確認することが大切になります。

では、サンプルデータの検証ポイントについて確認してみましょう。


1.文字の判読性

デジタル化対象資料に記載されている文字情報がサンプルデータに正しく反映されていて読み取ることができるか、というポイントになります。

小さい文字、薄いかすれ文字、漢字 などが資料に記載されていた場合には該当部分のサンプルデータをモニターで確認し資料と同等レベルで読み取ることができているか確認を行います。

また文字の周りに不自然な輪郭が出ている等のサンプルデータ上の不具合なども確認しましょう。

冊資料の場合には見開きでデジタル化を行っていると思いますので、ノド元(綴じ部分)の文字が綴じ部分にかかっていて読めなくなっていないかも確認する必要があります。

サンプルデータを確認して、文字がかすれていて読めない、文字がつぶれているなどの事象があった場合には、資料に記載されている文字の状態も併せて確認しましょう。昔の資料では、文字のかすれやつぶれ、曲がりなど多くありますので、デジタル化の際の不備ではなく、資料に起因している問題かもしれません。

サンプルデータだけでなく、資料も確認することが大切です。


2.色の再現性

デジタル化対象資料の色が正しくサンプルデータに反映されているかというポイントになります。

資料の各色が違和感なくサンプルデータで再現できているか、デジタル化により全体的に赤味がかっている、青味がかっている、などの事象が起きていないか確認をします。

色の再現性を確認する際には、色を自分の目で判断することになり、主観的にならざる得ない部分もありますので、サンプルデータを作製する際には資料と一緒に色見本となるカラーチャートをデジタル化することをおすすめします。

カラーチャートの色味がどのような色でデジタル化されているか見た目でも判断がつきやすくなりますし、色管理が可能なソフトウェア等で客観的に数値にて色評価することも可能となります。

また、使用しているモニターが原因で色が正しく表示されない場合もありますので、色の再現性に違和感があった場合には、サンプルデータを別のモニターで確認してみることも大切です。


3.トリミング範囲、資料の傾き

トリミングとは、デジタル化する際に資料の周りの余白部分を一定の範囲で切り取ることで、モニターでデジタルデータを表示した際に、余白が大きく資料が小さく表示されないようにするための処理です。

トリミングの範囲については仕様書で資料に対して〇〇%と定められていると思いますので、正しい範囲でトリミングされているか確認を行います。また、トリミング範囲が資料にかかってしまい資料の一部が欠損等していないか併せてサンプルデータにて確認します。

資料の傾きについては、資料が曲がってデジタル化されないように、仕様書で傾きの許容数値が資料に対して〇〇度未満と定められていると思いますので、傾きが許容範囲内か確認を行います。

また、資料の形状により資料の向きを変えて(文字が横になっている状態等で)デジタル化する場合がありますので、サンプルデータでは文字が読める向きに補正されているか確認を行います。

資料の傾きについては、

冊資料の綴じが曲がって綴じられており、見開きにしたときに資料が曲がってしまう

折込資料等が曲がって資料に綴じられている

資料の文字が曲がったまま印刷されている 

など資料に起因している場合もありますで、必要に応じてサンプルデータと併せて資料を確認することも必要になりますので注意してください。


4.データ容量

資料をデジタル化した際のデータ容量は、資料の大きさ、解像度(細かさ)、階調(白黒・カラー)、画像フォーマット(TIFFやJPEGなど)で定まりますが、実際にデジタル化してみたら、データ容量が大きすぎて運用上問題が出てきたとなってしまうと大変です。

サンプルデータで1ファイル当たりのデータ容量が分かりますので、デジタル化予定数量に基づき予定している資料を全てデジタル化した場合に、想定内のデータ容量となっているか確認をしましょう。

データ容量が想定より大幅に異なることが判明した場合には解像度等仕様書の修正が必要になるかもしれませんので、サンプルデータでしっかりとデータ容量を把握しておきましょう。


まとめ

資料のデジタル化にあたりサンプルデータを事前に確認しておくと、仕様書で求めている要求事項がデジタル化の際に守られているか、仕様書に無理無駄がある事項がないか明確にすることが期待できます。

今回の記事を参照して正しくサンプルデータを確認して、安全なデジタル化事業を目指していただきたいと思いますが、初めてデジタル化を行うという場合には、少々戸惑ってしまうかもしれません。

そんな時は経験豊富な委託業者さんに相談してみてください。きっと問題解決につながる意見やサンプルデータを提示してくれると思います!

参考URL

国立国会図書館資料デジタル化の手引2017年版

https://dl.ndl.go.jp/view/download/digidepo_10341525_po_digitalguide170428.pdf?contentNo=1&alternativeNo=


Hasegawa
Hasegawa
ニチマイの営業担当です。デジタルアーカイブに関して少しでも皆様のお役に立てるようにがんばります!