ドキュメントスキャナ ScanSnap・その5
ScanSnap
のまとまったレポとしては最終回です。
四月の上旬に購入して以来せっせと続けていた書籍の電子化ですが、総スキャン枚数37,000枚余――厚さにして恐らくは二メートル分ほど?を作業してみての印象をまとめてみます。50,000枚のパッドユニット(ゴムの紙押さえ)交換時期ももう間もなく、かな。
- 書籍の山の解消にはならない
- 透明テキスト付PDFの便利さ
- スキャンデータとモバイルの相性の悪さ
- 意外に使える名刺OCR
- こまめなお手入れが必須
ドキュメントスキャナの使用感はこの五つに尽きると思います。
「書籍の山の解消にならない」というのは書籍整理をドキュメントスキャナに期待していた人にはがっかりな結論かもしれませんが、偽りのない実感です。スペース確保目的での導入は労力が割に合わないと断言します。
毎日二時間前後を費やして一ヶ月半、電子化できたのはA4雑誌とB5雑誌計200冊ほど。資料的な意味合いの強い雑誌数種だったので「後で便利に使えるはず」とモチベーションが維持できましたし、実際資料として活用しているので「スキャンして良かった」と思います。けれど、単に捨てるのがためらわれるだけの書籍類に同じだけの労力を費やすのは私には無理です。
スキャナ自体がちょっとやそっと速くなっても書籍の山を片付けるという用途には適さないでしょう。ネックはスキャン速度ではなく手間と得られる成果にあると思います。(機械の速度が上がっても作業トータルでの時間短縮効果は薄い。トレイに原稿を放り込んで別の作業を始めるとスキャン終了に気づかず放置状態になる→速度なんてどうでもよくなる)
電子化してみても新しい知見が得られるわけではありません。
検索できても古いデータを利用することはまずありません。(2007.12追記 実際に電子化したデータの中で利用しているのは新しいデータばかり) つまり、新しいものほど電子化した方が効果的なのです。逆に言えば古い書籍・資料は手間をかけても労力対効果が低い=電子化のモチベーションが湧かない、となります。
てなわけで資料性が高いはずの捨てられない古資料は未だに山をなしたまま片付きません。(2008.4記)
小説類はとくにスキャンしてしまうと読まなくなるでしょう。スキャンしたものの品質はやはり印刷物には適いません。モニタ自体が100dpi未満でスキャンデータを扱うには性能が不足しています。コミックもスキャンしてしまうと繊細な絵柄の物は見映えしません。結局、購入直後に試しにスキャンしてみた小説とコミックは顧みられることなく無用のデータと化しています。資料として検索し参照する見られればいい物には向いていますが、内容を楽しむコンテンツのスキャンは今ひとつです。(2008.5記)
透明テキスト付PDF作成は、電子化するなら必須。
デスクトップ検索ツールと併用することでスキャンした資料がそのままデータベースになります。ただし、記事を電子販売しているものは素直にデータを買ってしまうのがお勧め。画像の上に記事を刷り込んでいるような書籍類もOCRの精度が低くなりすぎてスキャンする甲斐が薄い気がします。検索できない画像のみの電子化は――利用価値がないと、私は思います。
ScanSnapOrganizerのOCR機能はそこそこ優秀です。が、型番が列記されるようなカタログみたいなものでは「0(ゼロ)O(オー)。(句点)○(丸)」「1(いち)I(アイ)l(エル)」「8(はち)E(イー)」の判別がつけにくいようで記されているはずの内容が検索でヒットしない(※1)ことも珍しくありません。便利だけれど過度な期待は禁物、といったところでしょうか。
(※1)OCR自体の問題以外にもWindowsDesktopSearchやGoogleDesktopSearchは「あるはずの単語が検出できない」「ないはずの単語が検出される」問題がある。それも頻繁に。
モバイルとの相性の悪さ、というのは愛用のZaurusとのことです。
PDAの中では比較的大きく精細な画面を持つZaurusですが、A4やB5サイズのスキャン画像を閲覧するのは少々荷が重く、また、透明テキスト付PDFでの内容検索ができません。せっかく小説書き用に資料を電子化しても、それがモバイルで活用できないとあっては片手落ちです。ノートPCならばPDFでもへっちゃらなのですが……。
ZaurusのPDFの閲覧ソフトがどうにもメモリ食い&処理が重い、ということもあって実用性は低いです。
オマケのようについてくる名刺OCRソフト。
これが意外に使えます。2008年の正月に溜め込んだ名刺を読み込ませて整理してみたのですが、認識率も高く、アドレス帳が比較的楽にできあがりました。Zaurusのアドレス帳と連携させて超便利!と言いたいところなのですがOutlookを間に挟まねばならないのが玉に瑕。
ScanSnapユーザで未体験の方はお試しあれ。
埃。埃もScanSnapの大敵です。
ScanSnapのように原稿を動かしてスキャンする機械は、読取装置部分のガラスに埃が落ちただけでスキャン画像に縦線が入ってしまいます。特にカラー原稿では埃ひとつで赤・青・緑のいずれかの原色の線が引かれてしまうので目立ちます。これはもうスキャナをこまめに掃除するしか対処の方法がありません。原稿も(古い本であれば特に)濡れ雑巾で表紙や小口をざっと拭くのがお勧めです。裁断部も意外に細かな紙粉がついているものですし。
スキャナの掃除ですがこまめにするのはメガネ拭きで読取部を軽く拭くだけでOK。
印刷インクは油ですし、紙の繊維屑が出るので、時折、掃除機でぶぃ~んと吸い、不織布に無水アルコールを垂らして読取部を拭いてやるとすっきりします。あ、でもブロアの類で空気を吹き付けるのは厳禁。読取部の内部に埃が押し込まれ、ピンボケ縦線の元になるとか。(2006.6.11追記)
その他にも気になった点を列挙しておきます。
- 紙質、紙目方向によっては縦罫線が左右に波打つことがある
- 色つきの紙に印刷された原稿は紙の色が抜けてしまう
- 柔らかな(厚めの)原稿や写真にはローラの痕とピックアップユニットの爪痕がつく。
- 原稿トレイ容量50枚は雑誌や書籍の処理には少ない。
おまけ
最近はMac用モデルのScanSnap S510M
や小型版のScanSnapS300

も出たようです。コクヨのCaminacs

やキヤノンのimageFORMULA DR-2510C

が競合機種になるのかな。コクヨのは原稿の重送が起こりづらいとの評があるみたい。
まとめ
嵩張る本を電子化してスペース確保という目的には向きません。ドキュメントスキャナを買い、事務用の裁断機(例:PK-513
や楽天あたりで「500枚らくらく」と売られているもの)を用意して万端環境を整えたとしても三ヶ月と経たずに挫折するでしょう。フラットベッドスキャナに比べればマシですが、やっぱり手間は手間なのです。「スペース確保」という報償に対しては電子化は手間と時間がかかりすぎます。
検索利用することが確実な資料の電子化にはとても役に立ちます。日々手に入れる新鮮な資料を新しいうちに電子化するのが最も効果的。明確なリターンがあるので電子化に伴う手間も惜しくありません。
| 固定リンク
トラックバック
この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/169116/15185602
この記事へのトラックバック一覧です: ドキュメントスキャナ ScanSnap・その5:

コメント
私もScanSnap+Zaurus SL-C3200で,スキャンした書類の閲覧をしております。PDFのままザウルスで見るのではなく,FUJIXEROX社のDOCUWORKS形式に変換してザウルスで見ると,激しく快適です。ザウルス用ビューアが公式に出ています(Webから落とせます)
まだでしたら是非一度!DocuWorksは1万4千円ほどしますが,無駄にはならないと思います。体験版もありますよ。
投稿 通りすがりのアレックス | 2007.05.27 00:53
通りすがりのアレックス様、ご教授ありがとうございます。
早速試してみました。DocuWorksの体験版。
pdf→DocuWorks形式への変換だとサイズがかなり膨れ、透明テキストが消えてしまいました。ならば、と150dpiでjpeg保存したA4画像をひとまとめにしたDocuWorks形式ファイルを作ってみるとこちらは順当なサイズ。閲覧もZaurus上での専用ビューワは軽快です。OCRもDocuWorks上でかけられました。誤認識はかなり多いですが。
Zaurus上のDocuWorksビューワには「検索」メニューが見つかりません。これではせっかくのOCRが無意味に……。
Zaurus上ではPDFと比べてDocuWorksは断然快適ですが、全文検索が使えないとjpeg画像を無圧縮zipでまとめたものをaBookReaderで閲覧するのとあまり変わらない気もします。
なにぶん軽く試してみた程度なので、OCRや検索について誤解している部分もありそうです。試用期間も60日あるのでもうちょっと勉強してみようと思います。
有益な情報、ありがとうございました。
投稿 とうあさ | 2007.05.27 17:43