デスクトップ検索
WindowsDesktopSearch、GoogleDesktop、etc。
デスクトップ検索ツール、便利ですね。ですが、透明テキスト付のPDFとの相性が今ひとつです。WindowsDesktopSearchはver.2の頃は標準のifilterでうまく検索できたのですがver.3になってからはfoxitpdfのifilterでないと透明テキストが検索できなくなり、その後いつの間にかfoxitのifilterを使っても検索できないようになっていました。(ifilterをインストールし直し、インデックスを再構築すると直ります)
デスクトップ検索ができないんじゃ透明テキスト付PDFの魅力が半減、というわけで改めて探してみました。
ありました。“DesktopHE”。フリーソフトです。
Hyper Estraierを検索エンジンに使用した、Windows用のデスクトップ検索ツールです。
日本語の文書に対して、N-gram方式による漏れのない検索が行えるのが特長です。
指定したディレクトリの配下の、次の種類のファイルから全文検索を行えます。
・テキストファイル
・HTMLファイル
・電子メールファイル(拡張子が「.eml」「.mime」「.mht」「.mhtml」のもの)
・Wordファイル
・Excelファイル
・PowerPointファイル
・pdfファイル
・OpenOffice.orgファイルDesktopHE公式ページ概要より
以前に試したときはxdoc2txtとScanSnapOrganizerの生成する透明テキスト付PDFの相性が悪かったのかうまく全文検索ができなかったのですが、今回試してみたらうまく行きました。←日本語フォルダ名かxdoc2txtのファイルサイズ制限設定に引っかかっていたのだろう
DesktopHEは核となる検索エンジン部分がとても優秀です。WDSやGDSのように検索漏れがあったり、存在しないはずの語が検索に引っかかってきたりと、おかしな検索結果とは無縁です。代わりに
- 導入がほんのちょっとだけややこしい
- インデックスの作成が手動(自動化もできるけどパソコンに詳しくないと難しい)
- xdoc2txtでファイルサイズの制限を解除すると時々エラーを吐く
- 拾い物のPDFなどうまくインデックスできないものもある
と少しだけ敷居が高いです。
検索精度が高いことは何ものにも代え難いし、概要の抜き出し表示もシンプルですが良いアイデアで実用的。一太郎やOOo、MS-Officeファイルが検索できるのも便利。
お勧めです。
| 固定リンク
この記事へのコメントは終了しました。
コメント