« 記述記号とJIS X 0213:2004 | トップページ | 『Dark Seed』家系図 »

デスクトップ検索

 WindowsDesktopSearch、GoogleDesktop、etc。
 デスクトップ検索ツール、便利ですね。ですが、透明テキスト付のPDFとの相性が今ひとつです。WindowsDesktopSearchはver.2の頃は標準のifilterでうまく検索できたのですがver.3になってからはfoxitpdfのifilterでないと透明テキストが検索できなくなり、その後いつの間にかfoxitのifilterを使っても検索できないようになっていました。(ifilterをインストールし直し、インデックスを再構築すると直ります)

 デスクトップ検索ができないんじゃ透明テキスト付PDFの魅力が半減、というわけで改めて探してみました。

 ありました。“DesktopHE”。フリーソフトです。

 Hyper Estraierを検索エンジンに使用した、Windows用のデスクトップ検索ツールです。
日本語の文書に対して、N-gram方式による漏れのない検索が行えるのが特長です。

 指定したディレクトリの配下の、次の種類のファイルから全文検索を行えます。
 ・テキストファイル
 ・HTMLファイル
 ・電子メールファイル(拡張子が「.eml」「.mime」「.mht」「.mhtml」のもの)
 ・Wordファイル
 ・Excelファイル
 ・PowerPointファイル
 ・pdfファイル
 ・OpenOffice.orgファイル

DesktopHE公式ページ概要より

 以前に試したときはxdoc2txtとScanSnapOrganizerの生成する透明テキスト付PDFの相性が悪かったのかうまく全文検索ができなかったのですが、今回試してみたらうまく行きました。←日本語フォルダ名かxdoc2txtのファイルサイズ制限設定に引っかかっていたのだろう

 DesktopHEは核となる検索エンジン部分がとても優秀です。WDSやGDSのように検索漏れがあったり、存在しないはずの語が検索に引っかかってきたりと、おかしな検索結果とは無縁です。代わりに

  • 導入がほんのちょっとだけややこしい
  • インデックスの作成が手動(自動化もできるけどパソコンに詳しくないと難しい)
  • xdoc2txtでファイルサイズの制限を解除すると時々エラーを吐く
  • 拾い物のPDFなどうまくインデックスできないものもある

と少しだけ敷居が高いです。

 検索精度が高いことは何ものにも代え難いし、概要の抜き出し表示もシンプルですが良いアイデアで実用的。一太郎やOOo、MS-Officeファイルが検索できるのも便利。

 お勧めです。

|

« 記述記号とJIS X 0213:2004 | トップページ | 『Dark Seed』家系図 »

コメント

この記事へのコメントは終了しました。