Text変換実装ラッシュ

 前々から中村研にはWordToTextやPdfToTextへの要望があり、日本語全文検索エンジンnamazuプラグインを解析することでできるのではないか、と考えていました。
 それが今日4時間稼動で動いちゃいました。

PDFtoText
環境:WindowsXP
 http://www.foolabs.com/xpdf/download.htmlから、「Win32 (built with MSVC): xpdf-3.00pl3-win32.zip (1142558 bytes)」「Japanese: xpdf-japanese.tar.gz (494624 bytes)」をダウンロードする。
  「C:\usr\local\share\xpdf」に「xpdf-3.00pl3-win32.zip」を解凍する
  「xpdf-japanese.tar.gz」を解凍しディレクトリ名「xpdf-japanese」を「japanese」にリネームして「C:\usr\local\share\xpdf」に置く
 sample-xpdfrcをXpdfrcにリネーム
 環境変数のPathに「C:\usr\local\share\xpdf」を追加する
 「C:\usr\local\share\xpd」の「Xpdfrc」最下部に以下の内容をコピーする

……以降のデータロストしたorz