wvWare for Windows
現在、『レポート形式自動Checker』なるものを副業で開発している私ですが、諸事情でLinux上ではなくWindows上に構築する必要がありまして、『Microsoft Office Wordからテキスト形式への変換』をWindows上に構築しました。
その記録をここに。
1.Wv for Windowsにアクセス
2.使いたいだけならば、"Complete package, except sources"をダウンロード(wv-2.0.2.exe)
3.インストール
4.[インストール先]/binにPathを通す
準備完了。
コマンドプロンプトから、
wvWare InputFile.docコマンドプロンプト上にHTML形式へ変換されたデータが出力されます。
これをファイルに出力するためには、
wvWare InputFile.doc > OutputFile.htmlで。
私がやりたいのはテキスト形式への変換なので、これではダメです。Linux上ではwvTextなるコマンドがあるのですが、残念ながらそんなコマンドはないと言われてしまいます。
いろいろと調べてみたところ、configure.xmlなるファイルがあるとのこと。場所は…usr/local/…んなもんはありません。
share/wv/にそれらしきXMLファイル群を発見。
wvWare -x wvText.xml InputFile.doc > OutputFile.txt成功。
I won't mmap that file, using a slower methodと言われてしまい、『wvWare の stderr 出力を捨てる処理』を行えばいいとのことなのですが、その方法がわかりません。実用上は問題ないのですが、気持ち悪いのでどなたか助言をお願いします。
備考:
1.Linux上のwvTextでは
wvText InputFIle.doc OutputFile.txtとなっており、Outputは省略できません。が、上記オプションではOutputを記述してもファイルは出力されないので注意。
2.文字コードは?
Wordの文字コードは気にしないとして、出力されたのはUTF-8Nのようです。