UTF8版Chasen
を作ろうかどうか悩む。
http://journal.mycom.co.jp/column/yetanother/045/
VPNがなんだかんだでインフラとして頼りないので結局マイマシンでWindows環境。
Windowsだからと言ってShift-JISで日本語処理はしたくないのでUTF-8.
Chasenは辞書をUTF-8でコンパイルしなおすんだよね……
いや、そんなに手間じゃないんだけど、誰かがコンパイルしたの配ってくれてても……ライセンス関係で駄目なのかなぁ。
MeCabなら文字コードいろいろと対応してるんだっけ。
http://mecab.sourceforge.jp/
そっち検討してみよう。