UTF8版Chasen

 を作ろうかどうか悩む。
 http://journal.mycom.co.jp/column/yetanother/045/

 VPNがなんだかんだでインフラとして頼りないので結局マイマシンでWindows環境。
 Windowsだからと言ってShift-JISで日本語処理はしたくないのでUTF-8.

 Chasenは辞書をUTF-8コンパイルしなおすんだよね……
 いや、そんなに手間じゃないんだけど、誰かがコンパイルしたの配ってくれてても……ライセンス関係で駄目なのかなぁ。

 MeCabなら文字コードいろいろと対応してるんだっけ。
 http://mecab.sourceforge.jp/

 そっち検討してみよう。