2010-01-01から1年間の記事一覧
そんなにメモリ食うコードは直せよ,というのはおいておいて. 環境にも寄ると思うが,通常,256MB以上のメモリは確保しないため,OutOfMemoryエラーが発生してしまう. ので,より多くのメモリを確保できるようにオプションを設定する. application.confに…
パフォーマンス低下が著しいし,TOKENの設定が難しいので,入力データも出力データも一旦ファイルシステムを使うことに. 将来的にはtmpfsを使えばいいかな. オプション指定があるので,前回とは違い,mecabおよびcabocha専用. CabochaTest.java import ja…
先日,ProcessBuilderを使ったMecabの呼び出しを書いたが,テキストの規模が大きくなるとフリーズする(プロセスがどっかへ逝く)ことが判明した. Mecabより先にCabochaの方が限界を迎える. 原因は,JavaのBufferedStream(Reader|Writer)のバッファサイズ…
JAXB(Java Architecture for XML Binding)を使う方法を,Yahoo校正支援APIを題材に解説します. どこら辺が「簡単」なのか? 各種API系のサービスで配布されている,XMLスキーマファイル(xsd)から,Javaクラスファイル群を自動生成することで, 自前のコ…
Play frameworkのインストールは,zipを解凍するだけなので省略. 環境はUbuntu Desktop 10.04.MecabはUTF-8阪. Mecabのインストールは,http://d.hatena.ne.jp/Syo-Takasaki/20090528/1243484754 を参照してください. apiアプリの生成 $ ./play new api …
背景(読まなくてOK) i7 12GBメモリのマシンにCitrix XenServerを入れ,「これで仮想マシン使い放題!」と思ったのもつかの間. そのまま仮想マシンを作っても,ブリッジ接続にしかならず,IPが枯渇してしまう.IPv4の枯渇も問題だけど,うちのネットワーク…
セルA1にUNIX TIMEの数値が入っているとすると. ="1970/1/1"+A1/86400+9/24 で,JSTに変換できる.後はセルの書式設定を, yyyy/mm/dd/ hh:mm などとすれば,日本時間が分かる.Excel2007で動作確認済み.ところで,なんで,mmが被っても大丈夫なんだよ,と…
個人的メモ. アップデート 何度も入れていると,たまに忘れる. $ sudo apt-get update $ sudo apt-get upgrade 定番アプリのインストール ## いつものソフト $ sudo apt-get install vim screen nkf openssh-server ## ディレクトリ構造を英語に変更 $ LAN…
extract_document.pl use Archive::Zip; Archive::Zip->new("$ARGV[0]")->extractMember('word/document.xml', "./$ARGV[0].xml"); こんな風に使います. $ perl extract_document.pl target.docx すると,同じディレクトリにtarget.docx.xmlが生成されます.
先日の記事に書いた方法で,sun-java6-jdkをインストールすることはできたのだが,今度はNetBeansが文字化け. 起動時の「モジュールを読み込んでいます」的なメッセージも,一部の文字が四角い枠線になってしまう. NetBeans上のプロパティで,フォントの指…
Ubuntuを10.04にしたのですが、 $ sudo apt-get install sun-java6-jdk パッケージリストを読み込んでいます... 完了 依存関係ツリーを作成しています 状態情報を読み取っています... 完了 パッケージ sun-java6-jdk はデータベースには存在しますが、利用で…