Java

Randomを使ったHello World

ネットサーフィンをしていたら,stackoverflowに面白質問が投稿されていた. どこか日本語のサイトで扱われていたと思うのだが,元記事を見つけられなかったので,自前で投稿してみる. http://stackoverflow.com/questions/15182496/why-does-this-code-pri…

PlayFrameworkでOutOfMemory

そんなにメモリ食うコードは直せよ,というのはおいておいて. 環境にも寄ると思うが,通常,256MB以上のメモリは確保しないため,OutOfMemoryエラーが発生してしまう. ので,より多くのメモリを確保できるようにオプションを設定する. application.confに…

結局ファイル書き出しでmecab&cabocha

パフォーマンス低下が著しいし,TOKENの設定が難しいので,入力データも出力データも一旦ファイルシステムを使うことに. 将来的にはtmpfsを使えばいいかな. オプション指定があるので,前回とは違い,mecabおよびcabocha専用. CabochaTest.java import ja…

Mecab | Cabocha -I1 -f1 from Java

先日,ProcessBuilderを使ったMecabの呼び出しを書いたが,テキストの規模が大きくなるとフリーズする(プロセスがどっかへ逝く)ことが判明した. Mecabより先にCabochaの方が限界を迎える. 原因は,JavaのBufferedStream(Reader|Writer)のバッファサイズ…

JavaでXMLを簡単に解析する方法

JAXB(Java Architecture for XML Binding)を使う方法を,Yahoo校正支援APIを題材に解説します. どこら辺が「簡単」なのか? 各種API系のサービスで配布されている,XMLスキーマファイル(xsd)から,Javaクラスファイル群を自動生成することで, 自前のコ…

Play frameworkでmecab apiを自炊する

Play frameworkのインストールは,zipを解凍するだけなので省略. 環境はUbuntu Desktop 10.04.MecabはUTF-8阪. Mecabのインストールは,http://d.hatena.ne.jp/Syo-Takasaki/20090528/1243484754 を参照してください. apiアプリの生成 $ ./play new api …

Ubuntu 10.04のNetBeans文字化け解決方法

先日の記事に書いた方法で,sun-java6-jdkをインストールすることはできたのだが,今度はNetBeansが文字化け. 起動時の「モジュールを読み込んでいます」的なメッセージも,一部の文字が四角い枠線になってしまう. NetBeans上のプロパティで,フォントの指…

Ubuntu 10.04にsun-java6-jdkをインストール

Ubuntuを10.04にしたのですが、 $ sudo apt-get install sun-java6-jdk パッケージリストを読み込んでいます... 完了 依存関係ツリーを作成しています 状態情報を読み取っています... 完了 パッケージ sun-java6-jdk はデータベースには存在しますが、利用で…

オブジェクトのソケット通信

オブジェクトを送受信するソケット通信のサンプルコードが見つからなかったので,ここで晒します. 「形態素解析を高速に処理&クライアント側に形態素解析器環境不要」を実現したかったので,``ArrayList''を送受信するオブジェクトにしています. HelloWor…

Windows上でJavaをUTF8で開発

原則UTF-8でデータも保存するし,コーディングもするのですが,先日ちょっと躓いたのでメモ. Windows環境ではJavaは標準でSHIFT-JISで読み書きしてくれます. コードもSHIFT-JISで書かれていることを期待しているので,UTF-8で書いた時のコンパイルはこんな…

Linux版Java文字化け修正

環境はFedora Core 4,日本語環境ですが,OpenSUSE10.1,VINE4.0でも解決できたようです。 私の記事で一番人気(何 JRE5.0インストールとブラウザpluginインストール Linux用のJRE5.0をダウンロードする(jre-1_5_0_04-linux-i586-rpm.bin) 下記の手順でJRE…