Research

研究体制再整理

カテゴリ分けとか気にせずに書き出してみる。コンフリクトを起こしたものをどう解決するか。 自分の研究・Web辞苑(中村研)・個人の3つの観点で,開発環境・プロジェクト管理・ナレッジ管理を考える. 研究 開発は研究室のLinux+VMware ソースコード管理は…

BlogやSNSの信憑性=約85%

人はなぜブログやSNSの書き込み内容を信じるのか? - CNET Japan ブログやSNS(ソーシャルネットワーキングサービス)の書き込み内容に信憑性があるのは「知り合いのブログだから」――。オプトとクロス・マーケティングが8月28日に公表した「ブログ・SNS利用…

デジカメ口コミダウンロード中

12,872Pagesを5つのCrawlerでダウンロード中。一応時間計測。 現在328Pagesで58.7MB。 58.7 * 12872 / 328 = ……2.3GBですか。 これまた分析のし甲斐がありますね。 HTMLタグ取り除いたら数百MBでしょうけど。 1万ファイルを1フォルダに入れていると,エク…

掲示板収集マルチスレッドプログラム

雑記ばかり書いて居てもなんなので。 研究開発の話でも。 掲示板のURLを解析して,「次へ」で辿れるような数百ページを収集するプログラムを仕上げました。 まだ本動作はさせていませんが、試験動作で性能を確認。 50ページ分をNプロセスの並列処理で取得…

係り受け解析器はまだ少ない?

形態素解析器はたくさんでてきたけど。 係り受け解析器はまだまだ少ない。 と言うかWindows上でテキスト処理したくないんですが。 南瓜入れるか…… 先日、UTF-8版の〜とかいうエントリをしましたが。 Perlバインディング使えば文字コード考慮してくれるのでは…

修士論文目次案作成

中身を書きたくなってしまうわけですが。 ここは堪えて。 明日は会社へ行って,Linuxを弄る予定。 あ〜Fedora Core 5が……まだ入れていないrpmが私を待っている(壊 と、取りあえずはDebianとディレクトリ構成が違うので,Apache2.2とかの設定はどこ? ログは…

学会活動

先週木曜日は情報処理学会で発表でした。 今週木曜日はプロジェクトマネジメント学会で発表です。 両方とも年次大会なので査読はないです。情報処理学会 学生実験の労力削減と個別指導充実のための実験支援システム(レポート形式チェッカー込み)を発表。 …

CGIからPerlを呼ぶテンプレ

HelloWorld.pluse strict; print "Hello World"; exit;CGIuse CGI; $cgi = new CGI; print $cgi->header(); open(CH, "perl HelloWorld.pl |"); while(<CH>){ print "$_"; } close(CH); exit;</ch>

Perl-CGIトラブルシューティング2

今度は次のようなエラー。 Exec format error: exec of 'hello.cgi' failed こちらもK2Editor準拠で解説すると,UTF-8(BOM付き)では駄目で、UTF-8Nで保存すればOK。

英語が分からない

形容動詞語幹とか名詞-サ変接続とか。 日本語処理関係の英語論文を探索中……

情報処理学会 全国大会 原稿仮完成

タイトル通り、原稿が仮完成しました。朝焼けが目に眩しい。 エントリーの内容は研究というより雑学ネタ。 原稿はPDFで提出するのですが、Acrobatは個人所有していないので、フリーの変換ツールpdf995を使用したのですが……これが四苦八苦。最終的には解決し…

引数解析:コード量が微妙

先日の続き。 Parseはできたのでプログラムは問題なく動いているんですけど、コード量が微妙。 例えば、-lというオプションに1〜3の数値で実行レベルを引き渡せるとして、値を渡さなければデフォルト値で、更に-rオプションが使えてこれは単独で。 で、こ…

コマンドオプションのparse

parse arguments:引数を解析する なんて辞書にも載ってることですが。$ perl consept.pl -m 1 -r -l 10 みたいな感じでオプションを渡したい時のオプションが適切かどうかを解析する方法に悩み中。 -?だけを見ていくなら簡単なんですが……その後ろに数字が来…

Debian UTF-8 LWP::Protocol

DebianへのPerlモジュールインストールは下記のことをごにょごにょやっていたらなんとかなりました。ので、どれで解決できたのか不明。・CPANでinstallコマンドを叩きまくる ・# apt-get install dh-make-perl ・# apt-get install libhtml-parser-perl ・$ …

DebianでCPAN

HTTP::Responseを使うようなPerlコードを書いた途端、HTML::Parserでエラーが発生して先に進まず。 CPANを使っていろいろとやってみるも、makeがbad statusを返したり、途中でHTML::TokeParserがないと言われたり散々。 これを解決しないと、「インターネッ…

coLinux上のDebianへのjdk-1_5_0_05-linux-i586.binンストール方法

DebianにJavaが入らないであげていたスペイン語(chickさんコメントありがとう)の解説記事によって見事解決しました。 Debianのapt-getではJavaが入らないらしい。 ということで、jdk-1_5_0_05-linux-i586.binを入手し、Sambaを使ってcoLinuxのDebianに送り…

Perl XML::Writer

現実逃避というか、現実直視というか。 Javaの環境はPMシミュレータの開発のためには必要ですが、当面1週間ほどで週報・日報をオンラインで記述・管理するツールを開発するスケジュールになっているわけで。 データはXML形式で蓄積だぁ、とか言いつつ実はXM…

DebianにJavaが入らない

JavaのDebianオフィシャルパッケージがないだの、その癖OSとしてはサポートしているだのと混乱する中、様々なサイトを見て作業をしてみる。 /etc/apt/sources.listを下記のように(最後の行を追加)deb http://ftp.us.debian.org/debian/ stable main deb-src…

アンダーバーが入力できない

CygwinのXWinでFedoraCore3にアクセスした際に発生していた、アンダーバーが入力できない問題が解決しました。 XのConfigがどうのとかKeyMapがどうのとか多少情報がWeb上にあったのですが…… Cygwinのアップデートで解決 ……はぁ。

failedって言ったのにSuccessってどういうこと?

coLinuxからWindowsの共有フォルダにアクセスするため、~/mntにマウントした際の出来事。 Windows側の共有名mntフォルダにtest.txtファイルを作り、下記の条件の場合 Windows側の共有フォルダへはユーザ名hoge,パスワード*****でアクセス可能 Linux側のユー…

coLinux導入成功

Windows上でバイナリレベルでLinuxを実現するcoLinuxの導入に成功しました。 まだこれから研究環境を整えていかないといけないのですが、取り合えず最低限のネットワークと日本語キー配置設定はできたので。 汎用性のまったくない、私のcoLinuxインストール…

Perl Moduleのディレクトリ変更

Moduleがないと下記のようなエラーがでます。Can't locate Unicode/Japanese.pm in @INC (@INC contains: C:/usr/local/lib C:/usr/local/site/lib .) at Test.pl line 18. BEGIN failed--compilation aborted at Test.pl line 18. これはUnicodeのモジュー…

SemanticSearch

LinuxでのJava日本語文字化け記事でさりげなく紹介していたSemanticSearchですが、DNSがようやく正常稼動に復帰しまして、繋がるようになりました(学内専用です)。 IP直はちょっとね……バージョンが示す通り、βもいいところです。 利用にはJava JRE 1.5が必…

Perlのバッファリングを無効にできない

通常、出力系はある程度データをまとめて出力や表示を行っています(これをバッファリングと呼ぶ…はず)。 負荷が減るので大変重宝する機能なのですが、処理状態を例えば、下記のような形でリアルタイムに表示したいとします(というか、そういう風なものを…

LinuxでのJava 日本語文字化け

今日はオープンキャンパス用にLinuxマシンでもJavaAppletを動作するようにしようとしましたが……問題が出てくる出てくる。次のような問題を打ち破ってなんとか動かすことに成功しました。 ちなみに環境はFedora Core 4、日本語環境です。1.マシンへのファイ…

Perl-CGIトラブルシューティング

タイトルほど大層なものではありませんが。以下のエラーが解決できたので書き込み。状況 パーミッションはPerlのパスは確認済み。suExecを動かしているため、特にパーミッションには注意したがエラーなし。 FedoraCore3のUserDir上でPerlが動かない。 が、既…

wvWare for Windows

現在、『レポート形式自動Checker』なるものを副業で開発している私ですが、諸事情でLinux上ではなくWindows上に構築する必要がありまして、『Microsoft Office Wordからテキスト形式への変換』をWindows上に構築しました。 その記録をここに。1.Wv for Wi…

Text変換実装ラッシュ

前々から中村研にはWordToTextやPdfToTextへの要望があり、日本語全文検索エンジンnamazuのプラグインを解析することでできるのではないか、と考えていました。 それが今日4時間稼動で動いちゃいました。PDFtoText 環境:WindowsXP http://www.foolabs.co…

相関ルールマイニング

私は第3研究として、 学生実験に関する学生のアクション分析他を行い、即座にフィードバックし、よりよい指導を行うための研究を行っている。 アクション分析の対象は、サーバーへのアクセスログである。 そのため、データマイニングを電車の中で調べてみた…

新情報検出Level.1

自分が望む情報がネット上に出現したら即通知して欲しい。そんなニーズは企業個人を問わずあると思う。 企業なら、自社の口コミ情報や商品レビュー。 個人なら、自分の趣味の情報。自分のサイトにリンクを張っているサイト そんな、新情報検出サービスを実現…