OLAP(On Line Analytical Process ; オンライン分析処理)

多次元的にデータを眺めることを可能にするもので、データマイニングとの併用が問題解決には重要となる。 例えばとある会社の売り上げを考えると、店別,月別,商品別の3つの観点から分析する。 全体の売り上げが落ちていることを確認 店別の売り上げグラフ…

データの種類と用語

質的データ,カテゴリカルデータ 量的データ,数値データ 言語データ*1 質的変数(フィールド) 量的変数(フィールド) 顧客名 年齢 性別 購入商品 感想 *1:質的データもテキストで表されるため、テキストデータとは呼ばない

データマイニングの流れ

データの整備 生データでは分析できる状態にない場合が多い。データマイニングを実践しやすいように、データを蓄積して、必要なデータを容易に取り出せるように保管されたデータの集まりを、データウェアハウスと呼ぶ。 データマイニングでは大量のデータを…

データマイニングの手法

分類のための手法 クラスター分析 主成分分析 コレスポンデンス分析 ニューラルネットワーク 連関のための手法 マーケットバスケット分析 時系列パターン分析 類似時系列パターン分析 主成分分析 コレスポンデンス分析 判別のための手法 ロジスティック回帰…

データマイニングとは

統計解析の手法が多く使われているが、統計解析とは異なる。 統計解析との違い 大量のデータを使用する 統計解析は少量のデータで結論を出すことに主眼が置かれている 規則性の発見が目的となる 統計解析は、理論や経験・直感から導き出されたルールを検証す…

Data Mining: Multimedia, Soft Computing, and Bioinformaticsの目次和訳

Data Mining: Multimedia, Soft Computing, and Bioinformatics作者: Sushmita Mitra,Tinku Acharya出版社/メーカー: Wiley-Interscience発売日: 2003/09/25メディア: ハードカバー クリック: 6回この商品を含むブログ (1件) を見る 序文 1 データマイニング…

日本語の処理の難しさ

オノマトペとは擬声(音)語・擬態語のことだが,日本語はオノマトペに富む言語だと言われている。 すなわち,人間にはニュアンスが伝わるが,コンピュータにも相応のスキーマを与えないと意味を解釈できない。

構文解析関連URL

形態素解析・構文解析入門 CaboCha 先輩と話していてよく言われるのが,「形態素解析器? 自分で作った方がいいよ(むしろ作らないと使える性能がでない)」 ですが,私にそこまでの深い知識はありません。 結果を便利に使わせていただきますっていうスタン…

Ruby on Railsのお勉強開始

10分で作るRailsアプリ for Windows Rails+MySQLインストール編 アプリケーション編 URLとタイトル,概要を入力・編集・削除できるブックマークアプリケーションが……コーディングなしで出来上がります。 ちょっおまっwwwです。 坊やがゆく - Railsでソー…

namazuを参考にしたwvWareの導入

Linux版 環境はFedoraCore2って古いな。 ダウンロード http://prdownloads.sourceforge.net/wvwareから「wv-1.0.3.tar.gz」をダウンロード。 解凍およびインストール # su # tar -zxvf wv-1.0.3.tar.gz # cd wv-1.0.3 # view INSTALL((終了はCtrl+Z)) # ./co…

namazuを参考にしたXPDFの導入

WindowsXP環境におけるPDFtoTEXT.もちろん日本語対応. 入手 http://www.foolabs.com/xpdf/download.htmlから、 「Win32 (built with MSVC): xpdf-3.00pl3-win32.zip (1142558 bytes)」 「Japanese: xpdf-japanese.tar.gz (494624 bytes)」 をダウンロード…

報告/正確さを向上させるための質問

「順調です」 「そう。順調にってどのくらい進んだの?」 「どうやって計算したの? 根拠は?」 「“できた”というのは、どうやって判断したの?」 「○○さんは、それを見てOK出したの?」 「やることが多過ぎる」 「何と比べて?」 「誰と比べて?」 「指示が…

3つの座標から三角形の面積を求めるCプログラム

#include <stdio.h> #include <stdlib.h> /* 3つの座標から三角形の面積を求める */ main(){ /* 変数宣言部 */ double *x1_ptr, *x2_ptr, *x3_ptr, *y1_ptr, *y2_ptr, *y3_ptr; double x1val, x2val, x3val, y1val, y2val, y3val, area; /* アドレスを指定 */ x1_ptr = &x1val;</stdlib.h></stdio.h>…

移行に関する言い訳をしてみる

Blog,新天地は見つかりました。現在設定弄り中。 そのうちエントリ内容も移転します。いろいろと修正しないといけないんだろうなぁ……独自の記法多いし。 HTMLをベタ貼りした方がうまく行きそう。 言い訳? 研究室を卒業した時に,本名での活動拠点が研究室の…

WindowsでのPerlモジュールインストール

スタートメニューから"Perl Package Manager"というGUIツールがあった。 初めて知りました。今までずっとCygwinのCPANで不具合を抱えてインストールできないよ、と悩んでました。 それも年単位で……

作業量の分配

どこで読んだのか忘れてしまったのだけれど。 つい最近、読んで、「なるほどなぁ」と思ったので紹介。 複数人から構成されるチームで、作業量の分担を行う場合。 一番優秀な人に一番少なく割り当てる。 そうすることで、余力が生まれ、プロジェクトに遅延が…

mailコマンドで添付したがうまく行かない

unencode | mail -s 'タイトル' とやったのだが、Thunderbirdで受信した所,本文中に添付ファイルのバイナリが表示されてしまい、添付になってない。 いろいろと検索してみたが、解決策が見つからず。 ログファイルを添付したいだけなので、解凍して本文とし…

オープンサイエンスはありえるか?

404 Blog Not Found:オープンサイエンスはありえるか? 現在の論文の評価の仕組みとGoogleのPage Rankの仕組みは似ている。それも当たり前で、Page Rankの方が論文の評価システムをまねたのだ。しかし、一つ重要な点において異なっている。論文の場合、査読を…

みその??

注目キーワードに輝く(?)文字列。 misono ローマ字読みで、み・そ・の。 って何だ? と思いクリック。 day after tomorrowのヴォーカル。 I see. カラオケで歌うと皆知らないって言うんだよなぁ……Do as Infinityの次に好きです。 が、私の好きなんて、ボ…

学生の自己紹介書類の自動採点システム

NIKKEI NET:企業 ニュース:学生の自己紹介書類を自動で採点、採用支援へシステム 採用活動支援サービスとしてアトラクスヒューマネージが始めたらしい。 学生が就職活動時に自己紹介や志望動機を記入したエントリーシートを基に、表現力などを自動採点する …

MeCab,出力形式によってはエラーになる

NLP

MeCabにて解析できない文がある。 半角記号はすべて全角にしているので、その辺は心配していなかったのだが。 tagger.cpp(166) [writer_.write(ostrs_, str, n)] writer.cpp(271) [n MeCabのメーリングリストに入ってみた。まだこの件は投稿していない。 UTF…

Mecabをソースからインストールする

http://mecab.sourceforge.jp/ http://www.asahi-net.or.jp/~yw3t-trns/namazu/mecab/index.htm http://www.kaede-software.com/2006/02/post_393.html UTF-8専用にして軽いのを作るぞ。 ダウンロード http://mecab.sourceforge.jp/src/にアクセス。下記の3…

mecab-perlのインストールに失敗

NLP

環境はDebian。mecabはapt-get install mecabでインストール済み。 http://mecab.sourceforge.jp/src/からmecab-perl-0.93.tar.gzをダウンロード。 解凍し,Makefileを実行。 $ tar -zxvf mecab-perl-0.93.tar.gz $ cd mecab-perl-0.93 $ su # perl Makefile…

coLinuxインストール&Debian構築

予めCygwinをインストールしておく。ユーザIDは"user"で。 ダウンロード http://sourceforge.net/project/showfiles.php?group_id=98788 coLinux-0.6.4.exe Debian-20040605-mit.ext3.1610mb.bz2 インストール coLinux-0.6.4.exeを実行 Root Filesystem imag…

なんか増えてる

コントロールパネルに。 Windows CardSpaceなんてものが増えている。 コメントは、 Manage Information Cards used to log on and register with websites and online services. 何者だ……

院試終了

直前になってパワポ準備したり慌しかったですが。 無事(?)終了。 博士の研究は、ドメイン絞って有効性を語りやすく、ではなく、汎用性が求められるとのこと。 当面の目標は、修士研究でFullPaper一本。

迷惑トラックバック「かねこさん2周半お疲れ様でした。」

本文が、 かねこさん2周半お疲れ様でした。 とだけある迷惑トラックバックが、HNで活動している方のBlogに今朝から数件。 違うページに対して飛んできてます。 タイトルと氏名はランダムなのか,全部異なり,URLは書いてはあれども404 not found(苦笑 これ…

WritelyのBlock quote機能について

Googleに買収され、現在は登録さえすれば誰でも使えるオンライン・ワープロアプリケーション,Writelyの1機能についてです。 Styleメニューの中に"Block quote"と言うのがあります。 その名の通り <blockquote> タグでくくってくれ、引用部分を示すのによく使われるタグ</blockquote>…

雑記

や、タイトル通り本当に雑記。 何気なく毎日書けるもんだなぁ、と(途中抜けありますけど)。 "欠かさず"書ける人は凄いと思う。 書くネタは"あとで読む"を使って溜め込んでいるけど書く時間・精神的余力が取れないのが現状。 また、辛くたって今日みたいな…

マインドマップ作成サービス「Mayomi」

http://www.mayomi.com/ Biz.IDでレビューされていました。 以前、マインドマップ作成ツールを調べた時は、日本語が使えない、ということでスルーしていたんですが。 ほかのユーザーのマインドマップを見る「Browse Mind Maps」は、オンラインサービスならで…