2007-02-24から1日間の記事一覧

OLAP(On Line Analytical Process ; オンライン分析処理)

多次元的にデータを眺めることを可能にするもので、データマイニングとの併用が問題解決には重要となる。 例えばとある会社の売り上げを考えると、店別,月別,商品別の3つの観点から分析する。 全体の売り上げが落ちていることを確認 店別の売り上げグラフ…

データの種類と用語

質的データ,カテゴリカルデータ 量的データ,数値データ 言語データ*1 質的変数(フィールド) 量的変数(フィールド) 顧客名 年齢 性別 購入商品 感想 *1:質的データもテキストで表されるため、テキストデータとは呼ばない

データマイニングの流れ

データの整備 生データでは分析できる状態にない場合が多い。データマイニングを実践しやすいように、データを蓄積して、必要なデータを容易に取り出せるように保管されたデータの集まりを、データウェアハウスと呼ぶ。 データマイニングでは大量のデータを…

データマイニングの手法

分類のための手法 クラスター分析 主成分分析 コレスポンデンス分析 ニューラルネットワーク 連関のための手法 マーケットバスケット分析 時系列パターン分析 類似時系列パターン分析 主成分分析 コレスポンデンス分析 判別のための手法 ロジスティック回帰…

データマイニングとは

統計解析の手法が多く使われているが、統計解析とは異なる。 統計解析との違い 大量のデータを使用する 統計解析は少量のデータで結論を出すことに主眼が置かれている 規則性の発見が目的となる 統計解析は、理論や経験・直感から導き出されたルールを検証す…