統計学がわかる 回帰分析・因子分析編

統計学がわかる 【回帰分析・因子分析編】 (ファーストブック)

統計学がわかる 【回帰分析・因子分析編】 (ファーストブック)

前半部分まで。 計算式がなかなか覚えられないなぁ。

統計学がわかる 回帰分析・因子分析編

第1章 最高気温と客数の関係を知りたい

  • 散布図のパターン
    • 正相関
    • 負相関
    • 無相関
    • 曲線相関
  • データの散らばり具合や、データ同士の関係を調べたいときは、散布図を利用する

第2章 相関の強さを知りたい

  • 偏差
    • 偏差 = 1日の最高気温 - 気温の平均
  • 偏差積
    • 最高気温の偏差 × 客数の偏差
  • 相関係数
  • 相関の強さ
    • 絶対値
      • 0 < 相関係数 <= 0.2 ほとんど相関がない
      • 0.2 < 相関係数 <= 0.4 弱い相関がある
      • 0.4 < 相関係数 <= 0.7 中程度の相関がある
      • 0.7 < 相関係数 <= 1.0 強い相関がある

第3章 その相関係数に意味はあるのか?

  • 母集合
  • 抜き出したデータを標本集団(サンプル)
  • 標本集団を抜き出すことを標本抽出(サンプリング)
  • 無作為抽出(ランダムサンプリング)
  • 相関係数に意味があるかどうかを決めることを無相関検定
  • 母集団の相関係数が0とする仮定することを帰無仮説
  • 仮説を否定することを棄却
  • 仮説を受け入れることを採択
  • 1% か 5% 以下を滅多に起こらないとし、その境界を有意水準
    • 左右合わたパーセンテージ
  • 確率分布図の有意水準境界値を限界値

第4章 最高気温で客数を予測したい

  • 残差が最も小さくなるような直線を回帰直線
    • データと直線のズレを残差
    • 回帰直線を求める方法として最小二乗法
    • 回帰直線の計算式
      • 回帰直線の傾き = 相関係数 × (y の標準偏差 ÷ x の標準偏差)
      • y 切片 = y の平均 - (傾き × x の平均)
    • 見かけの相関