by shigemk2

当面は技術的なことしか書かない

Head First データ解析 2 持論を検証する

前回
Head First データ解析 1 データ解析入門 2 - by shigemk2

無作為に集めたアンケートを利用して、比較を行う

解析は比較すればするほどよくなるから。

交絡因子
統計モデルの中の従属変数と独立変数の両方に(肯定的または否定的に)相関する外部変数で、
研究において比較しようとしている因子以外で人々の間にある違いのこと

場所、期間、顧客層などで、データの結果に違いが生じることがある。

比較においてはこの交絡因子を見つける必要がある。
交絡因子はいっぱいあるし、大概おもてには出てこない。

というわけで、データを分割して交絡因子を管理し、
最も効果のある戦略を知るために実験を行う

ただし、実験を行うにあたって当然比較対象は必要になる。
そして、比較対象を選ぶにあたり、各グループが同じになる必要がある(交絡因子が実験の邪魔をしてはいけない)
そのため、グループを無作為に選ぶ必要がある


Head Firstデータ解析 ―頭とからだで覚えるデータ解析の基本

Head Firstデータ解析 ―頭とからだで覚えるデータ解析の基本