2015年7月7日火曜日

Rでのカイ二乗検定

年毎の発生率の有意性を確認するために実施しました。
今回は5年間のある事象の発生率に対し、有意性があるか検定します。

今回の対象はサンプル数10万件程度を仮定するので、ピアソンのカイ二乗検定を利用します。

今回のテーブルです。

  発生あり 発生なし
2015 1325 94055
2014 1358 34025
2013 1655 38484
2012 1873 75089
2011 1424 65571

帰無仮説 H0:発生の頻度と年代は独立である
対立仮説 H1:発生の頻度と年代は独立でない(関係がある)

実際にRでやってみます。
chisq.test(matrix(c(1325,94055,1358,34025,1655,38484,1873,75089,1424,65571),nrow=5,byrow=TRUE))

    Pearson's Chi-squared test

data:  matrix(c(1325, 94055, 1358, 34025, 1655, 38484, 1873, 75089,1424, 65571), nrow = 5, byrow = TRUE)
X-squared = 1245.7, df = 4, p-value < 2.2e-16

統計量であるカイ二乗値:X-squared = 1245.7
自由度:df = 4
p値(p-value): < 2.2e-16 < 0.001(有意水準0.1%)

よって帰無仮説H0を棄却する。

結論
有意水準0.1%で、事象の発生頻度と年代は独立でない。つまり年代と関係があるといえる。

参考
http://cse.naro.affrc.go.jp/takezawa/r-tips/r/66.html
http://monge.tec.fukuoka-u.ac.jp/r_analysis/test_crosstable00.html
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1169222731

0 件のコメント:

コメントを投稿