今回は5年間のある事象の発生率に対し、有意性があるか検定します。
今回の対象はサンプル数10万件程度を仮定するので、ピアソンのカイ二乗検定を利用します。
今回のテーブルです。
発生あり | 発生なし | |
2015 | 1325 | 94055 |
2014 | 1358 | 34025 |
2013 | 1655 | 38484 |
2012 | 1873 | 75089 |
2011 | 1424 | 65571 |
帰無仮説 H0:発生の頻度と年代は独立である
対立仮説 H1:発生の頻度と年代は独立でない(関係がある)
実際にRでやってみます。
chisq.test(matrix(c(1325,94055,1358,34025,1655,38484,1873,75089,1424,65571),nrow=5,byrow=TRUE))
Pearson's Chi-squared test
data: matrix(c(1325, 94055, 1358, 34025, 1655, 38484, 1873, 75089,1424, 65571), nrow = 5, byrow = TRUE)
X-squared = 1245.7, df = 4, p-value < 2.2e-16
統計量であるカイ二乗値:X-squared = 1245.7
自由度:df = 4
p値(p-value): < 2.2e-16 < 0.001(有意水準0.1%)
よって帰無仮説H0を棄却する。
結論
有意水準0.1%で、事象の発生頻度と年代は独立でない。つまり年代と関係があるといえる。
参考
http://cse.naro.affrc.go.jp/takezawa/r-tips/r/66.html
http://monge.tec.fukuoka-u.ac.jp/r_analysis/test_crosstable00.html
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1169222731
0 件のコメント:
コメントを投稿