散布図にラベルをつけて遊んでみる
意味はよく分からないけどグラフを描いてみようのコーナー。
せっかくRについて入門したのだから適当なデータを適当にグラフにしてみるだけして遊んでみます。そのグラフが何を意味するのか等はとりあえず置いておいて。
今回使うデータはこれ。
平成25年度実施の「学校教員統計調査」の中にある公立特別支援学校教員の都道府県別本務教員の平均勤務年数・平均週教科等担任授業時数・平均給料月額(表番号60)から必要なデータをひっぱてきます。
http://www.e-stat.go.jp/SG1/estat/List.do?bid=000001058725&cycode=0
エクセルファイルで表がダウンロードできるのでいらないところをちゃちゃちゃっと消してcsvで出力してRに読み込ませます。
都道府県ごとに平均勤続年数と平均給与月額を散布図で描いてみます。このとき、プロットした点にラベルがつけられると楽しいなぁということで、それ用のmaptoolsパッケージを使ってみます。
liblrary(maptools) plot(勤続年数,平均給与月額, xlab="勤続年数(年)",ylab="平均給与月額(千円)") pointLabel(勤続年数,平均給与月額, labels=都道府県)
pointLabelというのがmaptoolsに入っている関数。
で、出てきたのがこの図。
文字がやや大きいかな...
ということで文字サイズを変えて、ついでだから回帰直線も加えてリトライ。
plot(勤続年数,平均給与月額, xlab="平均勤続年数(年)",ylab="平均給与月額(千円)") pointLabel(勤続年数,平均給与月額, labels=都道府県,cex=0.8) abline(lm(平均給与月額 ~ 勤続年数))
まぁこんなところでしょう。
見て分かる通り、平均勤続年数が長い県ほど、教員の平均給与が高いです。年齢が上がれば年功序列で給与が上がっていくんだから当たり前ですね。ちなみに分散説明率0.65でした。
以下のサイトを参考にさせていただきました。
Rでラベル付き散布図を作成して保存するまで - 503 Service Unavailable