第4章は統計を扱います。

今回「シロート統計学」のハルさんとコラボレーションすることとなりました。

ハルさん、ありがとうございます!

シロート統計学はEZRを使った統計分析をわかりやすく解説されています。



第4章はシロート統計学で使われていたEZRをRで行うとどうなるのか?といった視点で進めていきます。

今回使うデータもハルさんのサイトと同じものを使わせでいただく事になりました。それぞれ見比べることで参考にしてみてください!



今回は4章を進めるにあたって抑えておきたいRの基本的な操作について復習します。

1.プロジェクトを作る

第4章では色々なデータを扱うため、フォルダやRのファイルが煩雑になりやすいです。そこで今回はプロジェクトを使って管理します。

RStudioでプロジェクトを作成する方法は第1章で紹介しています。




今回は「R練習」というプロジェクトを作りました。スクリーンショット 2019-10-20 7.54.14


更にデータを入れるフォルダを作ります。分析に使うExcelファイルはデスクトップやマイドキュメントに置かずにここに置くようにします!
スクリーンショット 2019-10-20 23.07.53

そしてRのコードを書くスクリプトファイルを作ります。
今回は【4-1】で使うためのスクリプトファイルを作成しました。
スクリーンショット 2019-10-20 23.12.27

これで完成です!
スクリーンショット 2019-10-20 7.57.37




2.Excelのデータを読み込む

Excelを読み込む方法はいくつかありますが、ここではコードを書かない方法を紹介します。


まずデータが入ってるdataフォルダに進みRStudioのfilesタブからImport DatasetでExcelファイルをRで読み込みます。


スクリーンショット 2019-10-23 8.08.00

View Fileではエクセルファイルを直接開くことができます
(エクスプローラやFinderを使わなくていいので便利!)

ここではImport Datasetを選びます。

スクリーンショット 2019-10-23 8.11.09

Name:Rで使うときのデータの名前(自由に決められる)
sheet:Excelに複数タブあればどれを使うか指定できる
Range:データの読み込む範囲を指定できる

主には上記3つで読み込む範囲を指定します。
もし1枚目のタブでデータの読み込む範囲の左上がA1だったらNameの指定だけでも大丈夫です。

そしてこの方法の良いところは右にコードを自動で書いてくれることです。これを忘れずにスクリプトにコピーします。

そうすることで2回目以降は1秒もかからずに行えるのでかなりの時短になります!




まとめ

今後色々な検定やデモデータを使うことになります。EZRを使うとあまり意識されない部分ですが、プロジェクトファイルを作ることでデータの管理やスクリプトファイルの管理が進めやすくなります。

次回はt検定を紹介します。