タグ:RStudio

これまでのブログでは「Rで何ができるか?」や「Rを使うためのソフトの紹介」を行ってきました。

この記事ではRの基本的な使い方を紹介していきます。

Rはプログラミング言語になるのですが、医療従事者でプログラミングをしている方は多くはないと思います。今回はプログラミング言語を勉強したことが無い方でもイメージできるように説明していきたいと思います。

また、このブログは「プログラミング未経験でも最短で基本的な医療統計が使える」ことを前提に説明するつもりです。そのためかなりざっくりとした表現にして、徐々に枝葉を伸ばそうと思っています。

今回は「変数」について説明します。


「変数」の使い方を知る 


スクリーンショット 2019-01-14 1.05.53
プログラミングでは「変数」というものを使います。
とりあえずというのは「名前がついているなんでも入るバッグ」みたいなものです。


スクリーンショット 2019-01-14 0.51.04

具体的には上記のように表記します。

これは1をaという変数に入れるという意味になります。ベクトルと言うこともあるらしいですが雰囲気を掴んでください。

ちなみに<ーの表記は不等号の"<"とマイナスの"ー"をくっつけたものです(必ず半角英数で!)。
他の言語では=を使ったりするらしいですが"<ー"はR独特なようです。

スクリーンショット 2019-01-14 0.59.15

変数には数字だけでなく、文字やExcelの表全体、Excelの列、関数(t検定の結果など)、グラフなど何でも入れることができます。

よく本や他のサイトでExcelの表など入れるときは"dat"や"Dataset"のような名前をつけていることが多いですが自分の好きな名前をつけても大丈夫です。ちなみに大文字と小文字を区別するので注意してください。

既にEZRやRコマンダーを使っている方はお気づきかもしれませんがExcelデータを取り込むときの画面がありますよね。その画面でDatasetとなっているものがありませんか?それは「Datasetという変数名に表を入れている」わけです。

スクリーンショット 2019-01-14 2.13.21



変数を使った計算

スクリーンショット 2019-01-14 1.30.30

スクリーンショット 2019-01-14 1.34.13


上の概念図を実際にRで書いたものが下になります。
  1. 左上のスクリプトにコードを書く
  2. 1行目を選択して順番にRunを押す(Runは選択している行のみを実行)
  3. 下に結果が出る
オレンジで書かれているのは「このプログラムを実行しました!」という意味です。
a <- 1 :1をaに入れました!
b <- 2 :2をbに入れました!
a + b  :a + bをします!

[1] 3
a <- 100 :100をaに入れました!
a + b   :a + bをします!
[1] 102

なんだか自衛隊とか船の操縦で何度も呼称している姿をイメージしてしまいます。


aに100を入れ直したので2回目のa + bは102になっています。
右上にはaとbに現在何が入っているのか一覧があります。
aに100を入れる前と入れたあとでaの値が変わることを確認してください。


問題

a <- 5
a <- a +1
a

答えは下にスクロール


























> a <- 5   :5をaに入れました!
> a <- a + 1  :a(この場合は5) +1したものをaに入れました!
> a     :aを表示します!
[1] 6
なんだか慣れない表現ではありますがよく使います。


まとめ

今回はRの「変数」について説明しました。でもこれだけでは「じゃあt検定はどうすればいいの・・・?」とイメージがつかないと思います。それを理解するためには「データフレーム」という考え方が必要になります。

次は医療統計やデータ分析を行う上で必ず必要になるデータフレームとベクトルの話をします。



すべての記事一覧はこちらになります。

RStudioには「プロジェクト」という機能があります。

プロジェクトを使うとファイルやデータの整理が行いやすくなります。

プロジェクトに慣れると「もしかしたらEZRなどのRコマンダーよりも使いやすいかも」と思うかもしれません。

今回はプロジェクトの初心者向けの使い方を紹介します。


プロジェクトを作ってみる

File → New Projectを選ぶ
スクリーンショット 2018-12-24 17.50.53


New Directoryを選択
スクリーンショット 2018-12-24 17.51.11


New Projectを選択
スクリーンショット 2018-12-24 17.51.18


プロジェクトの名前と保存先のフォルダを選択
スクリーンショット 2018-12-24 17.51.26



完成
スクリーンショット 2018-12-24 17.51.37



何をしたのか?


上記画面をよく見るとプロジェクトの名前でフォルダが作られています。確かに先はどの画面ではフォルダ名と場所を指定したようです。


メリット

プロジェクトを作ると1つのプロジェクトには1つのフォルダという習慣がつくようになります。すると以下のようなメリットがでてきます。

  1. スクリプト(プログラム)が保存しやすく、途中でやめても再開しやすい
  2. スクリプトをタブで複数管理できる
  3. 分析で使うExcelのファイルが簡単に確認・編集できる
  4. 結果(表やグラフの画像)を保存する時、自動的にこのフォルダに保存される

1.スクリプト(プログラム)が保存しやすく、途中でやめても再開しやすい

EZRなどのRコマンダーを使う方は作業を途中で中断する場合はどうするでしょうか。スクリプトを保存するという方もいると思いますが、Rに慣れていないと「もう一回最初からやり直す」という方が多いのではないでしょうか。また仮説検証的研究であれば目的の統計以外行うことはないですが、対数変換やグラフの作成、もしくは仮設探索的研究であればRを使ったいろいろな作業があります。

Rコマンダーで1からやり直すとなると途中で止められないですし、翌年に研究を行う時「あれっ、前どうしたっけ・・・?」となりやすいです。

RStudioでプログラムを作るようになると作業や分析の過程が残るので途中で中断することもできます。



2.スクリプトをタブで複数管理できる

スクリーンショット 2018-12-25 9.42.19
1つのスクリプトに全部のプログラムを入れるとすごく長くなってしまいます。1つのプロジェクトに複数のスクリプトやR Markdownが保存できるので以下のような使い方ができます。

  • 勉強しているRの本でプロジェクトを作り、章毎にスクリプトをつくる
  • 『試し』ファイルに色々作ったグラフや統計を残し、実際の研究で使う分だけを『本番』にコピペしておく
  • 『Markdown』で直接WordやPowerPointのファイルを作ってしまう

Rコマンダーはスクリプトを使い分けるのは得意ではない印象を受けます。



3.分析で使うExcelのファイルが簡単に確認・編集できる

プロジェクトのフォルダにExcelのデータを入れておくと非常に便利です。いちいち他の画面に変えなくてもExcelを開くことができるので、その場でファイルの確認や操作が行なえます。

スクリーンショット 2018-12-25 11.13.28


Rにエクセルファイルを読み込ませる時も「Import Dataset」を選ぶと簡単にできます。

スクリーンショット 2018-12-25 11.08.31

スクリーンショット 2018-12-25 11.24.01

Rの中で使う名前を決め、複数シートがあったり選択範囲が必要な場合は選択すればすぐに取り込めます。


4.結果(表やグラフの画像)を保存する時、自動的にこのフォルダに保存される

グラフを保存する時もプロジェクトで行っていると便利です。

スクリーンショット 2018-12-25 11.38.37
Save as Imageを選択



スクリーンショット 2018-12-25 11.38.50

ファイル名と画像のサイズを決める



スクリーンショット 2018-12-25 11.38.58

完成したファイルは特に設定を変えなければプロジェクトのフォルダに保存されるので、他の研究のファイルと混ざることもありません。



まとめ

今回はプロジェクトの基本的な使い方を説明しました。もっと使える人はgitでプロジェクトの管理を行うなど色々なことができるかもしれませんが、研究で医療統計を使ったりRの勉強を行う程度であればこのような使い方でも十分ではないかなと思います。

RStudioを使う場合はぜひプロジェクトも活用してみてください!

次はRを使うのに必要なパッケージについて紹介します。



全ての記事一覧はこちらになります。



今までExcelだけで、プログラミングをしたこと無い方はRの画面は非常にとっつきにくいです。そのためRコマンダー(EZRや改変Rコマンダー)は初めて統計を行う方におすすめのソフトです。しかし使いやすいと言っても初めて見るとよくわからないのが正直なところだと思います(自分がそうでした)。

今回はRの基本的な画面の説明を行います!


Rコマンダーの基本的な画面
スクリーンショット 2018-12-16 13.46.04


メニューバー
ここでエクセルデータの読み込み、統計、グラフや表の作成などほとんどの操作を行います。

そしてRコマンダーと改変Rコマンダー、EZRはメニューの位置が微妙に違います。


スクリプトウィンドウ

メニューバーで行った操作を行うとここに自動的にプログラムが書き込まれ、下の出力に結果が出てきます。

このスクリプトウィンドウを保存しておくと、再度同じ統計を実行することができます。

またスクリプトウィンドウに自分でプログラムを書くことができますが、正直RStudioの方が使いやすいです。


RStudioとの比較


スクリーンショット 2018-12-16 13.46.17

細かい事を言うと機能は違うのですが、画面としては上段のスクリプトウインドウと下に結果が出てくるという似た構図になります。

違いとしてはRStudioでプログラムを書くのに対し、Rコマンダーではメニューで統計を選択するのでスクリプトウインドウをあまり使わないところでしょうか。

加えてRStudioの右側にあるEnvironmentビューやFilesビュー、Plotsビュー、パッケージビューがRコマンダーにはありませんが、操作ができないというわけではありません。


スクリプトウインドウの別の使い方

メニューで統計をしてしまうのでスクリプトウインドウを使う場面は少ないのですが、別の使い方もできます。

それはRコマンダーで出てきたプログラムを読んで勉強するです。

決して見やすくないのと、ある程度慣れないと英語ばかりで何のことかわからないのですが、EZRとRStudioを両方使いしている時はEZRで行って出たプログラムを見て勉強することもできなくはありません。


まとめ


今回はRコマンダーの画面の説明を行いました。前回のRStudioの説明と併せて自分にあうソフトを選んでください。


次回はRStudioの便利な機能の1つであるプロジェクトについて紹介します。



全ての記事一覧は以下になります。


プログラミングの経験がなくExcelしか使ったことない方は、初めてRを開くと全く意味がわからなく感じると思います。

今回はRStudioの画面の説明を簡単に行います!


RStudioの画面

スクリーンショット 2018-12-16 13.45.24


RStudioを開くと3つの画面に分かれています。
色が紺色なのは私の好みで変えているだけです。色は設定で変更が可能です。

ただこれでは不十分で、次の操作でR Scriptを開きます。


スクリーンショット 2018-12-16 13.45.40



改めてRStudioの基本の画面!


スクリーンショット 2018-12-16 13.45.52


左上:スクリプトウィンドウ
基本はここでプログラムを書いたり、読み込んだエクセルファイルのデータを見ることができます。
他にもMarkdownなどあるのですがここでは割愛します。
スクリプトウィンドウが基本的な作業場になります

スクリーンショット 2018-12-16 15.07.15



左下:コンソールウィンドウ
Rの本体のような部分になります。ここはコードを書いて結果を出せるのですがここにはプログラムを書かず、上のスクリプトウインドウで書いたプログラムの結果を出す使い方がわかりやすいかと思います。

スクリーンショット 2018-12-16 15.25.46


右上:Environmentメニュー
いくつかあるのですが、プログラムで使用したデータや定義した変数(使いながら説明していきます)の一覧が乗っています。

スクリーンショット 2018-12-16 14.53.08



右下:Firesビュー、Plotsビュー、パッケージ

Filesビューではパソコン内のファイル一覧をみることができます。
エクセルファイルを読み込んだり、エクセルファイルの編集もここから可能です。

Plotsビューでは作成したグラフを確認したり保存したりできます。

パッケージには様々なパッケージが並んでいて、クリックするだけでパッケージのインストールが可能です。ここにないパッケージもインストール可能です。

スクリーンショット 2018-12-16 15.37.41


プロジェクト

右上にプロジェクトを選ぶボタンがあります。

後々説明しますが、Rstudioを使うときはプロジェクト単位で管理すると使いやすく、ここで切り替えることができます。

スクリーンショット 2018-12-16 15.43.35


まとめ

今回はRStudioの基本的な画面を説明しました。

使い方は少しずつ説明していきますが、少しでも全体像をつかんでいただければ幸いです。



前回の記事ではRコマンダー(EZR、改変R)とRStudioについて解説しました。

しかしRコマンダーやRStudioといっても、どれを使えばいいのか?という疑問も出てくると思います。

今回はチャートを作成しましたので目的別にソフトを紹介します!


Rのソフト、何を選ぶか


先に全体像を貼っておきます。時間がない方はこの図だけでもご参照ください。
以下それぞれの解説を書いています。

スクリーンショット 2018-12-16 6.00.42





①結果がわかればいい。グラフも標準で十分。


スクリーンショット 2018-12-16 6.01.14


統計はあくまでもツールなので統計に時間をかけるよりも研究に時間を割いたほうが効率的です。

そのような意味でプログラムを書かなくても統計ができるRコマンダーが適しています。

Rコマンダーは改変RコマンダーやEZRがありますが改変RコマンダーはWindows専用ソフトなので、Macの場合は自動的にEZRになります。

ただ2つ確認したいことがあります。


  • どの本(セミナー)で統計を勉強しているのか?
統計を勉強するのに何かしらの書籍やセミナーに参加すると思いますが、その本が何の統計ソフトを使っているかを確認することをおすすめします。

弘前大学の対馬栄輝先生の書籍やセミナーを受講されている場合は改変Rコマンダーを使う方がスムーズに進められると思います。EZRに関する書籍も多くあり、その場合はEZRを選ぶとおすすめします。

ソフトでメニューの位置や特徴が微妙に違うので、本と同じソフトを使ったほうが効率的です。


  • Macで日本語が使えない場面がある問題
MacでEZRを使う場合はExcelデータに日本語が入っている場合注意が必要です。EZRに日本語が直接入力できなかったり、作ったグラフに日本語があると□□□みたいに文字化けします。

変数名を全て英語にするなら問題ありませんが(年齢→age)、日本語を使いたいなら次の②を検討する必要があります。




②Rコマンダーからステップアップをしてみたい
スクリーンショット 2018-12-16 6.01.22


もちろんですが、Rコマンダーにない統計手法やグラフはそのままでは使えません。

例えば下図の左のグラフはRの標準的なものを使っています。それでもエクセルよりは十分多くのグラフが作れますが、右のように自分でグラフが作れるようになるとできることが大きく増えます。

またEZRは慣れてきたけど、実際にRも使ってみたいという声も聞きます。
スクリーンショット 2018-12-16 5.40.17


このような場合はRStudio+EZRを使う事をおすすめします。実はRコマンダーでも「パッケージ」をインストールして機能を追加することはもちろんできます。しかしR Studioはプログラムの書きやすさや、パッケージの管理がR コマンダーより勝っています。

加えて言うとEZRは「パッケージ」として登録されています。そのためRStudioからクリックするだけでEZRを呼び出すことができます。改変R はできませんのであしからず。

なので基本EZRを使いながら少しずつR も勉強していくという使い方ができます。私は「EZRで出したのをRStudioでもやってみる。逆にRStudioで挑戦してできなかったらEZRで補完する」といった勉強をしています。



③統計も必要なんだけど、実は研究よりも機械学習、AIに興味がある

スクリーンショット 2018-12-16 6.01.33



Rもパッケージを使うことで機械学習は可能です。しかし近年、機械学習の分野ではPythonというプログラム言語の方が多く使われています。私はRとPythonどちらも勉強していくつもりですが、統計はRコマンダーに任せて、Pythonで機械学習を勉強するのはありだと思います。

現在統計の分野ではR の方が得意とされてますが、今年に入りPythonで統計をするための本も出版されてきました。もし研究や統計以上に機械学習・プログラミングに興味があればPythonに挑戦するのもいいかもしれません。学会の統計でPythonを使っていたらレアキャラかも!


まとめ

今回は目的別にRのソフトを選ぶ方法を紹介しました。

今からRを勉強してみたい方も、すでにEZRなど使っていて「次はどうすればいいか?」と思われている方の参考になれば幸いです。

それぞれのソフトの簡単な解説は「RコマンダーやRStudioなどRのソフトにも色々あるので解説してみる」でも紹介していますので、興味のある方はあわせてご覧ください。


次回はRStudioの紹介を行います。



全ての記事一覧はこちらになります。

↑このページのトップヘ