遅れましたが、あけましておめでとうございます。

正月早々風邪を引いてしまいました。お晦日から5連勤だったはずなのに2日間も休んでしまい、正月早々職場のスタッフに迷惑をかけまくっています・・・

早く復活するよう布団に入ってますが、昨年の振り返りと今年の目標を整理しようかと思います。

昨年の振り返り

ロジスティック回帰分析を調べまくった2月。

学会発表の統計は昨年度まで大学院を卒業した職場の同僚にお願いしていました。ただそもそもの統計がわからなかったので、相談しても相手に思いが伝わらないことも多くありました。

そのため今年の日本神経理学療法学会は「自分でなんとか統計を頑張ろう」と思ったのが2018年の2月。使う統計は「ロジスティクス回帰分析」と「ROC曲線」ということはわかっていたのですが、すぐに理解できるわけでもなく毎日ネットで検索し続けていた記憶があります。

googleで「ロジスティクス回帰分析」と名の付くものはほぼ全て確認し、slideshareを知ったりyoutubeで新谷歩先生の医療統計を毎日見ていました。


もっと統計学を学ぼうと思った初夏

学会の抄録は完成して落ち着いてた頃、図書館に子供の絵本を探している時に統計の本もあることに気づきました。そこから図書館にある統計の本を片っ端から借りまくり、医療統計に限らず統計を勉強してみました。

そこで統計学と一言で言っても医療統計、機械学習、計量経済学、心理統計などそれぞれの分野で考え方や何に重きをおいているのかが微妙に違うことを知ることができました。

読んで勉強になった本もいつか紹介してみようかと思います。


同じ時期に情報収集にと仕事専用のtwitterも開設したのもこの頃だったと思います。


MOOCとプログラミングを知った夏

新谷歩先生のyoutubeを見ながらEdxというMOOCがあることをしりました。

MOOCとは?大学レベルの無料オンライン講義サービスを解説 | TECH::NOTE|テックノート|テクノロジー学習やエンジニア転職に役立つ情報を発信しています


大学院は妻が専業主婦で時間とお金もなく諦めていたのですが、MOOCを知って「これなら自分にもできる!」とEdxで勉強を始めることにしました。「専門卒でも院生に負けない!」という気持ちで今も続けています。


そして同時期にRENさんがプログラミングを勉強し合うMETCに参加しました。活動は短い期間でしたが、METCでのモチベーションが今に生かされています。



学会発表と統計は今まで以上にできた

自分が発表した学会はは1つでしたが、医師の発表も含め6つの学会発表の統計をRを使ってできました。来年の学会発表も3つ+α予定があり、もっと研究と統計は勉強したいです。




今年の目標

Edxで勉強しているRを終了させる
8月から始めているEdxを今年度中には終わらせるつもりで考えています。

Data Science

大晦日のtwitterでは「自分の勘違いで半分の講義が受けられなかった」と書きましたが、どうやら復活するようなので、(もしそうなら)頑張って全てクリアしたいと思います!


4月からpythonを勉強する

医療統計であればRだけで十分と思うのですが、今後の機械学習・AIを見越すとpythonの勉強も始めたいと思っています。pythonの勉強をする目的の1つが東京大学のData Science Online Courseです。今年挑戦できるか、去年のテキストも受けてみましたがpythonの基本も勉強していなかったので、まずはprogateから初めて行きたいと思っています。


アウトプットを引き続き行う

研究や先月から始めたブログだけでなくQiitaへの投稿もはじめました。

ROC曲線とPR曲線の違いを混合行列と有病率から考えてみる - Qiita


色々な形でのアウトプットを続けていきたいと思います。

まとめ



上記ツイートのように、長期的な目線では研究だけでなく色々な形で今の勉強が活かせたら面白いだろうなぁという気持ちでマイペースで進んでいきたいと思います!

RStudioには「プロジェクト」という機能があります。

プロジェクトを使うとファイルやデータの整理が行いやすくなります。

プロジェクトに慣れると「もしかしたらEZRなどのRコマンダーよりも使いやすいかも」と思うかもしれません。

今回はプロジェクトの初心者向けの使い方を紹介します。


プロジェクトを作ってみる

File → New Projectを選ぶ
スクリーンショット 2018-12-24 17.50.53


New Directoryを選択
スクリーンショット 2018-12-24 17.51.11


New Projectを選択
スクリーンショット 2018-12-24 17.51.18


プロジェクトの名前と保存先のフォルダを選択
スクリーンショット 2018-12-24 17.51.26



完成
スクリーンショット 2018-12-24 17.51.37



何をしたのか?


上記画面をよく見るとプロジェクトの名前でフォルダが作られています。確かに先はどの画面ではフォルダ名と場所を指定したようです。


メリット

プロジェクトを作ると1つのプロジェクトには1つのフォルダという習慣がつくようになります。すると以下のようなメリットがでてきます。

  1. スクリプト(プログラム)が保存しやすく、途中でやめても再開しやすい
  2. スクリプトをタブで複数管理できる
  3. 分析で使うExcelのファイルが簡単に確認・編集できる
  4. 結果(表やグラフの画像)を保存する時、自動的にこのフォルダに保存される

1.スクリプト(プログラム)が保存しやすく、途中でやめても再開しやすい

EZRなどのRコマンダーを使う方は作業を途中で中断する場合はどうするでしょうか。スクリプトを保存するという方もいると思いますが、Rに慣れていないと「もう一回最初からやり直す」という方が多いのではないでしょうか。また仮説検証的研究であれば目的の統計以外行うことはないですが、対数変換やグラフの作成、もしくは仮設探索的研究であればRを使ったいろいろな作業があります。

Rコマンダーで1からやり直すとなると途中で止められないですし、翌年に研究を行う時「あれっ、前どうしたっけ・・・?」となりやすいです。

RStudioでプログラムを作るようになると作業や分析の過程が残るので途中で中断することもできます。



2.スクリプトをタブで複数管理できる

スクリーンショット 2018-12-25 9.42.19
1つのスクリプトに全部のプログラムを入れるとすごく長くなってしまいます。1つのプロジェクトに複数のスクリプトやR Markdownが保存できるので以下のような使い方ができます。

  • 勉強しているRの本でプロジェクトを作り、章毎にスクリプトをつくる
  • 『試し』ファイルに色々作ったグラフや統計を残し、実際の研究で使う分だけを『本番』にコピペしておく
  • 『Markdown』で直接WordやPowerPointのファイルを作ってしまう

Rコマンダーはスクリプトを使い分けるのは得意ではない印象を受けます。



3.分析で使うExcelのファイルが簡単に確認・編集できる

プロジェクトのフォルダにExcelのデータを入れておくと非常に便利です。いちいち他の画面に変えなくてもExcelを開くことができるので、その場でファイルの確認や操作が行なえます。

スクリーンショット 2018-12-25 11.13.28


Rにエクセルファイルを読み込ませる時も「Import Dataset」を選ぶと簡単にできます。

スクリーンショット 2018-12-25 11.08.31

スクリーンショット 2018-12-25 11.24.01

Rの中で使う名前を決め、複数シートがあったり選択範囲が必要な場合は選択すればすぐに取り込めます。


4.結果(表やグラフの画像)を保存する時、自動的にこのフォルダに保存される

グラフを保存する時もプロジェクトで行っていると便利です。

スクリーンショット 2018-12-25 11.38.37
Save as Imageを選択



スクリーンショット 2018-12-25 11.38.50

ファイル名と画像のサイズを決める



スクリーンショット 2018-12-25 11.38.58

完成したファイルは特に設定を変えなければプロジェクトのフォルダに保存されるので、他の研究のファイルと混ざることもありません。



まとめ

今回はプロジェクトの基本的な使い方を説明しました。もっと使える人はgitでプロジェクトの管理を行うなど色々なことができるかもしれませんが、研究で医療統計を使ったりRの勉強を行う程度であればこのような使い方でも十分ではないかなと思います。

RStudioを使う場合はぜひプロジェクトも活用してみてください!

今までExcelだけで、プログラミングをしたこと無い方はRの画面は非常にとっつきにくいです。そのためRコマンダー(EZRや改変Rコマンダー)は初めて統計を行う方におすすめのソフトです。しかし使いやすいと言っても初めて見るとよくわからないのが正直なところだと思います(自分がそうでした)。

今回はRの基本的な画面の説明を行います!


Rコマンダーの基本的な画面
スクリーンショット 2018-12-16 13.46.04


メニューバー
ここでエクセルデータの読み込み、統計、グラフや表の作成などほとんどの操作を行います。

そしてRコマンダーと改変Rコマンダー、EZRはメニューの位置が微妙に違います。


スクリプトウィンドウ

メニューバーで行った操作を行うとここに自動的にプログラムが書き込まれ、下の出力に結果が出てきます。

このスクリプトウィンドウを保存しておくと、再度同じ統計を実行することができます。

またスクリプトウィンドウに自分でプログラムを書くことができますが、正直RStudioの方が使いやすいです。


RStudioとの比較


スクリーンショット 2018-12-16 13.46.17

細かい事を言うと機能は違うのですが、画面としては上段のスクリプトウインドウと下に結果が出てくるという似た構図になります。

違いとしてはRStudioでプログラムを書くのに対し、Rコマンダーではメニューで統計を選択するのでスクリプトウインドウをあまり使わないところでしょうか。

加えてRStudioの右側にあるEnvironmentビューやFilesビュー、Plotsビュー、パッケージビューがRコマンダーにはありませんが、操作ができないというわけではありません。


スクリプトウインドウの別の使い方

メニューで統計をしてしまうのでスクリプトウインドウを使う場面は少ないのですが、別の使い方もできます。

それはRコマンダーで出てきたプログラムを読んで勉強するです。

決して見やすくないのと、ある程度慣れないと英語ばかりで何のことかわからないのですが、EZRとRStudioを両方使いしている時はEZRで行って出たプログラムを見て勉強することもできなくはありません。


まとめ


今回はRコマンダーの画面の説明を行いました。前回のRStudioの説明と併せて自分にあうソフトを選んでください。

↑このページのトップヘ