これまでのブログでは「Rで何ができるか?」や「Rを使うためのソフトの紹介」を行ってきました。

この記事ではRの基本的な使い方を紹介していきます。

Rはプログラミング言語になるのですが、医療従事者でプログラミングをしている方は多くはないと思います。今回はプログラミング言語を勉強したことが無い方でもイメージできるように説明していきたいと思います。

また、このブログは「プログラミング未経験でも最短で基本的な医療統計が使える」ことを前提に説明するつもりです。そのためかなりざっくりとした表現にして、徐々に枝葉を伸ばそうと思っています。

今回は「変数」について説明します。


「変数」の使い方を知る 


スクリーンショット 2019-01-14 1.05.53
プログラミングでは「変数」というものを使います。
とりあえずというのは「名前がついているなんでも入るバッグ」みたいなものです。


スクリーンショット 2019-01-14 0.51.04

具体的には上記のように表記します。

これは1をaという変数に入れるという意味になります。ベクトルと言うこともあるらしいですが雰囲気を掴んでください。

ちなみに<ーの表記は不等号の"<"とマイナスの"ー"をくっつけたものです(必ず半角英数で!)。
他の言語では=を使ったりするらしいですが"<ー"はR独特なようです。

スクリーンショット 2019-01-14 0.59.15

変数には数字だけでなく、文字やExcelの表全体、Excelの列、関数(t検定の結果など)、グラフなど何でも入れることができます。

よく本や他のサイトでExcelの表など入れるときは"dat"や"Dataset"のような名前をつけていることが多いですが自分の好きな名前をつけても大丈夫です。ちなみに大文字と小文字を区別するので注意してください。

既にEZRやRコマンダーを使っている方はお気づきかもしれませんがExcelデータを取り込むときの画面がありますよね。その画面でDatasetとなっているものがありませんか?それは「Datasetという変数名に表を入れている」わけです。

スクリーンショット 2019-01-14 2.13.21



変数を使った計算

スクリーンショット 2019-01-14 1.30.30

スクリーンショット 2019-01-14 1.34.13


上の概念図を実際にRで書いたものが下になります。
  1. 左上のスクリプトにコードを書く
  2. 1行目を選択して順番にRunを押す(Runは選択している行のみを実行)
  3. 下に結果が出る
オレンジで書かれているのは「このプログラムを実行しました!」という意味です。
a <- 1 :1をaに入れました!
b <- 2 :2をbに入れました!
a + b  :a + bをします!

[1] 3
a <- 100 :100をaに入れました!
a + b   :a + bをします!
[1] 102

なんだか自衛隊とか船の操縦で何度も呼称している姿をイメージしてしまいます。


aに100を入れ直したので2回目のa + bは102になっています。
右上にはaとbに現在何が入っているのか一覧があります。
aに100を入れる前と入れたあとでaの値が変わることを確認してください。


問題

a <- 5
a <- a +1
a

答えは下にスクロール


























> a <- 5   :5をaに入れました!
> a <- a + 1  :a(この場合は5) +1したものをaに入れました!
> a     :aを表示します!
[1] 6
なんだか慣れない表現ではありますがよく使います。


まとめ

今回はRの「変数」について説明しました。でもこれだけでは「じゃあt検定はどうすればいいの・・・?」とイメージがつかないと思います。それを理解するためには「データフレーム」という考え方が必要になります。

次はデータフレームとベクトルの話をします。


このサイトを見ていただきありがとうございます。

MITTIといいます。

ここではこのページと自分の紹介を簡単にさせていただきます。



理学療法士をしています

回復期病棟で理学療法士をしています。メインは脳卒中です。

興味がある分野は「評価」です。


なぜ評価に興味があるのか?

現在理学療法には色々な治療技術があります。個人的にはどんな治療技術でもいいと思います。

どの治療技術にも学ぶべきところがあると思いますし、ボバースでも認知神経リハでもCIでもロボットでも別の治療を学ぶからこそ自分のやってきた技術を違う解釈で捉えられると思っています。

正直「言葉が違うだけで本質は同じことをしているんじゃないか?」と思うこともあります。

ただそこに共通言語がないだけで・・・

評価はその共通言語になりうると思います。そしてデータとなりこれからの理学療法の発展に寄与するのではないかと思っています。

●評価を使うことで現在の状態がわかる

●評価を使うことで治療効果が確認できる

●評価の組み合わせでクリニカルリーズニングができる

●評価を使うことで予測ができる


巨人の肩に乗る、車輪の再発明

「巨人の肩に乗る」や「車輪の再発明」という言葉があります。

先人たちの知恵を有効活用することは大切さを説明していますが、リハビリテーションではこれができているか考えることがあります。


経験を積むと「この患者はこうなるかも」という感覚があります。それを「評価」という言葉で説明できれば、後輩がそれを利用してくれればいいなと思います。




中間管理職をしています

自分が入職する前は電子カルテが導入されていなくて、数年して導入されました。

職場にExcelが強いスタッフがいなかったので、若手の頃から担当表やデータベースなど数多くのフォーマットを作ってきました。

Excelの相談ができる人もいなかったので全部独学でした。最近はマクロも使い始め「ボタン1つで今月入院した患者の評価ファイルを患者の人数分、しかも患者情報を自動入力して作成する」みたいなこともできるようになりました。

需要があればブログにExcelやマクロの記事も入れていこうと思っています。

(ただ素人なのできれいなコードなんてかけませんよ。泥臭くても動けばみんなハッピーなので)


また回復期ということもありいくつか他職種合同チームの立ち上げとかも経験しました。

理学療法の自分のチームのリーダーするより、他職種合同チームのリーダーをする方が得意だったりします。チームの目標が明確なので。



自分の強み

ストレングス・ファインダーの5つの強みは以下のとおりです。
  • 回復志向
  • 学習志向
  • 分析志向
  • 内省
  • 収集心

カリスマのようなリーダーではなく「メンバーを後方から支えながら次のステップへ導くリーダー」が自分にあっています。そしてデータを集め分析し学ぶのは自分の得意なスタイルです(苦に感じないという意味で)。


「評価に興味があるのも」分析志向と収集心が影響しているのかもしれません。


広告の配信について

当サイトは第三者配信の広告サービス「Google Adsense グーグルアドセンス」「Amazonアソシエイト」を利用しています。

広告配信事業者は、ユーザーの興味に応じた広告を表示するためにCookie(クッキー)を使用することがあります。

Cookie(クッキー)を無効にする設定およびGoogleアドセンスに関する詳細は「広告 – ポリシーと規約 – Google」をご覧ください

アクセス解析ツールについて

当サイトでは、Googleによるアクセス解析ツール「Googleアナリティクス」を利用しています。

このGoogleアナリティクスはトラフィックデータの収集のためにCookieを使用しています。このトラフィックデータは匿名で収集されており、個人を特定するものではありません。この機能はCookieを無効にすることで収集を拒否することが出来ますので、お使いのブラウザの設定をご確認ください。この規約に関して、詳しくはここをクリックしてください。


まとめ

簡単に自己紹介をさせていただきました。

これからもマイペースで進んでいきたいと思います。




遅れましたが、あけましておめでとうございます。

正月早々風邪を引いてしまいました。お晦日から5連勤だったはずなのに2日間も休んでしまい、正月早々職場のスタッフに迷惑をかけまくっています・・・

早く復活するよう布団に入ってますが、昨年の振り返りと今年の目標を整理しようかと思います。

昨年の振り返り

ロジスティック回帰分析を調べまくった2月。

学会発表の統計は昨年度まで大学院を卒業した職場の同僚にお願いしていました。ただそもそもの統計がわからなかったので、相談しても相手に思いが伝わらないことも多くありました。

そのため今年の日本神経理学療法学会は「自分でなんとか統計を頑張ろう」と思ったのが2018年の2月。使う統計は「ロジスティクス回帰分析」と「ROC曲線」ということはわかっていたのですが、すぐに理解できるわけでもなく毎日ネットで検索し続けていた記憶があります。

googleで「ロジスティクス回帰分析」と名の付くものはほぼ全て確認し、slideshareを知ったりyoutubeで新谷歩先生の医療統計を毎日見ていました。


もっと統計学を学ぼうと思った初夏

学会の抄録は完成して落ち着いてた頃、図書館に子供の絵本を探している時に統計の本もあることに気づきました。そこから図書館にある統計の本を片っ端から借りまくり、医療統計に限らず統計を勉強してみました。

そこで統計学と一言で言っても医療統計、機械学習、計量経済学、心理統計などそれぞれの分野で考え方や何に重きをおいているのかが微妙に違うことを知ることができました。

読んで勉強になった本もいつか紹介してみようかと思います。


同じ時期に情報収集にと仕事専用のtwitterも開設したのもこの頃だったと思います。


MOOCとプログラミングを知った夏

新谷歩先生のyoutubeを見ながらEdxというMOOCがあることをしりました。

MOOCとは?大学レベルの無料オンライン講義サービスを解説 | TECH::NOTE|テックノート|テクノロジー学習やエンジニア転職に役立つ情報を発信しています


大学院は妻が専業主婦で時間とお金もなく諦めていたのですが、MOOCを知って「これなら自分にもできる!」とEdxで勉強を始めることにしました。「専門卒でも院生に負けない!」という気持ちで今も続けています。


そして同時期にRENさんがプログラミングを勉強し合うMETCに参加しました。活動は短い期間でしたが、METCでのモチベーションが今に生かされています。



学会発表と統計は今まで以上にできた

自分が発表した学会はは1つでしたが、医師の発表も含め6つの学会発表の統計をRを使ってできました。来年の学会発表も3つ+α予定があり、もっと研究と統計は勉強したいです。




今年の目標

Edxで勉強しているRを終了させる
8月から始めているEdxを今年度中には終わらせるつもりで考えています。

Data Science

大晦日のtwitterでは「自分の勘違いで半分の講義が受けられなかった」と書きましたが、どうやら復活するようなので、(もしそうなら)頑張って全てクリアしたいと思います!


4月からpythonを勉強する

医療統計であればRだけで十分と思うのですが、今後の機械学習・AIを見越すとpythonの勉強も始めたいと思っています。pythonの勉強をする目的の1つが東京大学のData Science Online Courseです。今年挑戦できるか、去年のテキストも受けてみましたがpythonの基本も勉強していなかったので、まずはprogateから初めて行きたいと思っています。


アウトプットを引き続き行う

研究や先月から始めたブログだけでなくQiitaへの投稿もはじめました。

ROC曲線とPR曲線の違いを混合行列と有病率から考えてみる - Qiita


色々な形でのアウトプットを続けていきたいと思います。

まとめ



上記ツイートのように、長期的な目線では研究だけでなく色々な形で今の勉強が活かせたら面白いだろうなぁという気持ちでマイペースで進んでいきたいと思います!

↑このページのトップヘ