こんにちは!このサイトではプログラミング未経験者でも簡単に始められるRプログラミングを使って日頃のエクセル仕事を超効率化する方法を解説しています!
コピペで動くコードの紹介や、細かな関数の使い方解説も今後どんどん行っていきますので、是非フォローをよろしくお願いいたします?
今回はR言語を使ったプログラミングならばマストユーズなRstudioについて、インストール後に行って欲しい設定を解説したいと思います。
RstudioはRstudio社が公開しているR言語専用の統合開発環境(IDE)です。Rstudioにはファイルマネージャー等の一般的なIDEに搭載されている機能はもちろん、R言語に特化したコード補完・デバッガー・パイプチェーン入力の支援といった機能もあります。Rstudio社はある程度大きな会社で、多くのユーザーがRstudioコミュニティに参加していることもあり、ソフトウェアの開発は安定している方だと思います。
私はおよそ10年弱くらいRプログラミングの経験があり、これまでに様々なIDEを使ってきました。今では複数のIDEを用途に分けて使用していますが、それでもガッツリとRプログラミングするときにはRstudioを使います。また、特に初心者の人ならばRstudioの使用を強くオススメします。学習速度が格段に速まります。
Rstudioには三つのプラットフォームがあります。
簡単にそれぞれがどんなものなのかを説明してみます。
普通はデスクトップ版を使う人が多く、そしてそれで問題無いと思います。デスクトップ版はWindows・Macintosh・Linuxといった各種OSに対応しており、基本的にどのOSでも問題なく動作すると思います。
デスクトップ版にデメリットはほとんどありませんが、強いて言うならWindowsユーザーがデスクトップ版を使うと困ることがあるかもしれません。これはRstudioに問題があるわけではなく、そもそもRをWindowsで動かす場合に正常に動作しないパッケージが存在することが理由です。
Rstudio cloudは10分速習でも使いました。2018年にベータ版として公開された後、2020年ごろから正式サービス開始、有料プランが公開されました。
Rstudio cloudのシステムはRstudio社のサーバー(Linux, Ubuntu)で動作しており、そこにリモートで接続している感じになります。
フリープランと有料プランの違いは「一ヶ月に使用可能な時間・プロジェクト数の上限・計算能力」などですが、一番気にしたいのは使用可能な時間です。フリー版では月に25時間しか使えないので、毎日一時間使えばもうアウトです。課金必須となります。このあたりの時間制限は「実用レベルではないな」と思わされるレベルですね?
GoogleもGoogle Colabという似たようなサービスを提供していますが、こちらはフリープランでも業務に活用できるレベルです。なんなら電気屋さんで売っているパソコンよりも高い計算応力を享受できてしまいます。Google ColabでR解析を実施することも可能ですので、興味のある方は調べてみてください!(今度時間があれば解説記事書きます)
このように、Rstudio cloudの有料プランはやや割高ですので、課金するくらいならデスクトップ版を使いましょう。
Rstudio serverは文字通りサーバー上で動作させ、ユーザーはブラウザからアクセスすることができます。使用感はRstudio cloudと全く同じですし、何ならデスクトップ版との遜色もありません。 私はもう4年近くRstudio serverを会社で使用していますが、非常に満足度の高いソフトウェアです。
一昔前までRstudio serverはこのような大衆向けに紹介するような代物ではなく、本格的に仕事としてRを使う人向けでした。しかし、最近になってWindowsにもLinuxOSが簡単にセットアップできるWSL2というシステムが公開されたことから急速にRstudio serverの重要度が増してきています。
前に述べたとおり、Windows上でRを動かしているとパッケージ周りで問題が発生することがままあるため、できればMacまたはLinuxで動かしたいというのが本音です。この問題はRに限らず、C++やPython、Goなど、プログラミング言語を問わずいつでもつきまとう問題でした。 その問題がWSLを使えば立ち所に解決してしまうので、わざわざMacを買う必要がなくなった人も多いかもしれませんね。
話を戻しますが、WSLはWindows上でLinuxを動作させるものですが、WindowsからLinuxへの接続はあたかもLinuxのサーバーが別に存在するかのような振る舞いをするんですね。つまり、通常はWindowsの中からLinuxに入ってマウスをポチポチすることができません。 そのため、WSLで動作するLinux上でRstudio serverを立てて、そこにWindowsからアクセスする形をとることになります。
Rstudio serverの導入そのものは簡単ですが、WSLのセットアップは一癖二癖あるかもしれません。
昔はRプログラミングといったらRstudioデスクトップ版一択でしたが、最近では色々なプラットフォームで開発可能になりました。このセクションでは、あなたの目的に応じてどのプラットフォームを選べば良いか、オススメを語りたいと思います。
プログラミング未経験の方の場合、本当に右も左も分からず、どこから初めて良いか分からないと思います。 また、実際プログラミングを使うとどれくらい便利なのかも分からないと思います。
そのような場合、まずはRstudio cloudでお手軽に初めて見てはいかがでしょうか。このサイトでもRstudio cloudを使った10分体験コースを紹介していますので、そちらから試してみてください。
Rの良さが分かってきて、実際の業務やちょっとしたエクセル仕事の効率かなどにRを活用したいと思ったのであれば、デスクトップ版でどっしりとプログラミングしましょう。
コピペでも自作でも、コードが増えてくるとクラウドでは管理しきれませんし、セキュリティ面の不安も払拭されます。そして何より、ちゃんとRを使うのであればRstudio cloudのフリープランの上限を超える可能性が高いです。
デスクトップ版の導入方法は今度解説しますので、良ければ参考にしてください?
RはAI開発や、データサイエンスにおける分析においても強力なツールです。もちろん、Pythonが界隈では圧倒的人気ですが、Rでも十分に戦えます。特に、統計学的な分析をしたいのであればPythonよりもRに軍配が上がります。
もしも本格的にRによる分析を生業としてみたいと思うならば、MacまたはLinuxでの開発を強く勧めます。また、WSLを使ってWindows上にLinuxを動作させる方法でもOKです。特に、最近ではGPUを使った高速な計算もWSLを使って簡単にできる時代になりましたし、Windowsユーザー=プログラミング弱者ということは全く無い状況です。
ちなみに、私はマウスコンピューターで買ったゲーミングPC上でWSLを使っています。
あなたが既にPythonを使ったデータ分析をしているのであれば、JupyterNotebook(Lab)でRを使うことが可能です。ただし、一つのipynbファイル内でpythonとRをごちゃ混ぜにすることはできないので注意です。 しかし、最近ではJupyterNotebookをRstudio内でも扱えるようにしたQuartoという便利なものが登場していますので、Rstudio内でQuartoを使う方が良いかもしれません。
QuartoではRの{reticulate}パッケージを使うことでpythonとRを一つのノートブック内で使うことが出来ます。さらに、pandasデータフレームをそのままRのdplyrに投げるといった離れ業も簡単に実行可能です。 Quartoは天下のRstudio社がかなりのリソースを注ぎ込んで開発中ですので、今後R解析のスタンダードとなる可能性も秘めているのではないかと思っています。
今回はデスクトップ版・クラウド版など、Rstudioの種類と使い分けについて説明しました。 RプログラミングコミュニティにおいてRstudio社の影響力は非常に大きいですし、Rstudioがトレンドを作ることもあります。個人的な予想では、Rstudioは向こう十年以上R解析のゴールドスタンダードであり続けるのでは無いかと思います。 開発環境としてはJupyterやVScode、Atomなどもありますが、基本的にRstudioを使い続けて問題ないのではないでしょうか。
今後Rstudioに新しいプラットフォームが追加されるなどしたら、この記事も更新していきたいとおもいます!では?