• Like
「R for Cloud Computing」の紹介
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

「R for Cloud Computing」の紹介

  • 190 views
Published

 

Published in Data & Analytics
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
190
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
2
Comments
0
Likes
4

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. 「R for Cloud Computing」の紹介 Takekatsu Hiramura 2015-01-17 TokyoR #45 1
  • 2. 自己紹介 » 平村 健勝 (Taketatsu Hiramura) コンサルティングファーム勤務 » seekR 管理人 » Rパッケージ RForcecom 開発者 » Twitter @hiratake55 » http://about.me/takekatsu.hiramura 2
  • 3. SeekR: Rに特化した検索エンジン 3
  • 4. RForcecom パッケージ R から Salesforce.com, Force.com に接続するパッケージ、「RForcecom」 を開 発しました。本体は CRAN に登録済で、コードは GitHub で公開中です。 4  データマニピュレーション  統計分析(多変量解析、データマイニング等)  データビジュアリゼーション  CRM(顧客情報管理)  ダッシュボード・レポート  コラボレーション基盤(Chatter, ToDo管理等) RSalesforce.com データ 削除 データ 挿入 データ 更新 画面 イメージ ・ データ 連携内容 用途 データ 抽出 SOQL クエリ 検索  http://cran.r-project.org/web/packages/RForcecom/
  • 5. Enterprisezine連載 「意志決定のためのデータサイエンス講座」 5http://enterprisezine.jp/article/detail/6471
  • 6. R for Cloud Computing » UseR! 2014でRForcecomパッケージの紹介をしたのがきっかけで、「R for Cloud Computing」という書籍をAjay氏と執筆することになりました。 6 UseR!2014@UCLA
  • 7. 本の概要 » 目的 › Cloud Computing時代のRの使い方とし て今までとは違った使い方を紹介する。 › 手順をスクリーンショットStep-by-Step で紹介し、初心者でも理解しやすい内容 とする。 » 対象読者 › Rを現在、手持ちのローカル環境のPCで 使っているが、大量のデータを素早く処 理するためにクラウド上でRを試したい。 › 外部のWebサービス(SaaS, PaaS)を用いて、 機械学習やビジュアリゼーションを行い たい 7 http://www.amazon.com/dp/1493917013
  • 8. 本は全9章で構成されている 8 Chapter Introduction to R for Cloud Computing An Approach for Data Scientists Navigating the Choices in R and Cloud Computing Setting Up R on the Cloud Using R Using R with Data and Bigger Data R with Cloud APIs Securing Your R cloud Training Literature for Cloud Computing and R 1 2 3 4 5 6 7 8 9 各章の概要 この本について データサイエンティストがクラウ ドを使うにあたっての心得 クラウドでRを使うにあたっての 様々な選択肢 クラウドでRを実行する クラウドに特化したRの使い方 Rで大量のデータを処理する RからクラウドのWeb APIを実行 する セキュリティ面において注意する こと より詳しく知るのに役立つ情報源 技術要素 - - Renjin, RFiddle, Shiny, and etc. AWS, Google and etc. Rappoter, R Service Bus RHadoop, NoSQL Salesforece.com, and etc. - - 次スライド で紹介 次スライド で紹介 次スライド で紹介 次スライド で紹介
  • 9. 3. クラウドでRを使うにあたっての様々な選択肢 Rをブラウザから使う » R-Fiddle (http://www.r-fiddle.org/) › Datamind社が開発。JSFiddleに影響を受けて開発された。 › Chrome Appもある。 » Domino (http://www.dominodatalab.com/) › PythonやRのコードをブラウザから実行可能。最近では、 Notebookにも対応。 » Intuitics(旧:Statace) (https://www.intuitics.com/) › コーディングの知識が無くてもデータ分析、整形、可視化が可能 なサービス 9
  • 10. 3. クラウドでRを使うにあたっての様々な選択肢 Rの実行環境 » Renjin (http://renjindemo.appspot.com/) › Java VMを用いた独自のRインタプリタ。他システムと連携が容易 なのが特徴。 (現在開発中) » pqR (http://www.pqr-project.org/) › A pretty quick version of R。R Core Teamが高速化を目的として開 発。 › R 2.15.0がベース。 10
  • 11. 4. クラウドでRを実行する AWSでRを利用する » RStudio Server › EC2インスタンスにRStudio Serverをインストール。Webブラウザ からアクセスして利用可能。 › http://www.rstudio.com/products/rstudio/download-server/ » RevolutionRのAMI › Windows版, Linux版が提供 › https://aws.amazon.com/marketplace/seller-profile?id=3c6536d3- 8115-4bc0-a713-be58e257a7be » BioconductorのAMI › Bioconductorの他、RStudio Serverなどがインストール済。 › http://www.bioconductor.org/help/bioconductor-cloud-ami/ 11
  • 12. 4. クラウドでRを実行する Google Cloud PlatformでRを利用する » Big Query › bigrqueryパッケージ。Hadley Wickham氏が開発。 › https://github.com/hadley/bigrquery » Google Prediction API › googlepredictionapiパッケージ。Googleが開発。 › https://code.google.com/p/google-prediction-api-r-client/ » Fusion Tables API › GFusionTablesパッケージ › http://gfusiontables.lopatenko.com/ 12
  • 13. 7.RからクラウドのWeb APIを実行する » BigML › bigml-Rパッケージ: https://github.com/bigmlcom/bigml-r » Microsoft Azure Machine Learning › Webインターフェース(ML Studio)からRコードを実行可能 » plot.ly › チュートリアル:https://plot.ly/r/getting-started/ » yhat › yhatrパッケージ: https://github.com/yhat/yhatr » Salesforce.com › RForcecomパッケージ: http://rforcecom.plavox.info/ 13
  • 14. 8. より詳しく知るのに役立つ情報源 14 情報源・コミュニティ » R-bloggers http://www.r-bloggers.com/ » R User Meetups http://r-users-group.meetup.com/ オンラインコース » Coursera https://www.coursera.org/course/dataanalysis » DataCamp https://www.datacamp.com/courses » UCLA http://www.ats.ucla.edu/stat/r/
  • 15. 15 書籍には、本日紹介できなかったパッケージ、 サービスを多数紹介しています Takekatsu Hiramura http://thira.plavox.info/ thira@plavox.info http://www.amazon.co.jp/exec/obidos/ASIN/1493917013 » ご興味のある方はぜひ購入ください