財務時系列データによる機械学習

このソリューションでは、機械学習機能を使って、Google Cloud Platform で財務時系列データを分析する例を紹介します。

時系列は、財務分析の重要な部分です。現在は、これまで以上に多くのデータを処分し、大量のデータのソースを受け取り、そのデータをより頻繁に配信しなければなりません。新しいソースには、新しい交換、ソーシャル メディア アウトレット、ニュースソースなどがあります。配布頻度は、10 年前は 1 秒あたり数十件のメッセージだったものが、現在では 1 秒あたり数十万件のメッセージまで増大しました。この結果、多様な分析方法が生み出されました。最新の分析技術の大半は新しく開発されたもので、すべて統計を基盤にしており、その適用範囲は利用可能なコンピューティング パワーの規模に密接に関連しています。利用可能なコンピューティング パワーの成長は時系列ボリュームの成長よりも速く、以前は実用的でなかった方法で大規模な時系列を分析できるようになりました。

特に、機械学習技術、その中でもディープ ラーニングが時系列分析に極めて有望です。時系列の精度が高くなり、オーバーラップが始まると、機械学習は信号とノイズを分離する方式を提供します。ディープ ラーニングは、財務時系列のランダムに見える性質に最適である場合が多いため、非常に有望です。

このソリューションは Quandl からのパブリック データを使用します。

目標

  • 数多くの金融市場のデータを取得します。
  • 分析の前提を探索して検証するために、取得したデータを使用可能なフォーマットに変換し、探索的データ分析を実行します。
  • TensorFlow を使用し、金融市場で何が起きるか予測するため、数多くのモデルを構築し、実際に使用して評価します。

料金

Cloud Datalab の使用については、Cloud Datalab の料金をご覧ください。

このチュートリアルは、費用に加算される可能性がある Google BigQuery と Google Cloud Storage を使用します。

始める前に

Cloud Datalab をデプロイし、ログインします。Cloud Datalab クイックスタートの手順に従ってください。

チュートリアルの使用

チュートリアルは Cloud Datalab ノートブックで実行されます。Cloud Datalab は Jupyter ノートブック上に構築されています。Cloud Datalab で、Python と SQL を使用して、Google BigQueryGoogle Cloud Storage 内のデータを分析することができます。

ノートブックの使用

ノートブックは、Cloud Datalab 配布に組み込まれたプリインストール サンプルです。ノートブックを表示するには次のようにします。

  1. datalab/samples フォルダに移動します。
  2. TensorFlow Machine Learning with Financial Data on Google Cloud Platform.ipynb という名前のノートブックを開きます。
  3. ノートブックの手順に従います。

チュートリアルを進める際には、進めながら個々のセルを実行したり、すべてのセルを実行してからチュートリアル全体を確認したりできます。

次のステップ

フィードバックを送信...