無料評価版
  • セールス

    Azure についてご質問がおありの場合、 弊社のセールス チームまでお問い合わせください。

    United States: 1-800-867-1389
    米国: 1-800-867-1389

    地元の電話番号を見つける
  • アカウント
  • ポータル
  • Azure を選ぶ理由
    • Azureとは Microsoft のクラウド プラットフォームの基本を学ぶ
    • 信頼できるクラウド セキュリティ、プライバシー、透過性、障害復旧について説明します
    • コンプライアンスと認定 独立して検証されたコンプライアンス認定について説明します
    • ケース スタディ Azure により、お客様はすばらしい成果を上げています。その実例をご覧ください
    • AzureAWS ぜひお客様に合ったパブリック クラウドをお選びください。
    • ウェビナー 最新の機能について、オンラインのライブ プレゼンテーションをご覧ください
    • はじめに ビデオを見て、Azure をすばやく始めましょう

    無料評価版にサインアップしていただいた方に、すべての Azure サービスに使用できる $200 相当の使用権をプレゼント

    詳細情報
  • 製品
    • 人気のソリューション
      • 人気のソリューション
      • Web Apps Azure のサービスを使用して Web アプリを構築する方法の説明。
      • モバイル アプリ Azure のサービスを使用してモバイル アプリを作成する方法の説明。
      • Virtual Machines Azure を使用して Virtual Machine のシナリオを作成する方法の説明
      • データ分析 Azure を使用したデータ処理と視覚化の方法について説明します
      • ハイ パフォーマンス コンピューティング クラウドで大規模なワークロードを実行する方法について学習
      • モノのインターネット ビジネス全体でデバイスと人とを結び付ける方法について学習
      • 開発とテスト 開発/テストの環境でクラウドを使用する方法を説明します

      次が利用できるクレジットを入手:

      Windows または Linux VM を 4 台

      1 か月間の 24 時間稼働

      その他...

      詳細情報
    • Compute
      • Compute
      • Virtual Machines Windows と Linux Virtual Machines やアプリケーションを数分でプロビジョニング
      • Cloud Services 高可用性と無限の拡張性を備えたクラウド アプリケーションと API を作成
      • Batch 大規模な並列/バッチ コンピューティング ジョブの実行
      • RemoteApp Windows クライアント アプリをクラウドにデプロイし、あらゆるデバイスで実行

      次が利用できるクレジットを入手:

      Windows または Linux VM を 4 台

      1 か月間の 24 時間稼働

      その他...

      詳細情報
    • Web とモバイル
      • Web とモバイル
      • App Service 任意のプラットフォーム、任意のデバイスを対象とした Web アプリとモバイル アプリの作成
      • Web Apps 実際の業務に合わせて、拡張可能な基幹業務系 Web アプリを短時間に作成してデプロイする
      • Mobile Apps モバイル アプリ用のバックエンドを構築およびホストする
      • Logic Apps コードを記述せずに、クラウド全体でデータのアクセスと使用を自動化する
      • API Apps 簡単操作によるクラウド API の作成と利用
      • API Management API を開発者、パートナー、および従業員に安全に、そして大規模に発行する
      • Notification Hubs スケーラブルでクロスプラットフォームのプッシュ通知インフラストラクチャ
      • Mobile Engagement パフォーマンスを最大にするデータ主導のユーザー エンゲージメント プラットフォーム

      次が利用できるクレジットを入手:

      20 の Web サイトをデプロイ

      10,000,000 を超えるモバイル API 呼び出し

      その他...

      詳細情報
    • Data と Storage
      • Data と Storage
      • SQL Database サービスとしての管理されたリレーショナル SQL Database
      • DocumentDB 管理されたサービスとしての NoSQL ドキュメント データベース
      • Redis Cache スループット向上とデータ アクセスの待機時間の短縮により、高速で拡張性の高いアプリケーションをビルド
      • Storage: BLOB、テーブル、キュー、ファイル、ディスク 耐久性があり、高度にスケーラブルな高可用性クラウド ストレージ
      • StorSimple エンタープライズ用のハイブリッド クラウド ストレージは、コストを削減しデータ セキュリティを向上させます
      • Azure Search 完全に管理されたサービスとしての検索
      • SQL Data Warehouse エンタープライズ クラスの機能を伴うエラスティックなサービスとしてのデータ ウェアハウス (data warehouse-as-a-service)

      次が利用できるクレジットを入手:

      標準 SQL Database を 8 まで

      1 週間の Hadoop インスタンス

      その他...

      詳細情報
    • 分析
      • 分析
      • Data Lake Batch, real-time, and interactive analytics made easy
      • HDInsight プロビジョニング管理された Hadoop クラスター
      • Machine Learning 強力なクラウド ベースの予測分析
      • Stream Analytics リアルタイム ストリーム処理
      • Data Factory データ変換と移動の調整と管理
      • Event Hubs 1 秒間に何百万ものイベントを取り込み、保持、および処理
      • SQL Data Warehouse エンタープライズ クラスの機能を伴うエラスティックなサービスとしてのデータ ウェアハウス (data warehouse-as-a-service)
      • Data Catalog 既存のエンタープライズ データ アセットからより多くの価値を引き出すためのデータ ソース検出

      次が利用できるクレジットを入手:

      標準 SQL Database を 8 まで

      1 週間の Hadoop インスタンス

      その他...

      詳細情報
    • モノのインターネット
      • IoT サービス
      • IoT Suite Capture and analyze untapped data to improve business results
      • IoT Hub Connect, monitor, and control millions of IoT assets
      • Event Hubs 何百万ものデバイスから製品利用統計情報を受信
      • Stream Analytics 数百万の IoT デバイスからのデータ ストリームをリアルタイムで処理
      • Machine Learning 予測メンテナンスを可能にする強力なクラウド ベースの予測分析
      • Notification Hubs 数百万のメッセージを迅速に送信できるスケーラブルなプッシュ通知エンジン

      無料評価版にサインアップしていただいた方に、すべての Azure サービスに使用できる $200 相当の使用権をプレゼント

      詳細情報
    • ネットワーク
      • ネットワーク
      • Virtual Network プライベート ネットワークをプロビジョニング、オプションでオンプレミスのデータセンターに接続
      • ExpressRoute Azure への専用プライベート ネットワーク ファイバー接続
      • Traffic Manager 高パフォーマンスと高可用性のために着信トラフィックをルーティングする
      • Load Balancer アプリケーションに優れた可用性とネットワーク パフォーマンスを提供
      • DNS Azure で DNS ドメインをホストする
      • VPN Gateway 安全なクロスプレミス接続を確立する
      • Application Gateway HTTP 負荷分散および配信管理の機能を持つ、高度にスケーラブルな Web サイト

      Virtual Machines と Virtual Network を無料で接続します。

      詳細情報
    • メディアと CDN
      • メディアと CDN
      • Media Services 大規模にビデオおよびオーディオをエンコード、保存、ストリーミング
      • Encoding クラウドの規模でスタジオ グレードのエンコード
      • Azure Media Player 1 つのプレーヤーですべての再生ニーズに対応
      • Media Intelligence メディアの検出可能性とアクセス性の向上
      • Content Protection AES または PlayReady を使用した安全なコンテンツ配信
      • ライブおよび On-Demand Streaming ビジネス ニーズを満たすように規模を調整しながら事実上すべてのデバイスにコンテンツを配信
      • CDN グローバル データ センターの信頼性の高いネットワークを介してコンテンツをエンド ユーザーに配信

      次が利用できるクレジットを入手:

      100 GB のメディアの Encoding

      最大 1600 GB のコンテンツを転送

      その他...

      詳細情報
    • ハイブリッド統合
      • ハイブリッド統合
      • BizTalk Services エンタープライズとクラウドをシームレスに統合
      • Service Bus プライベートとパブリックのクラウド環境間での接続
      • Backup クラウドへのシンプルで信頼性の高いサーバー バックアップ サービス
      • Site Recovery プライベート クラウドの保護と回復の調整

      次が利用できるクレジットを入手:

      200,000,000 のメッセージを送信

      その他...

      詳細情報
    • ID 管理とアクセス管理
      • ID 管理とアクセス管理
      • Azure Active Directory オンプレミスのディレクトリを同期してシングル サインオンを可能にする
      • Azure Active Directory B2C クラウドでのコンシューマー ID とアクセスの管理
      • Multi-Factor Authentication 高度な認証により、データとアプリへのアクセスを保護

      次が利用できるクレジットを入手:

      500,000 のオブジェクトを Active Directory に保管

      100 ユーザーに対応の Multi-Factor Authentication

      その他...

      詳細情報
    • 開発者サービス
      • 開発者サービス
      • Visual Studio Online チームがコードを共有し、作業を追跡し、ソフトウェアを出荷するためのサービス (すべての言語に対応)
      • Visual Studio Application Insights 問題を診断して使用量を追跡し、Web アプリおよびモバイル アプリを改良する

      無料アカウントには、以下が含まれます。

      5 つの無料の Basic ライセンス

      無制限のプライベート コード リポジトリ

      その他にもあります。

      詳細情報
    • 管理
      • 管理
      • Microsoft Azure プレビュー ポータル 新しい Microsoft Azure プレビュー ポータルを確認する
      • Scheduler 単純または複雑な定期的スケジュールでジョブを実行
      • Automation プロセス自動化でクラウド管理を簡素化
      • Operational Insights オンプレミスおよびクラウドのマシン データの収集、検索、および視覚化
      • Key Vault キーやその他のシークレットを保護し、制御を維持する

      無料評価版にサインアップしていただいた方に、すべての Azure サービスに使用できる $200 相当の使用権をプレゼント

      詳細情報
  • ドキュメント
    • 概要
      • 概要
      • はじめに ビデオを見て、Azure をすばやく始めましょう
      • Azure Friday のビデオ Scott Hanselman による毎週 10 分間のビデオ シリーズをご覧ください
      • Windows 仮想マシンの作成 Azure プレビュー ポータルでの Azure 仮想マシン (VM) の作成
      • Linux 仮想マシンの作成 Azure コマンド ライン インターフェイスを使用して Azure 仮想マシンを作成する
      • ASP.NET Web アプリの作成 ASP.NET Web アプリケーションを作成し、Visual Studio を使って App Service にデプロイする
      • Node.js Web アプリを作成する Node アプリケーションを作成し、Git を使って Azure App Service Web Apps にデプロイする
      • iOS モバイル バックエンドの作成 Azure Mobile Services を使用して iOS アプリにクラウド ベースのバックエンド サービスを追加する
      • 初めての Machine Learning の実験を構築する Azure Machine Learning Studio での初めての実験の作成
    • ベスト プラクティス
      • ベスト プラクティス
      • 可用性のチェックリスト 可用性の高いアプリケーションを設計する際の考慮事項
      • スケーラビリティのチェックリスト スケーラブルなアプリを設計する際の考慮事項のチェックリストを確認する
      • 監視および診断のガイダンス 信頼性の高い監視と診断をアプリ内に構築するためのガイダンス
      • 再試行に関するサービスごとのガイダンス Azure サービスでの障害の処理に関する使用法ガイダンス
      • 自動スケーリングのガイダンス 自動スケーリング戦略の実装に関する考慮事項とガイダンス
      • データのパーティション分割のガイダンス データを複数のデータ ストアに分割するためのガイダンス
      • キャッシュのガイダンス Azure Redis Cache を実装する際の考慮事項
      • バックグラウンド ジョブのガイダンス Azure アプリでバックグラウンド ジョブを利用することの利点を知る
    • Compute
      • Compute
      • Virtual Machines Windows と Linux Virtual Machines やアプリケーションを数分でプロビジョニング
      • Cloud Services 高可用性と無限の拡張性を備えたクラウド アプリケーションと API を作成
      • Batch 大規模な並列/バッチ コンピューティング ジョブの実行
      • RemoteApp Windows クライアント アプリをクラウドにデプロイし、あらゆるデバイスで実行
      • Service Fabric 複数のマイクロサービスで構成される、高度にスケーラブルで信頼性が高く、管理が容易なアプリケーションを構築

      次が利用できるクレジットを入手:

      Windows または Linux VM を 4 台

      1 か月間の 24 時間稼働

      その他...

      詳細情報
    • Web とモバイル
      • Web とモバイル
      • App Service 任意のプラットフォーム、任意のデバイスを対象とした Web アプリとモバイル アプリの作成
      • Web Apps 実際の業務に合わせて、拡張可能な基幹業務系 Web アプリを短時間に作成してデプロイする
      • Mobile Apps モバイル アプリ用のバックエンドを構築およびホストする
      • Logic Apps コードを記述せずに、クラウド全体でデータのアクセスと使用を自動化する
      • API Apps 簡単操作によるクラウド API の作成と利用
      • API Management API を開発者、パートナー、および従業員に安全に、そして大規模に発行する
      • Notification Hubs スケーラブルでクロスプラットフォームのプッシュ通知インフラストラクチャ
      • Mobile Engagement パフォーマンスを最大にするデータ主導のユーザー エンゲージメント プラットフォーム

      次が利用できるクレジットを入手:

      20 の Web サイトをデプロイ

      10,000,000 を超えるモバイル API 呼び出し

      その他...

      詳細情報
    • Data と Storage
      • Data と Storage
      • SQL Database サービスとしての管理されたリレーショナル SQL Database
      • DocumentDB 管理されたサービスとしての NoSQL ドキュメント データベース
      • Redis Cache スループット向上とデータ アクセスの待機時間の短縮により、高速で拡張性の高いアプリケーションをビルド
      • Storage: BLOB、テーブル、キュー、ファイル、ディスク 耐久性があり、高度にスケーラブルな高可用性クラウド ストレージ
      • StorSimple エンタープライズ用のハイブリッド クラウド ストレージは、コストを削減しデータ セキュリティを向上させます
      • Azure Search 完全に管理されたサービスとしての検索
      • SQL Data Warehouse エンタープライズ クラスの機能を伴うエラスティックなサービスとしてのデータ ウェアハウス (data warehouse-as-a-service)

      次が利用できるクレジットを入手:

      標準 SQL Database を 8 まで

      1 週間の Hadoop インスタンス

      その他...

      詳細情報
    • 分析
      • 分析
      • HDInsight プロビジョニング管理された Hadoop クラスター
      • Machine Learning 強力なクラウド ベースの予測分析
      • Stream Analytics リアルタイム ストリーム処理
      • Data Factory データ変換と移動の調整と管理
      • Event Hubs 1 秒間に何百万ものイベントを取り込み、保持、および処理
      • Data Catalog 既存のエンタープライズ データ アセットからより多くの価値を引き出すためのデータ ソース検出

      次が利用できるクレジットを入手:

      標準 SQL Database を 8 まで

      1 週間の Hadoop インスタンス

      その他...

      詳細情報
    • モノのインターネット
      • IoT サービス
      • IoT Developer Center Get started connecting your devices
      • Event Hubs 何百万ものデバイスから製品利用統計情報を受信
      • Stream Analytics 数百万の IoT デバイスからのデータ ストリームをリアルタイムで処理
      • Machine Learning 予測メンテナンスを可能にする強力なクラウド ベースの予測分析
      • Notification Hubs 数百万のメッセージを迅速に送信できるスケーラブルなプッシュ通知エンジン
      • IoT Hub Connect, monitor, and control millions of IoT assets

      無料評価版にサインアップしていただいた方に、すべての Azure サービスに使用できる $200 相当の使用権をプレゼント

      詳細情報
    • ネットワーク
      • ネットワーク
      • Virtual Network プライベート ネットワークをプロビジョニング、オプションでオンプレミスのデータセンターに接続
      • ExpressRoute Azure への専用プライベート ネットワーク ファイバー接続
      • Traffic Manager 高パフォーマンスと高可用性のために着信トラフィックをルーティングする
      • Load Balancer アプリケーションに優れた可用性とネットワーク パフォーマンスを提供
      • DNS Azure で DNS ドメインをホストする
      • VPN Gateway 安全なクロスプレミス接続を確立する
      • Application Gateway HTTP 負荷分散および配信管理の機能を持つ、高度にスケーラブルな Web サイト

      Virtual Machines と Virtual Network を無料で接続します。

      詳細情報
    • メディアと CDN
      • メディアと CDN
      • Media Services 大規模にビデオおよびオーディオをエンコード、保存、ストリーミング
      • CDN グローバル データ センターの信頼性の高いネットワークを介してコンテンツをエンド ユーザーに配信

      次が利用できるクレジットを入手:

      100 GB のメディアの Encoding

      最大 1600 GB のコンテンツを転送

      その他...

      詳細情報
    • ハイブリッド統合
      • ハイブリッド統合
      • BizTalk Services エンタープライズとクラウドをシームレスに統合
      • Service Bus プライベートとパブリックのクラウド環境間での接続
      • Backup クラウドへのシンプルで信頼性の高いサーバー バックアップ サービス
      • Site Recovery プライベート クラウドの保護と回復の調整

      次が利用できるクレジットを入手:

      200,000,000 のメッセージを送信

      その他...

      詳細情報
    • ID 管理とアクセス管理
      • ID 管理とアクセス管理
      • Azure Active Directory オンプレミスのディレクトリを同期してシングル サインオンを可能にする
      • Azure Active Directory B2C クラウドでのコンシューマー ID とアクセスの管理
      • Multi-Factor Authentication 高度な認証により、データとアプリへのアクセスを保護

      次が利用できるクレジットを入手:

      500,000 のオブジェクトを Active Directory に保管

      100 ユーザーに対応の Multi-Factor Authentication

      その他...

      詳細情報
    • 開発者サービス
      • 開発者サービス
      • Visual Studio Application Insights 問題を診断して使用量を追跡し、Web アプリおよびモバイル アプリを改良する
      • Visual Studio Online チームがコードを共有し、作業を追跡し、ソフトウェアを出荷するためのサービス (すべての言語に対応)

      無料アカウントには、以下が含まれます。

      5 つの無料の Basic ライセンス

      無制限のプライベート コード リポジトリ

      その他にもあります。

      詳細情報
    • 管理
      • 管理
      • Microsoft Azure プレビュー ポータル 新しい Microsoft Azure プレビュー ポータルを確認する
      • Scheduler 単純または複雑な定期的スケジュールでジョブを実行
      • Automation プロセス自動化でクラウド管理を簡素化
      • Operational Insights オンプレミスおよびクラウドのマシン データの収集、検索、および視覚化
      • Key Vault キーやその他のシークレットを保護し、制御を維持する

      無料評価版にサインアップしていただいた方に、すべての Azure サービスに使用できる $200 相当の使用権をプレゼント

      詳細情報
    • 課金
      • 課金
      • Microsoft Azure のリソース消費を理解する Billing API が Azure の消費データを提供する方法を理解する
      • Azure Billing REST API リファレンス (プレビュー) Billing API の使用について学ぶ
      • パートナー ソリューション: Cloudyn Cloudyn での Billing API の使用方法を見る
      • パートナー ソリューション: Cloud Cruiser Cloud Cruiser での Billing API の使用方法を見る
      • 請求書の見方 Microsoft Azure サブスクリプションの請求書の見方を学ぶ
      • Azure の制限、クォータ、制約事項 実装を最適に管理できるように、サブスクリプションとサービスの制限について確認する

      無料評価版にサインアップしていただいた方に、すべての Azure サービスに使用できる $200 相当の使用権をプレゼント

      詳細情報
  • 価格
  • パートナー
  • ブログ
  • リソース
    • ダウンロード 必要なコマンド ライン ツールと SDK を入手
    • Samples Learn how to interact with Azure services through code
    • ホワイトペーパーとアナリスト レポート 人気のホワイトペーパーやアナリスト レポートを読み、ニュースレターに登録
    • イベント 対面型のイベント、またはウェビナーを探す
    • トレーニング トレーニングと認定プログラムを見つける
    • テンプレート Azure リソース マネージャーを使用してコミュニティ提供のテンプレートで Azure リソースをデプロイ
    • サービスの更新情報 Azure 製品の更新についての詳細

    無料評価版にサインアップしていただいた方に、すべての Azure サービスに使用できる $200 相当の使用権をプレゼント

    詳細情報
  • サポート
    • サポート オプション
    • サポート プラン
    • トラスト センター
      • トラスト センター
      • 概要
      • セキュリティ
      • プライバシー
      • コンプライアンス
      • リソース
      • FAQ

      無料評価版にサインアップしていただいた方に、すべての Azure サービスに使用できる $200 相当の使用権をプレゼント

      詳細情報
    • 法的情報
      • 法的情報
      • 概要
      • サブスクリプション契約
      • サービス使用条件
      • プランの詳細
      • プライバシーに関する声明
      • サービス レベル アグリーメント
      • プレビューの追加使用条件
      • Marketplace の使用条件
      • Microsoft Azure Web サイト使用条件

      無料評価版にサインアップしていただいた方に、すべての Azure サービスに使用できる $200 相当の使用権をプレゼント

      詳細情報
    • フォーラム
    • Azure Status Dashboard
    • FAQ
  • 無料評価版 セールス:
Machine Learning
  • 概要
    • Machine Learning とは
    • Studio とは
    • よく寄せられる質問
  • はじめに
    • 最初の実験
    • サンプルの実験
    • 予測ソリューションを作成する
    • アルゴリズムとモジュールのヘルプ
  • Advanced analytics training
    • Build advanced analytics solutions
    • Data processing techniques
  • アルゴリズム
    • 選択する方法
    • チート シート
    • アルゴリズムとモジュールのヘルプ
    • パラメーターを伴うアルゴリズムの最適化
    • 線形回帰
  • モデルの開発
    • モデル結果の解釈
    • モデル パフォーマンスの評価
    • トレーニング実験をスコアリングに変える
    • 実験イテレーションの管理
    • モデルのデバッグ
  • データの処理
    • トレーニング データのインポート
    • サンプル データセットの使用
    • 特徴エンジニアリングと特徴選択
  • R および Python による拡張
    • R のクイック スタート ガイド
    • R の実験を拡張する
    • 作成者カスタム R モジュール
    • R を使用したサンプル Web サービス
    • Python スクリプトの実行
    • Python のデータ セットへのアクセス
  • Web サービスの発行
    • Web サービスの発行
    • Marketplace に発行する
    • Marketplace アプリに関する FAQ
  • ソリューションのビルド
    • Web サービスへの接続
    • Web サービスの使用
    • Excel からの Web サービスの使用
    • プログラムによるモデルの再トレーニング
    • Web サービスのログ記録
    • ホワイトペーパー: 顧客離れの分析
    • Machine Learning API
    • Net# ニューラル ネットワーク仕様言語
  • ワークスペースの管理
    • ワークスペースの作成
    • ワークスペースの管理
    • トラブルシューティング
  • コミュニティ
    • ブログ
    • フォーラム
    • ギャラリーへの投稿
    • すぐに使用できるアプリケーション
    • Marketplace のサンプル アプリ
  • See more
  • ドキュメント
  • Machine Learning

Microsoft Azure Machine Learning のアルゴリズムの選択方法

By Brandon Rohrer 更新日: 08/10/2015
Contributors Edit on GitHub
In this article:
  • 機械学習アルゴリズム チート シート
  • 機械学習の種類
  • アルゴリズム選択時の考慮事項
  • アルゴリズムの注意事項

「どのような機械学習アルゴリズムを使用すべきか」という質問への答えは、常に「場合による」です。 データのサイズ、品質、および性質によって異なります。回答で何を行うかによって異なります。アルゴリズムの数値演算が使用しているコンピューターの命令にどのように変換されるかによって異なります。そして、どれだけ時間があるかによって異なります。最も経験豊富なデータ科学者であっても、試してみる前にどのアルゴリズムが最適か判断することはできません。

機械学習アルゴリズム チート シート

Microsoft Azure Machine Learning のアルゴリズム チート シートを使用すると、Microsoft Azure Machine Learning のアルゴリズム ライブラリから、予測分析ソリューションに適した機械学習アルゴリズムを選択できます。この記事では、その使用方法について説明します。

NOTE:

チート シートをダウンロードし、それを見ながらこの記事を読むには、「Microsoft Azure Machine Learning Studio の機械学習アルゴリズム チート シート」にアクセスしてください。

このチート シートは非常に特定のユーザーを対象にしていることに注意してください。Azure Machine Learning Studio でアルゴリズムを選択しようとしている機械学習について学部レベルの知識を持つデータ科学初心者です。つまり、一部の一般化と過度の単純化を行いますが、安全な方向に案内します。また、多くのアルゴリズムが一覧にないことも意味します。Azure Machine Learning で使用可能な方法が増えたら、それらを追加します。

推奨事項は、多くのデータ科学者と機械学習専門家からのフィードバックとヒントをまとめたものです。すべてに同意したわけではありませんが、大まかな総意に意見を合わせるように調整しました。同意できない意見のほとんどは、「...によって異なる」と記述されています。

チート シートの使用方法

チャートのパス ラベルとアルゴリズム ラベルは、"<パス ラベル> の場合は <アルゴリズム> を使用する" と読んでください。 たとえば、"*速度*の場合は *2 クラスのロジスティック回帰*を使用する" といった具合です。 場合によっては複数の分岐が適用されます。どれも完全に一致しない場合もあります。大まかな推奨事項なので、正確さは気にしないでください。複数のデータ科学者が、最善のアルゴリズムを探す唯一の方法はすべてを試してみることであると言っています。

同じデータに対して複数のアルゴリズムを試した Azure Machine Learning ギャラリーの実験例と、その結果の比較については、「Compare Multi-class Classifiers: Letter recognition (多クラス分類モデルの比較: 文字認識)」をご覧ください。

機械学習の種類

教師あり

教師あり学習アルゴリズムは、一連の例に基づいて予測を行います。たとえば、過去の株価を使用して将来の価格を推測できます。トレーニングに使用される各例には、関心のある値でラベルが付けられます。この場合は株価です。教師あり学習アルゴリズムでは、これらの値ラベルのパターンを検索します。関連する可能性があるすべての情報を使用でき (曜日、季節、会社の財務データ、業界の種類、破壊的なジオポリティカル イベントの存在など)、各アルゴリズムは異なる種類のパターンの検索します。アルゴリズムは、最適なパターンを発見した後、そのパターンを使用してラベル付けされていないテスト データ (明日の価格など) を予測します。

これは、人気のある便利な機械学習の種類です。1 つの例外を除き、Azure Machine Learning のモジュールはすべて教師あり学習アルゴリズムです。教師あり学習には複数の種類があり、Azure Machine Learning では分類、回帰、異常検出と表されています。

  • 分類。カテゴリを予測するためにデータが使用されている場合、教師あり学習は分類とも呼ばれます。これは、写真を「猫」または「犬」に割り当てるような場合です。選択肢が 2 つだけの場合、これは 2 クラス分類または二項分類と呼ばれます。全国高校野球選手権大会の優勝校を予測するように、多くのカテゴリがある場合は、多クラス分類と呼ばれます。

  • 回帰。株価のような値を予測するときの教師あり学習は回帰と呼ばれます。

  • 異常検出。目的が単に異常なデータ ポイントを識別することである場合があります。たとえば、不正行為の検出では、極めて異常なクレジット カード使用パターンは疑いがあります。可能性のあるバリエーションは非常に多く、トレーニングの例は少ないので、不正行為がどのようなものになるかを学習するのは不可能です。異常検出が使用するアプローチは、単に正常な行為がどのようなものかを (非不正取引履歴を使用して) 学習し、それと大きく異なるものを識別するというものです。

教師なし

教師なし学習では、データ ポイントにラベルが関連付けられていません。代わりに、教師なし学習アルゴリズムの目的は、いくつかの方法でデータを整理したり、その構造を記述することです。これは、クラスターにグループ化したり、複雑なデータを簡単に、または整然と表示したりできるようにさまざまな表示方法を検索することを意味します。

強化学習

強化学習では、アルゴリズムが各データ ポイントに応答してアクションを選択します。学習アルゴリズムでは、短時間で報酬信号を受信し、その決定がいかに優れていたかを示します。アルゴリズムはこれに基に、最大の報酬を実現するために、戦略を変更します。現時点で、Azure Machine Learning には強化学習アルゴリズム モジュールはありません。強化学習はロボット工学の一般的な手法であり、ある時点での一連のセンサーの読み取りがデータ ポイントになり、アルゴリズムがロボットの次の動作を選択します。モノのインターネット アプリケーションにも自然に適合します。

アルゴリズム選択時の考慮事項

精度

可能な限り最も正確な回答を得ることが常に必要であるとは限りません。使用目的によっては、近似の方が適切な場合があります。その場合は、より大まかな方法を使用することで、処理時間を大幅に削減できることがあります。大まかな方法のもう 1 つの利点は、一般に過剰適合が回避される傾向があることです。

トレーニング時間

モデルのトレーニングに必要な分数または時間数は、アルゴリズムによって大きく異なります。通常、トレーニング時間は精度と密接に関係しています。さらに、一部のアルゴリズムは他よりデータ ポイントの数に大きく影響を受けます。時間が限られている場合、アルゴリズムの選択を左右することがあります。データ セットが大きい場合は特にそうです。

線形性

機械学習アルゴリズムの多くは線形性を使用します。線形分類アルゴリズムは、クラスを直線 (またはその高次元版) で分離できるものと想定します。これには、ロジスティック回帰および (Azure Machine Learning で実装されている) サポート ベクター マシンが含まれます。線形回帰アルゴリズムは、データの傾向が直線に従うことを想定しています。問題によって、このような想定が適切な場合もありますが、精度が低下することもあります。

非線形クラスの境界

非線形クラス境界* - 線形分類アルゴリズムに従うと精度が低下します*

非線形傾向のデータ

非線形傾向のデータ* - 線形回帰法を使用すると必要以上に多くのエラーが生成されます*

危険性はありますが、線形アルゴリズムは最初に使用する方法として非常に一般的です。アルゴリズムが簡単で、速くトレーニングできる傾向があります。

パラメーターの数

パラメーターは、アルゴリズムを設定するときに使用します。エラーの許容範囲や反復回数などのアルゴリズムの動作に影響を与える値、またはアルゴリズムの動作のバリエーションのオプションです。アルゴリズムのトレーニング時間と精度は、適切な設定に大きな影響を受けることがあります。通常、パラメーター数の多いアルゴリズムは、適切な組み合わせを見つけるのに多くの試行錯誤が必要です。

または、Azure Machine Learning にはパラメーター スイープ モジュール ブロックがあり、ユーザーが選択した細かさでパラメーターのすべての組み合わせを自動的に試行します。これは、パラメーター空間を確実に網羅する優れた方法ですが、パラメーターの数が増えるとモデルのトレーニングに必要な時間が指数関数的に増加します。

利点は、通常、パラメーターの数が多いことは、アルゴリズムがより柔軟であることを示します。多くの場合、非常に高い精度を得られます。ただしそれは適切なパラメーター設定の組み合わせを見つけられる場合です。

特徴の数

特定の種類のデータでは、特徴の数がデータ ポイントの数と比較して非常に大きくなる可能性があります。遺伝学やテキスト データの場合によくあります。特徴の数が多いと一部の学習アルゴリズムは処理が遅くなり、実行不可能なほどトレーニング時間が長くなります。サポート ベクター マシンは特に当てはまります (下記参照)。

特殊なケース

一部の学習アルゴリズムは、データの構造や目的の結果について特定の想定をします。ニーズに合うものが見つかれば、より役に立つ結果、正確な予測、または短時間のトレーニングが得られます。

アルゴリズム 精度 トレーニング時間 線形性 パラメーター メモ
2 クラス分類
ロジスティック回帰 ● ● 5
デシジョン フォレスト ● ○ 6
デシジョン ジャングル ● ○ 6 低メモリ フットプリント
ブースト デシジョン ツリー ● ○ 6 大メモリ フットプリント
ニューラル ネットワーク ● 9 追加カスタマイズ可能
平均化パーセプトロン ○ ○ ● 4
サポート ベクター マシン ○ ● 5 大きい特徴セットに好適
ローカル詳細サポート ベクター マシン ○ 8 大きい特徴セットに好適
ベイズ ポイント マシン ○ ● 3
多クラス分類
ロジスティック回帰 ● ● 5
デシジョン フォレスト ● ○ 6
デシジョン ジャングル ● ○ 6 低メモリ フットプリント
ニューラル ネットワーク ● 9 追加カスタマイズ可能
一対全多クラス - - - - 選択された 2 クラス法のプロパティを参照

アルゴリズムのプロパティ:

● - 優れた正確性、高速のトレーニング時間、および線形性の使用。

○ - 高い精度と中程度のトレーニング時間。

アルゴリズムの注意事項

線形回帰

前に説明したように、線形回帰はデータ セットに直線 (または平面、または超平面) を適合させます。役に立ち簡単で高速ですが、一部の問題については過剰に単純になる可能性があります。線形回帰のチュートリアルについてはこちらをチェックしてください。

線形傾向のデータ

線形傾向のデータ

ロジスティック回帰

名前に「回帰」が含まれていて紛らわしいですが、ロジスティック回帰は実際には 2 クラスおよび複数クラスの分類に強力なツールです。高速で単純です。直線ではなく「S」型の曲線を使用して、グループへのデータの分割に自然に適合します。ロジスティック回帰は線形クラスの境界を提供するので、使用するときは、線形近似を受け入れ可能なことを確認します。

特徴が 1 つだけの 2 クラス データに対するロジスティック回帰

特徴が 1 つだけの 2 クラス データへのロジスティック回帰* - クラス境界はロジスティック曲線が両方のクラスに近いポイントです*

ツリー、フォレスト、ジャングル

デシジョン フォレスト (回帰、2 クラス、多クラス)、デシジョン ジャングル (2 クラス、多クラス)、およびブースト デシジョン ツリー (回帰、2 クラス) はすべて、機械学習の基本概念であるデシジョン ツリーに基づきます。デシジョン ツリーには多くのバリエーションがありますが、行うことはすべて同じで、特徴空間をほとんど同じラベルを持つ領域に分割します。これらは、分類または回帰のどちらを実行しているかにより、一貫性のあるカテゴリを持つ領域、または定数値です。

デシジョン ツリーで特徴空間を細分化する

デシジョン ツリーは特徴空間をほぼ同じ値の領域に細分化します

特徴空間は任意の小さい領域に分割できるので、1 つの領域が 1 つのデータ ポイントになるまで細かく分割することを簡単に想像できます。これは過剰適合の例です。これを回避するには、ツリーが関連しないように数学的に特別に考慮したツリーの大きなセットを作成します。この「デシジョン フォレスト」の平均は、過剰適合を回避するツリーです。デシジョン フォレストは多くのメモリを使用する場合があります。デシジョン ジャングルは、トレーニング時間が若干長くなるのと引き替えにメモリ消費が少ないバリエーションです。

ブースト デシジョン ツリーは、分割できる回数、および各領域に許可されるデータ ポイントの最小数を制限することによって、過剰適合を回避します。このアルゴリズムはツリーのシーケンスを構築し、各ツリーは前のツリーによって残されたエラーを補正するために学習します。結果は非常に正確ですが、メモリを多く使用する傾向があります。技術的な詳細については、Friedman の元の論文を参照してください。

高速フォレスト分位回帰は、領域内の標準 (中央) 値だけでなく分位の形式でその分布も知りたい特殊なケースに対応するデシジョン ツリーの一種です。

ニューラル ネットワークとパーセプトロン

ニューラル ネットワークは脳にインスパイアされた学習アルゴリズムで、多クラス、2 クラス、および回帰の問題をカバーします。無限の多様性がありますが、Azure Machine Learning のニューラル ネットワークはすべてが無閉路有効グラフの形式です。つまり、入力特徴はレイヤーのシーケンスを前方に通過して (戻ることはありません) 出力に変換されます。各レイヤーでは、入力はさまざまな組み合わせで加重され、合計されて、次の層に渡されます。この単純な計算の組み合わせにより、一見マジックのように、高度なクラス境界とデータ傾向を学習できます。この種の多レイヤー ネットワークでは、多くの技術ポートと SF の基になっている「深い学習」が実行されます。

ただし、この高パフォーマンスは無料でありません。ニューラル ネットワークはトレーニングに時間がかかり、多数の特徴を持つ大規模なデータ セットの場合は特にそうです。また、ほとんどのアルゴリズムよりパラメーターが多く、パラメーター スイープによってトレーニング時間が大幅に延びます。また、独自のネットワーク構造を指定しようとがんばると、無限の可能性があります。

ニューラル ネットワークによって学習された境界

ニューラル ネットワークによって学習される境界は複雑で不規則になる場合があります

2 クラス平均化パーセプトロンは、急激に増加するトレーニング時間に対するニューラル ネットワークの回答です。これは、線形クラスの境界を提供するネットワーク構造を使用します。今日の標準ではほとんど旧式ですが、確実に動作する長い歴史があり、十分に小さいので短時間で学習できます。

SVM

サポート ベクター マシン (SVM) は、可能な限り広いマージンでクラスを分離する境界を探します。2 つのクラスを明確に分離できない場合、アルゴリズムは最善の境界を検出します。Azure Machine Learning の 2 クラス SVM は、直線のみでこれを行います。(SVM-speak では、線形カーネルを使用します。) この線形近似を行うため、非常に高速に実行できます。特に有効なのは、テキストやゲノムのような特徴の多いデータの場合です。このような場合、SVM は、他のほとんどのアルゴリズムより速く、少ない過剰適合でクラスを分離でき、さらに必要なメモリ量も中程度です。

サポート ベクター マシンのクラス境界

標準的なサポート ベクター マシンのクラス境界は、2 つのクラスを分離するマージンを最大化します

Microsoft Research のもう 1 つの製品である 2 クラスのローカル詳細 SVM は、SVM の非線形バリエーションであり、線形バージョンの速度とメモリ効率性をほぼ維持しています。線形アプローチでは十分に正確な回答を得られない場合に最適です。速さを維持するために、問題が多数の小さな線形 SVM 問題に分解されています。仕組みについては、詳細な説明を参照してください。

非線形 SVM の巧妙な拡張機能を使用して、1 クラス SVM はデータ セット全体の特徴を正確に示す境界を描画します。異常検出に有効です。その境界のはるか外側に位置する新しいデータ ポイントは、注目するのに十分な異常値です。

ベイズ法

ベイズ法は高品質であり、過剰適合を回避します。回答の予想される分布について事前にいくつかの想定を行うことによってこれを実現します。この方法のもう 1 つの副産物は、パラメーターが非常に少ないことです。Azure Machine Learning には、分類 (2 クラスのベイズ ポイント マシン) と再帰 (ベイジアン線形回帰) の両方に対するベイズ アルゴリズムがあります。これらのアルゴリズムではデータを直線で分割または適合できるものと想定していることに注意してください。

歴史的には、ベイズ ポイント マシンは Microsoft research で開発されました。いくつかの非常に美しい理論的な処理が背後で行われています。興味がある場合は、JMLR のオリジナル記事および Chris Bishop による洞察に富むブログを参照してください。

特殊なアルゴリズム

非常に特定の目標がある場合でも大丈夫です。Azure Machine Learning のコレクションには、ランク予測 (順序回帰)、カウント予測 (ポワソン回帰)、異常検出 (PCA ベースの異常検出に基づくものと、サポート ベクター マシンに基づくもの) に特化したアルゴリズムがあります。また、唯一のクラスタリング アルゴリズム (k-means) もあります。

PCA ベースの異常検出

PCA ベースの異常検出 - 大部分のデータは標準的な分布に分類され、その分布から大きく逸脱したポイントは異常です

K-means を使用してグループ化されたデータ セット

データ セットは、k-means を使用して 5 つのクラスターにグループ化されます

集合体の一対全多クラスもあります。これは、N クラス分類問題を N-1 2 クラス分類問題に分割します。精度、トレーニング時間、線形性プロパティは、使用される 2 クラス分類子によって決まります。

3 クラス分類子を形成するために組み合わされた 2 クラス分類子

2 クラス分類子のペアの組み合わせで、3 クラス分類子が形成されます

Azure Machine Learning には、Vowpal Wabbit のタイトルの下に強力な機械学習フレームワークへのアクセスも含まれます。VW はここでの分類には当てはまらず、分類と回帰の両方の問題を学習でき、部分的にラベル付けされていないデータからさえも学習できます。さまざまな学習アルゴリズム、損失関数、および最適化アルゴリズムのいずれかを使用するように構成できます。効率的で、並列的で、非常に高速なように一から設計されました。非常に大きい特徴セットを簡単に処理します。Microsoft Research の John Langford による VW は、市販車のようなアルゴリズムの中の F1 です。VW に適さない問題もありますが、学習する価値は十分にあります。また、複数の言語でスタンドアロンのオープン ソース コードとして使用することもできます。

Need help?

Go to an MSDN forum
StackOverflow discussion
Go Social
  • Facebook
  • Twitter
  • Rss
  • ニュースレター
Microsoft Azure
  • サービス
  • リージョン
  • ケース スタディ
  • 価格
  • メンバー プラン
  • 計算ツール
  • ドキュメント
  • ダウンロード
  • Samples
  • Marketplace
コミュニティ
  • ブログ
  • サービスの更新情報
  • フォーラム
  • イベント
サポート
  • フォーラム
  • Azure Status Dashboard
  • サポート
アカウント
  • サブスクリプション
  • プロファイル
  • プレビュー機能
  • Azure 管理ポータル
トラスト センター
  • セキュリティ
  • プライバシー
  • コンプライアンス

Hello from Seattle.

日本語
JPY
  • Nutzungsbedingungen
  • Impressum
  • お問い合わせ
  • フィードバック
  • 商標
  • プライバシーと Cookie
Microsoft © 2015 Microsoft