Microsoft Fabric とは

Microsoft Fabric は、データの移動からデータ サイエンス、Real-Time Analytics、ビジネス インテリジェンスまで、あらゆるものをカバーする企業向けのオールインワン分析ソリューションです。 データ レイク、データ エンジニアリング、データ統合など、包括的なサービス スイートを 1 か所で提供します。

Fabric を使用すると、複数のベンダーの異なるサービスをまとめる必要はありません。 代わりに、分析のニーズを簡素化するように設計された、高度に統合された、エンドツーエンドで使いやすい製品を楽しむことができます。

このプラットフォームは、サービスとしてのソフトウェア (SaaS) の基盤に基づいて構築されており、シンプルさと統合をまったく新しいレベルに引き上げます。

重要

Microsoft Fabric は プレビュー段階です

SaaS Foundation

Microsoft Fabric は、Power BI、Azure Synapse、Azure Data Factoryの新しいコンポーネントと既存のコンポーネントを 1 つの統合環境にまとめます。 これらのコンポーネントは、カスタマイズされたさまざまなユーザー エクスペリエンスで提供されます。

Fabric のさまざまなエクスペリエンスの下にあるサービスとしてのソフトウェアの基礎の図。

Fabric は、Data Engineering、Data Factory、Data Science、Data Warehouse、Real-Time Analytics、Power BI などのエクスペリエンスを共有 SaaS 基盤に統合します。 この統合には、次の利点があります。

  • 業界で深く統合された分析の広範な範囲。
  • 使い慣れた簡単なエクスペリエンス間で共有されたエクスペリエンス。
  • 開発者は、すべての資産に簡単にアクセスして再利用できます。
  • 任意の分析ツールを使用しながらデータを保持できる統合データ レイク。
  • すべてのエクスペリエンスにわたる一元管理とガバナンス。

Microsoft Fabric SaaS エクスペリエンスを使用すると、すべてのデータとサービスがシームレスに統合されます。 IT チームはコアエンタープライズ機能を一元的に構成でき、基になるすべてのサービスにアクセス許可が自動的に適用されます。 さらに、データ秘密度ラベルはスイート内の項目全体で自動的に継承されます。

Fabric を使用すると、作成者は最高の作業の作成に集中し、エクスペリエンスをサポートする基になるインフラストラクチャを統合、管理、または理解する必要がなくなります。

Microsoft Fabric のコンポーネント

Microsoft Fabric は、シームレスに連携するように設計された包括的な分析エクスペリエンスセットを提供します。 各エクスペリエンスは、特定のペルソナと特定のタスクに合わせて調整されます。 Fabric には、エンドツーエンドの分析ニーズに対して、次のカテゴリに業界をリードするエクスペリエンスが含まれています。

エクスペリエンスの [ファブリック] メニューのスクリーンショット。

  • Data Engineering - Data Engineeringエクスペリエンスは、優れたオーサリング エクスペリエンスを備えた世界クラスの Spark プラットフォームを提供し、データ エンジニアがレイクハウスを通じて大規模なデータ変換を実行し、データを民主化できるようにします。 Microsoft Fabric Spark と Data Factory の統合により、ノートブックと Spark ジョブをスケジュールおよび調整できます。 詳細については、「Microsoft Fabric のデータ エンジニアリングとは」を参照してください。

  • Data Factory - Azure Data Factoryでは、Power Queryのシンプルさと、Azure Data Factoryのスケールとパワーが組み合わされています。 200 を超えるネイティブ コネクタを使用して、オンプレミスとクラウドのデータ ソースに接続できます。 詳細については、「Microsoft Fabric の Data Factory とは」を参照してください。

  • Data Science - Data Science エクスペリエンスを使用すると、Fabric エクスペリエンス内で機械学習モデルをシームレスに構築、デプロイ、運用化できます。 Azure Machine Learning と統合され、組み込みの実験追跡とモデル レジストリが提供されます。 データ サイエンティストは、予測を使用して組織データをエンリッチし、ビジネス アナリストがそれらの予測を BI レポートに統合できるようにします。 これにより、わかりやすい分析情報から予測分析情報に移行します。 詳細については、「Microsoft Fabric のデータ サイエンスとは」を参照してください。

  • Data Warehouse - Data Warehouseエクスペリエンスは、業界をリードする SQL のパフォーマンスとスケールを提供します。 コンピューティングをストレージから完全に分離し、両方のコンポーネントの独立したスケーリングを可能にします。 さらに、開いている Delta Lake 形式でデータをネイティブに格納します。 詳細については、「Microsoft Fabric のデータ ウェアハウスとは」を参照してください。

  • リアルタイム分析 - 監視データ。アプリ、IoT デバイス、人間との対話など、さまざまなソースから収集されます。 現在、最も急速に成長しているデータ カテゴリです。 このデータは、多くの場合、JSON や Text などの形式で半構造化されます。 これは、スキーマをシフトして大量に提供されます。 これらの特性により、従来のデータ ウェアハウス プラットフォームの使用が困難になります。 Real-Time Analytics は、観測データ分析に最適なクラス エンジンです。 詳細については、「Fabric のReal-Time Analytics とは」を参照してください。

  • Power BI - Power BI は、世界をリードするビジネス インテリジェンス プラットフォームです。 これにより、ビジネスオーナーは Fabric 内のすべてのデータに迅速かつ直感的にアクセスして、データを使用してより良い意思決定を行うことができます。 詳細については、「Power BI とは」を参照してください。

Fabric は、これらすべてのエクスペリエンスを統合プラットフォームにまとめ、業界で最も包括的なビッグ データ分析プラットフォームを提供します。

Microsoft Fabric を使用すると、組織や個人は、大規模で複雑なデータ リポジトリを実用的なワークロードと分析に変換でき、データ メッシュ アーキテクチャの実装です。 データ メッシュの詳細については、データ メッシュアーキテクチャについて 説明した記事を参照してください。

OneLake と Lakehouse - レイクハウスの統一

Microsoft Fabric プラットフォームは、企業全体で OneLake と Lakehouse のアーキテクチャを統合します。

OneLake

データ レイクは、すべての Fabric サービスが構築される基盤です。 Microsoft Fabric Lake は OneLake とも呼ばれます。 これは Fabric サービスに組み込まれており、エクスペリエンスが動作するすべての組織データを格納するための統合された場所を提供します。

OneLake は、ADLS (Azure Data Lake Storage) Gen2 上に構築されています。 これは、プロフェッショナル開発者と市民開発者の両方にサービスを提供するデータに対して、単一の SaaS エクスペリエンスとテナント全体のストアを提供します。 OneLake SaaS エクスペリエンスによりエクスペリエンスが簡素化され、リソース グループ、RBAC (ロールベースのAccess Control)、Azure Resource Manager、冗長性、リージョンなどのインフラストラクチャの概念をユーザーが理解する必要がなくなります。 さらに、ユーザーが Azure アカウントを持っている必要もありません。

OneLake は、個々の開発者が独自の分離ストレージ アカウントをプロビジョニングして構成するときに作成する、今日の広範で混沌としたデータ サイロを排除します。 代わりに、OneLake は、すべての開発者に単一の統合ストレージ システムを提供します。検出とデータ共有は簡単で、ポリシーとセキュリティ設定への準拠は一元的かつ一様に適用されます。 詳細については、「OneLake とは」を参照してください。

OneLake と Lakehouse の組織構造

OneLake は本質的に階層構造であり、組織全体の管理が簡略化されます。 これは Microsoft Fabric に組み込まれており、事前プロビジョニングの要件はありません。 テナントごとに OneLake が 1 つだけあり、ユーザー、リージョン、さらにはクラウドにまたがる一括管理画面のファイル システム名前空間が提供されます。 OneLake のデータは、簡単に処理できるように管理可能なコンテナーに分割されています。

テナントは OneLake のルートにマップされ、階層の最上位レベルにあります。 テナント内には任意の数のワークスペースを作成できます。これはフォルダーと考えることができます。

次の図は、データが格納されているさまざまな Fabric 項目を示しています。 これは、Fabric 内のさまざまな項目が OneLake 内にデータを格納する方法の例です。 表示されているように、テナント内に複数のワークスペースを作成し、各ワークスペース内に複数のレイクハウスを作成できます。 レイクハウスは、データ レイク上のデータベースを表すファイル、フォルダー、およびテーブルのコレクションです。 詳細については、「 レイクハウスとは」を参照してください。

テナント内のワークスペース内のレイクハウスやデータセットなどの項目の階層の図。

テナント内のすべての開発者と部署は、OneLake で独自のワークスペースをすぐに作成できます。 Office の OneDrive と同様に、データを独自のレイクハウスに取り込み、データの処理、分析、共同作業を開始できます。

Office アプリケーションが組織の OneDrive を使用するように事前に配線されているのと同様に、すべての Microsoft Fabric コンピューティング エクスペリエンスが OneLake に事前に接続されています。 Data Engineering、Data Warehouse、Data Factory、Power BI、Real-Time Analytics などのエクスペリエンスでは、ネイティブ ストアとして OneLake が使用されます。 追加の構成は必要ありません。

同じ OneLake データ ストレージにアクセスするさまざまなエクスペリエンスの図。

OneLake は、 ショートカット 機能を使用して既存の PaaS ストレージ アカウントを OneLake にすぐにマウントできるように設計されています。 既存のデータを移行または移動する必要はありません。 ショートカットを使用すると、Azure Data Lake Storageに格納されているデータにアクセスできます。

さらに、ショートカットを使用すると、情報を移動または複製することなく、ユーザーとアプリケーション間でデータを簡単に共有できます。 ショートカット機能は他のストレージ システムまで拡張されるため、透過的でインテリジェントなキャッシュを使用してクラウド間でデータを作成および分析できます。これにより、エグレス コストが削減され、データがコンピューティングに近くなります。

次の手順