クラウドコンピューティングの発展に伴って、企業がデータ分析用のリソースを自社で負担する必要がなくなったことから、現代のビジネス界ではビッグデータの利活用がますます注目を集めている。このトレンドに沿い、コストダウンや業務効率化などの“守り”だけでなく、ビジネスに付加価値をもたらす“攻め”のデータ活用を実現するサービスを積極的に世に出しているのがMicrosoftだ。
その中でMicrosoftが特に力を入れ、テクノロジーを結集して作り上げた、新しいデータ活用プラットフォームが「Azure Synapse Analytics」。同社が2015年から提供していた「Azure SQL Data Warehouse」をリブランディングし、2019年11月に再リリースしたもの。CRMやERPに保存されたデータや、IoTデバイスが収集したデータなどを統合・分析し、ユーザー企業に新たな知見をもたらすのが特徴だ。
「リブランディングはもちろん、名前を変えただけではありません。Azure Synapse Analyticsでは、処理能力、スケーリング、UIとUX、セキュリティなどの機能を旧サービスから進化させています」と語るのは、国内で同プラットフォームのセールスを手掛ける日本マイクロソフトの田中研一氏(クラウド&ソリューション事業本部 インテリジェントクラウド第2統括本部 Azure 第三営業本部 Data & AI Specialist)だ。
日本マイクロソフトは現在、Azure Synapse Analyticsを使ったアーキテクチャの構築支援やコンサルティングなどを通じて、業種を問わずさまざまな企業にデータ分析システムを提供している。今回はこれらの施策を主導する田中氏に、Azure Synapse Analyticsの強みや旧サービスから進化したポイント、今後のビジョンを余すところなく聞いた。
かつてのビジネス界におけるデータ活用とは、コストダウンや業務効率化などの“守り”に向けたものが中心だった。だが、テクノロジーが発展した現代では、ビジネスに付加価値を生むための“攻めのデータ活用”が可能になっている。
データアナリティクス市場の発展と盛り上がりを踏まえ、日本マイクロソフトは現在、“攻めのデータ活用”を可能にする製品やサービスを数多く展開している。「Office 365」「Dynamics 365」「Microsoft Azure」、そして「Azure Synapse Analytics」――。同社はこれらを通じて、顧客にどんなメリットを提供できるのか。
田中氏がAzure Synapse Analyticsのメリットとして最初に挙げたのは、その処理能力の高さだ。同氏は「Azure Synapse Analyticsは、ペタバイト規模で全てのTPC-Hクエリを実行できる性能を持ちます。クラウド型の分析プラットフォームとしては業界トップクラスだと自負しています」と胸を張る。
高い処理能力を実現できている理由について、田中氏は「Microsoftが1989年から開発・改良を続けているMicrosoft SQL Serverのエンジンを使っているので、SQL文の解釈や実行時の効率が優れている点が挙げられます。また、ストレージ層とコンピューティング層を分離したシステム構成が可能なので、性能を追求する際にバランスが取りやすいのも大きなポイントです」と語る。
続いて田中氏は、Azure Synapse Analyticsの強みとして「使い勝手の良さ」を挙げた。データ分析では一般的に、ETLツールなどを利用してデータを加工したり、BIツールなどで内容を分析したりと、異なるツールを使い分ける必要がある。Azure Synapse Analyticsはこの手間を解消するため、異なる種類のツールを統合し、管理画面の「Synapse Analytics Studio」からワンストップで利用できるようにしている。
「旧サービスでは、データ分析基盤を構築する際に、『Azure Data Factory』『Azure Databricks』などのETLツールやミドルウェアを組み合わせる必要がありましたが、Azure Synapse Analyticsではその必要はなく、スムーズなデータ分析が可能です。キャッチアップすべき技術やスキルが絞られるので、ユーザー企業はシステム運用の内製化も促進できます」と田中氏は説く。
田中氏は「Azure Synapse Analyticsではクラウド経由で最新のサービスをまとめて提供するため、これを1つ導入するだけで、技術の新陳代謝が激しい現代のビジネスに対応できます。システムの陳腐化を先延ばしにする効果もあると考えます」(田中氏)
オープンソースソフトウェア(OSS)との連携強化が図られているのもAzure Synapse Analyticsの大きなメリットだ。同サービスでは大容量のデータを分析する際に、リレーショナルデータベース(RDB)による処理の効率化に向けて「Spark」「Hadoop」「Kafka」といったOSSのミドルウェアを組み合わせて利用できる。
Microsoftはこれらの新機能を通じて、ユーザーのコストを削減する効果も見込んでいる。クラウドは確かにオンプレミスよりも初期コストや運用コストが低いが、機能に応じて異なるベンダーのサービスを複数選んで組み合わせると、コストが想定外に膨れ上がるケースがあるといい、Azure Synapse Analyticsではこれを防げるとしている。
Azure Synapse Analyticsには、分析するデータの特性によって、プロビジョニング型とオンデマンド(サーバレス)型の2つのアーキテクチャを使い分けられる機能がある。これも、SQL Data Warehouseにはなかったものだ。
プロビジョニング型は、16段階あるサービスレベルの中から、要件に応じてクエリの実行性能やコンピューティングの容量を事前に決定し、ユーザーに提供する仕組み。サービスレベルの下限は100DWU、上限は30000DWUと幅広い。田中氏は「決められたタスクを、毎日自動で実行する場合などにコストメリットの大きいアーキテクチャです」と解説する。
プロビジョニング型は「SQL pool」というアーキテクチャで作られている。データを蓄積するストレージの「Azure Storage」と、計算処理を実施実行する「Compute Node」がそれぞれ独立している構成だ。これにより、ユーザーはデータ容量の増加に対応してストレージだけを増設し、コンピュートノードの容量は現状のまま据え置く形の運用ができる。
その逆も可能で、ストレージ容量はそのままで、計算処理の部分だけを高速にしたい場合は、コンピュートノードを最大で60ノード(=30000DWU)まで増設できる。「ノードの増設に比例して性能が向上するので、キャパシティーのプランが立てやすいという特徴があります」(田中氏)という。
これらの機能を駆使し、データの分析が追いつかない場合にリソースを増強したり、逆にリソースが有り余った場合に減らしたりといった対応を、その時々の状況に応じて取れる柔軟性がこの方式のメリットだ。
ただ、Azure Synapse Analyticsを拡張する場合、拡張分は従量課金制を採用しており、ノードを急激に増強した場合はそれに応じた利用料がかかる。そこで、顧客に負担がかからないよう、日本マイクロソフトはコストも含めたプランニングの支援にも力を入れている。
田中氏は「業務に応じてリソースを自在に変更できる伸縮性は、クラウドのメリットの一つではあるものの、やはり費用の最適化は必要だと考えています。そこで、データの規模や要件に基づいた事前のプラン策定や、お客さまの負担を最小限にする形でのPoCも実施しています」と取り組みの例を挙げる。
なおAzure Synapse AnalyticsのSQL poolアーキテクチャでは、古くからのユーザーの要望に応え、SQL Data Warehouseでは利用できなかったSQL Serverの一部機能を使えるようにしている。
オンデマンド(サーバレス)型はその名が示す通り、「SQL on-demand」と呼ぶアーキテクチャを採用し、必要に応じてクエリを実行する仕様にしている。「初期コストが抑えられるので、単発限りの分析業務に適しています。オンデマンド型もSQL Data Warehouse にはなかった機能で、Azure Synapse Analyticsで新しく追加しました」と田中氏は説明する。
新たに追加した理由は、「データの全体象や性質を把握するために、様々なクエリを実行した上で最適なモデルを定義する『探索的データ分析』のニーズが高まっているからです」と田中氏は言う。「手法が毎回異なるなど、定形化されていないデータ分析を実行する場合は、オンデマンド型の方がコストメリットが大きく、運用もしやすいです」という。
田中氏によると、Microsoftは2019年に、オンデマンド型アーキテクチャを使って約3ペタバイトのオンラインゲームのプレイヤーデータを分析するデモを実施。「特定の機能を利用した25~27歳のユーザーの最大セッションタイムを求める」というクエリを実行したところ、約9秒で完了したという。また、年齢を25歳から28歳に広げるなど、属性の条件を変えながら何度か分析を行ったが、「いずれもスピーディーに結果を導き出せました」と田中氏は強調する。
このように、2つのアーキテクチャをそろえることで、データ分析の手法が決まっている場合と、さまざまな手法を試したい場合の両方に対応できるのもAzure Synapse Analyticsの大きな利点といえよう。
Microsoftは現在、Azure Synapse Analyticsのさらなる強化に向けて開発を行っており、追加機能を搭載した「新しいジェネレーション」をプライベートプレビュー中だ。リリース時期は未定だが、田中氏は「さらなる新機能を追加する予定です」と明かす。
新機能の一つが、「Azure Synapse Link」。基幹系システムなどからデータを取り込む際に、事前のデータ処理を自動で実行するものだ。
従来、勘定系などのオンプレミス環境からAzure Synapse Analyticsにデータを流す場合は、データを送る前にETLツールを挟んでデータを加工する必要があった。新機能を使うと、端末からデータを入力した際、基幹系システムに書き込むと同時に、オンラインでAzure Synapse Analyticsにも書き込むことが可能になる。田中氏は、「ETL処理そのものがいらなくなる世界を実現できます」と胸を張る。
Microsoftが現時点で明かしている新機能はこの1点のみ。他のアップデートやリリース時期はこれから発表する方針だ。田中氏は「新バージョンでは他にも、これまでAzure Synapse Analyticsをご利用いただく上で課題になっていた機能に大幅な改善を加える予定です。これまでご利用頂いていたお客さまにはより高い価値をご提供でき、ご検討中の方にも必ずご満足いただけるものをお届けします」と意気込む。
ここまで述べてきた通り、Azure Synapse Analyticsは現在の仕様でも、企業のデジタルトランスフォーメーション(DX)をさらに加速させる機能を持っている。だが、まだ完成形ではなく、最新のテクノロジーを取り込んでさらに進化するようだ。「新しいジェネレーション」はどんなサービスになり、データ分析に取り組むユーザーにどんなメリットをもたらすのか。今後の動向に注目だ。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:日本マイクロソフト株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2020年11月18日