特別コンテンツ
Nimbleを起点に変わりつつあるシステム運用の形
最終的に目指すのは「自律型データセンター」の実現
DXの進展で高まる可用性への要求
ITがビジネス遂行に欠かせないインフラになったことで、システム基盤には高い可用性が求められるようになりました。今後DX(デジタルトランスフォーメーション)がさらに進んでいくことで、可用性への要求はさらに高いものになっていくでしょう。DXによってITは「ビジネスを支える存在」から、「ビジネスそのもの」へと変貌を遂げていくからです。
しかしITシステムも物理的な機器で構成されている以上、故障や老朽化による障害発生を避けることはできません。ここで重要になるのが、物理的な機器で発生した障害が、ビジネスに波及しないようにすることです。つまり障害やその予兆を的確に検知し、その影響が生じる前に予防措置を取ることで、その影響を封じ込めてしまうのです。
これを可能にしたストレージシステムが、「HPE Nimble Storage(以下、Nimble)」です。
Nimbleはもともと、IoTやビッグデータ分析にいち早く取り組んできたスタートアップ企業が開発したストレージ製品で、2017年11月にヒューレット・パッカード・エンタープライズ(HPE)が10億ドルで買収し、HPEの製品ポートフォリオに統合されました。その評価は極めて高く、日本国内でも数多くの企業が採用しています。(導入事例をみる)
Nimbleが提供する高い可用性とサポートの変革
Nimbleが提供する価値は、大きく2つあります。
第1は、メインフレーム並みの高い可用性です。可用性は99.9999%に達しており、年間で30秒程度しか停止しない計算になります。これを可能にしているのが、HPEのデータセンターとの連携です。このデータセンターは、5分おきにNimbleからパフォーマンス情報や環境情報などを収集しており、予防保全に役立てているのです。
第2はユーザーサポートの変革です。従来のサポートは障害が発生してから行われるのが当たり前であり、まずユーザーが問題に気づき、ベンダーに問い合わせをした段階で対応が始まります。そのため障害対応に時間がかかり、復旧まで数週間から数ヶ月かかることも珍しくありません。そのため障害がビジネスに、大きな影響を与える結果になっていました。
これに対してNimbleでは、予防保全の観点から障害発生前にメンテナンスの提案が行われます。これによってビジネスに影響を与えうる障害を、未然に封じ込めることが可能なのです。また万一障害が発生した場合でも、データセンターにログデータが蓄積されているため、適切な対応を迅速に行えます。障害発生から対応完了までにかかる平均時間は、わずか47分となっています。
これら2つの価値提供を支えているのが「HPE InfoSight(以下、InfoSight)」です。これはIoTデータのモニタリングとAIを活用した運用支援データ分析を行う、SaaS型のサービスです。
図:InfoSightの概要と収集データの例
サポートのレベル1~2を自動化するInfoSight
一般的なサポートは、大きく3つのレベルに分けることができます。ユーザーが障害を連絡するまでの「レベル1」、ベンダーが障害の切り分けと原因特定を行う「レベル2」、そして実際に障害に対処する「レベル3」です。InfoSightはこのうちレベル1とレベル2を担う存在だと言えます。これらは従来、コールセンターのオペレーターやフィールドエンジニアが行ってきたものですが、InfoSightを活用することで自動化できるのです。HPEではこの自動化によって、人によるサポート対応件数を年率20%削減すると共に、それによって余裕ができた人的リソースをレベル3に振り分けることで、素早い復旧を実現しています。
またレベル3では、コールセンターのオペレーターやフィールドエンジニアではなく、データアナリストやデータサイエンティストが対応を担っています。この取り組みを推進しているのが「PEAKチーム」と呼ばれる組織です。PEAKとは、「Performance(システム性能把握)」「Escalation(作業のエスカレーション)」「Analytics(障害の特定と分析)」「Knowledge(情報の共有)」の頭文字を組み合わせた造語です。
PEAKチームがInfoSightを運用することで見えてきたのは、システムトラブルのうちストレージそのものが問題であるケースは、意外と多くないということです。システム全体の安定した運用を自動化していくには、ストレージ以外の問題も予測すべきなのです。そこで現在のPEAKではストレージに加え、ネットワークやファイルシステム、パフォーマンスなどもカバー。これらの機能毎に特化した14人の専門家が分析などの活動を行っています。
HPE製品全般へと拡大されるInfoSightの適用対象
InfoSightのカスタマーサポートの仕組みはNimbleへの提供から始まりましたが、現在では「HPE 3PAR」をはじめとするHPE製品全般へと拡大されています。すでに3PARに関しては専任のPEAKチームが発足しており、2002年から収集されてきた稼働状況のデータがデータアナリストやデータサイエンティストによって分析されています。
その分析から新たな成果も生まれています。その1つが、仮想マシンの状況を可視化するInfoSightの機能である「VMVision」の3PAR対応です。この機能は「VMware vCenter Server」が取得するさまざまな情報をグラフィカルに表示するというもの。3PARユーザーは既存のカスタマーIDを使用してポータルにログインすることで、自分が使用している3PARの稼働状況を詳細に把握できるようになっています。
仮想マシンの中のアプリケーション稼働状況なども分析できる
VMVisionが機能強化されたことも注目すべきポイントだと言えます。ストレージに加えサーバーやネットワークも可視化対象となりました。ユーザーはInfoSightのポータルで、これらの情報を単一画面でまとめて確認できます。3PARユーザーの中には数十台のアレイを世界中に分散して保有しているケースも少なくありませんが、ビッグデータで得られた知見を活用することで、企業のインフラ全体を可視化できるようになったのです。
この他にも、Nimbleで提供されていた機能を含め、さまざまな機能強化が行われる計画です。また今後はAIと機械学習を活用し、予防保全とカスタマーサポートのあり方を、さらに変革していくことも目指されています。
AIレコメンデーションエンジンで障害対策の提案も可能に
その基盤となる技術が、2017年11月にリリースされた「AIレコメンデーションエンジン」です。HPEはこれまでもAIや機械学習を活用することで、ベテランの運用担当者ですら解決が難しい問題を分析してきました。この取り組みをさらに発展させ、より高い精度で障害の予兆を検知すると共に、その障害にどのような対応を行えばいいのかをIT担当者にレコメンドするのが、AIレコメンデーションエンジンです。
AI レコメンデーションエンジン
現時点のAIレコメンデーションエンジンは、障害への対策をレコメンドするところまでをカバーしており、提案された対策の実装は人によって行う必要があります。しかし今後はその機能をさらに拡張し、対策を提案するだけではなく、自動実行する仕組みを作り上げていくことも視野に入っています。これによってHPEが目指すのは、データセンター自らが「自己管理(Self-Managing)」や「自己修復(Self-Healing)」、「自己最適化(Self-Optimizing)」を行う「自律型データセンター」の実現です。そのための中核技術が、InfoSightやAIレコメンデーションエンジンなのです。
InfoSightの登場によってレベル1とレベル2が自動化され、ユーザーは障害を発見して連絡する必要がなくなりました。またAIレコメンデーションエンジンによって、障害への対策を検討する作業も不要になります。近い将来にはさらに、障害対応そのものも自動化されることになるでしょう。
このようにHPEはNimbleを起点に、次世代データセンターに向けた歩みを着々と進めているのです。
記載の社名・製品名は各社の商標または登録商標です。
おすすめコンテンツ
HPE Nimble 導入事例
-
トッパン・フォームズ株式会社様
主力事業であるデータ・プリント・サービス(DPS)の一翼を担う仮想化環境の中核にHPE Nimble Storageを採用し、システム全体の信頼性を向上しました。
事例をみる -
株式会社学研エデュケーショナル様
HPE Nimble Storageを中心に仮想化基盤を刷新し、パブリッククラウドと同等の使いやすさを実現しながら、移行コストを1/2に抑制しました。
事例をみる -
富山県済生会富山病院様
無停止で医療の現場を支えるインフラ基盤にHPE Nimble Storageを採用。HPE InfoSight の障害予兆検知機能を利用し、万全の保守フローを整備しました。
事例をみる