コンサルタントのコラム
ファイルサーバ管理のススメ
[第2回]データの肥大対策とファイルサーバの見える化
2013年11月
これまで、「ファイルサーバのバックアップ」について書いてきました。今回は、「データの肥大化対策と、ファイルサーバの見える化」について考えてみたいと思います。データの肥大化対策は、これまで書いてきた「有効かつ確実なバックアップ」を実現するために最大の課題の1つもあります。
1.ファイルサーバの現状(おさらい)
第1回にも書きましたが、弊社では「簡易情報アセスメント」というサービスを行なっており、過去40社弱のレポートを作成させていただいています。ここから見えてきた傾向として以下を上げました。
- データは年率50%程度ずつ増加する
- 「生成もしくは最終更新から1年以上経過」しているデータは60~80%存在する
- 「生成もしくは最終更新が最近30日以内」のデータは全体容量の3~10%程度しかない
- 「過去1年以上参照されていない」データは全体容量の50~80%程度ある
- 重複するデータが20~30%存在する
2.データの肥大化
まず、データ容量が年50%増加するとはどういうことか、シミュレーションしてみます。
グラフを見ればわかりますが、年50%でデータが増えるということは、3年後には3倍以上、5年後には8倍弱にまでデータが増えることを意味しています。確かに、これを放置していれば、ディスクはいくらあっても足りなくなることは目に見えています。弊社も例外ではありませんが、定期的にファイルサーバ管理者から、「ディスクが逼迫しているので、不要なデータ削除してください」とアナウンスが出ますが、なかなか効果が上がらないのが現状です。
昨今の資料のビジュアル化、高解像度化、さらにファイルサーバの集約傾向を考えると絶対的なデータ量の増加は防げないと思います。
一番簡単な対策としては、ある程度費用をかけて、ディスク増設が容易なスケーラビリティを持ったストレージを導入することが考えられます。
しかし、データが増えれば、バックアップに問題が出るし、ファイルの検索にも時間がかかるため、なにかしらの対策は必要となります。
3.データの肥大化対策
そこで、注目したいのは、ファイルサーバの現状で上げたうちの2つの項目です。
- 「過去1年以上参照されていない」データは全体容量の50~80%程度ある
- 重複するデータが20~30%存在する
「過去1年以上参照されていない」ファイルを主ファイルサーバに保存しておく必要があるのでしょうか?例えば、「過去1年以上参照されていない」ファイルは、「別の保存媒体で保管する」もしくは、圧縮して別サーバ(より安いサーバ)に待避することはできないでしょうか?
また、「重複するデータ」は削除できないのでしょうか?
ここで、またシミュレーションを行ってみます。
シミュレーションの条件は以下のとおりです。
- データの増加量は、先のシミュレーションと同じとする
- 過去1年以上参照されていないデータが50%存在する
- 過去1年以上参照されていないデータは圧縮(圧縮率50%)し、別媒体に退避する
- 前年圧縮されたデータのうち10%は利用する(活用データとして復帰する)
- 重複ファイルが30%存在し、これは削除できる(15%の削減)
まず、現状1TByteのデータは、上記条件で整理を行うと、10分の1以下にまでデータが整理されます。その上で、ファイルサーバに残るデータ量は3年後で、約1.3TByte、5年後でも3TByte以下、圧縮退避用の媒体も5年後で1.5TByte以下で済むことが見て取れます。何もしなかった場合、5年でデータ量が8倍近くとなるのに比べ、その差は歴然としています。
しかし、このシミュレーションには大きな課題があります。それは、以下の3点です。
- どうやって、重複ファイルを識別し、削除するか?
- どうやって、1年以上参照されていないファイルを識別し、圧縮退避するか?
- どうやって、圧縮退避したファイルを必要なときに取り出すのか?
管理者が、手動で行うことは、理論上可能ですが、その手間を考えると現実的ではありません。つまり、このシミュレーションを実環境で行うためには、管理するファイルサーバの見える化と、管理を自動化するツールが必要となるということです。
4.ファイルサーバの管理ツール
ファイルサーバの管理ツールはいくつかありますが、NECには、NEC Information Assessment System(愛称NIAS)という製品があります。
NIASはファイルサーバの、(1)見える化、(2)ファイル整理・容量削減、(3)アクセス権管理を行うファイルサーバ整理・活用ソフトウェアです。
実は、弊社の「簡易情報アセスメント」もNIASの「見える化」機能限定版を用いてデータの収集・分析を行っています。「簡易情報アセスメント」では、ファイルサーバの現状分析しか行えませんが、製品版では目標値を設定してのシミュレーション等もGUIを用いて行うことが可能です。
シミュレーションをもとに、削除対象ファイルの抽出・リスト化を行い、これを利用者(ファイルオーナ)に整理依頼メールを送付、手動での削除または圧縮を行うことができます。
また、整理ポリシーを設定し、自動でファイル整理を行うことも可能です。この際、元ファイルサーバには圧縮ファイルへのショートカットが残るので、利用者が再利用する際にも影響を与えません。
これらの機能により、NIASでは、先に上げた3つの課題、
- どうやって、重複ファイルを識別し、削除するか?
- どうやって、1年以上参照されていないファイルを識別し、圧縮退避するか?
- どうやって、圧縮退避したファイルを必要なときに取り出すのか?
を解決することができます。
5.まとめ
今回はちょっとコマーシャルっぽくなってしまいましたが、データの肥大化は多くの組織で共通の課題だと思います。この課題に「精神論」や「管理者の手作業」で対応するのには限界があります。
また、2つのシミュレーションを行いました。基本データは弊社で行っている「簡易情報アセスメント」の結果(平均値)を用いています。当然のことながら、ファイルサーバの使い方には、組織固有の「クセ」があります。まず、自社のファイルサーバがどのような使われ方をしているのかを把握し、その上で対策を検討することをお勧めします。
次回はファイルサーバの情報セキュリティ対策(アクセス管理)について考えてみたいと思います。
執筆
NECネクサソリューションズ
コンサルタント 吉川 明人
[CISA公認情報システム監査人,CRISC 公認リスク情報システム管理者,情報セキュリティアドミニストレータ,ネットワークスペシャリスト,NPO事業継続推進機構会員]
個人的には、1年以上ダイビングに行けていません。機材のメンテナンスが、直近のリスク管理上の課題となっています。
*本コラムは、筆者の個人的な見解に基づいて書かれています。
関連ソリューション
ご質問・ご相談などお気軽にどうぞ
資料ダウンロードはこちらから