機密情報の種類と完全に一致する機密情報のソース テーブルをハッシュしてアップロードする

この記事では、機密情報ソース テーブルをハッシュしてアップロードする方法について説明します。

ヒント

E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview コンプライアンス ポータルのトライアル ハブで今すぐ開始してください。 サインアップと試用期間の詳細については、こちらをご覧ください。

適用対象

機密情報ソース テーブルをハッシュしてアップロードする

このフェーズでは、次の操作を行います。

  1. カスタム セキュリティ グループとユーザー アカウントを設定します。
  2. EDM アップロード エージェント ツールを設定します。
  3. EDM Upload Agent ツールを使用して、salt 値と機密情報ソース テーブルをハッシュし、アップロードします。

ハッシュとアップロードは、1 台のコンピューターを使用して実行することも、ハッシュ ステップをアップロード ステップから分離してセキュリティを強化することもできます。

1 台のコンピューターでハッシュ化とアップロードを行う場合は、ご利用の Microsoft 365 テナントに直接接続可能なコンピューターから行う必要があります。 これには、ハッシュのためにクリア テキストの機密情報ソース テーブル ファイルがそのコンピューター上にある必要があります。

直接アクセス コンピューターでクリア テキストの機密情報ソース テーブル ファイルを公開したくない場合は、セキュリティで保護された場所にあるコンピューターでハッシュできます。 次に、ハッシュ ファイルと salt ファイルを、アップロードのために Microsoft 365 テナントに直接接続できるコンピューターにコピーできます。 分離されたハッシュとアップロードのシナリオでは、両方のコンピューターに EDMUploadAgent が必要です。

重要

スキーマ ファイルを作成するために Exact Data Match スキーマと機密情報の種類ウィザードを使用した場合は、まだ作成していない場合は、この手順のスキーマをダウンロード する必要があります 。 「 XML 形式での EDM スキーマ ファイルのエクスポート」を参照してください。

注意

organizationがテナント レベルで Microsoft 365 のカスタマー キーを設定している場合、正確なデータ一致によって暗号化機能が自動的に使用されます。 この機能を利用できるのは、商用クラウド内の E5 ライセンスが割り当てられたテナントのみです。

ベスト プラクティス

機密データのハッシュとアップロードのプロセスを分離して、プロセス内の問題をより簡単に分離できるようにします。

運用環境に入ったら、ほとんどの場合、2 つの手順を分離しておいてください。 分離されたコンピューターでハッシュ 処理を実行し、インターネットに接続しているコンピューターにアップロードするファイルを転送すると、インターネットへの接続によって侵害された可能性があるコンピューター上のクリア テキスト 形式で実際のデータを使用できないようにします。

機密データ テーブルに書式設定の問題がないことを確認する

機密データをハッシュしてアップロードする前に、検索を実行して、コンテンツの解析に問題が発生する可能性がある特殊文字の存在を検証します。 次の構文で EDM アップロード エージェントを使用することで、テーブルが EDM で使用するのに適した形式であることを検証できます。

PowerShell
EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

このツールが列数の不一致を示している場合は、列区切り記号と混同されているテーブル内の値にコンマまたは引用符文字が含まれていることが原因である可能性があります。 値全体を囲む場合を除き、単一引用符と二重引用符を使用すると、個々の列の開始位置または終了位置がツールによって誤って識別される可能性があります。

完全な値を囲む単一引用符または二重引用符文字が見つかる場合は、そのままにしておくことができます。

値の中に単一引用符文字またはコンマが見つかる場合: たとえば、人の名前 Tom O'Neil や都市 's-Gravenhage(アポストロフィ文字で始まる) は、機密情報テーブルの生成に使用されるデータ エクスポート プロセスを変更し、そのような列を二重引用符で囲む必要があります。

値内に二重引用符文字が見つかった場合は、このような問題の影響を受けにくいテーブルにタブ区切り形式を使用することをお勧めします。

前提条件

  • EDM_DataUploaders セキュリティ グループに追加する Microsoft 365 の職場または学校アカウント
  • .NET バージョン 4.6.2 を使用したWindows 10、Windows Server 2016、または EDMUploadAgent を実行するための Windows Server 2019 マシン
  • アップロード マシン上のディレクトリを次に示します。
    • EDM アップロード エージェント
    • .csv、.tsv またはパイプ (|) 形式の機密アイテム ファイルPatientRecords.csv例
    • この手順で作成した出力ハッシュファイルと salt ファイル
    • edm.xml ファイルのデータストア名 (このサンプルでは PatientRecords)

重要

  1. Windows Server 2016またはそれ以前を使用している場合は、EDM アップロード エージェントをインストールする前に Visual C++ もインストールする必要があります。

  2. 管理者のアクセス許可が不要になるように、 EDM アップロード エージェント をカスタム フォルダーにインストールします。 既定 (プログラム ファイル) にインストールする場合は、管理者権限が必要です。

セキュリティ グループとユーザー アカウントをセットアップする

  1. グローバル管理者として、サブスクリプションの適切なリンクを使用して管理センターに移動し、EDM_DataUploadersというセキュリティ グループを作成します。

  2. EDM_DataUploaders セキュリティ グループに 1 人以上のユーザーを追加します。 (これらのユーザーは機密情報のデータベースを管理します)。

1 台のコンピューターからハッシュ化とアップロードを行う

このコンピュータは、ご利用の Microsoft 365 テナントに直接アクセスできる必要があります。

注意

この手順を開始する前に、 EDM_DataUploaders セキュリティ グループ のメンバーであることを確認してください。

ヒント

必要に応じて、機密情報ソース テーブル ファイルに対して検証を実行して、次を実行してアップロードする前にエラーをチェックできます。

EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]

サポートされているすべての EdmUploadAgent.exe パラメーターの実行について詳しくは、以下をご覧ください。

EdmUploadAgent.exe /?

  1. EDMUploadAgent の作業ディレクトリを作成します。 たとえば、C:\EDM\Data です。 そこに PatientRecords.csv ファイルを配置します。

  2. 手順 1 で作成したディレクトリに、サブスクリプションに適した EDM アップロードエージェント をダウンロードしてインストールします。

    • 商用 + GCC - ほとんどの商用顧客は、このオプションを使用する必要があります。
    • GCC-High - このオプションは、セキュリティの高い政府機関のクラウド サブスクライバー専用です。
    • DoD - このオプションは、米国国防総省クラウドのお客様向けです。

    注意

    上記リンクにある EDMUploadAgent は、ハッシュ化されたデータに自動的にソルト値を追加するように更新されています。 または、独自のソルト値を提供することもできます。 このバージョンを使用すると、以前のバージョンの EDMUploadAgent は使用できなくなります。

    EDMUploadAgent を使用して、1 日に最大 5 回、任意のデータ ストアにデータをアップロードできます。

  3. EDM アップロード エージェントを承認し、管理者としてコマンド プロンプト ウィンドウを開き、 C:\EDM\Data ディレクトリに切り替えてから、次のコマンドを実行します。

    EdmUploadAgent.exe /Authorize

    重要

    インストールされているフォルダーから EdmUploadAgent を実行し、データ ファイルへの完全なパスを示す必要があります。

  4. EDM_DataUploaders セキュリティ グループに追加された、Microsoft 365 の職場または学校のアカウントでサインインします。 ユーザー アカウントからご利用のテナント情報を抽出し、接続を行います。

    重要: 完全なデータ一致スキーマと機密情報の種類ウィザードを使用してスキーマを作成した場合は、まだ使用していない場合は、この手順で使用するためにダウンロード する必要があります 。 コマンド プロンプト ウィンドウで次のコマンドを実行します。

    Windows コマンド プロンプト
    EdmUploadAgent.exe /SaveSchema /DataStoreName <schema name> /OutputDir <path to output folder>
    
  5. 機密データをハッシュ化してアップロートするには、コマンド プロンプト ウィンドウで次のコマンドを実行します。

    Windows コマンド プロンプト
    EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Schema [Schema file] /ColumnSeparator ["{Tab}"|"|"] /AllowedBadLinesPercentage [value]
    

    注意

    機密データ ファイルの既定の形式は、コンマ区切りの値です。 /ColumnSeparator パラメーターを使用して "{Tab}" オプションを指定することでタブ区切りファイルを指定することも、"|" オプションを指定してパイプ区切りファイルを指定することもできます。

    例: EdmUploadAgent.exe /UploadData /DataStoreName PatientRecords /DataFile C:\Edm\Hash\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5

EDM および 2 バイト文字セット言語

正確なデータ一致では、中国語、日本語、韓国語で使用される 2 バイト文字がサポートされています。 ただし、2 バイト文字としてエンコードされた裏付け証拠の文字列一致はサポートされていません。 以下で説明するように EDM のグローバリゼーションが有効になっていない限り、分類されたコンテンツで検出されたマルチトークン CJK テキストとも一致しません。 いずれの場合も、SIT は、プライマリ フィールドと裏付け証拠フィールドの両方のマルチトークン テキストにマップする必要があります。

重要

2 バイト文字に対して正確なデータ マッチングを呼び出すには、次の手順を実行する必要があります。

  1. 日本語の漢字など、2 バイト文字セット言語で一致することを目的とした EDM 機密情報の種類 (SIT) を作成します。

  2. EDM アップロード エージェントのバージョン 17.01.0495.0 (またはそれ以降) をダウンロードしてインストールしていることを確認します

  3. EDMUploadAgent.exe.config ファイルのグローバリゼーション パラメーターを true に更新します。<add key=" IsGlobalizationEnabled" value="true">

  4. 一致するデータを含むソース テーブルをハッシュしてアップロードします。

ハッシュ化とアップロードを分離する

安全な環境にあるコンピューター上でハッシュ化を実行します。 両方のコンピューターに EDMUploadAgent がインストールされている必要があります。

省略可能: 完全なデータ一致スキーマと機密情報の種類ウィザードを使用してスキーマを作成し、まだダウンロードしていない場合は、コマンド プロンプト ウィンドウで次のコマンドを実行して XML 形式でファイルをダウンロードします。

Windows コマンド プロンプト
EdmUploadAgent.exe /SaveSchema /DataStoreName <schema name> /OutputDir <path to output folder>
  1. セキュリティで保護された環境のコンピューターで、コマンド プロンプト ウィンドウで次のコマンドを実行します。

    Windows コマンド プロンプト
    EdmUploadAgent.exe /CreateHash /DataFile [data file] /HashLocation [hash file location] /Schema [Schema file] /AllowedBadLinesPercentage [value]
    

    例:

    Windows コマンド プロンプト
    EdmUploadAgent.exe /CreateHash /DataFile C:\Edm\Data\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5
    

    注意

    機密データ ファイルの既定の形式は、コンマ区切りの値です。 /ColumnSeparator パラメーターを使用して "{Tab}" オプションを指定することでタブ区切りファイルを指定することも、"|" オプションを指定してパイプ区切りファイルを指定することもできます。

    /Salt saltvalue オプションを指定しなかった場合、ハッシュされたファイルとこれらの拡張子を持つ salt <ファイルが出力されます。>

    • .EdmHash
    • .EdmSalt
  2. 機密情報ソース テーブル ファイル (PatientRecords) をテナントにアップロードするために使用するコンピューターに、これらのファイルを安全な方法でコピーします。

  3. EDM アップロード エージェントを承認し、管理者としてコマンド プロンプト ウィンドウを開き、 C:\EDM\Data ディレクトリに切り替えてから、次のコマンドを実行します。

    Windows コマンド プロンプト
    EdmUploadAgent.exe /Authorize
    

    重要

    インストールされているフォルダーから EdmUploadAgent を実行し、データ ファイルへの完全なパスを示す必要があります。

  4. EDM_DataUploaders セキュリティ グループに追加された、Microsoft 365 の職場または学校のアカウントでサインインします。 ユーザー アカウントからご利用のテナント情報を抽出し、接続を行います。

  5. ハッシュされたデータをアップロードするには、Windows コマンド プロンプトで次のコマンドを実行します。

    Windows コマンド プロンプト
    EdmUploadAgent.exe /UploadHash /DataStoreName \<DataStoreName\> /HashFile \<HashedSourceFilePath\ /ColumnSeparator ["{Tab}"|"|"]
    

    例:

    Windows コマンド プロンプト
    EdmUploadAgent.exe /UploadHash /DataStoreName PatientRecords /HashFile C:\\Edm\\Hash\\**PatientRecords.EdmHash**
    
  6. 機密データがアップロードされたことを確認するには、コマンド プロンプト ウィンドウで次のコマンドを実行します。

    Windows コマンド プロンプト
    EdmUploadAgent.exe /GetDataStore
    

    データ ストアの一覧と、データ ストアが最後に更新された日時が表示されます。

  7. 特定のストアへのすべてのデータアップロードを表示する場合は、コマンド プロンプト ウィンドウで次のコマンドを実行して、すべてのデータ ストアと更新日時の一覧を表示します。

    Windows コマンド プロンプト
    EdmUploadAgent.exe /GetSession /DataStoreName <DataStoreName>
    

注意

ハッシュとアップロードプロセスを初めて作成した後に自動化するには、「 正確なデータ一致の機密情報ソース テーブル ファイルを更新する」を参照してください。

次のステップ

または