データはどこまで探してみましたか?データガバナンス&データディスカバリー DDP(Data Discovery Platform)を活用したデータセキュリティ!

April 11, 2024

こんにちは。CHEQUERのBackend/FrontendチームリーダーのBruceです。前回に続き、本記事ではデータ・ディスカバリーと連携したデータセキュリティについてもう少し詳しく説明します。

本題に入る前に、私、個人の歩みについて簡単に紹介しておくことが、現代のビジネス環境の変化を理解するのに役立つかと思います。私は約20年間、検索ドメインで分散環境の大容量サービスの開発、データ収集及び精製など、多岐にわたる興味深い経験を積み重ねてきました。

セキュリティソリューションを開発している今、検索ドメインからセキュリティドメインに切り替えた、自分のキャリアの歩みについて振り返ってみます。すると意図したわけではありませんが、「検索」と「セキュリティ」という二つの分野の密接な関連性を確認することができました。セキュリティという領域で個人情報などのデータを迅速かつ正確に認識し、同時にAI技術を活用して異常行動の検知などを行う際、検索技術の活用が必要になるという点です。検索技術の発展と共に、ユーザーの情報に対するセキュリティ問題が重要になっている現在の状況が重なった結果だと思います。

現代のビジネス環境で日増しに高まるデータの重要性

現代のビジネス環境において、データの重要性はいくら強調しても過言ではないほど、誰もが認識し共感している領域です。これは、様々な産業の企業がデータを効果的に収集、分析および活用することで、競争優位性を確保することに起因しています。同時に、セキュリティの面でも大きな課題を残しています。

企業はビジネスインテリジェンスツールを利用して顧客行動、市場動向、製品実績など様々な側面のデータを分析し、これを戦略的な意思決定に活用します。正確で信頼性のあるデータに基づいた意思決定は企業の成功に直結し、競争の中で差別化された強みに繋がる可能性があります。

また、多くの企業が顧客データに基づくパーソナライズされたサービスの提供に注力しています。パーソナライズされたマーケティング戦略や、カスタマイズされた製品およびサービスは顧客との肯定的な相互作用を促し、顧客ロイヤリティを高める橋渡し役をするからです。そして、顧客に合わせたアプローチが求められるこの時、企業はやむを得ず、センシティブな個人情報を扱わざるを得なくなります。正にデータセキュリティの必要性が際立つ瞬間です。

データが企業のビジネス価値を生み出し、成功に直結する核心的な資源と見なされているだけに、現代のビジネスにおける核心的な課題はデータの重要性を認識し、それに伴う責任とセキュリティレベルを高め、これを効果的に管理・保護することです。

データガバナンス & データディスカバリー

効率的かつ安定したデータ管理の重要性について先に説明しましたが、これら全てを総称する概念がデータガバナンス(Data Governance)です。

より厳密にいえば、データガバナンスは組織内のデータを効果的に管理し保護するためのフレームワークとポリシーシステムを意味します。

データの品質、セキュリティ、規制遵守、アクセス権限、メタデータ管理などを含むデータライフサイクル全体にわたって適切な管理を行うことを目標とし、組織内の全てのデータ活動を調整・制御することで、データ資産を保護し、戦略的観点からデータを管理・活用する際に核心的な役割を果たします。

この一連のプロセスで最も基本となる必須領域がデータディスカバリー(Data Discovery)です。データディスカバリーとは組織が保有する様々なデータソースから意味のある情報を見つけ、探索するプロセスを意味します。

これはデータアナリスト、ビジネスユーザー、意思決定者など様々なステークホルダーがデータに関する洞察を得て、データを活用し、価値のあるインサイトを得られるように支援する活動です。

膨大なデータ管理を可能にするDDP(Data Discovery Platform)

DDPはセキュリティの観点からデータの安全性を強化し、個人情報を効果的に管理するお手伝いをすることができます。

企業管理者が何のツールも使わずに、組織内の膨大なデータの山の中でどのようなデータが存在し、どのようなデータが新しく生成されているかを一つ一つ把握し、分類することはほとんど不可能に近いです。

このときDDPは強力なデータ分類及び識別機能を提供することで、膨大なデータ管理を可能にします。以下は、個人情報の検知、アクセス制御、異常行動の検知などに該当するシナリオです。

Data Discovery Platform

第一に、個人情報や機密情報を示すパターン、ルール、または機械学習のアルゴリズムを活用してデータを分類します。この際、個人情報が含まれたデータは自動的に識別および分類され、データカタログに記録されます。特に、識別された個人情報へのアクセスは、管理者が設定したルールに従って制御することができます。個人情報にアクセスできる権限は、その情報に必要な役割および責任に基づいて付与することにより、不要なアクセスを防ぎます。

第二に、ユーザーおよびシステムの異常行動を識別するために、効果的な検知メカニズムを提供します。これを実現するために正常な行動パターンを学習し、その学習を基準として異常行動を検出し、管理者にリアルタイムで通知を行います。例えば、特定のユーザーが普段閲覧しない個人情報にアクセスしたり、大量のデータをダウンロードしたりした場合、それを識別してアラートを発するのです。これにより、管理者はリスクのある状況に対して迅速に対応することができ、報告書やログ機能を通じて事件に関する記録を残すことができます。報告書は監査および規制遵守の目的で活用することができ、セキュリティ向上および潜在的な脅威に対する予防策を講じることにも役立ちます。

最後に、データを中央で統合的に管理することで、個人情報や機密情報、または管理者が定義した特定データに関する全体的なトレンドや視点を提供します。これにより、組織はデータの位置、使用、権限およびセキュリティ状態に関する総合的なインサイトを得ることができます。

個人情報を保護しながら、データへのアクセスを制御し、異常行動を識別するDDPは、上記のようなシナリオを通じてセキュリティレベルの向上に貢献することができます。これは規制遵守を強化し、組織のデータセキュリティを強力に支援する重要な役割を担います。

今回は、CHEQUERが目指すCDPP(Cloud Data Protection Platform)を理解する上で欠かせない要素として作用する、データディスカバリー(Data Discovery)を活用したデータセキュリティについて概念的なお話をしました。次回はDDPの実際の動作やプロセスについてより詳しく紹介したいと思います。

次回も有益なトピックで伺います。次回も多くのご関心、ご支援をよろしくお願いします。