マーケティング業務はデータに大きく依存しています。多種多様なマーケティング手法が開発され、アプリやプラットフォームなど異なるデータソースから膨大で多様なデータを収集できるようになったことからマーケターはそれらのデータを的確に管理することがこれまで以上に重要になっています。
AppierのチーフAIサイエンティストであるミン・スンは、「マーケターのデータ管理に関しては、主に3つの問題があります。1つ目は Garbage in, garbage out(ゴミからはゴミしか生まれない)を認識してデータを収集することです。データの品質を確認できたら2つ目は、データの有用性を検討し、どのようなデータに価値があるのか、どのデータセットを一緒に使うことができるのかと考えることです。最後に、強固なデータガバナンスを確保する必要があります。これらは、EUの一般データ保護規則(GDPR)、シンガポールの個人情報保護法(PDPA)など、司法権の枠組みを含む法的および企業の義務が含まれます」」と説明します。
「良い」データとは
データ品質にはいくつかの側面があります。ミン・スンによれば、データのエラーや一貫性のないノイズなどの問題は、巨大なデータセットの有用性や価値を著しく低下させるといいます。
しかし、さらに微妙な問題は、データが完全に正しい場合でも、選択基準の基礎となる前提条件が偏っていたり、歪んでいたりする場合があります。その結果、収集されたデータが、AIモデルに悪い結果をもたらすことがあります。 データの選択に多少のバイアスがあることは有用ですが、そのバイアスを認識し、理解することが重要です。
「そのバイアスが分かれば、機械学習やAIアルゴリズムへの影響を取り除くために、データのバイアスを解除することが可能です」とミン・スンは付け加えます。
また、データの収集時期の新しさ度、頻度、包括性もデータの質に影響します。新しいデータも古いデータも有用ですが、一般的にマーケターはより関連性の高い新しいデータを好むでしょう。しかし、トレンド分析や因果関係の把握のためには、古いデータと新しいデータの両方を持つことが有効な場合もあります。広範な時間軸が含まれるデータは、マーケターにとって強力な武器になるとミン・スンは言います。
マーケターが利用できるデータソース
マーケターは、多くのデータを入手できるため、どのデータが最も価値があり、どのように利用できるかを知ることが重要です。ほとんどの場合、データは大きく分けて、顧客のオンライン行動データとオフライン行動データの2つに分けられます。どちらも既存顧客を理解し、顧客に魅力的な提案をするためには同じように価値があります。
「現在ではマーケターは、ウェブサイトでの顧客の行動など、大量のオンラインデータにアクセスできるようになりました。例えば、顧客がどのような商品を購入したか、決済が完了したか、そして再訪問したかなどを知ることができます。しかし、オフラインのデータソースもあります。実店舗への来店、カスタマーセンターへの電話やCRMで管理されている情報なども含まれています」とミン・スンは説明します。
一般的に、オンラインデータから入手できるデータ量は膨大ですが、CRMやファイナンスアプリケーションなどから得られるオフラインデータは、顧客がどのように購入代金を支払ったかなどをマーケターが顧客行動を理解するのに役立ちます。これにより、クーポンや送料無料、クレジット払い、現金後払いなどの多様な支払い方法を利用できるオプションなど、好ましいインセンティブを提供するタイミングを知ることができ、販売を促進するモデルを開発することができます。
また、企業はAPIやその他のツールを利用して、ソーシャルメディアなどの他のソースから顧客にリーチし、自社のデータから抽出した知識を活用して、他のプラットフォームのオーディエンスとエンゲージすることができます。
「ファーストパーティーデータの力と、他のプラットフォームのAPIを通じて様々な種類の新規顧客を獲得するために学んだ知識を組み合わせるべきです」とミン・スンは付け加えます。
データをまとめる
データ主導のマーケティングプロセスは 適切なデータを見つけて収集することから始まります。次に乗り越えなければならないハードルは、様々なソースからのデータを統合し、効果的に利用できるようにすることです。そのためには、各ソースのデータに共通する要素を見つけ、顧客レコードを完全なものにし、重複しないようにする必要があります。そのための理想的な方法は、データを関連付けさせるための共通の識別子を見つけることです。
「最初のステップは、データの質を維持したままデータを集約することです。理想的には、あるソースからのデータポイントAと、別のソースからのデータポイントBを、簡単な識別子を見つけてマッチングすることです」とミン・スンは言います。 例えば、CRMデータでは、名前と携帯電話番号で誰かを特定することができます。そして、別のオンラインデータソースも携帯電話番号を持っているかもしれません。このような場合、携帯電話番号によって、同一人物のデータであることを特定できます。あるいは、異なるシステムから収集した2つの記録が同一人物のものであることを明確に判断するために、複数の属性の組み合わせが必要な場合もあります。
実際にはもっと複雑なことがあります。誤って、あるいは意図的に間違った数字を入力してしまうことがあります。また、あるシステムではフルネームを使い、別のシステムではペンネームや略称を使うこともあります。そのため、データを正しく集約する作業が非常に複雑になることがあります。
データを集約する際のもう一つの要素は、タイミングです。同一人物に関する2つのデータレコードが存在する場合、どちらが最新であるかを知ることは重要です。しかし、ミン・スンは、最新のレコードが必ずしも欲しいレコードではないことを理解することも重要だと指摘します。2つの記録がある場合、一方の記録が結果を示し、もう一方の記録が原因を反映している場合があります。このような場合には、両方の記録に価値があります。
また、カスタマーデータプラットフォーム(CDP)に取り込むデータが部分的なデータである可能性があり、選択基準によってはバイアスが生じることもあります。
「データを把握すれば、それをモデルに読み込ませ、どのデータが有用かを把握し、不足しているデータがあれば積極的に収集してモデルの改善することができます」とミン・スンは言います。
データガバナンスの重要性
データ管理における重要な要素は、ガバナンスです。データガバナンスには、内部ポリシー、プロセス、手順が含まれ、それらは司法権や法的枠組みによっても左右されます。
例えば、欧州連合(EU)のGDPRでは、自国民に関わるデータを保有する組織に対し、一連の具体的なガイドラインやルールに従うことを求めています。また、シンガポールのPDPAでは、情報の収集と使用に対する同意、データの使用方法の制限、保持の制限に関する具体的な規定があります。現在、多くの国では、データ損失の報告に関する具体的な法律が制定されています。オーストラリアにはデータ漏洩通知義務(NDB:Notifiable Data Breaches)規則があり、ニュージーランドは最近データプライバシー法を改正しました。
実際には、企業はどのようなデータが収集され、どのように使用されるのかを顧客に明確にし、データ削除のためのプロセスを用意し、強固な情報セキュリティを確保しなければなりません。これは、データガバナンスポリシーまたはフレームワークの中に含まれ、このプロセスを明確に示し、データガバナンスポリシーの様々な要素に対して誰が責任を持つかを明確にします。
データガバナンスは、単なる規則遵守ではありません。優れたデータガバナンスとは、データアーキテクチャからセキュリティ、データ保持までを含む適切なルールを適用し、可能な限り最高のデータ品質を維持するための適切な手順を確保することです。ガバナンスの観点からは、データのライフサイクルを考慮に入れることを意味します。
データが新たな石油であるならば、貴重な資源としてのデータを確実に収集し、精錬し、利用することがマーケターに課せられています。また、マーケティングデータが司法権上の義務に関して正しく管理されていることを確保することも重要です。データの収集、保存、管理、使用には代償が伴います。データは、マーケターが顧客を理解し、売上向上につながる魅力的な提案をするための能力となる有形の資産です。
*詳しくは当社のホワイトペーパーをご参照ください。
Appier のソリューションにご興味がありましたら、こちらからお問合せください。