情報フロー観客ポートレートのデータ分析。理解できたら負け！

私は長い間広告の最適化を行っており、広告バックエンドで多くのオーディエンスポートレートを見てきました。一般的に言えば、広告データ分析と効果の最適化に対するそれらの参考価値は限られていますが、何もないよりはましです。

その理由は、多くの広告背景における視聴者ポートレートデータは、広告を見た人がどのような人であるかを示しているだけで、コンバージョンしたユーザーのポートレートデータが欠けているからです。主な理由は2つあります。

まず、ほとんどの広告プロセスでは、フロントエンドとバックエンドのデータが分離されています。つまり、メディアは、あなたが支払った広告を誰が見たかを知ることができますが、一般的に誰がコンバージョンしたかはわかりません。当事者Aは、独自のモニタリングを通じて、コンバージョンしたユーザーのどの部分を知ることができます。モニタリングが十分に行われていれば、この部分の人口プロファイルも知ることができます。ただし、人口プロファイルの判断基準はメディアの基準と異なる場合があり、統計の精度は一貫しておらず、データを手動で接続することはできません。

第二に、メディアはそれほど多くのデータを公開したがらず、視聴者のポートレート自体にも一定の問題がある。

現在、情報フローの最適化は業界でホットな話題となっています。創造性とターゲティングの最適化は当たり前になっていますが、オーディエンスポートレートのデータ分析についてはほとんど言及されていないため、まだ探求の余地があります。今日は、この機会を利用して、視聴者データ分析のアイデアを皆さんと共有したいと思います。

以下の広告データ分析には、メディアが提供するデータと当事者 A が監視するデータが真実かつ正確であると仮定するという基本的な前提があることを強調する必要があります。以下では、編集者が実際のケースとデータ（ Toutiao 、ホーム改善カテゴリ）を使用して、ナイーブベイズアルゴリズムを使用してToutiaoのオーディエンスポートレートのデータマイニングと分析を実行し、正確なターゲティングの下でコンバージョン率の予測を実現する方法を紹介します。

1. ナイーブベイズの原理

ベイズの定理について話すたびに、私は心の中で畏敬の念を覚えます。それは、定理が非常に深遠だからではなく、特に有用だからです。この定理は、現実の生活でよく遭遇する問題を解決します。つまり、特定の条件付き確率が与えられた場合、2 つのイベントが交換される確率をどのように得るか、つまり、P(A|B) がわかっているときに P(B|A) をどのように得るかという問題を解決します。たとえば、コンバージョンしたユーザーのうち 36% が女性であることがわかっています。では、女性ユーザーが私の広告を見たときに、コンバージョンする確率はどれくらいでしょうか?

ここでまず条件付き確率とは何かを説明します。

P(A|B)は、イベントBがすでに発生しているという前提の下でイベントAが発生する確率を表します。これは、イベントBの発生下でのイベントAの条件付き確率と呼ばれます。基本的な解の式は次のとおりです。

以下では証明の過程を省略し、ベイズの定理を直接示します。高校の数学を覚えている友人なら、この式をよく知っているはずです。

2. ナイーブベイズのデータマイニング原理

以下は、Naive Bayes のデータマイニングの原理を紹介する簡単な例です。サンプルサイズは大きくありませんが、原則とアイデアを説明するには十分です。

これは、20 個の UV を表す合計 20 個のデータを含む、観客ポートレートデータのセットです。このフォームフィールドには値が 1 のエントリが 9 つあり、これは 9 人のユーザーが変換したことを意味します。

表1

次に、ID (単なる数字で、マイニングには価値がありません) と省地域 (すべて広東省なので、マイニングには価値がありません) を除く他のフィールドの割合の分布を図のように作成します。

表2

たとえば、X=(県級市="佛山", 性別="男性", 年齢="18-23歳", 興味カテゴリ="不動産")をターゲットにしたコンバージョン率を知りたいとします。つまり、P(フォームに記入="1" | X)を見つけたいとします。

直接計算することはできません。前述の Naive Bayes に戻りましょう。これは、この種の問題を解決するために特別に設計されています。必要なのは P(X | フォームに記入 = "1") だけです。式から P(フォームに記入 = "1" | X) を取得できます。

具体的な直接式は次のとおりです。

P(記入済みフォーム="1" | X) = P(X | 記入済みフォーム="1") * P(記入済みフォーム="1") / P(X)

同様に、

P(記入フォーム = "0" | X) = P(X | 記入フォーム = "0") * P(記入フォーム = "0") / P(X)

ここでもう 1 つの重要な式を導入する必要があります。P(A,B) は、イベント A と B が同時に発生する確率を表します。

イベントAとBが独立して発生する場合、P(A,B) = P(A|B) * P(B) = P(A)P(B)となります。

地級市、性別、年齢などのフィールド（または方向）の発生は互いに独立していると理解できるため、P(X | フォームに記入 = "1") = P(X) * P(フォームに記入 = "1")、および P(X | フォームに記入 = "1") = P(地級市 = "仏山"、性別 = "男性"、年齢 = "18〜23歳"、関心分野 = "不動産" | フォームに記入 = "1") = P(地級市 = "仏山" | フォームに記入 = "1") * P(性別 = "男性" | フォームに記入 = "1") * P(年齢 = "18〜23歳" | フォームに記入 = "1") * P(関心分野 = "不動産" | フォームに記入 = "1") となり、このとき、同様に直接取得不可能と思われる P(X | フォームに記入 = "1") は、5 つの一見単純なイベントの確率の積に分割されます。

特定の値を代入して計算します。

P(フォームに記入 = "1" | X) = P(X | フォームに記入 = "1") * P(フォームに記入 = "1") / P(X) = (3/9 * 6/9 * 2/9 * 1/9)*0.45 / P(X) = 0.002469 / P(X)…………………………………………①

P(フォームに記入 = "0" | X) = P(X | フォームに記入 = "0") * P(フォームに記入 = "0") / P(X) = (2/11 * 5/11 * 2/11 * 2/11) * 0.55 / P(X) = 0.0015026 / P(X)……………………………………………………②

次に、問題に遭遇します。P(X) が何であるかが分からないのです。しかし、それは問題ではありません。X をターゲットとするユーザーが来た場合、そのユーザーはコンバージョンするかしないかのどちらかになります。

P (フォームに記入 = "1" | X) + P (フォームに記入 = "0" | X) = 1……………………………………………………③

①②③を組み合わせると、次のようになります。

P(記入フォーム="1" | X) = 62.2%

P(記入フォーム = "0" | X) = 37.8%

したがって、方向が X の場合、Naive Bayes データマイニングモデルでは、このタイプのユーザーのコンバージョン率は 62.2% であると考えられます。

3. ナイーブベイジアンデータマイニングの利点

ニューラルネットワーク、決定木などの主流のデータマイニングアルゴリズム。それらのほとんどは、表 1 に示すデータに依存しています。各フィールドはユーザーの異なる次元を表し、各行は独立したユーザーのデータを表します。しかし、実際の最適化プロセスでは、メディアがそのような詳細な視聴者のポートレートデータを提供することは不可能です。しかし、ナイーブベイズは異なります。元のデータに対する要件は少し低く、各ユーザーの状況を細分化することなく、さまざまな次元の組み合わせでの割合を提供するだけで済みます。

4. ナイーブベイズによるデータマイニングの事例研究

1) 生データと前処理

簡単な処理の後、Toutiao 広告バックエンドから取得したデータは次のようになります。

合計 13,339 回のクリックと 37 回のコンバージョン。

表3

2) フィールドの重要度を計算し、入力フィールドを決定する

すべてのフィールドはカテゴリフィールド (数値フィールドではない) であるため、出力フィールドに対するすべての可能な入力フィールドの重要性を評価するための、より一般的なアルゴリズムがここにあります。

式は次のように解釈されます。

（注：ABS関数は絶対値を求めるために使用されます）

出力フィールドに対するすべての可能な入力フィールドの重要度は次のように計算されます。

一般的な経験則として、重要度が 0.1 未満のフィールドはデータマイニングモデルに含めることはできません。

したがって、現時点では限られたデータに基づくと、「性別」フィールドは、ユーザーがコンバージョンするかどうかを判断するのにあまり役立ちません。そのため、次のデータマイニングモデルでは、入力フィールドには、都道府県レベルの都市、年齢、および興味の分類が含まれます。

データマイニングを開始します。具体的な原則はここでは繰り返さず、結果を直接示します。

。。。（途中は長すぎるので省略）

データマイニングにより、1への変換の最大確率は1.51％であり、このときの方向条件は「広州＆（50歳以上）-母と子」であることがわかります。サンプルデータの全体的な変換率は 37/13339 = 0.28% です。

下の図は、1へのコンバージョンの確率分布です。約25％のデータが0.28％を超えていることがわかります。つまり、ナイーブベイズに基づくユーザーデータマイニングに基づいて、324の方向の組み合わせのうち約4分の1が、推定コンバージョン率が平均レベルの0.28％よりも高くなることがわかりました。データ量が増えるにつれてモデルは改善し続け、正確なターゲティングの組み合わせによるコンバージョン率予測のパフォーマンスがますます向上し、限られた広告コストを最もコンバージョンする可能性が高いユーザーに費やすことが可能になります。

次に、この洞察を広告に適用して、より高い ROI を生み出す方法を検討します。たとえば、ターゲットを絞ったクリエイティブの作成、入札額の引き上げなどです。皆さんはこの分野のベテランなので、ここでは詳細には触れません。

最後に、オーディエンスポートレートのデータマイニングでは、特定の条件を満たす必要があること、つまり、コンバージョンしたユーザーとコンバージョンしていないユーザーを区別できなければならないことを強調したいと思います。

上記は参考までに、Naive Bayes に基づくユーザーデータマイニングです。

この記事の著者は@互联网数据官であり、(青瓜传媒)によって編集および公開されています。転載する場合は著者情報と出典を明記してください。

製品プロモーションサービス：APPプロモーションサービス、情報フロー広告、広告プラットフォーム

<<: この記事では、Keep の教科書的な運営戦略「ユーザーにプロモーションに協力してもらうにはどうすればいいか」をまとめています。

>>: 2020年安徽大学入学試験の得点ラインが発表されました 2020年安徽大学入学試験の得点ラインリスト

情報フロー観客ポートレートのデータ分析。理解できたら負け！

面接で高得点を取るための実践的なスキル

TikTokで海外ライブストリーミング機能を有効にするにはどうすればいいですか？ TikTokで海外ライブ配信を始める方法

酒泉最適化ウェブサイトプロモーション、2020年の企業ウェブサイトSEO最適化ではどのような点に注意すべきでしょうか？

プライベートドメイン運営者向け上級チェックリスト

お金をかけずに活動を運営・推進するには？

Baidu のドロップダウンボックスと関連検索の否定的な情報を削除するにはどうすればよいですか?会社のネガティブな側面にどう対処すればいいのでしょうか?

武漢のお茶を飲むSNお茶友達がお茶の試飲をシェアすることを勧める健康高級クラブ

小紅書アカウントの重量と紙幣フロー制限の解決策！

Baidu プロモーション情報フロー広告表示スタイル - フィードギャラリー

核分裂ポスターのデザイン手法を分析した9,000語の記事！

推薦する

詳しい例の解説：ダウンロードコンバージョン率を一気に上げるスクリーンショットデザインテクニック10選！

大雪を有利に利用するブランド：デュレックスは3台続けて車を発売したが、デュラックスに敗れた

コミュニティ運営：コミュニティ活動のデータ分析モデル

大規模および中規模の Web サイトで SEO 最適化を実行するにはどうすればよいでしょうか?

オンライン広告チャネルは数多くありますが、自分に合ったプラットフォームをどのように選択すればよいのでしょうか?

BMW H5 をフィーチャーした広告が溢れかえった後、WeChat Moments 広告の効果についてお話ししましょう。

女性はブルウィップを食べるとどう反応するでしょうか？女性が鞭を食べることのデメリット

レッドプラネット＆赤ちゃんのグループ2022 Douyin電子商取引の実践的な操作スキル

アプリのプロモーションに資金を費やす時代に、プロダクトマネージャーが持つべき4つの資質

IFBB スポーツ栄養リン・ダオウェイ炭水化物サイクリングダイエット

【安定ハングアップ】World of Warcraft 完全自動ハングアップレンガ移動プロジェクト、1 つの数字で 1 日あたり 50 以上稼ぐ [完全自動スクリプト]

曹宇肩トレーニング百度クラウドダウンロード

夫がいないとき、どのように対処しますか?夜一人で恥ずかしいことをするにはどうすればいいですか？

Badou College AI実践チュートリアル - 就職に特化したコース 2021

パーフェクトダイアリーの爆発的製品に対する方法論