情報フロー観客ポートレートのデータ分析。理解できたら負け!

情報フロー観客ポートレートのデータ分析。理解できたら負け!

私は長い間広告の最適化を行っており、広告バックエンドで多くのオーディエンスポートレートを見てきました。一般的に言えば、広告データ分析と効果の最適化に対するそれらの参考価値は限られていますが、何もないよりはましです。

その理由は、多くの広告背景における視聴者ポートレートデータは、広告を見た人がどのような人であるかを示しているだけで、コンバージョンしたユーザーのポートレートデータが欠けているからです。主な理由は2つあります。

まず、ほとんどの広告プロセスでは、フロントエンドとバックエンドのデータが分離されています。つまり、メディアは、あなたが支払った広告を誰が見たかを知ることができますが、一般的に誰がコンバージョンしたかはわかりません。当事者Aは、独自のモニタリングを通じて、コンバージョンしたユーザーのどの部分を知ることができます。モニタリングが十分に行われていれば、この部分の人口プロファイルも知ることができます。ただし、人口プロファイルの判断基準はメディアの基準と異なる場合があり、統計の精度は一貫しておらず、データを手動で接続することはできません。

第二に、メディアはそれほど多くのデータを公開したがらず、視聴者のポートレート自体にも一定の問題がある。

現在、情報フローの最適化は業界でホットな話題となっています。創造性とターゲティングの最適化は当たり前になっていますが、オーディエンスポートレートのデータ分析についてはほとんど言及されていないため、まだ探求の余地があります。今日は、この機会を利用して、視聴者データ分析のアイデアを皆さんと共有したいと思います。

以下の広告データ分析には、メディアが提供するデータと当事者 A が監視するデータが真実かつ正確であると仮定するという基本的な前提があることを強調する必要があります。以下では、編集者が実際のケースとデータ( Toutiao 、ホーム改善カテゴリ)を使用して、ナイーブベイズアルゴリズムを使用してToutiaoのオーディエンスポートレートのデータマイニングと分析を実行し、正確なターゲティングの下で​​コンバージョン率の予測を実現する方法を紹介します。

1. ナイーブベイズの原理

ベイズの定理について話すたびに、私は心の中で畏敬の念を覚えます。それは、定理が非常に深遠だからではなく、特に有用だからです。この定理は、現実の生活でよく遭遇する問題を解決します。つまり、特定の条件付き確率が与えられた場合、2 つのイベントが交換される確率をどのように得るか、つまり、P(A|B) がわかっているときに P(B|A) をどのように得るかという問題を解決します。たとえば、コンバージョンしたユーザーのうち 36% が女性であることがわかっています。では、女性ユーザーが私の広告を見たときに、コンバージョンする確率はどれくらいでしょうか?

ここでまず条件付き確率とは何かを説明します。

P(A|B)は、イベントBがすでに発生しているという前提の下でイベントAが発生する確率を表します。これは、イベントBの発生下でのイベントAの条件付き確率と呼ばれます。基本的な解の式は次のとおりです。

ベイズの定理が役立つ理由は、私たちが人生でこのような問題によく遭遇するからです。P(A|B) は簡単に直接導出できますが、P(B|A) を直接導出するのは困難です。しかし、実際には P(B|A) の方が重要です。このとき、ベイズの定理は P(A|B) から P(B|A) を取得する方法を提供します。

以下では証明の過程を省略し、ベイズの定理を直接示します。高校の数学を覚えている友人なら、この式をよく知っているはずです。

2. ナイーブベイズのデータ​​マイニング原理

以下は、Naive Bayes のデータ マイニングの原理を紹介する簡単な例です。サンプルサイズは大きくありませんが、原則とアイデアを説明するには十分です。

これは、20 個の UV を表す合計 20 個のデータを含む、観客ポートレート データのセットです。このフォーム フィールドには値が 1 のエントリが 9 つあり、これは 9 人のユーザーが変換したことを意味します。

表1

次に、ID (単なる数字で、マイニングには価値がありません) と省地域 (すべて広東省なので、マイニングには価値がありません) を除く他のフィールドの割合の分布を図のように作成します。

表2

たとえば、X=(県級市="佛山", 性別="男性", 年齢="18-23歳", 興味カテゴリ="不動産")をターゲットにしたコンバージョン率を知りたいとします。つまり、P(フォームに記入="1" | X)を見つけたいとします。

直接計算することはできません。前述の Naive Bayes に戻りましょう。これは、この種の問題を解決するために特別に設計されています。必要なのは P(X | フォームに記入 = "1") だけです。式から P(フォームに記入 = "1" | X) を取得できます。

具体的な直接式は次のとおりです。

P(記入済みフォーム="1" | X) = P(X | 記入済みフォーム="1") * P(記入済みフォーム="1") / P(X)

同様に、

P(記入フォーム = "0" | X) = P(X | 記入フォーム = "0") * P(記入フォーム = "0") / P(X)

ここでもう 1 つの重要な式を導入する必要があります。P(A,B) は、イベント A と B が同時に発生する確率を表します。

イベントAとBが独立して発生する場合、P(A,B) = P(A|B) * P(B) = P(A)P(B)となります。

地級市、性別、年齢などのフィールド(または方向)の発生は互いに独立していると理解できるため、P(X | フォームに記入 = "1") = P(X) * P(フォームに記入 = "1")、および P(X | フォームに記入 = "1") = P(地級市 = "仏山"、性別 = "男性"、年齢 = "18〜23歳"、関心分野 = "不動産" | フォームに記入 = "1") = P(地級市 = "仏山" | フォームに記入 = "1") * P(性別 = "男性" | フォームに記入 = "1") * P(年齢 = "18〜23歳" | フォームに記入 = "1") * P(関心分野 = "不動産" | フォームに記入 = "1") となり、このとき、同様に直接取得不可能と思われる P(X | フォームに記入 = "1") は、5 つの一見単純なイベントの確率の積に分割されます。

特定の値を代入して計算します。

P(フォームに記入 = "1" | X) = P(X | フォームに記入 = "1") * P(フォームに記入 = "1") / P(X) = (3/9 * 6/9 * 2/9 * 1/9)*0.45 / P(X) = 0.002469 / P(X)…………………………………………①

P(フォームに記入 = "0" | X) = P(X | フォームに記入 = "0") * P(フォームに記入 = "0") / P(X) = (2/11 * 5/11 * 2/11 * 2/11) * 0.55 / P(X) = 0.0015026 / P(X)……………………………………………………②

次に、問題に遭遇します。P(X) が何であるかが分からないのです。しかし、それは問題ではありません。X をターゲットとするユーザーが来た場合、そのユーザーはコンバージョンするかしないかのどちらかになります。

P (フォームに記入 = "1" | X) + P (フォームに記入 = "0" | X) = 1……………………………………………………③

①②③を組み合わせると、次のようになります。

P(記入フォーム="1" | X) = 62.2%

P(記入フォーム = "0" | X) = 37.8%

したがって、方向が X の場合、Naive Bayes データ マイニング モデルでは、このタイプのユーザーのコンバージョン率は 62.2% であると考えられます。

3. ナイーブベイジアンデータマイニングの利点

ニューラル ネットワーク、決定木などの主流のデータ マイニング アルゴリズム。それらのほとんどは、表 1 に示すデータに依存しています。各フィールドはユーザーの異なる次元を表し、各行は独立したユーザーのデータを表します。しかし、実際の最適化プロセスでは、メディアがそのような詳細な視聴者のポートレートデータを提供することは不可能です。しかし、ナイーブベイズは異なります。元のデータに対する要件は少し低く、各ユーザーの状況を細分化することなく、さまざまな次元の組み合わせでの割合を提供するだけで済みます。

4. ナイーブベイズによるデータマイニングの事例研究

1) 生データと前処理

簡単な処理の後、Toutiao 広告バックエンドから取得したデータは次のようになります。

合計 13,339 回のクリックと 37 回のコンバージョン。

表3

2) フィールドの重要度を計算し、入力フィールドを決定する

すべてのフィールドはカテゴリ フィールド (数値フィールドではない) であるため、出力フィールドに対するすべての可能な入力フィールドの重要性を評価するための、より一般的なアルゴリズムがここにあります。

式は次のように解釈されます。

(注:ABS関数は絶対値を求めるために使用されます)

出力フィールドに対するすべての可能な入力フィールドの重要度は次のように計算されます。

一般的な経験則として、重要度が 0.1 未満のフィールドはデータ マイニング モデルに含めることはできません。

したがって、現時点では限られたデータに基づくと、「性別」フィールドは、ユーザーがコンバージョンするかどうかを判断するのにあまり役立ちません。そのため、次のデータマイニングモデルでは、入力フィールドには、都道府県レベルの都市、年齢、および興味の分類が含まれます。

データ マイニングを開始します。具体的な原則はここでは繰り返さず、結果を直接示します。

。 。 。 (途中は長すぎるので省略)

データマイニングにより、1への変換の最大確率は1.51%であり、このときの方向条件は「広州&(50歳以上)-母と子」であることがわかります。サンプルデータの全体的な変換率は 37/13339 = 0.28% です。

下の図は、1へのコンバージョンの確率分布です。約25%のデータが0.28%を超えていることがわかります。つまり、ナイーブベイズに基づくユーザーデータマイニングに基づいて、324の方向の組み合わせのうち約4分の1が、推定コンバージョン率が平均レベルの0.28%よりも高くなることがわかりました。データ量が増えるにつれてモデルは改善し続け、正確なターゲティングの組み合わせによるコンバージョン率予測のパフォーマンスがますます向上し、限られた広告コストを最もコンバージョンする可能性が高いユーザーに費やすことが可能になります。

次に、この洞察を広告に適用して、より高い ROI を生み出す方法を検討します。たとえば、ターゲットを絞ったクリエイティブの作成、入札額の引き上げなどです。皆さんはこの分野のベテランなので、ここでは詳細には触れません。

最後に、オーディエンス ポートレートのデータ マイニングでは、特定の条件を満たす必要があること、つまり、コンバージョンしたユーザーとコンバージョンしていないユーザーを区別できなければならないことを強調したいと思います。

上記は参考までに、Naive Bayes に基づくユーザー データ マイニングです。

この記事の著者は@互联网数据官であり、(青瓜传媒)によって編集および公開されています。転載する場合は著者情報と出典を明記してください。

製品プロモーションサービス:APPプロモーションサービス、情報フロー広告、広告プラットフォーム

<<:  この記事では、Keep の教科書的な運営戦略「ユーザーにプロモーションに協力してもらうにはどうすればいいか」をまとめています。

>>:  2020年安徽大学入学試験の得点ラインが発表されました 2020年安徽大学入学試験の得点ラインリスト

推薦する

大雪を有利に利用するブランド:デュレックスは3台続けて車を発売したが、デュラックスに敗れた

考え続ければ、反応はあるでしょう。当初、デュレックスは二十四節気の間に短いビデオだけを投稿すると思っ...

コミュニティ運営:コミュニティ活動のデータ分析モデル

本日お話しする主なポイントは、コミュニティ運営におけるグループトピックディスカッションでどのようにデ...

大規模および中規模の Web サイトで SEO 最適化を実行するにはどうすればよいでしょうか?

大規模・中規模ウェブサイトとは、百度インデックスのエントリ数が10万~100万以上、艾展網からの推定...

オンライン広告チャネルは数多くありますが、自分に合ったプラットフォームをどのように選択すればよいのでしょうか?

はじめに:この記事を読んだ友人の中には、わかりにくいと感じる人もいるかもしれませんが、困難を感じてこ...

BMW H5 をフィーチャーした広告が溢れかえった後、WeChat Moments 広告の効果についてお話ししましょう。

昨日はBMWのH5の広告が皆さんを魅了したと思います。このH5は「すぐに削除されました」というタイト...

女性はブルウィップを食べるとどう反応するでしょうか?女性が鞭を食べることのデメリット

通常、私の周りにはブルウィップを食べる女性はほとんどいません。ブルウィップは主に媚薬の役割を果たすた...

レッドプラネット&赤ちゃんのグループ2022 Douyin電子商取引の実践的な操作スキル

レッドプラネット&Aグループオブベイビーズ2022 Douyin eコマースの実践的な操作スキルリソ...

アプリのプロモーションに資金を費やす時代に、プロダクトマネージャーが持つべき4つの資質

モバイルインターネットとO2O産業の発展に伴い、さまざまな伝統的および新興のインターネット企業がユー...

IFBB スポーツ栄養 リン・ダオウェイ 炭水化物サイクリングダイエット

IFBB スポーツ栄養 リン・ダオウェイ 炭水化物サイクリングダイエット リソース紹介:コースカタロ...

曹宇肩トレーニング百度クラウドダウンロード

曹宇肩トレーニングリソース紹介:コースカタログ肩1.mp4肩2.mp4肩3.mp4肩4-5.mp4シ...

夫がいないとき、どのように対処しますか?夜一人で恥ずかしいことをするにはどうすればいいですか?

夫は一年中家にいません。男性がいないとどうやって耐えるのですか?もう耐えられない気がします。いつも夜...

Badou College AI実践チュートリアル - 就職に特化したコース 2021

Badou College AI実践チュートリアル - 就職に特化したコース 2021 リソース紹...

パーフェクトダイアリーの爆発的製品に対する方法論

Perfect Diary 、Hua Xizi、Cha Yan Yue Seなどのブランドは、モバイ...