情報フロー観客ポートレートのデータ分析。理解できたら負け!

情報フロー観客ポートレートのデータ分析。理解できたら負け!

私は長い間広告の最適化を行っており、広告バックエンドで多くのオーディエンスポートレートを見てきました。一般的に言えば、広告データ分析と効果の最適化に対するそれらの参考価値は限られていますが、何もないよりはましです。

その理由は、多くの広告背景における視聴者ポートレートデータは、広告を見た人がどのような人であるかを示しているだけで、コンバージョンしたユーザーのポートレートデータが欠けているからです。主な理由は2つあります。

まず、ほとんどの広告プロセスでは、フロントエンドとバックエンドのデータが分離されています。つまり、メディアは、あなたが支払った広告を誰が見たかを知ることができますが、一般的に誰がコンバージョンしたかはわかりません。当事者Aは、独自のモニタリングを通じて、コンバージョンしたユーザーのどの部分を知ることができます。モニタリングが十分に行われていれば、この部分の人口プロファイルも知ることができます。ただし、人口プロファイルの判断基準はメディアの基準と異なる場合があり、統計の精度は一貫しておらず、データを手動で接続することはできません。

第二に、メディアはそれほど多くのデータを公開したがらず、視聴者のポートレート自体にも一定の問題がある。

現在、情報フローの最適化は業界でホットな話題となっています。創造性とターゲティングの最適化は当たり前になっていますが、オーディエンスポートレートのデータ分析についてはほとんど言及されていないため、まだ探求の余地があります。今日は、この機会を利用して、視聴者データ分析のアイデアを皆さんと共有したいと思います。

以下の広告データ分析には、メディアが提供するデータと当事者 A が監視するデータが真実かつ正確であると仮定するという基本的な前提があることを強調する必要があります。以下では、編集者が実際のケースとデータ( Toutiao 、ホーム改善カテゴリ)を使用して、ナイーブベイズアルゴリズムを使用してToutiaoのオーディエンスポートレートのデータマイニングと分析を実行し、正確なターゲティングの下で​​コンバージョン率の予測を実現する方法を紹介します。

1. ナイーブベイズの原理

ベイズの定理について話すたびに、私は心の中で畏敬の念を覚えます。それは、定理が非常に深遠だからではなく、特に有用だからです。この定理は、現実の生活でよく遭遇する問題を解決します。つまり、特定の条件付き確率が与えられた場合、2 つのイベントが交換される確率をどのように得るか、つまり、P(A|B) がわかっているときに P(B|A) をどのように得るかという問題を解決します。たとえば、コンバージョンしたユーザーのうち 36% が女性であることがわかっています。では、女性ユーザーが私の広告を見たときに、コンバージョンする確率はどれくらいでしょうか?

ここでまず条件付き確率とは何かを説明します。

P(A|B)は、イベントBがすでに発生しているという前提の下でイベントAが発生する確率を表します。これは、イベントBの発生下でのイベントAの条件付き確率と呼ばれます。基本的な解の式は次のとおりです。

ベイズの定理が役立つ理由は、私たちが人生でこのような問題によく遭遇するからです。P(A|B) は簡単に直接導出できますが、P(B|A) を直接導出するのは困難です。しかし、実際には P(B|A) の方が重要です。このとき、ベイズの定理は P(A|B) から P(B|A) を取得する方法を提供します。

以下では証明の過程を省略し、ベイズの定理を直接示します。高校の数学を覚えている友人なら、この式をよく知っているはずです。

2. ナイーブベイズのデータ​​マイニング原理

以下は、Naive Bayes のデータ マイニングの原理を紹介する簡単な例です。サンプルサイズは大きくありませんが、原則とアイデアを説明するには十分です。

これは、20 個の UV を表す合計 20 個のデータを含む、観客ポートレート データのセットです。このフォーム フィールドには値が 1 のエントリが 9 つあり、これは 9 人のユーザーが変換したことを意味します。

表1

次に、ID (単なる数字で、マイニングには価値がありません) と省地域 (すべて広東省なので、マイニングには価値がありません) を除く他のフィールドの割合の分布を図のように作成します。

表2

たとえば、X=(県級市="佛山", 性別="男性", 年齢="18-23歳", 興味カテゴリ="不動産")をターゲットにしたコンバージョン率を知りたいとします。つまり、P(フォームに記入="1" | X)を見つけたいとします。

直接計算することはできません。前述の Naive Bayes に戻りましょう。これは、この種の問題を解決するために特別に設計されています。必要なのは P(X | フォームに記入 = "1") だけです。式から P(フォームに記入 = "1" | X) を取得できます。

具体的な直接式は次のとおりです。

P(記入済みフォーム="1" | X) = P(X | 記入済みフォーム="1") * P(記入済みフォーム="1") / P(X)

同様に、

P(記入フォーム = "0" | X) = P(X | 記入フォーム = "0") * P(記入フォーム = "0") / P(X)

ここでもう 1 つの重要な式を導入する必要があります。P(A,B) は、イベント A と B が同時に発生する確率を表します。

イベントAとBが独立して発生する場合、P(A,B) = P(A|B) * P(B) = P(A)P(B)となります。

地級市、性別、年齢などのフィールド(または方向)の発生は互いに独立していると理解できるため、P(X | フォームに記入 = "1") = P(X) * P(フォームに記入 = "1")、および P(X | フォームに記入 = "1") = P(地級市 = "仏山"、性別 = "男性"、年齢 = "18〜23歳"、関心分野 = "不動産" | フォームに記入 = "1") = P(地級市 = "仏山" | フォームに記入 = "1") * P(性別 = "男性" | フォームに記入 = "1") * P(年齢 = "18〜23歳" | フォームに記入 = "1") * P(関心分野 = "不動産" | フォームに記入 = "1") となり、このとき、同様に直接取得不可能と思われる P(X | フォームに記入 = "1") は、5 つの一見単純なイベントの確率の積に分割されます。

特定の値を代入して計算します。

P(フォームに記入 = "1" | X) = P(X | フォームに記入 = "1") * P(フォームに記入 = "1") / P(X) = (3/9 * 6/9 * 2/9 * 1/9)*0.45 / P(X) = 0.002469 / P(X)…………………………………………①

P(フォームに記入 = "0" | X) = P(X | フォームに記入 = "0") * P(フォームに記入 = "0") / P(X) = (2/11 * 5/11 * 2/11 * 2/11) * 0.55 / P(X) = 0.0015026 / P(X)……………………………………………………②

次に、問題に遭遇します。P(X) が何であるかが分からないのです。しかし、それは問題ではありません。X をターゲットとするユーザーが来た場合、そのユーザーはコンバージョンするかしないかのどちらかになります。

P (フォームに記入 = "1" | X) + P (フォームに記入 = "0" | X) = 1……………………………………………………③

①②③を組み合わせると、次のようになります。

P(記入フォーム="1" | X) = 62.2%

P(記入フォーム = "0" | X) = 37.8%

したがって、方向が X の場合、Naive Bayes データ マイニング モデルでは、このタイプのユーザーのコンバージョン率は 62.2% であると考えられます。

3. ナイーブベイジアンデータマイニングの利点

ニューラル ネットワーク、決定木などの主流のデータ マイニング アルゴリズム。それらのほとんどは、表 1 に示すデータに依存しています。各フィールドはユーザーの異なる次元を表し、各行は独立したユーザーのデータを表します。しかし、実際の最適化プロセスでは、メディアがそのような詳細な視聴者のポートレートデータを提供することは不可能です。しかし、ナイーブベイズは異なります。元のデータに対する要件は少し低く、各ユーザーの状況を細分化することなく、さまざまな次元の組み合わせでの割合を提供するだけで済みます。

4. ナイーブベイズによるデータマイニングの事例研究

1) 生データと前処理

簡単な処理の後、Toutiao 広告バックエンドから取得したデータは次のようになります。

合計 13,339 回のクリックと 37 回のコンバージョン。

表3

2) フィールドの重要度を計算し、入力フィールドを決定する

すべてのフィールドはカテゴリ フィールド (数値フィールドではない) であるため、出力フィールドに対するすべての可能な入力フィールドの重要性を評価するための、より一般的なアルゴリズムがここにあります。

式は次のように解釈されます。

(注:ABS関数は絶対値を求めるために使用されます)

出力フィールドに対するすべての可能な入力フィールドの重要度は次のように計算されます。

一般的な経験則として、重要度が 0.1 未満のフィールドはデータ マイニング モデルに含めることはできません。

したがって、現時点では限られたデータに基づくと、「性別」フィールドは、ユーザーがコンバージョンするかどうかを判断するのにあまり役立ちません。そのため、次のデータマイニングモデルでは、入力フィールドには、都道府県レベルの都市、年齢、および興味の分類が含まれます。

データ マイニングを開始します。具体的な原則はここでは繰り返さず、結果を直接示します。

。 。 。 (途中は長すぎるので省略)

データマイニングにより、1への変換の最大確率は1.51%であり、このときの方向条件は「広州&(50歳以上)-母と子」であることがわかります。サンプルデータの全体的な変換率は 37/13339 = 0.28% です。

下の図は、1へのコンバージョンの確率分布です。約25%のデータが0.28%を超えていることがわかります。つまり、ナイーブベイズに基づくユーザーデータマイニングに基づいて、324の方向の組み合わせのうち約4分の1が、推定コンバージョン率が平均レベルの0.28%よりも高くなることがわかりました。データ量が増えるにつれてモデルは改善し続け、正確なターゲティングの組み合わせによるコンバージョン率予測のパフォーマンスがますます向上し、限られた広告コストを最もコンバージョンする可能性が高いユーザーに費やすことが可能になります。

次に、この洞察を広告に適用して、より高い ROI を生み出す方法を検討します。たとえば、ターゲットを絞ったクリエイティブの作成、入札額の引き上げなどです。皆さんはこの分野のベテランなので、ここでは詳細には触れません。

最後に、オーディエンス ポートレートのデータ マイニングでは、特定の条件を満たす必要があること、つまり、コンバージョンしたユーザーとコンバージョンしていないユーザーを区別できなければならないことを強調したいと思います。

上記は参考までに、Naive Bayes に基づくユーザー データ マイニングです。

この記事の著者は@互联网数据官であり、(青瓜传媒)によって編集および公開されています。転載する場合は著者情報と出典を明記してください。

製品プロモーションサービス:APPプロモーションサービス、情報フロー広告、広告プラットフォーム

<<:  知乎情報フロー広告を評価する方法! (納品データ・資料添付)

>>:  中国科学院の学習専門家が、子供たちが学習を好きになるような優秀な生徒を育てる方法についての講座を教える

推薦する

春節の旅行ラッシュが始まりました。画面にあふれるこれらの広告のうち、どれが一番故郷を懐かしく感じますか?

ブランドが打ち出す新年広告を数多く目にしたことがあると思いますが、見回すと毎年新年ごとにさまざまな新...

12.12が近づいてきました。ウェディング写真業界の広告の秘密をぜひチェックしてください!

11.11の人気に続き、12.12プロモーションがやって来ます。ウェディング写真業界の広告主は、ど...

蘭州のWeChat食品配達ミニプログラムはどうやって収益を上げているのでしょうか? WeChatミニプログラムはどうやって収益を得るのでしょうか?

インターネットの継続的な発展に伴い、ネットユーザーの数も増えています。「食は国民の第一の必需品」であ...

オンライン教育のための成長活動促進マトリックス!

オンライン教育は2020年に急速に発展し、人気の花形産業ともいえるでしょう。オンライン教育の急速なマ...

APP はグロースハッキング手法をどのように活用して 400,000 の成長を達成できるでしょうか?

この記事では、グロースハッカーの方法論を使用し、データ主導の運用思考の原則に従って、家庭用家具アプリ...

プロモーションに多額の費用をかけたのに、まだ効果がない?読めば分かるよ

企業は、売り上げを増やし、より多くのお金を稼ぎ、人生の頂点に到達するためだけに自社製品を宣伝します。...

純粋に実践的な共有: 入札をマスターするのに役立つアカウント最適化の 2 つの戦略!

なぜデータ分析を行うのでしょうか?変換用。アカウントを最適化するのはなぜですか?変換用。そこで、今日...

2018年初秋のポスターコレクション!

雲や空は夏の色を失い、木の葉は秋の音を立ててざわめきます。「秋」は暑さが去り涼しさが訪れ、すべてが澄...

初心者がTik Tokライブ配信をするための5つのポイント!

4月15日、「海外客室乗務員リンエル」は4時間の生放送を行い、売上は643.2w、生放送売上は60...

sxy Xiaoyueの乳房健康治療システムの高度な実践指導

sxy Xiaoyueの乳房リハビリテーションシステムの高度な実践教育リソースの紹介: 「乳房リハビ...

役立つ情報丨ランディングページの最適化スキルを習得するのに役立つ 7 つの画像

ランディングページとは何ですか?ガイドラインは何ですか? 7枚の絵で答えてください! この記事の著者...

「みんなが鄭勝利に不満を言う」というTmallライブ放送は、90分で1億件以上の注文を生み出しました!

最近、マーケティング界ではペチョインの広告と販売転換の問題について議論されています。一方ではブランド...

広告を「配信」から「放送」に変えるにはどうすればよいでしょうか?

最近、華山先生の「スーパーシンボルはスーパークリエイティビティ」を取り出して、もう一度読みました。こ...

Baiduの広告プランがすべてここにあります!

友人たちはまだ百度情報フロー広告について尋ね続けています。アカウントの設定方法は?創造的なアイデアを...

APPプロモーションに必読!「国内携帯電話市場の中間レビュー」の簡易版。役立つポイントをまとめました!

このレポートのデータは、 Jiguang Big Data の「2017 Q2 モバイルデータレポー...