0から1まで、ユーザーポートレートシステムを構築するには?

0から1まで、ユーザーポートレートシステムを構築するには?

この記事では、データ製品レベルから始めて、ユーザー ポートレートシステムを 0 から 1 まで構築する方法を分析します。主に、ビジネス ニーズ分析、ラベル システム構築、ポートレート システム構築、ポートレート アプリケーションという 4 つのステップで構成されており、皆様の参考と学習に役立ちます。

PCからモバイルインターネットまで、トラフィック配当を活用した一連のインターネット製品が急速に台頭してきました。しかし今、トラフィック配当は消え、狂気じみた伝説的なトラフィック時代は終わりました。既存市場における漸進的な成長の欠如と競争の激化により、オペレーションの洗練が進みました。ビッグデータを組み合わせることで、ユーザーがグループ化され、ユーザーグループごとに異なるマーケティング戦略が採用されています。

兵法書には、「己を知り、敵を知れば、百戦しても負けることはない」とあります。洗練された作戦の全過程において、ユーザー ポートレート システムの構築は不可欠な役割を果たします。先ほど、ポイントデータ収集、指標システム構築、データウェアハウス、OLAP分析など、データインフラストラクチャ層の構築について紹介しました。次に、ユーザーポートレートシステムを0から1まで構築する方法と、ユーザーポートレートの応用シナリオについて学びましょう。

ユーザー ポートレートの概念は、インタラクティブ デザインの父であるアラン クーパーによって初めて提案されました。これは、製品またはサービスの対象グループの特徴的な描写です。

ユーザーデータのソースが少なく、データ量も比較的少なかった初期の頃は、ユーザーポートレートの研究は主に統計分析に基づいており、ユーザーポートレートのラベルはユーザー調査を通じて構築されていました。

その後、カリフォルニア大学のSyskill氏とWebert氏は、ウェブサイトのユーザーのページに対する満足度を手動で収集し、統計分析を通じて徐々にユーザーの関心モデルを構築しました。

インターネットと情報収集技術の発展に伴い、カリフォルニア経営大学は、データ収集装置を通じてインターネット上のユーザーのさまざまな閲覧行動や興味嗜好を記録し、ユーザーの興味モデルを構築し、データが蓄積されるにつれてシステムモデルを拡張・更新し、ユーザーのポートレートラベルがより豊かになるWeb Watcherを開発しました。

近年、インターネット上の膨大なデータの爆発的な増加に伴い、多くの企業にユーザーポートレート研究の新たな機会がもたらされています。ユーザーの属性、行動、興味、趣味などのデータラベルに基づいて、アルゴリズムを使用して特徴を分析およびモデル化し、それによってユーザーの全体像を抽象化することが、製品担当者の焦点となっています。

例えば、ルフィの場合、彼のユーザーポートレートは、18〜25歳、資産15億、肉とかっこいいロボットが大好き、衝動的な消費者である中学生と簡単に説明できます。電子商取引サイトが事前にユーザーの情報を知っていれば、ユーザーの好みの特性に基づいて肉やハイテク製品をプッシュし、ルフィがプラットフォームで購入を完了するように促進できます。

このプロセスでは、ユーザー ポートレートを記述するために使用される重要な要素はラベルです。通常、ラベルの分類はアプリケーション シナリオによって異なります。

たとえば、Tencent Advertising はタグを次のように分類します。

  • 人口統計ラベル: 性別、年齢、居住地、教育、婚姻状況、資産、仕事の状況など。
  • 興味タグ: ビジネス興味、一般的なエンターテイメント興味、意味的興味など。
  • デバイス タグ: デバイスのブランド、オペレーター、ネットワーク方法、モデル、オペレーティング システムなど。
  • 行動タグ: 人々の職場、移動頻度、電子商取引ショッピング、O2O、ゲームやその他のアプリケーション固有の行動、インタラクティブな行動、支払い行動など。

Alibaba eコマースのラベルの分類によれば、次のように分類できます。

  • ユーザー属性タグ: 性別、年齢、地域、登録日、携帯電話のブランド、携帯電話のシステム、連絡先情報、過去の購入状況、ユーザーアクティビティ、RFM 値。
  • ユーザー行動タグ: 過去 30 日間の訪問回数、過去 30 日間の平均注文額、過去 30 日間のアクティブ日数、過去 30 日間の訪問期間、平均訪問深度、リチャージ ユーザーなど。
  • 消費タグ: 収入状況、購買力レベル、購入品目、購入チャネルの好み、最終購入時間、購入頻度。
  • 製品カテゴリタグ: ハイヒール、ブーツ、シャツ、フレンチドレス、ミートジャーキー、ビーフジャーキー、掃除ロボット、スマートスピーカーなど。
  • ソーシャル タグ: 頻繁にアクティブな時間帯、アクティブな場所、シングル、レビュー数、肯定的なレビューの度合いなど。

ポートレートシステム全体には、ラベルモデリング、ポートレートシステム、ポートレートアプリケーションが含まれます。では、データ製品の観点から、0から1までのユーザーポートレートシステムをどのように構築すればよいのでしょうか。次に、次の構造に従って展開します。

  1. ビジネスニーズ分析
  2. ラベリングシステムの構築
  3. ポートレートシステムの構築
  4. ポートレートアプリケーション

ユーザー ポートレート システムの構築は、何もないところから生み出せるものではありません。経済発展を中心に据え、実際のビジネス ニーズに基づいてポートレート システムがビジネスにもたらす価値を考慮する必要があります。そのため、まずはビジネス ニーズを分析する必要があります。

製品、ユーザー操作、イベント操作、マーケティング、リスク管理などの部門など、企業内でユーザーポートレートが果たす役割を明確にし、ビジネス側のニーズに基づいて、ユーザーポートレート分析後の将来の製品構築目標と期待される結果を明確にします。

会社全体に関して言えば、彼の目標はプラットフォーム全体の収益を増やすことです。その過程で、彼は製品、運営、データ分析、マーケティング、顧客サービスなどの同僚を駆り立て、協力して業務を遂行し、会社の収益を増やす方法にもっと注意を払います。

オペレーターのナミの目標は、コンバージョン率の向上です。その過程で、パーソナライズされたコンテンツのプッシュと正確なユーザーリーチの戦略を採用し、ポートレートはユーザーの個人的な行動の好みにさらに注意を払います。

データ アナリストのロビンの目標は、ユーザーの離脱を警告し、ターゲットを絞った精密マーケティングを実施することです。そのためには、ユーザーの行動特性と消費者の好みを分析する必要があります。

需要分析フェーズでは、ビジネスプロセス、各部門の中心的な懸念事項、部門 KPI、組織構造、ユーザー行動パス、機能フローチャートなどを分析する必要があります。ここでの分析プロセスは、追跡ビジネス需要分析と同様です。詳細については、追跡ビジネス需要分析を参照してください。ここでは詳しく説明しません。

データ製品構築のためのラベルシステムの観点から見ると、ラベルは、ラベルの統計的手法に応じて、統計ラベル、ルールラベル、予測ラベルの 3 つのカテゴリに分類できます。

ユーザーポートレートは最も基本的で一般的なタグです。統計タグ値は、ユーザーに関連する値をカウントし、ユーザーの状態を客観的に説明するタグです。このタイプのデータは通常、ユーザー登録データ、ユーザーアクセス、消費統計から取得できます。

たとえば、ユーザーの場合、性別、年齢、都市、星座、過去 7 日間のアクティブ日数、過去 7 日間のアクティブ回数、累計購入金額、累計購入回数、月平均消費金額などのフィールドがあります。

ユーザーの行動と決められたルールに基づいて生成され、実際のポートレート開発プロセスでは、アクティビティタグ、RFMタグなど、ビジネスニーズに応じて運用担当者とデータ担当者が共同で策定します。たとえば、プラットフォーム上の「アクティブな取引」の定義は、「過去 90 日間の取引数 > 3」です。

次に、ユーザーアクティビティタグとRFMタグの分割方法としてよく使われる方法を紹介します。

(1)ユーザーアクティビティタグ

実際のビジネス シナリオでは、ユーザーはアクティビティに基づいて、非常にアクティブ、中程度にアクティブ、低アクティブ、または失われたとラベル付けされる場合があります。

では、このプロセスでは高、中、低の時間範囲はどのように分割されるのでしょうか?

ここでは、ルフィの衝動的な決断はうまくいきません。ラベルの構築には、定義に基礎と方法が必要です

まず、ユーザーの離脱サイクルを分割します。通常は 2 つの方法があります。

1 つ目は変曲点理論です。X 軸の値の増加は、Y 軸の値の大幅な増加 (減少) をもたらしますが、ある点を超えると、X が増加すると、Y のデータの増加 (減少) が大幅に低下します。つまり、経済学における限界利益が大幅に減少し、その点がグラフの「変曲点」になります。

例えば、図の離脱周期が5週間に伸びると、ユーザー再訪率の低下率が大幅に低下するため、この5週間が転換点となります。ユーザー離脱を定義する期間として5週間を使用することができます。つまり、以前に訪問/ログインしたユーザーが5週間連続で訪問/ログインしなかった場合、そのユーザーは離脱したと定義されます。

2 つ目は、ユーザーの最後の訪問と最後から 2 番目の訪問の間の時間間隔をカウントすることです。時間間隔がこれより大きいユーザーは基本的に再訪問しない、つまり失われたと想定できます。履歴データを見ると、最後の訪問から 2 番目までの訪問までの期間が 30 日を超えるユーザーは 10% 未満であることがわかります。これよりも期間が長いユーザーは「失われたユーザー」とみなすことができます。

解約サイクルを分割した後、ユーザーはアクティビティ レベルに応じてさらに高、中、低のアクティビティに分類されます。履歴データは 80/20 の原則に従って分割されます。

たとえば、分析の結果、10 回以上アクティブであるユーザーが過去 30 日間にアクセスしたユーザー総数の 20% を占める場合、このグループは「非常にアクティブなユーザー」、5 ~ 10 回アクティブであるユーザーはさらに「中程度のアクティブなユーザー」、1 ~ 5 回アクティブであるユーザーは「あまりアクティブでないユーザー」に分類されます。

(2)RFMタグ

RFM モデルは、主に、最新の消費時間、消費頻度、消費量という 3 つの基本指標で構成されています。履歴データに基づいてユーザーの割合を確認し、80/20 の原則に従って分割してセグメンテーション ラベルを取得できます。

  • R: 履歴データ内のユーザーの 80% が 60 日以内にサイトにアクセスした場合、そのデータは「最近」とみなされます。ユーザーが 60 日以上前にサイトにアクセスした場合、そのデータは「遠い」とみなされます。
  • F: 過去の取引注文量の 80% を占めるユーザーの注文量が 5 件未満の場合は「低頻度」、5 件以上の場合は「高頻度」とみなされます。
  • M: 例えば、過去の取引注文金額の80%の取引金額が500元未満の場合、「低額」とみなされ、取引金額が500元以上の場合は、「高額」とみなされます。

ユーザーの属性、行動、場所、特徴に基づいて、決定木アルゴリズム、回帰アルゴリズムなどを使用して、ユーザーの関連機能と潜在的なニーズを掘り起こします。これらの潜在的なニーズに基づいて、ユーザーにラベルを付け、さまざまなマーケティング戦略でプッシュします。

たとえば、ユーザーの消費習慣に基づいて製品に対するユーザーの好みを判断できます。また、否定的なレビューを返すなどのユーザーの行動に基づいて、リスク レベルを予測できます。

一般的に、統計タグとルールタグはアプリケーションの要件を満たすことができ、開発プロセスの大部分を占めます。機械学習マイニングラベルは、ユーザーのリスク、ユーザーの購入嗜好、ユーザーの解約意図などの判断などの予測シナリオで主に使用され、開発サイクルが長く、開発コストが高くなります。

例えば、Toutiaoにはデータ製品のトピックに関連する記事や投稿などのテキストデータが大量に蓄積されていますが、歴史的な理由により、これらの記事は適切に分類およびラベル付けされておらず、コンテンツの管理が困難になっています。次に、投稿に適切なハッシュタグを付ける必要があります。

まず、すでに定義されている記事の種類に従って、分類された記事が対応する種類に自動的に分割されます。

2 つ目は、記事の集中管理をサポートし、記事の内容に基づいて、各記事にそのトピックに関連するタグを自動的に付与します。

(1)機能選択と開発プロセス

データ分類: トレーニング セットのサンプルとしてドキュメントのバッチに手動で正確に注釈を付け、注釈のないドキュメントのバッチをテスト セットとして作成します。

データ前処理: テスト セットとトレーニング セットのテキストに対して単語のセグメンテーションを実行し、語彙ライブラリを構築し、ストップワードやモーダル助詞などを削除します。

ナイーブベイズ分類: 精度、再現率、F 値に基づいて記事を分類する

(2)ラベル重量を計算する

プラットフォーム上のユーザーのさまざまな行動は、ユーザー タグ レベルではさまざまな重みを持ちます。たとえば、ユーザーによる製品の購入の重みは、ユーザーが製品をショッピング カートに追加したり、製品を収集したり、製品を閲覧したりすることの重みよりも高くなります。

ラベル策定プロセスでは、ユーザー ポートレート モデラーとビジネス担当者が緊密にコミュニケーションを取り、ビジネス シナリオに基づいてさまざまな動作タイプと重みを策定する必要があります。重みを決定するために一般的に使用される方法には、TF-IDF 単語空間ベクトルと時間減衰係数が含まれます。

1) TF-IDF単語空間ベクトル

TF-IDF は、ドキュメント セットまたはコーパス内の他の単語と比較した単語または用語の重要性を評価するために使用される統計手法です。単語の重要度は、ドキュメント セット内での出現回数に正比例し、コーパス内での出現回数に反比例します。

2) 時間減衰係数

ユーザーデータが十分に高密度のレベルに達すると、ユーザーのラベルに対応する属性は高い安定性を示し、ユーザーの長期的な行動によって形成された個人特性と一致します。

ユーザーラベルの重み = 行動タイプの重み * 時間減衰 * ユーザー行動の数 * TF-IDF で計算されたラベルの重み

サポートシステムとしてのポートレートシステムの主な対象ユーザーは、マーケティング、オペレーション、製品、データアナリストなどの担当者であり、ユーザー分析、タグクエリ、マーケティング活動のドッキングなどのニーズを満たします。したがって、ポートレート システムの設計では、機能的なユーザー分析要件と非機能的なインターフェイス開発要件を考慮する必要があります。

機能的には、ホームページのポートレートデータ、タグ管理、ユーザークエリ、ユーザーグループ化などに分けられます。

  • ホームページのポートレートデータには、性別、年齢、地域、職業分布などの基本的なユーザー特性、ユーザーアクティビティ、メンバーシップレベル、解約警告、ユーザー価値 RFM 分布などのユーザー価値特性など、ユーザーデータの全体的な状況が表示されます。
  • ラベル管理により、データ担当者は、ラベルの分類、新しいラベルの作成、ラベルのレビュー、ラベルのオフライン、異常なラベルなど、ラベルを追加、削除、変更、照会できます。
  • ユーザークエリの主な機能には、ユーザーIDを入力することで、ユーザーの基本情報、ユーザー属性情報、ユーザーの行動などのユーザーポートレートやその他の詳細データを表示することが含まれます。
  • ユーザーのグループ化、アプリケーション シナリオが主にタグのビジネス用途である場合、プッシュに使用されるタグは 1 つだけではありません。ほとんどの場合、クラウドのビジネス定義を満たすには、複数のタグを組み合わせる必要があります。ユーザーのグループ化は、クラウド テンプレートを作成し、さまざまなシナリオでクラウドをプッシュすることと同じです。

グループを追加するときは、通常、グループ名、満たす必要のある条件を設定し、対象となる人数を計算し、メッセージ通知、電子メール、テキスト メッセージにプッシュします。

非機能要件には主にインターフェース要件が含まれ、これにより、ポートレートシステムのデータがプッシュシステム、マーケティングシステム、広告システム、推奨システム、BI プラットフォームなどのさまざまなシステムと接続され、各システムのデータがリアルタイムで更新され、同じソースからの異なる数値の問題が回避されることが保証されます。

ラベルシステムとユーザーポートレートシステムが構築されたので、ユーザーポートレートはどこでどのように活用され、ビジネスにどのような価値をもたらすのでしょうか。

広告、電子商取引などの分野では、ユーザーポートレートは精密マーケティングや推奨システムの基礎としてよく使用されます。主な応用シナリオには、精密マーケティング、ユーザー分析、パーソナライズされた推奨の 3 つのカテゴリが含まれます。

オペレーターは、過去のユーザー特性に基づいて、製品の潜在的なユーザーと関連するニーズを分析し、特定のグループ向けにパーソナライズされたマーケティング サービスを提供できます。一般的に使用されるサービスには、SMS、電子メール、サイト内メッセージ、プッシュメッセージによる正確なプッシュ通知、ユーザー向けのカスタマーサービスのさまざまなスクリプト、高価値ユーザー向けの迅速な返金や返品などの VIP サービスなどがあります。

SMS/メール/プッシュマーケティング

日常生活では、複数のチャネルからマーケティング情報を受け取ります。赤い封筒の到着に関するテキストメッセージのプッシュは、ユーザーが長い間アクセスしていなかったアプリを開くように促す可能性があります。ウィッシュリストの値下げに関するメッセージは、ユーザーがプッシュリンクを開いて直接購入するきっかけとなる可能性があります。

ポートレートシステムをマーケティングに使用する際の注意点:

SMS に対する敏感さ: ユーザーによっては、マーケティング SMS に対してあまり敏感でない場合があります。たとえば、過去のデータによると、送信された 10 件の SMS メッセージのうち、1 回しか開かないか、まったく開かない場合があります。 SMS チャネルにはマーケティング コストが必要であることを考慮すると、このユーザー グループを除外して、ユーザーへの干渉を減らすことができます。

無効な携帯電話番号: プラットフォーム上で自分の携帯電話番号ではない番号をランダムに入力し、携帯電話番号が無効化/変更され、テキストメッセージを受信した後に「TD」と返信するユーザーは、テキストメッセージを受信できず、テキストメッセージのブラックリストに登録されます。このようなユーザーも除外する必要があります。

製品のマーケティングに興味のあるユーザー: 最近、商品を閲覧、収集、カートに追加、または複数回注文したユーザーは、特定の製品の潜在的なユーザーであり、割引クーポンや赤い封筒を通じてマーケティングを行うことができます。

カスタマーサービストーク

プラットフォームのカスタマーサービス部門に苦情や相談、フィードバックをすると、カスタマーサービススタッフはプラットフォームでの購入状況、前回の相談問題の結果などの情報を正確に伝え、的を絞った解決策を提案し、高価値ユーザー向けのVIPカスタマーサービスチャネルなどの特別なサービスを提供してくれます。

アプリケーションの運営者は、ユーザーポートレートの性別、年齢層、興味や趣味、閲覧や購入行動などのラベルに基づいて、ユーザーにさまざまなコンテンツを推奨できます。例えば、Toutiao でのパーソナライズされた記事コンテンツの推奨、Douyin でのユーザーのポートレートに基づいたパーソナライズされた動画コンテンツの推奨、Taobao でのユーザーの閲覧行動やその他のポートレートデータに基づいたパーソナライズされた商品の推奨などです。

ユーザーポートレートラベルは、ユーザー分析、注文分析、ファネル分析、人口特性分析など、さまざまな種類の分析に適用できます。

この記事では、主にデータプロダクトの観点から、ユーザーポートレートシステムを0から1に構築する方法について説明します。麦わら小僧が書いた追跡ポイントとインジケータシステムに関する記事を読んだことがある友人は、肖像システムの構築が追跡ポイントとインジケータの構築と同じであることに気づいたかもしれません。また、需要分析からラベル/インジケータの設計、背景設計、そして最終的にビジネスへの応用まで、通常の製品設計プロセスに従います。

ことわざにあるように、物事はどんなに変化しても、本質的には変わらない。ルフィの技が常に変化しているように見えるのと同じように、ゴムの能力を使ってさまざまな変化を起こすのが核心です。さまざまな形態のデータ製品の核はビジネスにあります。

著者: 麦わら帽子の少年

出典: 麦わら帽子の少年 (luckily304)

<<:  Baidu 検索プロモーション ocpc 毎日最適化ガイド

>>:  ジェシーのトレーディングシステム(半年コース)説明付き + ビデオコース

推薦する

補助金は本当にユーザー増加への近道なのでしょうか?

今年の春節も、各インターネット企業が配布する紅包特典が引き続き好評で、金額も過去最高を更新し続けてい...

Android Modification Master v8.1.0 完全クラック版 VIP機能を無料で使用可能

Android Modification Master v8.1.0 完全クラック版 VIP機能を無...

プロモーションとマーケティング: トラフィックは多いがコンバージョン率が低い場合はどうすればよいでしょうか?

訪問者は多いのに売上があまりない場合はどうすればよいでしょうか?言い換えれば、商品/店舗のコンバージ...

李星星PRチュートリアル15エピソード、李星星PR編集スコア戦略15レッスンBaiduクラウドダウンロード

李星星PRチュートリアル15エピソード、李星星PR編集スコア戦略15レッスンBaiduクラウドダウン...

APP製品運用ユーザー獲得チャネル!

APP製品運用を通じて、プロモーションチャネル、ユーザーの評判、ユーザーインタラクション、ブランド...

短編動画商品の競合分析

インターネットの発展に伴い、ショートビデオ業界は今日では人気のトレンドとなっています。著者は短編動画...

1 つの数式と 5 つの指標が、プロダクト マネージャーとしてのデータ分析思考の構築に役立ちます。

質問:製品のデータ分析機能を向上させるために、具体的な提案や優れた学習リソース (e コマース向け)...

張普の「アリババの成功への道:起業と成長に関する19の講義」

張浦の「アリババの成功への道:起業と成長に関する19の講義」リソース紹介:アリババに関する多くの物語...

お金やリソースなしでシードユーザーを獲得するにはどうすればいいでしょうか?

新しい製品が運用を開始したばかりのときは、すべてのオペレーターが同じ問題に直面すると思います。お金も...

2017 年に画面を席巻した H5 広告のトップ 10、いくつ再生しましたか?

2017 年ももうすぐ終わりです。今年、WeChat モーメントでよく見かけた H5 を覚えていま...

ユーザー操作:ツール型製品コンテンツモジュールのユーザー成長を向上させるには?

最近受けた質問:編集者、私は最近、あるツール型製品の小説モジュールのユーザー成長を担当しています。目...

検索とプロモーションのターゲティング手法を組み合わせたもの!

検索エンジンをターゲットにする方法は数多くありますが、ターゲット顧客をターゲットにするにはどの方法を...

福州の特産品アプリに参加するにはいくらかかりますか?

起業家にとって、ミニプログラムの開発には一定のスキルが必要ですが、多くのサードパーティのサービスプラ...

大魚中国語学 - 三字経典啓蒙講義百度クラウドダウンロード

ビッグフィッシュ中国語研究 - 三文字古典啓蒙講義リソース紹介: CCTV Finance の吹き替...

ショート動画コンテンツの作成に役立つショート動画ユーザー心理の4つのタイプ

ショートビデオの「コンテンツ出力」の表面的な研究はコンテンツの構造形式に関するものですが、根底にある...