ユーザー離脱率は、製品の市場での受け入れ度と運用品質を直接反映します。解約率を予測する目的は、ユーザーがどの時点で離脱するかを予測し、ユーザーを維持するための戦略を事前に準備することです。 解約率とは何ですか?ユーザー離脱を気にする必要があるのはなぜですか? 簡単に言うと、ユーザー離脱率とは、製品(またはサービス)を使用/消費するユーザー総数に対するユーザー離脱数の比率を指します。これはユーザー離脱を定量的に表現したもので、ユーザー離脱を判断するための主な指標です。製品の市場での受け入れ度と運用品質を直接反映します。 一般的に言えば、この指標は、情報サブスクリプションアプリ「Hammer Reading」や、大多数のオンラインSaaS製品、さらには従来の牛乳サブスクリプションなど、「サブスクリプション製品」の場合に最も多く使用されます。 既存ユーザーを維持する方が新規ユーザーを獲得するよりもコスト効率が高いため、解約を予測する目的は次のとおりです。 ユーザーがどの時点で離脱するかを予測し(サブスクリプション期間の終了前)、SMS、メール、アプリなどを通じて適切なタイミングでこれらのユーザーに影響を与え、再訪問を促す超低価格の製品や限定クーポンなどを使用してユーザーを維持します。これらの戦略は、一部の離脱ユーザーに対して非常に効果的です。 次に、簡単な統計知識を使用して、ユーザーの非アクティブ記録に基づくユーザー離脱予測モデルを紹介します。 このモデルは、機械学習アルゴリズムを使用せずに、簡単に理解できるユーザー離脱予測を提供できるため、離脱しようとしているユーザーについてかなり正確な洞察を得ることができます。 では早速本題に入りましょう〜 1. ユーザーアクティビティの運用上の定義ユーザー離脱の予測を始める前に、ユーザーの過去のアクティビティを記録する必要があります。これを行う目的は、ユーザーが当社の製品やサービスを使用しているかどうかを把握することです。 そこで疑問になるのが、ユーザーの「アクティビティ」の操作上の定義(つまり、観察可能、測定可能、および実行可能な特性に基づいて変数の意味を定義する方法)は何でしょうか。 実際、「ユーザー アクティビティ」の定義はビジネスの背景によって異なり、製品やサービスのシナリオと密接に関連しています。製品の種類によって、「ユーザー アクティビティ」の定義は異なります。 Sina Micro Public Opinion の「情報モニタリング」を例に挙げると、これはサブスクリプションベースのビッグデータ製品です。ユーザーはさまざまなキーワードの組み合わせで情報を検索した後、電子メールまたはクライアント経由でサブスクリプションを選択し、カスタマイズされた受信頻度に従ってサブスクリプション情報を受け取ります。 このデータ製品では、ユーザー アクティビティは次のように定義できます。ユーザーがアクティブである場合、指定された期間内 (分析単位はアナリストによって異なり、日、週、月、四半期、または年になります) に、次の支払い、使用、またはインタラクションの動作が含まれる必要があります。
この製品の場合、最短のサブスクリプション期間は 1 か月、最長のサブスクリプション期間は 1 年であるため、ユーザーの行動を月単位で分析することは理にかなっています。 「ユーザー アクティビティ」の定義が明確になったら、これらの操作定義を使用して、バイナリ値 (0,1) を使用して各月のユーザー アクティビティ (非アクティビティ) をエンコードできます。つまり、ユーザーが X 月にアクティブだった場合はアクティビティ値を 1 に設定し、それ以外の場合は 0 に設定します。 2. 「非アクティブユーザープロファイル」を作成する現在、各ユーザーについて、月単位の「アクティブ マーク」があります。次に、これに基づいて「ユーザーの非アクティブ ファイル」を作成します。これは、各ユーザーについて、連続して非アクティブであった月数をカウントすることを意味します。 ここで、著者は 1 年間の「分析ウィンドウ」(つまり、分析時間範囲として 12 か月) を選択し、「アクティブ ファイル」と「非アクティブ ファイル」を表の形式で提示しました。青い表には各ユーザーの各月のアクティブ レコードが表示され、緑の表にはユーザーの非アクティブ レコードが表示されます。 この期間中のユーザーの可能性のあるアクティブな状況に基づいて、著者は次の表に示すように 3 つの典型的なユーザーを列挙します。 1. ユーザーA:ユーザーは「分析ウィンドウ」の開始時にはアクティブでしたが、5 月に非アクティブになりました (つまり、5 月が最初の非アクティブ月でした)。次に、ユーザーの非アクティブ状態は「分析期間」の終了となる 12 月まで続きました。 したがって、「ユーザー非アクティブ ファイル」では、5 月から 12 月まで、ユーザーが非アクティブであった月を月ごとにカウントします。 2. ユーザーB:ユーザー A と同様に、このユーザーも最初はアクティブでした。違いは、ユーザーが 3 月から 6 月までは非アクティブで、7 月に 1 か月間だけアクティブになり、その後 8 月と 9 月に再び非アクティブになり、最終的に「分析ウィンドウ」の 10 月、11 月、12 月にアクティブ状態に戻ったことです。 この場合、ユーザーが非アクティブ状態からアクティブ状態に戻るたびに、以前の非アクティブ月数をリセットする必要があります。つまり、ユーザーの連続した非アクティブ月数を再度カウントする場合、再度 1 からカウントを開始する必要があり、以前の非アクティブ月数は累積されなくなります。 3. ユーザーC:上記の 2 種類のユーザーとは異なり、このユーザーは「分析ウィンドウ」に初めて入ったときは非アクティブです。この状況は、ユーザーのサブスクリプションの有効期限が切れてから長いこと (処理が難しいため、正式な分析の前にこの状況を除外することが最善です)、またはユーザーが「分析ウィンドウ」の開始前に非アクティブであったために発生する可能性があります。 「分析ウィンドウ」より前のユーザーアクティビティは確認できないため、それ以前のユーザーのアクティビティステータスについてはわかりません。このような状況を考慮して、これらの月に特別なマークを付けます。つまり、ユーザー C の最初の数か月間の非アクティブをマークするために -1 を使用します。ユーザーのその他の非アクティブな状況は、上記の 2 種類のユーザーと同じ方法でカウントできます。 注: 後ろの緑色の表 (「ユーザー非アクティブ ファイル」) は、ユーザー離脱モデルを構築するときに注意する必要があるデータです。 3. ユーザー離脱モデルを構築する上記のユーザー非アクティブの操作定義を使用すると、「分析ウィンドウ」(1 月から 12 月) 内で 0 から 12 までの連続非アクティブ月数を持つユーザーの数を月単位でカウントできます。 このステップは、ピボット テーブルを使用して、月ごとおよび非アクティブ レベルごとのユーザー数を集計することで実現できます。 次の表に示すように: 上記の表では、各セルの値は、列方向から各月で X か月連続して非アクティブであったユーザーの数を表しています。 たとえば、上の表の最初の強調表示された値 (574) は、1 月に 1 か月間非アクティブだったユーザーの数を表します。この値は、過去 12 か月間のアクティブ ユーザー 4,815 人から算出されます。2 番目に強調表示された値 (425) は、2 月に 2 か月間連続して非アクティブだったユーザーの数を表します。425 は、574 (1 月に 1 か月間非アクティブだったユーザーの数、つまり 2 月に 2 か月間非アクティブだったユーザーの基本数) から算出されます。最初の行の連続非アクティブ月数 (0) は、実際にはベース内のアクティブ ユーザーの数を表していることに注意してください。 このデータを使用して、「分析ウィンドウ」内の各月で連続して非アクティブな月があるユーザーの割合を計算できます。下の緑色の表に示すように: 上記の表で強調表示された値 (74%) は、2 月に 2 か月連続で非アクティブであったユーザーの割合を示しています。 パーセンテージは次のように計算されます。 最も代表的な値を得たかったので、分析期間の最後の 4 か月 (9 月、10 月、11 月、12 月) の平均を取得しました。これらの平均値を計算するのに十分なデータがない場合があります (例: 10 月、11 月、12 月)。この場合、利用可能なすべての値の平均を取得します (平均値の計算に使用される値の範囲は赤で囲まれています)。 4. ユーザー離脱の確率を計算するハハ、もしまだこの記事を読んでいるのなら、おめでとうございます!これから最もエキサイティングな部分に入ります。このセクションでは、統計に関する知識を少し使用します。 この記事の最終的な目標である、連続する非アクティブ月数 (0 ~ 12) ごとにユーザー離脱の確率を計算することをもう一度考えてみましょう。 つまり、ユーザーが X か月連続して非アクティブだった場合、このユーザーが次に解約する可能性はどれくらいでしょうか? 数学的に言えば、強力なベイズの公式を使用してユーザー離脱率を計算できます。ベイズの公式は数式ですが、その原理は数字がなくても理解できます。誰かがいつも良いことをしているのを見たら、その人は良い人である可能性が高いです。つまり、物事の本質を正確に知ることができない場合でも、その物事の特定の本質に関連するイベントの数に基づいて、その本質的な属性の確率を判断できます。 これを数学的な言葉で表現すると、ある特性を裏付けるイベントが多ければ多いほど、その特性が真である可能性が高くなります。 その数学的形式は次のとおりです。 ここで、AとBは両方ともイベントを表し、P(B)≠0です。 P(A) と P(B) は、それぞれ A と B の事前確率または周辺確率を表します。 A (B) に関連する要素を一切考慮しないため、「事前」と呼ばれます。 P(A|B) は、B が発生した場合の A の条件付き確率であり、B の値から導出されるため、A の事後確率とも呼ばれます。 P(B|A) は、A が発生した場合の B の条件付き確率であり、A の値から導出されるため、B の事後確率とも呼ばれます。 この場合、対応する式は次のようになります。 ただし、上記の式には意味のない項目があります。P(X か月連続で非アクティブ | 解約) は、「ユーザーがすでに解約している場合に、X か月連続で非アクティブになる確率」を意味します。考えてみてください。すでにユーザーを失っている場合は、非アクティブな状態になることはできないため、この確率値にビジネス上の重要性はありません。 この状況を考慮して、著者はこの項目を断固として放棄しました(覚えておいてください!)。ここから、解約率の計算式の最終的なバージョンが得られます。 次に、式の右側にある 2 つの項 (分子と分母) を見て、各非アクティブ月についてその値を計算して、必要なユーザー離脱確率値を取得します (これは条件付き確率値、つまり、X か月間連続して非アクティブであるという条件下でのユーザー離脱確率であることに注意してください)。 まず分母についてお話しましょう。P (X か月連続して非アクティブ) は、前に計算した値、つまり過去 4 か月間のユーザーの平均割合です。
次に、分子P(損失)を例を通して解いてみましょう。 まず、1か月間非アクティブなユーザーの離脱確率P(C1)はいくらでしょうか?離脱しそうなユーザーの場合、非アクティブになる連続月数は、すでに私たちが検討している範囲内にあります。つまり、これらのユーザーが非アクティブになる月数は、1 か月、2 か月、3 か月、... となります。したがって、1か月間非アクティブなユーザーの離脱確率P(C1)を次のように定義します。 さて、同じように、2 か月間非アクティブなユーザーの P(離脱率)、つまり P(C2) はいくらでしょうか。解約しようとしているユーザーは、2 か月、3 か月、4 か月、...、12 か月間非アクティブなままになります。したがって、2か月連続して非アクティブなユーザーの離脱確率P(C2)を次のように定義します。 帰納法と演繹法によって、非アクティブな月ごとの解約確率を同様に計算します。 ここで、n は連続して非アクティブな月数の限界であり、この確率は安定していることがわかります。上記の表から、これが 7 か月連続で発生し、ここでの確率値は 95 ~ 96% のままであることがわかります。 簡単にするために、連続した数か月間の非アクティブ状態は独立したイベントであると仮定します。その場合、 P(A∩B) = P(A)* P(B) です。 したがって、次の式を使用できます。 各非アクティブ月確率の分子と分母を計算したので、最後のステップ、つまり連続する非アクティブ月数ごとのユーザー離脱確率の計算を開始できます。前に説明したように、n の値は 7 です。 最終的な計算結果は次の表に示されます。 アクティブユーザー(つまり、最初の行で連続0か月間非アクティブであるユーザー)の解約率は、P(1) X P(2) X P(3) X P(4) X … X P(7)として計算されることに注意してください。ユーザーがアクティブな場合、P(0 か月連続して非アクティブ) は 1 になるため、ここでは何も除算しません。 最後に、解約率曲線を使用して解約率の変化を直感的に反映し、非アクティブなユーザーを維持するのに最適な時期を決定することもできます。この曲線を下の図に示します。 V. 結論この記事では、このモデルのバッチ使用の具体的な実装の詳細は説明していません。このモデルの構築ロジックを理解していれば、SQL、Python、さらには Excel を使用して実装できます。 さらに、実際には、このモデルはさまざまなユーザー グループで実行するのが最適です。この記事では、特定のタイプのユーザーのみを対象としていますが、実際のビジネスでは、さまざまな基準に従ってユーザー グループを分割する方が意味があります。たとえば、ユーザーをその価値に基づいてセグメント化し、各ユーザー サブグループの解約予測を行うことができます。 もちろん、著者は月単位でのみユーザー離脱分析を行っています。しかし、多くのビジネス シナリオでは、週ごとや日ごとなど、よりきめ細かい分析の観点の方が意味があるかもしれません。 この記事の著者は@Scottish Fold Ear Catです。編集・出版は(Qinggua Media)が行っています。転載の際は著者情報と出典を明記してください。 製品プロモーションサービス:APPプロモーションサービス、広告プラットフォーム、Longyou Games |
<<: ユーザー数の増加に伴い、新規ユーザーを維持するにはどうすればよいのでしょうか?
>>: Douyin のコメントを読むだけで 1 か月で 100 万人のフォロワーを獲得できますか?新しい富のコード
インターネットに関して難しいと思うことが 2 つあります。 まず第一に、ユーザーのお金を上司の懐に入...
私のことを知っている人は、私が広報、広告、インターネットの分野で働いてきたことを知っているでしょう。...
この記事では、主にケース分析を使用して、アプリの具体的なリテンション改善分析計画を説明します。アプリ...
少し前に、同僚がまた保険に加入しました。詳しく調べてみると、この保険は数百万の費用(特殊疾病)を補償...
ウェブサイトの最適化には、サイトの内側と外側の両方が非常に重要です。多くの初心者は、オリジナルの記事...
動画を撮影した後は、ただ公開するだけではなく、プロモーションのプロセスもあります。今日は、ショートビ...
故宮博物院は、ブランドマーケティング戦略を組み合わせてブランドの若返りに成功し、革新的な運営とコミュ...
オンライン教育のコンバージョン率は、多額の投資予算を持つ大企業であれ、配信協力のためにKOLを慎重に...
ユーザーオペレーションシステムには、Acquisition(獲得)、Activation(活性化)、...
インターネットが広く普及している今日の社会では、誰かに会うコストは非常に低いですが、誰かを知るコスト...
WeChatショートビデオ機能のリリース以来、多くのパブリックアカウント運営者がビデオを使用してト...
口頭英語クラス、心理学クラス、財務管理クラス...知識に対してお金を払う時代では、クラスごとに数百元...
よく広告主から、「iQiyi にはスプラッシュ スクリーン広告、情報フロー広告、ビデオ パッチ広告な...
ユーザーポートレートは、ラベル付きの形式でユーザーの特徴を記述および描写する方法です。ユーザーを包括...
情報フロー広告のプロセスにおいて、多くのネットワーク事業者は次のような状況に遭遇しています。 1.タ...