データベース運用システムをゼロから構築

データベース運用システムをゼロから構築

データドリブンオペレーションとは、近年登場した概念であり、オペレーションを基盤として、データに基づいた意思決定をスローガンに掲げています。

データ駆動型の操作を理解する前に、オペレーターは次のような疑問を持ったことがありますか?

  1. 異なるチャネルは良いのか悪いのか?
  2. アクティブユーザー数が減っています。理由は何でしょうか?
  3. このプロモーションはどれくらい効果的でしたか?
  4. バージョンがリリースされましたが、ユーザーは気に入っていますか?
  5. 私たちは常に普及について話しますが、普及の規模はどの程度でしょうか?

これは、製品や運用が毎日常に直面する問題です。データ駆動型の運用は、実際にはこれらの問題を解決することに基づいています。これは決して BAT だけの独占領域でもなければ、ビッグデータだけの独占領域でもありません。あらゆるインターネット企業がデータ運用に適した土壌を持っています。

データ運用システムは、データの収集と分析の応用であり、データファースト戦略でもあります。これは、オペレーターの仕事であるだけでなく、製品、市場、研究開発の共通のビジョンでもあります。経営の観点から言えば、これはトップダウンの推進です。リーダーが注意を払わなければ、実行者がデータをどれだけうまく活用しても、中途半端なものになってしまいます。

データ駆動型オペレーションシステムを構築するには?以下は私の要約した考えです。

私はデータ駆動型オペレーションシステムを 4 層のアーキテクチャに分割しています。アーキテクチャの各層は徐々に進化し、相互に依存しており、各層は不可欠です。 4 つのレイヤーは、データ収集レイヤー、データ製品レイヤー、データ操作レイヤー、ユーザーリーチレイヤーです。オペレーターの視点に基づいたフレームワークです。

データ収集レイヤー

データ駆動型運用システムの基盤はデータ収集であり、データはシステム全体の原動力です。

データ収集の核心は、可能な限りすべてのデータを収集することです。これには 2 つの原則があります。遅く収集するよりも早く収集する方がよい、そして少ないデータよりも完全に収集する方がよいということです。

  • 遅くするよりも早く行う方が良いので、会社がBラウンドやCラウンドに発展するまで待つのではなく、製品作成段階から意識的にデータを収集する必要があります。データ駆動型の運用は製品段階全体にわたって実装されており、段階ごとに異なる運用方法が採用されています。
  • 完全であることは、少ないことよりも良いことです。つまり、不適切なデータのみが存在し、不良なデータが存在しないことを意味します。履歴データ、変更記録、詳細などのデータはすべて価値があります。

例えば、信用調査システムがユーザーの行動を詳細に記録する金融商品があります。ユーザーが借入時に保証情報をアップロードすると、システムはそのページでのユーザーの操作手順と時間を記録します。ここでは、一般の人が保証情報をアップロードする際には注意しなければならないという前提があります。この手順が非常にスムーズかつ迅速に完了した場合、人々が債務不履行となり、借金を負う可能性が非常に高くなります。あなたはそれがとても上手ですが、大金を稼ごうとしているのですか?これは熟練した作業事例です。信用報告システムは、このデータを特性として使用してリスクを判断します。

収集する必要があるデータは、行動データ、トラフィック データ、ビジネス データ、外部データの 4 つの主要なタイプに分けられます。

行動データ

製品に対するユーザー操作を時系列順に記録したものです。ユーザーがアプリを開き、メニューをクリックしてページを閲覧する動作、ユーザーが曲を収集し、曲をループ再生し、曲を早送りしたりスキップしたりするのも動作です。

行動データの中核は、どのユーザーがどのタイプの操作を、いつ、どこで、どのように完了したかを説明することです。

これを使用して、ユーザーの好み、ページに滞在する時間の長さ、閲覧頻度、ページの好みの有無などを分析することができ、これらはすべて分析の基礎として役立ちます。一方、ユーザー行動もユーザー操作システムの基礎であり、購入、コメント、返信、友達追加などのさまざまな行動に応じて、異なるグラデーションに分割され、コアユーザー、重要なユーザー、一般ユーザー、潜在的ユーザーの階層化が定義されます。

行動データは追跡技術を通じて収集されます。トラッキングポイントの実装方法はさまざまですが、収集されるデータの内容は同じです。主なフィールドは、ユーザー ID、ユーザーの行動、行動のタイムスタンプです。表を使用して簡略化されたモデルを描画します。

useId は、ユーザーの一意の ID を識別するために使用されます。これは、ユーザーが誰であるかを判断するために使用され、ID 番号と考えることができます。アクティブは特定の操作の動作であり、技術レベルで設定および定義する必要があります。タイムスタンプは動作が発生した時点です。ここでは分単位の精度のみを使用しますが、通常はミリ秒単位の精度です。ユーザーの行動記録は、閲覧したページやその時点でページ上にあった要素(価格など要素は動的であるため)など、詳細である必要があります。これは半構造化 NoSQL 形式であり、ここでは簡略化しています。

技術的な都合により、ユーザーが製品上で閲覧したページでのみ行動データが収集され、クリックやスワイプなどの操作は記録されない場合があります。妥協的なアプローチ。

さらに、行動データには、ユーザーのデバイス、IP、地理的位置などのより詳細な情報も記録されます。デバイスによって画面の幅は異なります。ユーザーインタラクションやデザインエクスペリエンスに違いや影響はあるでしょうか? どのように分析すればよいでしょうか?これもデータ駆動型操作の応用例の 1 つであり、少ないよりも完全な方がよいという考えを反映しています。

交通データ

トラフィック データは行動データの前身であり、Web 1.0 で登場した概念です。一般的にはWebページ側の記録や、製品側の行動データの記録に使用されます。

トラフィック データと行動データとの最大の違いは、トラフィック データでは、検索エンジン、外部リンク、直接訪問のいずれを経由してユーザーが来たのかがわかることです。これはSEOSEM 、さまざまなチャネルマーケティングの基礎でもあります。

今はモバイル時代ですが、Web 時代のトラフィック データは古くなりません。例えば、 WeChatモーメントのコンテンツはすべてHTMLページであり、アクティビティ操作はこの統計効果に基づいて行う必要があり、一種のトラフィックデータとみなすことができます。また、多くの製品はネイティブ + Web の複合フレームワークであり、内蔵のアクティビティ ページは主にフロントエンドを通じて実装されています。このとき、それは行動とトラフィック データとしてカウントされます。アクティビティ ページを友達の輪に送信すると、フロントエンドのトラフィック データに基づいてのみ、対応する統計を収集できます。

トラフィック データは、ユーザーがアクセスした Web ページに基づいて生成されます。主なフィールドは、ユーザー ID、ユーザーが閲覧したページ、ページ パラメータ、およびタイムスタンプです。簡略化されたモデルは次のとおりです。

url はアクセスしたページで、***.com/*** の形式で記録されます。param はこのページを説明するパラメータで、ページ上の検索と属性情報はパラメータの形式で記録されます。行動データと同様に、トラフィックデータにさらに詳細な統計が必要な場合は、操作記録を含む半構造化データを使用する方が適切です。

イベントやコンテンツ運用の強い味方です。イベントのコンバージョン率や、友だちの輪に投稿した記事の読者数などがトラフィックデータとして記録されます。主にJSを通じて収集されます。

トラフィック データの統計はすでに比較的成熟しています。Google AnalyticsBaidu Statistics はどちらもよく知られたサードパーティツールであり、最もよく使用されています。ただし、プライベート展開はサポートされておらず、統計情報しか提供できません。このページに 100 人がアクセスしたことはわかりますが、その 100 人が誰なのかはわかりません。また、そのデータをデータベースに記録することもできないため、データに基づく操作には面倒です。いくつかの新しいツールは、このより高度な要件をサポートできますが、有料です。

信頼性が高く高度な技術的手段があれば、行動データとトラフィックデータを統合できるようになります。これが将来のトレンドです。

ビジネスデータ

ビジネスデータは、製品の運用プロセス中にビジネスとともに生成されます。例えば、 eコマース製品の場合、プロモーションを実施すると、何人のユーザーがクーポンを受け取り、何枚のクーポンが使用され、どの製品にクーポンが使用されたか。これらのデータは業務と密接に関連しており、行動やトラフィックでは説明できないため、ビジネスデータとして分類されます。

在庫、ユーザーの速達住所、製品情報、製品レビュー、プロモーション、友人関係チェーン、運用活動、製品機能などはすべてビジネスデータです。業界によってビジネスデータは異なり、ビジネスデータには固定構造がありません。

ビジネスデータはバックエンドの R&D によって構成する必要があります。構造は汎用的ではないため、事前に R&D スタッフに通知して要件を明記しておくことをお勧めします。

行動データ、トラフィック データ、ビジネス データは、データ ソースの 3 つの柱を構成します。総称して生データと呼ばれ、何ら処理されていないデータを意味します。

外部データ

外部データは、内部で生成されるのではなく、サードパーティのソースから取得される特別な種類のデータです。たとえば、 WeChatのパブリックアカウントでは、ユーザーが私たちをフォローすると、そのユーザーの地域、性別などのデータを取得できます。例えば、 AlipayのSesame Creditは多くの金融商品で利用されるでしょう。天気、人口、国の経済指標などの公開データもあります。

外部データを取得するもう 1 つの方法は、クロールです。Douban の映画評価、Weibo のコンテンツ、Zhihu の回答、不動産情報をクロールして、独自の用途に使用できます。第三者があなたの買収をサポートすることは不可能であり、多くの場合、アンチクローラーメカニズムが存在するでしょう。特定の技術サポートが必要であり、安定した簡単なソースではありません。

外部データの品質を保証することは難しいため、外部データはあくまでも参考用であり、内部データほど大きな影響力はありません。

これら 4 種類のデータは、データ駆動型運用の基礎を構成します。インターネット企業のデータ化のレベルが上がるにつれて、より多くのデータが活用できるようになります。データ構造は SQL から NoSQL へと徐々に進化し、情報ソースはグラフィックやサウンドデータが増えて豊かになり、テクノロジーは単一サーバーから分散型へと進化し、レスポンスはオフラインバッチ処理からリアルタイムストリーミングへと進化してきましたが、これらはすべてデータ収集の課題となっています。

データを取得したら、次のレイヤーであるデータ製品レイヤーに移動します。

データ製品レイヤー

データ製品とは、データの処理と活用のことです。テクノロジーと自動化のカテゴリに属し、生のデータはコンピューターによって処理されます。従来の意味でのデータプロダクト(広告システムなど)ではありませんが、データの価値と生産性を最大化することが目的です。データを処理するプロダクトとも捉えられます。

生データはそのまま操作に使用することはできず、通常は乱雑で乱雑です。特定の標準に従って統合し、処理する必要があります。

たとえば、行動データやトラフィックデータでは、ユーザーはWeChat Momentsでイベントを見て良いと思ったので、アプリをダウンロードし、登録してイベントに参加します。ここでの行動データとトラフィックデータは完全に独立しています。 WeChat Momentsを閲覧すると、ユーザーのweixinOpenIdとCookieが記録されますが、ダウンロード後は製品内で使用されたuserIdが記録されます。この2つは対応できないため、Cookie、携帯電話番号、userIdなどの情報を同じ人物にマッピング(マッピング)するには、データ統合が必要です。

これは技術的なレベルでのデータクリーニングです。このプロセス全体を ETL と呼びます。

データを活用して価値を生み出す方法は数多くあります。つまり、BI を通じて、元のデータをディメンションとメトリックの形式で集約し、さまざまな種類の視覚的な意思決定分析とデータ マイニングを実行できます。ビジネスとシナリオに基づいてデータのさまざまな使用方法を決定します。ここで最も重要なことは、まず指標を用意することです。

データ指標

私はできるだけ多くのデータを収集することを強調してきましたが、生のデータが大量にある場合、どのようにビジネスを導くことができるのでしょうか?これには、膨大な量のデータから方向性を見つける必要があります。現時点では、指標を確立する必要があります。指標は私たちの方向性を示すものであり、ビジネスと生データをつなぐものです。

指標は、データに基づく運用システムの上部と下部をつなぐ潤滑油とも言え、生データから加工され、他の製品を動かします。

BIが必要ですか? BI は間違いなく指標を中心にダッシュボードを構築することですが、機械学習アルゴリズムを使用することでしょうか?アルゴリズムの目的はインジケーターの効果を向上させることです。操作しますか?コンテンツ、ユーザー、アクティビティ モジュールの KPI も指標を中心に展開されます。

インジケーターは、通常の意味でのデータ製品ではありません。私は、他のデータ製品を推進および計画し、反復的なビジネスの運営に協力する、データ業界のプロダクトマネージャーとして説明することを好みます。この説明で誰もが理解するでしょう。

指標の設定方法は事業運営によって決定され、事業運営の主な原動力にもなります。

生データから指標がどのように処理されるかを簡単に見てみましょう。下の図は、生データに記録されたユーザーがアプリを開いた状況を示しています。

各タイムスタンプは、対応するユーザーがアプリを 1 回開いたことを意味します。このテーブルを通じて、毎日何人のユーザーがアプリを開いたかを計算できます。これが起動量です。ユーザー数の重複を排除すると、運用上の重要な指標であるアクティブ ユーザー数を取得できます。保持率は、 SQL Left Join を使用するなど、テーブルに対してさらに複雑な操作を実行することで取得できます。

記事の閲覧数、1日の売上、イベント参加者数など、これらはほぼすべて生データから集計・加工されています。指標がまとめられた後、運用担当者と製品担当者に日報ダッシュボードが提供されます。

指標がわかったので、他のデータ製品を見てみましょう。スペースが限られているため、ユーザー ポートレートに焦点を当てます。

ユーザープロフィール

ユーザー ポートレートは、一般的に使用されるデータ製品ですが、製品担当者や運用担当者にとっては謎に包まれていることがよくあります。これには 2 つの解釈があり、多くの初心者にとって曖昧さの原因にもなっています。ユーザー ポートレートの 1 つのタイプは、マーケティングとユーザー リサーチの分野に属し、ペルソナと呼ばれています。より正確な翻訳は、自然人の社会的属性を表し、ユーザーのニーズとシナリオを決定するために使用されるユーザー ロールです。

データ フィールド内のユーザー ポートレートはプロファイルと呼ばれ、一連のデータを処理して人物の属性を説明するデータ ラベルです。最もよく知られている例は、タオバオの「一人当たり数千の顔」です。ユーザーが妊娠関連商品を購入しようとすると、妊婦としてラベル付けされる可能性が高く、自動車関連商品を閲覧すると、自動車に興味があるとしてラベル付けされます。

ユーザーポートレートは、ビッグデータと機械学習に依存する複雑なシステムです。正確で豊富なユーザーポートレートにより、運用結果が飛躍的に向上します。

ユーザーポートレートも使い方が簡単なので、データマイニングがなくても問題ありません。ユーザーの性別、年齢、地域などの情報を取得するのは難しいことではないですよね?単純なユーザー行動に基づいてユーザーの好みを区別することは難しくありません。次に、User Portrait V1.0 があります。

推奨システム、精密マーケティング、広告はすべて、ユーザーポートレートに基づく一般的なアプリケーションです。化粧品のプロモーションを推進したい場合、女性ラベルを選択したユーザーのほうが成功率が確実に高くなります。さらに、女性ユーザーがどのカテゴリーの化粧品を好むかオペレーターが知っていれば、効果はさらに高まります。

ユーザーのポートレートは、既存のデータを精製することで取得できます。たとえば、ユーザーのIDカード情報があれば、性別、出身地、生年月日の3つのラベルを正確に取得できます。アルゴリズム計算によっても得ることができます。例えば、タオバオで買い物をするときに残された受取人の名前は、機械学習によって、購入者が男性か女性かの確率という形で得ることができます。Jianguo は男性である可能性が非常に高く、Cuilan は女性である可能性が非常に高いです。

ユーザー ポートレートは、生データの処理に基づいています。生データが完全であればあるほど、ユーザー ポートレートはより充実したものになります。

データプロダクト層では、データを指標に加工し、それを中核としてデータプロダクトの構築と計画を行います。指標の表示方法 (BI)、指標の改善方法 (アルゴリズム)、指標の計算方法 (ETL)、指標の組み合わせ方法 (ユーザー ポートレート)。

これらの「製品」を入手したら、次のステップはそれを使用することです。運用担当者と製品担当者がそれらのユーザーです。

データ操作

データ運用層は、運用担当者がデータを運用戦略に変換する場所です。人間は、データ製品のコンピューター自動化に対応する主な生産力です。

具体的な方法について話す前に、まずは人の役割について強調しておきましょう。どれだけ優れたデータ製品を作成しても、従業員のデータに基づく業務意識が向上しなければ、すべてはゼロになってしまいます。

人材には3つの要件があります。

(1)データに基づいて意思決定をする際には、データで何ができるか、何ができないかの両方を知る必要があります。

前者は理解しやすいです。私は仕事で何度もこれに遭遇しました。意思決定に役立つデータがある場合でも、私はやはり個人的な経験を信じています。これは、一人だけではなくチーム全体で避けるべき考え方です。

データドリブンな運用は、業務運営の万能薬ではありません。企業規模が大きいほど、データドリブンな運用の効果が高まることを客観的に認識する必要があります。スタートアップや中小企業では、技術サポートの不足、改善効果が不十分、データ量の不足など、一定の制限があり、優先的な遅延が発生します。これは避けることのできないトレードオフであり、問​​題を解決することが最優先事項となります。

(2)データ分析と運用レベルが標準に達していない

意識的に使っているとはいえ、社員は平均値しか求めることができず、あまり期待しすぎないようにしましょう。

この問題は、継続的な体系的なトレーニングと人材の採用を通じて解決する必要があります。トップダウンの提唱と推進が最良の結果をもたらします。トップマネジメントがデータ駆動型業務の戦略と認識を持ち、経営陣がデータ駆動型業務の指導経験を持ち、経営幹部がデータ駆動型業務を実践できれば、システム全体がうまく実装されます。

(3)製品ツールの使用

MySQLクエリデータ、BI多次元分析、精密マーケティング、ABテスト、コンバージョン率分析など、社員に求められるスキルであり、いずれも必須です。従業員がデータ関連のツールを使いこなせるようになって初めて、その価値を最大化することができます。

運用と製品がデータ操作を実行する方法については、具体的なテクニックや方法論が多すぎます。ここでは、その中核となる考え方を紹介したいと思います。私たちは思考を理解することに重点を置いています。

1. 量ではなく細かさ、細かさだけでなく、脂肪の少なさも

本格運用は集中型の運用戦略です。アクティビティ、コンテンツプッシュ、マーケティング、ユーザー関係維持をすべてのユーザーを対象にすると、運用リソースの無駄になります。1 つの方法ですべてのユーザーを満足させることはできず、1 つの方法で最善を尽くすこともできません。

ユーザー間には違いがあり、その違いを洗練された操作で補う必要があります。

洗練とは、目標をより細かい粒度に細分化することを意味します。たとえば、国内の売上は上海の売上と北京の売上になり、年間の売上は第 1 四半期の売上と第 2 四半期の売上になり、ユーザーは新規ユーザーと既存ユーザーになります。電子商取引でマスクを販売する場合、北京のユーザーに販売する方が良いのでしょうか、それとも海南省のユーザーに販売する方が良いのでしょうか?化粧品を宣伝する場合、ターゲット層が男性と女性であることは明らかです。洗練(分割)はデータ分析の考え方であり、また運用手段でもあります。

リーンは精度よりも一歩先を行きます。精度は手段であり、リーンは目標です。リーンとは何ですか? Lean は 80/20 ルールであり、最も重要なユーザーを見つけることです。化粧品は女性向けに販売されるべきであることは誰もが知っていますが、より多く支払う女性も必ず存在します。女性の 20% が売上の 80% を占めています。リーンとは、この 20% を特定することです。

最も適切なユーザーに対して、最も適切なタイミングで最も適切な対策を講じることで、最大の価値を生み出します。

最初の 3 つの「最も」は精度を指し、最後の「最も」は無駄のなさ、つまり価値/目標の最大化を指します。 CRM があるので、CRM から最も価値のある顧客を見つけて維持することができます。リスク管理があるので、最も不履行になりそうな投資を見つけることができます。活動を組織するときは、他人を利用しようとするユーザーではなく、最も高い成果を上げているユーザーを歓迎します。ポイント センターの場合、最高の結果は最高品質の顧客によってのみ達成されます。

2. 未来は現在よりも重要であり、現在は過去よりも重要である

2つ目のコアであるデータ駆動型の運用により、未来を予測し、現在を把握することができます。従来の運用方法は、過去に何が起こったか、どれくらいの売上があったか、アクティブユーザーがどれくらいいるかを把握することですが、ますます激化する競争環境においては、これでは十分ではありません。

現在の瞬間を捉えるということは、データから即時のフィードバックを得ることを意味します。アクティビティを推進したい場合、事前に 5% のユーザーを選択してテストを実施し、コンバージョン率は高いか、アクティビティの反応は良いかなど、ユーザーからのフィードバックをタイムリーに得ることができます。そして、そのデータを基にその後の運用を継続するか改善するかを決定します。これはテクノロジーによってもたらされた進歩的な利点です。

未来を予測するのは機械学習の分野です。データモデリングを通じて、ユーザーが解約する可能性があるかどうか、製品を気に入って購入するかどうか、新しく公開された映画を好むかどうかなどの確率的な予測を得ることができます。運用担当者はこれらの確率を使用して、ターゲットを絞った運用を行うことができます。

技術的な制限により機械学習を使用できない場合は、オペレーターの経験とデータの機密性に応じて、既存のデータ傾向に基づいて推定を行う必要があります。

3. システム化と自動化

データベースの運用システムを構築する過程で、オペレーターは多くのツールを使用します。

ユーザー数が一定レベルに達したら、ユーザーの定着率を高めるためにポイントセンターの導入を検討します。製品に現場のプロモーションや営業担当者が関わる場合は、顧客基盤を維持するためにCRM(顧客関係管理)を追加する必要があります。O2Oやeコマースの場合、基本構成にクーポンの送信を含める必要があります。フィードバックが増えるにつれて、さまざまな質問を解決するためのカスタマーサービスセンターも必要になります。これらのツールは操作と密接に関係しており、データ操作システムにおいて重要な割合を占めています。

目標をより良く達成するために、独立した操作モジュール/操作バックグラウンドに分離されます。優れた運用バックエンドはユーザー側の製品と同じくらい重要であり、バックエンド製品マネージャーによる計画も必要です。

私たちがよく目にするクーポンを例にとると、クーポンには一定のルールが必要です。主な目標は財務データ、つまりクーポンのコストと収益のバランスです。クーポンを無差別に発行すると確実に損失が発生しますし、少なすぎるとユーザーに知られることさえありません。どのようなクーポンがあるのか​​、どのように発行するのか、これまでに何枚発行して何枚使ったのか、今後何枚発行するのか、発行したが使われていないのはどれくらいなのか、これらが大きな枠組みになるので、クーポン発行システムを作りました。

クーポンは CRM と組み合わせることができ、CRM は複数の指標を通じてユーザーをさまざまな価値とグループに分類します。このユーザーは特にお金を使うのが好きなので、1,000 元以上の購入で 100 元の割引が受けられるクーポンは、200 元以上の購入で 20 元の割引が受けられるクーポンよりも間違いなく優れています。ユーザーはまだ購入を行っていないため、初回注文割引で購入を促進させる必要があります。しばらく購入していないユーザーもいるので、運営側はマーケティングに力を入れなければなりません。以上が、より高次の視点から、効果、ROI、収益性を評価する一連の流れとなります。これはデータを活用して運用戦略を立てることです。

CRM はカスタマー サービス センターと組み合わせることもできます。電話番号はユーザーのデータにバインドする必要があります。VIP ユーザーからの電話には、アカウント スーパーバイザーが応対し、ゲストがくつろげるよう配慮します。一般ユーザーも油断はできません。カスタマーサービスは、少なくとも背景のユーザーポートレートを通じてユーザーの状況を把握し、的を絞ったサービスを提供する必要があります。データ運用システムは、運用や製品にのみ役立つわけではありません。

システム化には、どのような方法が使いやすいか、どのような手段が有効か、どの活動を継続的に実行できるかなど、運用プロセスと戦略フロー全体を製品として扱うことが必要です。これらすべてを修正し、日常のルーチンとトリックとして運用するための製品背景を作成する必要があります。このような体系的な考え方は「再利用」とも呼ばれます。次のステップは、システムをどんどん自動化し、どんどん強力にすることです。これもリーンの別の形です。

上記のすべては、データ、製品運用、システム、および人員を組み合わせたものです。システムがシステムである理由は、それが広大な段階から脱却したからです。すべてが秩序があり、ルールに基づいており、戦略に満ちています。データはシステムの潤滑油です。データがなければ、クーポンを選択的に発行したり、アクティビティを整理したり、メッセージをプッシュしたり、ユーザーを維持したりすることはできません。

データ製品層で処理された各種ラベル、ユーザーポートレート、モデルは、データ操作層で従業員が最大限に活用できるようになります。データ自体には価値はなく、戦略に変換されたときにのみ価値が生まれます。

これら3点をまとめると、処理されたさまざまなデータを体系的に活用し、精度と正確さを手段と目標とし、未来の把握を方向として、運用戦略を定めます。これはデータ操作層の中核です。

ユーザーリーチ

システム全体が最終段階に達すると、ユーザー指向になる必要があります。どれだけ多くのデータが収集され、どれだけ適切に処理され、どれだけ厳密に運用されたとしても、それがユーザーに届けられなければ、システムは失敗します。

システム全体の最初の 3 つの層のユーザーはこれに気づいていません。ユーザーが直接認識するのは、商品のプッシュ通知、バナー、広告スペース、アクティビティ、コピーライティング、商品の表示順序などです。ユーザーは製品とやりとりする際に、直接的なフィードバックを通じて自分の好き嫌いを表現します。

興味がある人はクリックし、気に入った人は購入し、気に入らない人はやめます...これらは新しい一連の行動データを構成し、クリックスルー率、コンバージョン率、直帰率、購入率などのフィードバック指標も構成します。これらの指標は、ユーザーリーチレイヤーの結果と、データ駆動型操作の結果を反映します。

良いか悪いか、どちらも検証する必要があります。

結果は終わりではありません。経営には PDCA と呼ばれる概念があり、これは中国語で Plan-Do-Check-Act と訳され、サイクルを意味します。ユーザーリーチ層は、データベースオペレーションシステムの終わりではなく、新たな始まりです。フィードバックを通じて得られたデータを通じて最適化および改善します。

クリックスルー率は 5% ですが、運用の最適化によって 10% に到達できますか?ユーザーはプッシュを承諾した後、アンインストールを選択しました。このユーザーを救うために何ができるでしょうか?維持率が向上しましたが、この戦略は他のユーザーにも適用できますか?

データ駆動型の運用を行っても満足のいく結果が得られないかもしれませんが、最適化や改善さえ行わなければ、良い機会さえも得られません。

優秀な社員は、データドリブンな運用の結果に満足せず、新たな一歩を踏み出すのです。

これは、終わりと始まりの両方です。このプロセスは反復であり、システムの中核です。

要約する

4 つのレイヤーを直列に見ていきます。下の図は、製品の簡略化されたデータベース操作クローズド ループです。

  • データ収集層: ユーザーがアプリを開いてニュースを閲覧すると、誰がどのニュースをいつ読んだかというユーザーの行動データが埋め込みポイントを通じて記録されます。
  • データ製品層: コンピューターは収集された行動データを処理し、軍事、科学技術、経済などのさまざまな種類のニュースを読んでいるユーザーの数をカウントします。カイ二乗検定を使用して、テクノロジーニュースに関するユーザーの読み方の好みを取得し、それをユーザーのポートレート/タグ システムに書き込みます。
  • データ操作層:最近、一定数のユーザーが参加する必要があるテクノロジー関連のイベントがあります。オペレーターはすべてのユーザーにプッシュすることを選択できないため、ユーザー プールからテクノロジに興味のあるユーザーを選択します。
  • ユーザーリーチレイヤー: ターゲットプッシュ通知の対象となるユーザーを選択し、ユーザーは携帯電話でメッセージを受信します。バックグラウンドでは、ユーザーがプッシュ通知を開いたかどうか、ページを閲覧したかどうか、イベントに参加したかどうかが記録されます。コンバージョン率はフィードバックとして記録され、次の反復での改善に使用されます。

この例は、修飾された閉ループです。データ駆動型の運用システムは、Excel で完結するだけのシンプルなものから、機械学習、データマイニング、分散システムなどのハイエンド技術を導入したものまで、すべては考え方と応用次第です。理解しやすいように、システムの 4 つのレイヤーを 4 つのモデルに簡略化します。

  • データ収集: ユーザーと製品間のインタラクションが入力され、生データ(行動、ビジネス、トラフィック、外部)が出力されます。
  • データ製品: 生データを入力として受け取り、処理済みデータ (ラベル、ポートレート、ディメンション、インジケーター、アルゴリズムの結果) を出力します。
  • データ操作: 処理されたデータが入力として使用され、操作戦略 (ユーザー、コンテンツ、アクティビティ、電子商取引) が出力として使用されます。
  • ユーザーリーチ: 運用戦略を入力として、フィードバック行動(コンバージョン率、クリックスルー率、応答率)を出力します。

ユーザーが生成したフィードバック動作は新しいインタラクティブな入力として機能し、反復と最適化を通じて、データベースの運用システムが適切に動作します。優れたデータ駆動型オペレーションシステムは、高度に自動化されています。たとえば、パーソナライズされた推奨は、データ操作層をバイパスできます。サーバーはリアルタイムで計算した後、推奨結果をユーザーに直接提供し、人が関与する必要はありません。

これらは、データベース運用システムを構成する、相互に接続された連続的な 4 つのシステムです。技術的手段の違いにより、実装方法は異なります。Excel でもデータ駆動型の操作が得意です。

上記は、製品と運用の観点から見たデータベース運用システムであり、R&D技術はあまり関与せず、実際の複雑さはさらに高くなります。もちろん、用途は何千通りもあり、すべては心次第です。皆さんが学ぶのは概念と考え方であってほしいと思います。実際の作業では、皆さんが探求するのを待っている遊び方がまだたくさんあります。

モバイルアプリケーション製品プロモーションサービス: APPプロモーションサービス青瓜メディア広告

この記事の著者は@秦路で、編集・出版は(Qinggua Media)です。転載の際は著者情報と出典を明記してください。

<<:  遵義のグループ購入ミニプログラムを開発するにはどれくらいの費用がかかりますか?遵義グループ購入アプレット開発価格問い合わせ

>>:  河北市場でお茶のミニプログラム代理店になるにはどれくらいの費用がかかりますか?

推薦する

冬休みが近づいてきました。オンライン教育機関はどのようにして生徒を募集し、顧客を引き付けることができるでしょうか?

今年も冬休みが近づき、各地の小中学校の休みのお知らせが続々と発表されています。冬休みは入学者確保の重...

イベントの短い宣伝文を書くにはどうすればいいですか?

実際に小さなイベントのコピーを書き込むことができるオペレーターは何人いるでしょうか? 運用業務では、...

APP はどのようにしてユーザー操作システムを構築するのでしょうか?

インターネット業界の同僚たちも、市場ユーザー総数はほぼ変わらないのに、顧客獲得コストがどんどん高くな...

ビデオスクリプトを使用して商品を販売する5つの方法!

企業や組織が有料トラフィック獲得のために必死に戦っているとき、「コンテンツの活用」はカーブを越えるた...

「カラービジネス実践講座」では、色の組み合わせ方だけでなく、色に関するあらゆる問題を一気に網羅します!

コースカタログ[プロモーションビデオ] カラーマッチングを教えるだけではない、実践的なビジネスコース...

WeChatレストラン注文アプリの使い方は?これらのことを実行して、ストアのパフォーマンスを 2 倍にしましょう。

張小龍が2017年にWeChatミニプログラムを開始して以来、ミニプログラムは企業の間で非常に人気が...

情報フロー広告アカウント最適化手法、5つの方向と次元からのアカウント最適化

情報フロー広告を行う際、次のような問題に遭遇したことがあると思います。露出が少なすぎて売上が上がらな...

快手ブランドアカウント運用プラン!

2021年はブランド自主放送元年です。過去6か月間、Kassが分析したVinda、Huili、Ch...

古代の美容エクササイズの5日間学習プラン。1日5分でシワを取り除き、シミを薄くし、老化を防ぐ

すべての女性は同年代の女性より若くありたいと願っているスキンケア製品には「明らかな効果はない」美容整...

2021年にZhihuで良い商品を推奨し、宣伝する方法についてお話ししましょう。

この記事は主にレッドオーシャン戦略、つまり、トラフィックの多いレッドオーシャン戦場で自分のケーキをど...

Douyin SEOレイアウト、Douyin SEOをどのように行うのですか?

SEOについて聞いたことがあるかどうかはわかりません。検索がある限り、SEO は不可欠です。最もよ...

Tik Tok ゲームのマーケティング例: ダウンロード数が iOS で 40 倍、Android で 16 倍に増加

現在、ますます多くの企業がDouyinのショートビデオに注目し、宣伝しようとしており、成功例も数多く...

感染症流行という大きな試練に直面して、教育機関はどのようにしてオンラインマーケティングとプロモーションに注力できるのでしょうか?

肺炎の突然の流行は、国内の教育機関の活力に「大きな試練」をもたらした。数百万のオフライン中小規模の教...

WeChat Tapの設定方法は? WeChat Tapにサフィックスを設定してテキストを追加するにはどうすればいいですか?

アップデート後、WeChatには個人情報に「タップ」設定が追加されました。多くのユーザーは、個人情報...