この記事の著者は、基本的な推奨エンジンと情報フローの影響要因について、皆さんが予備的な理解を得られるよう導き、情報フローフィードデータ操作の実際のケースを通じて、データ操作の価値をまとめ、皆さんが学習して参考にできるようにします。 1. 情報フローの概要情報フィードは、私たちの 24 時間のインターネット生活の中で、ほぼどこにでもあるものになりました。地下鉄で通勤しているとき、今日頭条をチェックして最新ニュースを入手することができます。情報フローは、ホットな記事をキューにきちんと配置して、読むことができます。おいしい食事をしたいときは、大衆点評の情報フローが市内の多くのレストランを推奨しています。夜眠れず、仕事で疲れた自分にご褒美として何かを買いたいときは、淘宝網のおすすめ商品の見事な配列は非常に正確で、閲覧を止めることができません... 情報フロー形式は広く使用されていますが、最も初期の応用は、2006 年に Facebook がリリースしたニュース フィード機能から始まった情報コンテンツのシナリオでした。 このプラットフォームは、確立されたアルゴリズムとルールに従ってコンテンツを分類した後に集約し、ユーザーが 1 つのページでスムーズかつ効率的にコンテンツを利用できるようにします。ユーザーは、モバイル インタラクティブ ネットワークの先史時代のように、ポータルとブログ サイトの間を頻繁に行き来する必要がなくなりました。また、プラットフォームは、集約されたコンテンツ表示プラットフォームを提供することで、ユーザーを自身の管轄区域内に効率的に留めています。 情報の流れを表す英語は「Feed」ですが、これは実に巧妙な言葉です。 Feed は英語で「飼料」を意味し、プラットフォームがユーザーに一定の順序でコンテンツを「供給」する情報フローの場面を鮮やかに表現しています。 ユーザーがコンテンツを消費する時間は限られています。プラットフォームは、限られた時間内にユーザーの好みのコンテンツを提供し、ユーザーがプラットフォーム上でより多くのコンテンツを消費できるようにするにはどうすればよいでしょうか (それによってプラットフォームに高い潜在的商業価値をもたらすには)? これは、すべてのフィード シーン運営者が長年研究してきた「推奨ランキング」の問題です。 2. 情報フローの基盤:レコメンデーションエンジンレコメンデーションエンジンの核心は「適切なアイテムを適切なユーザーにいかに推奨するか」であり、そのため「アイテム」と「ユーザー」のつながりを確立することがレコメンデーションアルゴリズムにおける最も核心的な命題となります。推薦プロセス全体は、基本的に「リコール」→「ソート」→「重みの調整」→「結果の出力」というプロセスとして要約できます。誰もがプロセスを理解できるように、簡単な比喩を使用します。 皆さんは学生時代に軍事訓練に参加したことがあるでしょう。訓練の最後に行われる最後の閲兵式は、訓練プロセス全体のハイライトです。では、キューを合理的に配置するにはどうすればよいでしょうか?
推奨アルゴリズムは非常に奥が深く技術的なテーマですが、この本は主にオペレーターを対象としているため、著者は情報フローのランキングに影響を与える主な要因をより明確なレベルからまとめようとしています。
3. 問題: 情報フィードをコールド スタートするにはどうすればよいでしょうか?そうは言っても、私はこれまでツール製品を操作してきた経験を皆さんと共有したいと思います。ほとんどのツール製品が抱えるジレンマは誰もがよく知っていることでしょう。つまり、ユーザーが長期間利用し続け、定着率が低いため、効率と収益化の方法が限られてしまうのです。市場には競合製品が多数存在しており、データ指標を通じて自社製品の価値を迅速に証明できなければ、製品全体がキャンセルされるリスクに直面することになります。 そのため、ユーザーがサイトで過ごす時間をいかに増やすかが、私たちのチームにとって非常に重要な課題となっています。当社のツール製品には、WiFi 接続機能があります。以前は、ユーザーが WiFi に正常に接続した後、リダイレクトされるランディング ページは「接続成功」ページでした。それ以外には、他の接続はありませんでした。 しかし、このとき、ユーザーは操作を完了したという感情の高揚期にあり、トラフィックに敏感ではない WiFi シナリオにいます。情報フィードのコンテンツを引き継ぐことで、ユーザーに何らかのコンテンツ消費価値を提供し、同時に商業的な収益化シナリオも作成できないかと考えました。 しかし、私たちはツールプロダクトチームであり、コンテンツ運用の経験はありません。どうすれば0から1の情報フィードを作れるのでしょうか?チームの現状を分析した後、私たちはすぐに次の側面から始めることにしました。まず、情報コンテンツはどこから来ているのでしょうか?当社の姉妹製品の中には、既成の情報コンテンツを備えているものもありますが、特定の推奨アルゴリズムは当社自身で開発する必要があります。当社のアルゴリズム チームにはコンテンツ推奨の経験はありませんが、ソフトウェア配信における推奨の経験にも類似点があり、そこから学び、再利用することができます。 料理上手は、米なしでは料理ができません。私たちには「米」と「料理上手」の両方がありますが、ユーザーが最もおいしいと思うのが「チャーハン」なのか「ライススープ」なのかは、結論を出す前にもっと試してみる必要があります。 推奨ソートにはさまざまな要素がありますが、ツール製品の属性により、使用できる要素は多くありません。状況に応じて、次の 3 つのグループの A/B テスト実験を実施することにしました。
3つの実験グループの設定に基づいて、戦略を実行するための3つのランダムテストユーザーグループを選択し、「平均情報消費時間」を主要な評価指標として設定しました。実験結果が出るまで 3 日間も待ちました。この 3 日間、私たちのチームはどの戦略が最も効果的かを賭けていました。読者の皆さん、どの戦略が最も効果的だと思いますか? 4. 分析: 問題のより深い原因を見つけるチーム内の賭けは基本的にすべて、最初の 2 つのグループの戦略の方が優れているという見方に集中していました。ユーザー ポートレートの方が良いと考える同僚の見解は単純明快です。ユーザーは、自分にとってより関連性の高いコンテンツに、より興味を持つようになります。人気順で並べ替えた方が効果があると考える同僚も正しいです。より多くの人がクリックするコンテンツは、好奇心をそそり、新鮮であることが多いため、自然とより多くの人が読みたくなります。 しかし、当社の運用スタッフが実験データを収集して分類した後、彼らは少し驚きました。時間による分類に基づいた最も人気のないオプション 3 が、実際には最初の 2 つのオプションよりも「平均情報消費時間」が優れていたのです。チームはしばらくの間、少し意気消沈し、アルゴリズムチームの同僚の技術力にも疑問を抱いていました。 オペレーターとして、この時点でデータ分析をさらに一歩進めて、データ指標が真実全体を示しているかどうかを確認する必要があります。 この問題を分析するために、まず問題を細分化しました。 実験データ指標:
実験設計:
分解して分析した結果、最初の 2 つのソリューション グループの貧弱なデータ指標が必ずしも真実のすべてではないことがわかりました。まず、「平均情報消費時間」という指標の設定に問題があることがわかりました。結局のところ、私たちの製品はツール製品であり、ほとんどのユーザーは WiFi に接続したらすぐに離れてしまいます。情報フィードは、比較的アイドル状態の一部のユーザーのみを対象とした機能になる運命にあります。 そのため、実験グループ間のユーザーの「平均情報消費時間」は非常に離散的であり、プラン3の個々の極値ユーザーの存在が全体の平均時間データを引き上げました。この問題を解決するには、計算中に極端な値に一定の調整を加え、「平均情報クリック率」のデータ指標を追加して、各ソリューションの有効性をより客観的に評価することができます。 第二に、分析の結果、データ収集上の理由により、計画 1 と計画 2 はそれぞれの戦略の効果を十分に達成できなかったことが判明しました。たとえば、ソリューション 1 の「ユーザー ポートレートに基づく並べ替え」では、Android の権限制限により、実験グループの多くのユーザーがインストール リスト データが不完全でした。一部のユーザーの IP の地理的位置識別は十分に正確ではありませんでした。テストでは、広州の一部のユーザーに北京のローカル ニュースが推奨されたことが判明し、当然ながら戦略の有効性に影響を与えました。 たとえば、プラン 2 では、一部の「クリックベイト」コンテンツはクリック率が高いため、実験グループ ユーザーの最初の画面は「クリックベイト」コンテンツでいっぱいになります。コンテンツの質が非常に低く、ユーザーはクリック後すぐに画面から飛び出してしまい、戦略の実験結果が悪くなります。 5. データ操作の考え方の重要性データ指標をさらに分析せずに実験結果だけを見ると、「時間ソート」がユーザーにとって最適なソリューションであり、今後はこの方向に開発を進めていくべきだとすぐに考えることができます。いわゆるモデルアルゴリズムの最適化は必要ありません。しかし、分析を通じてのみ、事実の全体像をより明確に把握し、反復のための最適化計画を継続的に提案することができます。 ここで反映されているのは、問題分解思考の重要性と、論理的な問題分析思考の重要性です。この本を通じて、読者の皆さんとこれらの思考フレームワークを共有し、より優れたオペレーターになれることを願っています。 裏面に記入今後は、データ操作、インターネット製品(または個人的な芸術的趣味)に関する記事をプラットフォーム上でさらに共有する予定です。皆さんのコミュニケーションを歓迎します! 著者: 黄一元 出典:黄怡源 |
<<: Weiboでソフト記事を宣伝するためのテクニックは何ですか?
企画提案書を書くとき、相手を惑わすような内容を書くにはどうすればいいのでしょうか?コンテンツの説得力...
2020年、ある飲料がどこからともなく現れ、飲料業界で急速に注目を集めました。この記事では、プライ...
ユーザーポートレートという言葉は非常に人気がありますが、市場にはユーザーポートレートを行うことができ...
Baoji Kitchen Mini Program をカスタマイズする場合の価格はいくらですか?...
「広告制作」となると、何から始めたらいいのかわからず頭を悩ませる方も多いのではないでしょうか。この...
2019年は教育業界にとって「冬の時代」となり、創業21年を迎えたWeb Englishをはじめ、...
新しく発表された「2016年第2四半期中国アプリランキング」。 概要 2016 年もすでに半分が過ぎ...
Q: WeChat ミニプログラムに応募できるのは誰ですか? 1 人あたり何個まで応募できますか?...
業界の発展にはサイクルがあり、約 20 年ごとに大きな変化が起こります。これは不動産、金融、インター...
学習を通じて、[Tik Tokショート動画を再生するためのクールで実用的なスキル]についての理解が深...
張山玲によるアリババの3つの重要な斧スキルに関する21回の講義[完了]リソースの紹介:張山玲: Al...
長い記事の警告:この記事は、3日間にわたってまとめられた1万語の実用的な情報の産物です。30分ですぐ...
最近、iResearch ConsultingとIMS New Media Business Gro...
ランディング ページはランディング ページとも呼ばれます。これは、ユーザーが広告をクリックした後に表...
運営において最も重要なタスクの 1 つは、ユーザーを引き付けることです。私たちは常に、より少ないコス...