Netflixがビッグデータをどのように使用しているか
Netflixがストリーミングビジネスにどれくらい
すべての顧客との対話を通じて情報を収集することで、Netflixは視聴者の心に飛び込むことができ、ショーや映画を終了する前であっても、次に見たい
曜日、時刻、デバイス、場合によっては場所によって異なる表示動作があることを示唆するデータがあります。
-リード-ヘイスティングス
Netflixには、1億4000万人以上の加入者がいる大規模なユーザーベースがあります。 Netflixがすべての人に個々の味を与えるために追跡するいくつかの指標は次のとおりです—
- コンテンツを視聴した日
- コンテンツを視聴した時間
- コンテンツの性質
- プラットフォーム上での検索方法
- 再視聴されたコンテンツの一部
- コンテンツが一時停止、巻き戻し、早送りされたか
- コンテンツが一時停止、巻き戻し、早送りされたか
- ユーザーの位置データ
- コンテンツを残したとき
- ユーザーによって与えられた評価
- 閲覧とスクロールの動作
以上 時間、Netflixは、このデータを利用し、正しい方向に会社を操縦するのに役立つ重要な洞察を生成するいくつかのアルゴリズムとメカニズムを展開していま これらのツールと機能のいくつかは次のとおりです。
●ニアリアルタイムレコメンデーションエンジン
ユーザーの海では、各ユーザーは、彼らが見て、検索し、自分のウォッチリストに追加するものに基づいて、一日あたりの評価の数百を生成し、このデータは、最終的にはビッグデータの一部になります。 Netflixはこれらすべての情報を保存し、主要な機械学習アルゴリズムを使用して、視聴者の好みを示すパターンを構築します。 このパターンは、みんなの味がどのようにユニークであるかのために、他の視聴者と一致することはありません。
視聴率に基づいて、Netflixはメディアを分類し、推奨システムが次に見たいと思うものを視聴者に提案します。
Netflixはすべてを知っています。 Netflixは、人がそれを見て停止したときに知っています。 彼らは彼らのアルゴリズムのすべてを持っており、この人はショーの五分を見て、その後停止したことを知っています。 彼らは彼らの歴史に基づいて、行動と時間によって彼らがそれに戻ってくることを伝えることができます。
-ミッチェル-フルウィッツ
● アートワーク&画像の選択
Netflixが単一のテレビ番組や映画のために複数の作品を表示する理由を疑問に思ったことはありますか?
この背後にあるツールはAVAと呼ばれ、本質的にはどの作品や画像を誰に表示するかを選択するアルゴリズムです。 美学の視覚分析のための短い、AVAは利用できるあらゆるビデオをふるいにかけ、アートワークとして使用されて最も適しているフレームを識別する。
AVAは、俳優の表情、シーンの照明、関心のある領域、画面上の被写体の配置など、画像を確定する前に多くの指標を考慮しています。 それも、いくつかの味のグループに分類されたユーザーに表示する作品を分類し、ソートします。
-ファムケ-ヤンセンJansson Jansson Jansson Jansson Janssen
● 制作計画
クリエイターが新しいショーや映画についてのアイデアを考え出すとき、データは不可欠な部分を果たします。 何かが紙の上に取得する前にブレーンストーミングの多くが行われ、データが入ってくるところです。
新しいオリジナルコンテンツの作成経験と、視聴者が以前のコンテンツをどのように認識したかに関する大量のデータを使用することで、ビッグデー
これらの課題には、撮影場所、撮影の時間と日などを特定することが含まれる可能性があります。 単純な予測モデルであっても、Netflixは計画に費やす労力を大幅に節約し、経費をさらに削減できます。
Netflixは、人々が何をしたいのかを知っているので、オリジナルのコンテンツを試運転しています。
-ニューヨーク-タイムズ
● Metaflow
Netflixには、データサイエンティストの生産性を高めることを目的としたクラウドネイティブで人間中心のフレームワークであるオープンソースのMetaflowがあります。
Metaflowの背後にあるアイデアは、データ科学者の焦点をモデルのインフラストラクチャの心配から問題の解決に移すことでした。 Metaflowは、Metaflowをプラグアンドプレイフレームワークのように感じるような微調整された機能のセットを提供することによって、彼らのアイデアを自由に試 Metaflowのいくつかの注目すべき機能は次のとおりです:9511>
●分散コンピューティングプラットフォーム上で作業する能力
●バージョン管理と実験のためのスナップショットコードとデータのオプション
●
● Polynote
Netflixによって開発され、オープンソース、Polynoteはポリグロットです Scalaやその他のさまざまな機能をサポートするノートブック。 Polynoteは、JVMベースの機械学習プラットフォームとPythonのデータ科学者や機械学習研究者へのスムーズな統合を可能にします。 このノートブックのいくつかのハイライトは次のとおりです。
●カーネルの状態と実行中のタスクに関する洞察を提供
●単純な依存関係と構成管理を提供
●オートコンプリート、エラーのハイライト、再現性、編集、改善、可視性、データの可視化など、IDEのような機能を提供します。
●Metacat
Netflixが運用する膨大なデータプールは、Amazon S3、Druid、Redshift、MySqlなどの複数のプラットフォームに分散しています。 これらのデータストア間のシームレスな相互運用性を維持するために、Netflixはサービスを必要としていました。
この単純化の必要性は、すべてのデータストアにメタデータアクセスを集中的に提供することを唯一の目的としたMetacatを生み出しました。 Netflixは、以下の主要な目標を達成することを目的としてMetaflowを作成しました:
●メタデータシステムの一元化されたビューを統一して提供する
●プラットフォーム用のデータセットメタデータのための単一のAPIを提供する
●データセットのビジネスおよびユーザーメタデータ保存のためのソリューションを提供する
● ドルイド
“Apache Druidは、高性能のリアルタイム分析データベースです。 これは、高速なクエリと取り込みが本当に重要なワークフロー用に設計されています。 Druidは、瞬時のデータ可視性、アドホッククエリ、運用分析、および高い同時実行性の処理に優れています。”
—ドルイド。io
Netflixは、ユーザーが毎回高品質のユーザーエクスペリエンスを得ることを保証するためにApache Druidを使用しています。 毎回一流のユーザーエクスペリエンスを提供することは、単純な偉業ではありません。 いくつかのイベントを一定の分析し、必要なデータを収集して分析する必要があります。 このデータは、再生情報からデバイス情報、プラットフォームのパフォーマンスの測定など、何でもかまいません。 これらのすべてのイベントメトリクスは生データを複雑にし、それがDruidの出番です。
Druidのタスクは、クエリが定期的かつ不確実な期間に実行されるデータベースに対してリアルタイム分析を提供することです。 それは非常に拡張可能、ある特定の作業負荷のための優秀な性能を提供する。
Netflixは、それがどのように強力であり、ライブラリとペアになったときにどのように優れているかのためにPythonを愛しています。 NetflixはPythonを使用して、次のようなミッションクリティカルな側面のホストを管理します:
●CDNインフラストラクチャを管理するアプリケーション
●運用データ、トラフィック分布、運用効率の分析
●プロトタイピング可視化ツール
●統計ツール、データ5949>●a/bテストを使用した実験用