コンテキストアウェアエンコーディングの概要

このトピックでは、コンテキストアウェアエンコーディングの概要を説明します。

入門

私たちは皆、携帯電話、タブレット、テレビ、職場、電車で、通りを歩いている間など、より多くのビデオをオンラインで見ています。ストリーミングサービスが拡張され、より多くのスクリーンにわたってコンテンツの需要を満たすため、それらの画面にビデオを配信するためのストレージと帯域幅のコストが増加します。幅広いデバイスに高画質のビデオを効率的に配信することは、Brightcoveでの業務の中核を成しています。コンテキスト認識エンコーディングにより、動画の保存とストリーミングにかかるコストが大幅に削減され、視聴者の再生品質が向上します。コンテキスト認識エンコーディングは、高度なコンテンツ分析アルゴリズムを使用して、ビデオごとに作成するレンディションの数と品質を決定します。ほとんどの場合、これにより、視覚品質を維持しながら、ビデオファイルのサイズが小さくなり（CDN 請求書も小さくなります）。

コンテキスト認識エンコーディングへのサインアップ

コンテキスト対応エンコーディングには追加料金が必要です。ビデオに最適なレンディションセットを入手するには、コンテキスト認識エンコーディングのバンドルについては、アカウントマネージャにお問い合わせください。

アダプティブビットレートストリーミング-ここに来た方法

今日、インターネット経由で配信されるほとんどの動画では、HLS や MPEG-DASH などのアダプティブビットレート (ABR) ストリーミングテクノロジを使用して、ビデオの再生を最適化しています。ABR ストリームには、異なる解像度とビットレートでエンコードされた「レンディション」と呼ばれる同じビデオの複数のコピーが含まれます。ユーザが再生ボタンを押すと、プレーヤーは再生可能なレンディションの一覧を示すマニフェストを受け取ります。プレイヤーは、現在利用可能な帯域幅、バッファの満度、再生ウィンドウのサイズなど、いくつかの要素に基づいて、再生する適切なレンディションを選択します。再生中にこれらの要因が変化するため、プレーヤーは高品質のレンディションまたは低品質のレンディションに切り替えることができます。これにより、最小限のバッファリングで可能な限り最高のビデオ品質が得られます。

ストリーミングサービスは、通常、すべてのコンテンツに対して 1 つのエンコーディング構成を作成します。これは、コンテンツのすべての部分をエンコードするために使用される、あらかじめ決められた ABR レンディションセット（多くの場合「ラダー」と呼ばれます）です。ABRラダーに入れる解像度とビットレートのリストを決定することは、不正確な科学です。場合によっては、ABR ラダーを特定のユースケースに合わせて調整できます。たとえば、アニメーションは一般的に複雑ではないため、低いビットレートでエンコードできます。

静的 ABR の問題

幅広い視聴者にリーチすると、ストリーマーは単一のビットレートのラダーを使用して、さまざまなエンドユーザーデバイス用のさまざまなコンテンツタイプをエンコードして、あらゆるサイズのシナリオに強制します。ほとんどの場合、単一のABRラダーを使用して、テレビ再生用のHDスポーツコンテンツをエンコードし、携帯電話で再生するための漫画もエンコードされています。

問題？1 つのビットレートラダーを使用すると、異なる種類のコンテンツ間で一貫性のない品質が生じることがよくあります。スポーツコンテンツなどの複雑度の高いビデオでは、アニメーションよりも多くのビットが許容される視聴体験を実現する必要があります。たとえば、ABR ラダーを高いビットレートの方向に歪ませて、スポーツコンテンツの見栄えがよくなると、同じプロファイルを使用してアニメーションコンテンツをエンコードするときに、ストレージと帯域幅を無駄に消費します。無駄なストレージと帯域幅は実質のお金です。

コンテキスト認識エンコーディングでの ABR ストリームの最適化

ここでBrightcoveのコンテキスト認識エンコーディング技術が登場します。コンテキスト認識エンコーディングは、すべてのコンテンツに 1 つの ABR ラダーを使用する代わりに、各ソースビデオを分析し、コンテンツごとにカスタムビットレートラダー（レンディションのセット）をインテリジェントに構築します。さらに、コンテキスト認識エンコーディングでは、コンテンツの表示に使用される配信ネットワークおよびデバイスに関連する制約も考慮されます。すべてのタイトルで一貫した品質を維持しながら、必要なレンディションの数と、それぞれに使用する解像度とビットレートを決定します。これにより、ストレージと帯域幅のコストが大幅に削減され、ユーザーの再生エクスペリエンスが向上します。

以下の図は、典型的なスタティック ABR ラダーと、一般的なニュースクリップ用に生成されたコンテキスト認識ラダーの例を示しています。

Context Aware Encoding では、レンディションごとに低いビットレートまたはより高い解像度を使用して、スタティック ABR ラダーと同じ品質を実現できました。これは、再生パフォーマンスとコスト効率の両方にプラスの影響を与えます。

低いビットレートでの再生パフォーマンスが向上

スタティック ABR ラダーを使用すると、1,000 kbps の持続帯域幅を持つモバイル 3G ユーザは、900kbps の 360p レンディションでピークになります。コンテキスト認識エンコーディングは、より低いビットレート（777kbps）で高解像度の 432p レンディションを作成できると判断しました。このレンディションは 13% 少ないビットを使用し、実際にはより高い解像度と品質を実現します。これは、以下のサイドバイサイド比較で見ることができます。下の例では、Context Aware クリップのよりシャープなディテールが、下部のテキストと男性の髪で顕著になります。

同様に、3,000kbps の持続帯域幅を提供するエコノミー価格の住宅用インターネットプランを持つユーザーは、静的 ABR ラダーの下で 720p レンディションでトップアウトし、コンテキストアウェアエンコーディングを使用してフル 1080 p でストリーミングでき、フル HD エクスペリエンスを提供します。

ストレージと帯域幅のコストを削減

静的 ABR ラダーの 8 つのレンディションすべてにビデオをエンコードすると、合計 14,750 kbps のデータが生成されます。1分間のビデオの場合、それは885MBです。右側のコンテキスト対応ラダーでは、4,950 kbps しか生成されません。したがって、同じ1分間のビデオでは、297 MBしかなく、ストレージコストが 66% 削減されます。使用される帯域幅は、視聴者の数と動画の視聴時間によって異なるため、帯域幅の節約はストレージ用の帯域幅よりもさらに大きくなる可能性があります。Brightcoveでは、ストレージと帯域幅のコストを最大 50% 削減できると予想しています。レンディションのビットレートを視覚品質を維持するために必要な最低レートに調整することにより、視聴者は通常、各閲覧セッションで消費する帯域幅が少なくなるため、帯域幅コストを節約できます。

コンテキスト認識エンコーディングと動的配信

コンテキスト認識エンコーディングは、動的配信の機能です。コンテキスト認識エンコーディングは、各ソースビデオを分析し、コンテンツごとにカスタムビットレートラダー（レンディションのセット）をインテリジェントに構築します。視聴者が再生を押すと、Video Cloud は要求しているデバイスを識別し、期待しているメディア形式（コーデック、配信用にパッケージ化する必要がある方法、使用する DRM の種類、必要なクローズドキャプション、オーディオ言語など）を把握します。次に、Dynamic Delivery はこの情報を使用してさまざまな品質レベルをリアルタイムで処理し、コンテンツを要求するデバイスに適した形式にします。

動的配信アーキテクチャを示す図を以下に示します。動的配信の詳細は、「動的配信の概要」を参照してください。

Dynamic Delivery Architecture — 動的配信アーキテクチャ

Video Cloud でのコンテキスト認識エンコーディングの使用

ビデオパブリッシングの観点からは、Video Cloud Studio の内部では、2 つのものが異なって表示されます。まず、アップロードモジュールを使用してビデオをアップロードすると、取り込みプロファイルを選択する際に「コンテキスト認識エンコード」セクションが表示されます。

メディアモジュールは緑色の雲のアイコンを表示します（）動的配信またはコンテキストアウェアの取り込みプロファイルを使用して取り込まれたビデオタイトルの横。従来の取り込みプロファイルを使用して取り込まれたビデオには、灰色のアイコンが表示されます（）。