ApsaraVideo Media Processing (MPS) では、オーディオファイルまたはビデオファイルを1つ以上のファイルに変換して、さまざまなネットワーク帯域幅、端末処理機能、およびユーザーのニーズに対応できます。 MPSは、メディアファイルのコンテンツ、テキスト、スピーチ、シーンのマルチモーダル分析を実行し、自動レビュー、コンテンツ認識、スマート編集などのさまざまな機能を提供します。

MPSを使用して次の操作を実行できます。
  • さまざまな端末デバイスに対応: メディア形式を変換して、PC、TV、モバイルデバイスなどの複数のタイプの端末デバイスでの再生をサポートできます。
  • さまざまなネットワーク条件に適応: さまざまな定義のビデオファイルを生成して、さまざまなネットワーク帯域幅にビットレートを適応させることができます。 トランスコードされたビデオファイルは、標準解像度、高解像度、または超高解像度にすることができます。
  • 透かしの追加: エンタープライズロゴ、テレビ局ロゴ、またはユーザーのニックネームを透かしとしてビデオに追加して、ブランド情報と著作権情報を強調し、製品の認知度を高めることができます。
  • スナップショットを撮る: 特定の時点でビデオのスナップショットを撮ることができます。 スナップショットをビデオサムネイルとして使用するか、複数のスナップショットを使用してスプライトを生成できます。
  • ビデオの編集: 元のビデオを編集、トリミング、およびマージして新しいビデオを生成できます。
  • ビデオの強化を実行する: 品質の悪いビデオからぼかしやモザイクを削除して、より高い定義で復元されたバージョンを生成できます。
  • ストレージとトラフィックのコストを削減: ビデオの品質を損なうことなく、ビデオのビットレートを調整したり、圧縮率を上げたり、ファイルサイズを縮小したりできます。 これにより、再生中のビデオの吃音が軽減され、ストレージとトラフィックコストが節約されます。
  • Generate media fingerprints: You can extract fingerprint features such as images and audio from a video to generate a media fingerprint. メディアフィンガープリントを使用して、重複するビデオを見つけて削除したり、ビデオクリップのソースを追跡したり、著作権を侵害するビデオをフィルタリングしたり、ユーザー生成コンテンツ (UGC) を識別したりできます。
  • 自動レビューを実行する: MPSは、ビデオのスピーチ、テキスト、およびシーンのポルノコンテンツ、テロコンテンツ、広告、および望ましくないコンテンツをインテリジェントに検出します。 この機能は、手動レビューのための人員コストを削減し、非準拠コンテンツによってもたらされるリスクを軽減するのに役立ちます。
  • ビデオのコンバージョン率 (CVR) を向上させる: MPSは、画像の美学と大量のユーザー行動データから学習し、ビデオから最適なキーフレームを選択してから、画像、アニメーションステッカー、または短いビデオをビデオサムネイルとして生成します。

トランスコード

コンテナー形式

設定項目 説明
Input format
  • コンテナフォーマット: 3GP、AVI、FLV、MP4、M3U8、MPG、ASF、WMV、MKV、MOV、TS、WebM、またはMXF
  • ビデオ符号化フォーマット: H.264/AVC、H.263、H.263 + 、H.265、MPEG-1、MPEG-2、MPEG-4、MJPEG、VP8、VP9、Quicktime、RealVideo、またはWindows Mediaのビデオ
  • オーディオエンコード形式: AAC、AC-3、ADPCM、AMR、DSD、MP1、MP2、MP3、PCM、RealAudio、またはWindows Mediaオーディオ
Output format
  • コンテナ形式:
    • ビデオ: FLV、MP4、HLS (M3U8 + TS) 、またはMPEG-DASH (MPD + fMP4)
    • オーディオ: MP3、MP4、OGG、FLAC、またはM4A
    • 画像: GIFまたはWEBP
  • ビデオ符号化フォーマット: H.264/AVCまたはH.265/HEVC
  • オーディオエンコード形式: MP3、AAC、VORBIS、またはFLAC
オーディオ抽出 ビデオイメージパーツを無効にして、ビデオからオーディオのみを抽出します。
Video extraction オーディオ部分を無効にして、ビデオファイルからビデオのみを抽出します。
コンテナ形式の変換 エンコード形式を変更せずに、ビデオのコンテナ形式を別の形式に変換します。 オーディオまたはビデオファイルのコンテナ形式をMP4、M3U8、またはFLVに変換できます。
アニメーションステッカーへのビデオ ビデオからハイライトクリップをキャプチャし、GIFまたはWEBP形式のアニメーションステッカーに変換します。
ビデオ符号化パラメータ
パラメーター 説明
Codec ビデオコーデック形式。
  • 有効な値: H.264、H.265、GIF、およびWEBP。
  • デフォルト値: H.264。
ビットレート トランスコードされたビデオのビットレート。
  • 有効な値: [10,50000] 。
  • 単位:Kbit/s
FPS トランスコードされたビデオのフレームレート。
  • デフォルト値は、入力ビデオファイルのフレームレートです。 入力ビデオファイルのフレームレートが60を超える場合、値は60です。
  • 有効な値: (0,60) 。
  • 単位: フレーム /秒。
Width* Height トランスコードされたビデオの解像度。
  • 幅:
    • デフォルト値: ビデオの元の幅。
    • 有効な値: [128,4096] 。
    • 単位: ピクセル
  • 高さ:
    • デフォルト値: ビデオの元の高さ。
    • 値の範囲: [128,4096] 。
    • 単位: ピクセル
規模 自動スケーリング。 高さまたは幅による比例スケーリングを有効にできます。
ゴップ グループオブピクチャ (GOP) サイズ。 GOPサイズは、キーフレームの最大間隔またはフレームグループ内の最大フレーム数を示す。
  • 最大間隔を指定する場合は、値に単位を含める必要があります。 この場合、単位は秒である。 デフォルト値: 10 秒。
  • 最大フレーム数を指定する场合, 値には単位が含まれません。 設定可能な値は1 から 100です。
プロファイル コーデックプロファイル。 This parameter is only valid when the codec format is H.264. このパラメーターは、Baseline、Main、またはHighに設定できます。
PixFmt The pixel format for video color encoding.
  • yuv420pやyuvj420pなどの標準ピクセル形式がサポートされています。
  • The default pixel format can be yuv420p or the original color format.
Rotate 時計回りのビデオの回転角度。
  • 有効な値: [0,360] 。
  • デフォルト値は 0 です。
ビデオ処理パラメータ
パラメーター 説明
ScanMode スキャンモード。 有効な値: インターレースとプログレッシブ。
レート制御モード ビットレート制御方法。 以下のビットレート制御方法がサポートされる: VBR、CBR、およびCRF。
Crop ビデオイメージをトリミングするかどうかを指定します。 MPSは、ビデオ画像の黒い境界を自動的に検出して削除できます。 必要に応じてトリミング関連のパラメーターを設定することもできます。
Pad ビデオイメージに黒い境界線を追加するかどうかを指定します。 ビデオ画像に黒い境界線を追加できます。
オーディオ符号化パラメータ
パラメーター 説明
Codec オーディオコーデック形式。
  • 有効な値: AAC、MP3、VORBIS、およびFLAC。
  • デフォルト値: AAC
Samplerate The sampling rate.
  • デフォルト値: 44100
  • 有効な値: 22050、32000、44100、48000、96000
  • 単位: Hz
  • ビデオファイルのコンテナ形式がFLVで、オーディオファイルのエンコード形式がMP3の場合、このパラメーターを32000、48000、または96000に設定することはできません。
  • オーディオファイルのエンコード形式がMP3の場合、このパラメーターを96000に設定することはできません。
ビットレート オーディオのビットレート
  • デフォルト値: 128
  • ビットレート範囲: [8,1000] 。
  • 単位:Kbit/s
Channels サウンドチャンネルの数。
  • デフォルト値:2。
  • CodecパラメーターがMP3に設定されている場合、このパラメーターは1または2にのみ設定できます。
  • CodecパラメーターがAACに設定されている場合、このパラメーターは1、2、4、5、6、または8にのみ設定できます。
トランスコーディング制御
機能 説明
HLS MasterPlayList この機能を使用すると、1つ以上のビデオストリームをさまざまなビットレートで、さまざまな言語の字幕、およびオーディオトラックをMaster Playlistファイルにパッケージ化できます。
条件付きコード変換 トランスコードテンプレートで指定したビットレートまたは解像度が入力ビデオのビットレートまたは解像度よりも高い場合は、次のいずれかのオプションを選択できます。
  • Do not transcode the video.
  • ビデオをテンプレート仕様にトランスコードします。ただし、トランスコードされたビデオのビットレートまたは解像度は入力ビデオのビットレートまたは解像度と同じです。
ワークフロー MPSは、オーディオまたはビデオファイルがアップロードされた後、クラウドでワークフローを自動的に実行します。

コード変換のテンプレート

プリセットテンプレート

MPSは、トランスコードされたビデオがさまざまなネットワーク帯域幅に適応できるように、一連のプリセットテンプレートを提供します。

  • インテリジェントなプリセットテンプレート

    インテリジェントプリセットテンプレートは、出力ビデオファイルが要件を満たすように、入力ビデオファイルに基づいてコード変換パラメータを自動的に調整します。 インテリジェントプリセットテンプレートが入力ビデオファイルに適用可能かどうかは、入力ビデオファイルの解像度、ビットレート、およびその他のプロパティによって異なります。 したがって、分析タスクを送信して、入力ビデオファイルで使用可能なインテリジェントプリセットテンプレートのリストを取得する必要があります。 MPSは、メディアファイルのビットレートを低減する必要性と、トランスコード処理における品質損失を低減する必要性とのバランスを取ろうとする。 インテリジェントなプリセットテンプレートを使用する場合、品質が優先されます。

  • 静的プリセットテンプレート

    このタイプのテンプレートを使用する前に、分析タスクは必要ありません。 静的プリセットテンプレートを使用して、ビデオファイルをトランスコードしたり、オーディオファイルをMP3形式にトランスコードしたり、メディアファイルのコンテナ形式を変換したりできます。 このタイプのテンプレートを使用して生成されたメディアファイルは、一般的な再生デバイスとネットワーク帯域幅に適応できます。 静的プリセットテンプレートは、最初に出力ビットレートを制御します。

  • プリセットNarrowband HD TMテンプレート

    このタイプのテンプレートを使用する前に、分析タスクは必要ありません。 このタイプのテンプレートを使用して、FLV、MP4、またはM3U8形式のビデオを生成できます。 プリセットNarrowband HD TMテンプレートを含むプリセットNarrowband HD TM 1.0テンプレートは、MPSによってのみ提供されます。 他のトランスコードテンプレートと比較して、プリセットNarrowband HD TMテンプレートは、ビデオ品質を損なうことなく、より低いビットレートで出力ビデオを生成できます。 このように、MPSはより多くのコストを節約するのに役立ちます。

カスタムテンプレート

カスタムテンプレートには、オーディオ、ビデオ、コンテナーパラメーターなど、一連のトランスコードパラメーターが含まれています。 必要に応じてコード変換パラメーターを設定し、通常のテンプレートを作成できます。 または、チケットを起票して、作成したテンプレートをNarrowband HD TM 1.0に設定することもできます。

ビデオ編集

機能 説明
ビデオ編集 この機能を使用すると、指定された時点から指定された期間のビデオをトリミングしてビデオクリップを生成できます。
ビデオマージ この機能により、最大20のビデオを1つにマージできます。
ぼやけ この機能により、ビデオの指定領域をぼかすことができます。
ビデオの頭と尾
  • この機能を使用すると、ビデオの先頭に動的なロゴを追加したり、ビデオの末尾のコンテンツを指定したりできます。
  • この機能は、製品の認識を高め、著作権情報を強調するのに役立ちます。

透かし

機能 説明
静的透かし
  • 出力ビデオには最大20個の透かしを追加できます。
  • サポートされているファイル形式: PNG、テキスト、MOV、およびAPNG。
動的な透かし 透かしを表示する期間を指定できます。

スナップショット

機能 説明
ビデオスナップショット
  • この機能を使用すると、Object Storage Service (OSS) に保存されているビデオの特定の時点で画像をキャプチャできます。 キャプチャされた画像はJPG形式です。
  • 単一のスナップショット、異なる時点での複数のスナップショット、または均等な間隔でのスナップショットを取得できます。
スプライトとWebVTTベースのサムネイル スプライトは、一連のスナップショットを取ることによって生成される。 この機能により、1回のリクエストで複数のスナップショットに関する情報を取得できます。 このようにして、リクエストの数が減り、クライアントのパフォーマンスが向上します。
スマートなサムネイル MPS learns from image aesthetics, recognizes the content of a video, selects the optimal keyframe from the video, and then generates an image as the video thumbnail.

狭帯域 HDTM

機能 説明
狭帯域HD TM 1.0 Narrowband HD TM 1.0は、Alibaba Cloudのトランスコード技術に基づいて開発されたメディア処理機能です。 Narrowband HD TM 1.0は、ビデオのシーン、アクション、コンテンツ、テクスチャをインテリジェントに分析します。 This helps reduce the bitrate of output videos and bandwidth costs without compromising the video quality.

高速トランスコーディング

30分を超える長いビデオの場合、MPSはビデオクリップを同時にトランスコードすることで、トランスコード処理を高速化できます。 トランスコーディング速度を5倍に上げることができます。

Video AI

機能 説明
メディア指紋 メディアフィンガープリントを使用して、ビデオを一意に識別することができる。 メディア指紋は、通常、バイナリ文字列である。 メディア指紋は一意です。 異なるビデオは異なるメディア指紋を有する。 メディア指紋も安定している。 オーディオファイルまたはビデオファイルのメディアフィンガープリントは、ファイルを別の形式に変換したり、トリミングしたり、マージしたり、圧縮したり、回転したりしても同じままです。
自動レビュー この機能は、大量のラベル付きデータと深層学習アルゴリズムに基づいて実装されています。 MPSは、ビデオのコンテンツ、サムネイル、タイトル、コメントを分析し、音声、テキスト、視覚的要素の観点から禁止されているコンテンツを正確に認識します。 Prohibited content includes pornographic, terrorism, and politically sensitive content, ads, and content in video blacklists. This feature can be used in multiple scenarios, such as short video platforms, live streaming platforms, and media auditing.

その他の機能

機能 説明
メディア情報 OSSに保存されているオーディオファイルとビデオファイルのエンコードとコンテンツ情報を取得できます。
M3U8出力メディアセグメントのカスタム期間
  • M3U8形式のメディアセグメントの期間をカスタマイズできます。 持続時間は、1秒から60秒の範囲であり得る。
  • この機能により、メディアセグメントの長さを再生クライアントのネットワーク帯域幅に適合させることができるため、最初のフレームの読み込み時間を短縮できます。
外部字幕 外部字幕ファイルをインポートし、トランスコードジョブの字幕ファイルのエンコード形式を指定できます。
通知
  • メッセージサービス (MNS) がサポートされています。
  • MPSキューにMNS関連のパラメーターを設定できます。 MPSキュー内のトランスコードジョブからメッセージが返されると、MNSは返されたメッセージをお客様に配信します。
Playback
  • ApsaraVideo Player SDK for Webは、Flash、HTML5、および自動回転モードでの再生をサポートしています。
  • ApsaraVideo Player SDKは、iOSおよびAndroidデバイス用に提供されます。