MPS (Media Processing) は、音声 / ビデオファイルを別形式の音声 / ビデオファイルへ変換するサービスです。 さまざまな帯域幅、端末、およびユーザーの要求に適したビデオを作成するのに役立ちます。 大量のデータのディープラーニングによって、コンテンツ、文章、音声、音声 / ビデオファイルのシナリオに基づく多様なモードの分析を行います。これにより、コンテンツのインテリジェントな検出、理解、編集が可能になります。

MPS は次の用途に利用することができます。
  • 端末への対応: PC、TV、携帯端末などのさまざまなデバイスでのメディアの再生を実現するために、音声 / ビデオ形式を変換することができます。

  • ネットワーク環境への対応: 動画の品質を、標準、高、最高などのさまざまな仕様に変換するために、ビデオコード変換をすることができます。 ユーザーは自分の帯域幅に基づいて適切な定義を選択し、スムーズな再生を実現できます。

  • ウォーターマーク: ビデオにウォーターマークを追加してブランドを強調し、著作権を保護し、製品の認知度を高めることができます。 ウォーターマークは企業のロゴ、テレビ局のロゴや、アップロードをする人のニックネームにすることができます。

  • スクリーンショット: 指定した時間にスクリーンショットを撮影することができます。 スクリーンショットをビデオのサムネイルとして利用したり、イメージスプライトを生成することができます。

  • ビデオ編集: ビデオをカット、結合することにより新しいビデオを制作することができます。

  • デジタル復元: 低品質な動画でのぼやけた画像やモザイクを調整して、高精細なビデオを作成することができます。

  • 保存と配信のコスト削減: 同じ画像品質を確保しながら、ビデオのビットレートを調整し、ビデオの圧縮効率を高めてファイルサイズを減らすことができます。 これにより再生時のリソース消費が減り、記憶域スペースとトラフィック量を節約することができます。

  • 重複したビデオの排除とオリジナルのコンテンツの認識: ビデオの画像と音声からフィンガープリントを抽出し、ビデオのフィンガープリントを生成することができます。 この機能により、重複するビデオを検出し、重複するビデオクリップの元を追跡することができます。 この機能は、ビデオの重複の排除、著作権侵害のフィルタリング、元ビデオの追跡などに利用できます。

  • ビデオ検出: この機能は、性的、暴力的、テロ関連、および政治的に敏感なビデオのインテリジェントな検出をサポートします。 手動によるチェックのコストを削減し、潜在的な脅威の危険性を減らします。

  • デジタルの改善と変換: この機能は、ビデオコンテンツの理解、写真の美しさ、および大量のユーザー行動データに基づいて、最適なキーフレームの選択に役立ちます。 キーフレームを使用して画像、アニメーション画像、または短いビデオを生成することができます。これらは動画のサムネイルとして利用して再生回数を増やすことに役立ちます。

トランスコーディング

カプセル化フォーマット

パラメーター 説明
Input format
  • コンテナ形式: 3GP、AVI、FLV、MP4、M3U8、MPG、ASF、WMV、MKV、MOV、TS、WebM、MXF
  • 動画エンコード形式: H. 264/AVC、H. 263、H. 263+、MPEG-1、MPEG-2、 MPEG-4、MJPEG、VP8、VP9、Quicktime、RealVideo、Windows Media Video
  • 音声エンコード形式: AAC、AC-3、ADPCM、AMR、DSD、MP1、 MP2、MP3、PCM、RealAudio、Windows Media Audio
Output format
  • コンテナ形式:
    • ビデオ: FLV、MP4、HLS (m3u8+ts)、MPEG-DASH (MPD+fMP4)
    • 音声: MP3、MP4、OGG、FLAC、m4a
    • 画像: GIF、 WEBP
  • ビデオエンコード形式: H. 264/AVC、H.265/HEVC
  • 音声エンコード形式: MP3、AAC、VORBIS、 FLAC
Audio extraction ビデオファイルから音声を分離します。つまりビデオ部分は無効となります。
Video extraction ビデオファイルからビデオを分離します。つまり音声部分は無効となります。
Encapsulation ビデオのカプセル化方式を変更しますが、エンコード形式は変更しません。 音声ファイルは MP4、M3U8、および FLV 形式にカプセル化することができます。
Conversion from videos to animated images ビデオのハイライトコンテンツを表示用に GIF または WEBP 形式のアニメーション画像へ変換します。
ビデオエンコードパラメーター
パラメーター 説明
Codec エンコード / デコード形式
  • サポートされているフォーマット: H. 264、H. 265、GIF、WEBP
  • デフォルト値: H. 264
Bitrate ビットレート
  • サポートされている出力ビットレートの範囲: 10 ~ 50000
  • 単位: kbps
FPS フレームレート
  • デフォルト値は、入力ファイルのフレームレートです。 入力ファイルのフレームレートが 60 よりも大きい場合、値は 60 となります。
  • 値の範囲: 0 ~ 60
  • 単位: fps
Width* Height 解像度
  • 幅:
    • デフォルト値は元の動画の幅です。
    • 値の範囲: 128 ~ 4096
    • 単位: ピクセル
  • 高さ:
    • デフォルト: ビデオの高さ
    • 値の範囲: 128 ~ 4096
    • 単位: ピクセル
Scale 自動スケーリング 幅に応じてファイルの大きさを比例的に拡大縮小することができます。高さに応じてファイルの大きさを比例的に拡大縮小することができます。
GOP 2 つのキーフレーム間の最大時間間隔または最大フレーム数。
  • 2 つのキーフレーム間の最大時間間隔: 値の単位を含める必要があります。 単位: 秒 デフォルト値: 10 秒
  • 最大フレーム数: 単位なし。 値の範囲: 1 ~ 100000
Profile エンコードの質 H. 264: サポートされているエンコードの質には、Baseline、Main、および High があります。
PixFmt ビデオの色形式。
  • 値: yuv420p、yuvj420p、およびその他の標準色形式。
  • デフォルト値: yuv420p または元の色形式。
Rotate ビデオの回転角。 ビデオの回転は時計回りです。
  • 値の範囲: 0 ~ 360
  • デフォルト値: 0
動画処理パラメーター
パラメーター 説明
ScanMode スキャンモード。 選択可能な値: インターレースとプログレッシブ。
RateControlModes ビットレートの制御方式。 サポートされているビットレート制御方式: VBR、CBR、CRF。
Crop ビデオのトリミング。 黒い枠線を自動的に検出して切り取ることができます。ユーザー定義のトリミングを許可します。
Pad ビデオに黒い枠を埋め込むことができます。
音声エンコードパラメーター
パラメーター 説明
Codec エンコード / デコード形式
  • 音声コーデック形式: AAC、MP3、VORBIS、FLAC
  • デフォルト値: AAC
Samplerate サンプリングレート
  • デフォルト値: 44100
  • 選択可能な値: 22050、32000、44100、48000、96000
  • 単位: Hz
  • ビデオコンテナー形式が FLV で、音声コーデック形式が MP3 の場合、サンプルレートを 32000、48000、および 96000 とすることはできません。
  • 音声コーデック形式が MP3 の場合、サンプルレートを 96000 とすることはできません。
Bitrate 音声ビットレート
  • デフォルト値: 128
  • 変更可能な範囲: 8 ~ 1000
  • 単位: Kbps
Channels 音声チャンネルの数
  • デフォルト値: 2
  • コーデックが MP3 の場合は、1 または 2 に設定することができます。
  • コーデックが AAC の場合は 1、2、3、4、5、6、 または 8 に設定することができます。
トランスコード制御
カテゴリー 説明
HLS MasterPlayList 複数の字幕、サウンドトラック、複数のビットレートのビデオストリームを組み合わせて、マスタープレイリストファイルを生成します。
条件付きトランスコード 2 つの方法がサポートされています。
  • トランスコードテンプレートのビットレート (または解像度) が、入力したビデオのビットレートよりも大きい場合、そのビデオはトランスコードされません。
  • トランスコードテンプレートのビットレート (または解像度) が、入力したビデオのビットレート (または解像度) よりも大きい場合、出力ビットレート (または解像度) は、入力したビデオのビットレート (または解像度) と同じになります。
ワークフロー クラウドベースの自動処理ワークフロー。 ワークフローは、ファイルがアップロードされた後に、音声ファイルとビデオファイルを自動的に処理するために使用されます。

トランスコードのテンプレート

プリセットテンプレート

MPS では、特定の帯域幅条件に適応するような、出力動画用の一連のトランスコードテンプレートを事前設定することができます。

  • プリセットスマートテンプレート

    この機能は、入力ビデオが出力ビデオの要件に合うように、自動的にトランスコードパラメーターを調整します。 入力ビデオは (解像度やビットレートなどの点で) 互いに大きく異なるため、すべてのプリセットスマートテンプレートが、すべての入力ファイルに適しているとは限りません。 特定の入力ファイルに適したプリセットテンプレートを見つけるには、テンプレート分析タスクを使用する必要があります。 マルチメディアトランスコードを実行する際は、品質の低下を最小限に抑えながら、ファイルサイズができるだけ小さくなるようにします (ビットレートを低くします)。 プリセットスマートテンプレートは品質を優先します。

  • プリセット静的テンプレート

    テンプレート分析を実行していなくても、これらのテンプレートを呼び出すことができます。 3 種類の静的テンプレートは、ビデオトランスコードテンプレート、音声 MP3 トランスコードテンプレート、およびカプセル化テンプレートです。 これらのテンプレートは、通常のメディアプレーヤー機器と帯域幅の状況に適しています。 このテンプレートはビットレートを小さくすることを優先します。

  • プリセット狭帯域 HD TM テンプレート

    テンプレート分析を実行していなくても、これらのテンプレートを呼び出すことができます。 これらのテンプレートは 3 つの出力形式、FLV、MP4、M3U8 に対応しています。 プリセット狭帯域 HD TM テンプレートは、 Alibaba Cloud MPS 固有のトランスコードテンプレートの一つです。 通常のトランスコードテンプレートと同じビデオ定義を維持しながら、さらに低いビットレートへのトランスコードを提供します。これによりコストがより下がります。

カスタムテンプレート

このプリセットは、ユーザー定義のトランスコードパラメーターから作成されます。 このトランスコードパラメーターの集まり (音声、ビデオ、コンテナなど) は、個別のトランスコードのニーズを満たすことができます。

編集

カテゴリー 説明
ビデオのカット 指定した開始点から、指定した期間のメディアクリップを抽出できます。
ビデオの結合 最大 20 のビデオを結合することができます。
ビデオのぼかし加工 ビデオの特定の領域をぼかすことができます。
オープニングとエンディングシーン
  • ビデオの冒頭へ動的なロゴを追加したり、エンドクレジットの内容を指定することができます。
  • シーンは製品の認知度を高め、ユーザーの著作権を保護するのに役立ちます。

ウォーターマーク加工

カテゴリー 説明
静的なウォーターマーク
  • 出力するビデオに最大 20 個の静的なウォーターマークを追加することができます。
  • ウォーターマークの式は、PNG、TEXT、MOV、および APNG 形式です。
動的なウォーターマーク ウォーターマークを表示する時間を設定することができます。

スクリーンショット

カテゴリー 説明
ビデオのスクリーンショット
  • 指定した時間に、OSS に保存されているビデオファイルの JPG 形式のスクリーンショットを撮影することができます。
  • 単一のスクリーンショット、複数のスクリーンショット、および平均的なスクリーンショットを撮影することができます。
ビデオ sprite/WebVTT サムネイル 一連の画像をキャプチャし、画像スプライトを作成することができます。 複数の画像に関する情報を一度に要求できるため、画像要求の数が減り、クライアントのパフォーマンスが向上します。
スマートカバー写真 ビデオコンテンツの理解と写真の美しさに基づいて、ビデオのカバー写真として最適なキーフレームを選択するのに役立ちます。

Narrowband HD TM

カテゴリー 説明
Narrowband HD TM 1.0 Alibaba Cloud 独自のトランスコード技術によって、ビデオの各シーン、アクション、コンテンツ、テクスチャをインテリジェントに分析し、ビットレートを下げながらも同じビデオ品質を保ち、帯域幅コストを効果的に削減します。
Narrowband HD TM 2.0
  • 人間の視覚システムモデルに基づいてモデル化されたこの機能は、エンコーダがビデオの最適化を実行するときに、エンコーダが忠実度よりもユーザー エクスペリエンスを強調するのに役立ちます。
  • この機能には独自のアルゴリズムが使用されているため、既存の動画エンコーダよりも優れたパフォーマンスを発揮し、低いビットレートでもビデオの明瞭度を高めます。

デジタル修復

カテゴリー 説明
フレームレート変換 (FRC) サービス 30 フレーム / 秒 以下の HD ビデオの場合、この機能を利用すると、 60 フレーム / 秒、さらには 120 フレーム / 秒 の高フレームレートなバージョンを生成することができます。 4K の大画面でもストリーミング品質は影響を受けません。
ビデオソースの修復 (PicRescue) 過度に圧縮されたオンラインビデオに対し、この機能を使用すると、画像がぼけている部分やモザイクを取り除き、復元された高解像度のバージョンを生成することができます。
SD から HD への変換サービス (SD から HD) 標準精細度の古典的な映画に対し、この機能を使用すると、フィルムの粒状物や圧縮ノイズを除去し、超高解像度技術を使用して 720p または 1080p の HD バージョンを生成することができます。
2k から 4k への変換サービス (2k から 4k) 1080p フィルムに対し、この機能を使用すると、高品質の専用 4k コンテンツソースを生成することができます。 この機能は、大量の動画を使用する、スーパー精細技術に基づいています。

高速トランスコード

30 分を超える長いビデオに対し、この機能はビデオを分割してパラレルにトランスーコディングすることによって、トランスコードの速度を大幅に向上させます。 トランスコードが最大 5 倍高速になります。

詳細

カテゴリー 説明
メディア情報 この機能により、 OSS に保存されている音声およびビデオファイルに関するエンコードおよびコンテンツ情報を取得することができます。
M3U8 出力スライスのカスタマイズ期間
  • この機能により、M3U8 スライスの長さを 1 秒から 60 秒の間でカスタマイズすることができます。
  • これにより、最初の画面のロード時間を短縮するために、帯域幅の条件に基づいてスライスの長さを決定することができます。
外部字幕のインポート この機能を使用すると、外部字幕ファイルをインポートして、字幕のエンコード形式を指定することができます。
通知の統合
  • この機能は MNS サービスを統合します。
  • MTS キューの通知属性が設定された後、 MTS キュー内のトランスコーディングタスクのために非同期インターフェイスによって返されたメッセージは、 MNS サービスによってメッセージ受信サービスへアクティブにプッシュされます。
Playback
  • この機能は、Flash、HTML5、およびアダプティブモードをサポートする Web プレーヤーを提供します。
  • また、iOS と Android 用のモバイルプレーヤー SDK も提供しています。