マルチメディアの将来におけるMPEG-4の今後とその役割

イタリア CSELT レオナルド・キャリリオーネ

 

 今日のマルチメディア社会は、決して予想されていた道筋によって現出したものではない。光ファイバを通して数ギガビット/秒ものマルチメディアデータを受信しているのではなく、人々は衛星やケーブルを通してデジタルテレビの番組を見たり、携帯電話を使って会話を楽しみメッセージやファイルの交換を行ったり、DVDによって映画を見たり、ウェブで各種の情報検索や様々なつながりを楽しんだり、ウェブからダウンロードした音楽を聞いたり、ウェブで切手の大きさほどのビデオを見たり、ゲーム専用機でコンピュータゲームを楽しんだり、などが実際の姿である。

 収束(大変乱用されている言葉であるが)は、どこにも見られない。今の世界は独自技術が結集した縦断的なシステムに満ち溢れているのである。一方でビデオとオーディオから成る基本的な情報単位は、技術的には全て同一のものに過ぎないことを考えると、このことにより、一層の驚嘆を覚える。

 19937月に始まったMPEG-4は、いまやマルチメディア社会のニーズを満たすことのできる、とても包括的な、そして多分野汎用的なツールにまで発展した。その特徴をあらためて眺めてみると、

1.伝送媒体に非依存な伝送システムとして機能する。つまりユーザ(コンテンツプロバイダならびにエンドユーザ)が、効率的にトランスポート層およびそれ以下の低レイヤから抽出可能な情報である。

2.音声と音楽を含むオーディオ、ならびにビデオを、超低レートから超高レートまで、多くの機能性を有しながら圧縮するフルセットのツールを与える。

3.合成音楽や、多様な情報と付随する文字列、人間の顔や体といった特殊なタイプの合成AV情報を表現するツールを与える。

4.時間とともに変化する2D3D物体の圧縮を行う効率的なツールを与える。

5.異なる物体の2D3D空間における効率的な合成を可能にする。

6.著作権の保護対象となるコンテンツ単位でのインタオペラビリティを実現するために、現在拡張されようとしているコンテンツマネジメントおよび保護を支援する枠組みを持つ。

 すなわちMPEG-4は、マルチメディア社会を繁栄させる技術的プラットフォームを提供することが可能である。実はこの動きはすでに始まっていることであるが、この先まだ長い道のりがある。例えば以下のような課題がある。

1.ISDNADSLに接続された固定的回線端末では、高画質なビデオやオーディオをストリーミングにて受信することがすでに可能である。しかし、同じことが数10kbps程度しか利用できないモバイル端末においても可能となるべきである。

2.著作権所有者は、自分たちの著作権が侵害されることなく、モバイル端末、ポータブル機器に対して、高品質オーディオが配信されるよう、ウェブ上の音楽配信手段を利用したいと考えるが、まだ実現されていない。

3.テレビを使ってウェブサービスを提供しようという途方もない夢は、多くの会社を魅了し、かなりのリソースを投入させたが、現実には何も得られていない。このことは、テレビが現状のテレビの使い方と親和性のあるマルチメディアパラダイムでしか拡張できないものであり、まったく異質なパラダイムでは拡張不可能であることによる。

 残念ながら、実際のところ、こうした課題が解決されるという確実な保証は、今のところ何もない。それは、経済社会全体やその中に位置する企業は、往々にして極めて近視眼的な振る舞いをするものだからである。このことを示す顕著な例としては、以下のようなものが挙げられよう。

1.VRMLは大きくつまづいた。原因は、情報がテキスト形式で符号化されており、VRMLファイルのサイズがあまりにも大きくなったため、今日のインターネットでは伝送できないことにある。それでもなお、第3世代のモバイルネットワークに関する仕様を作るリーダーシップを取っている3GPPは、SMILを採用しようとしており、これはメディアの組み合わせを表現するのにまたもやテキストを用いている。もっとも、組み合わせ情報はごくまれにしか使用されないこと、どのような場合でもサイズは小さくなること、からビット効率は重視するような問題ではないという正当化がつけられているが。この正当化は、今日の携帯電話から進化するデバイスにおいては、恐らく当てはまるであろう。しかし、同じような時期に出現すると思われるPDAは、より大きなスクリーンを具備しており、上記の2つの仮定が成り立つという保証はない。従って、2種類の互いに非コンパチなタイプのデバイスが出現し、これらが人為的に市場を分断するとともに、関心が多大に寄せられつつあるこの分野が成功するチャンスを埋没させてしまうであろう。

2.著作権所有者たちの間では、自分たちの財産であるコンテンツの流れをコントロールし続けたいという願望のみが、共通の願望である。一方、保護すべきコンテンツを単一の供給源によって提供し、ユーザはこれを利用するために、いわば壁に囲まれた庭園に入って来るようにしたいと言う願望は、共通のものではない。無料の音楽や購入されたものかどうか識別できないような音楽に、アクセスしたり利用したりすることを可能にする多くの技術を、ユーザは持っていることが、MP3によって明らかになった。幅広い接続性を提供する技術に支えられた無料コンテンツの世界から人々が離れて、壁に囲まれた庭園を構築する技術により支えられる有料コンテンツの方に集まるという考え方は、あまりにも単純素朴であり、狂喜の考え方と言っても過言ではない。

 危険性に気づくということは、それを避けるための1つの方法である。恐らく最初から実現することはないであろうが、経済社会や企業が製品やサービスやアプリケーションの島をいくつも作ることの近視眼性に結局は気づき、全てのMPEG-4技術を包含したものを作るようになるだろう。そしてMPEG-4ユーザは、恩恵として、個々のアプリケーションニーズを満足するために、独立して動作するように設計された技術ツールや、また当初からの設計思想に基づき、より洗練されたアプリケーションを目指して今後も組み合わせられるメディアアクセス技術ツールを利用できるであろう。またその上、MPEG-4のバージョンアップによって、技術が進歩しつづけるという保証が与えられるのである。このことは、新しい3Dオブジェクト符号化や進行中のオーディオcall for evidence、ビデオcall for proposalが示しているように既存のオーディオ、ビデオ圧縮ツールがアップグレードされることや、SMILX3Dを含むテキスト/バイナリXMTコンパイラやMultiuser World call for proposalが示しているように、新しいシステムレベルの機能性が追加されることなどから明らかである。さらにこれに加えて、コンテンツへのアクセスや利用方法を、ユーザが自分たちで新しく開拓することが可能となるMPEG-7の成果や、世界をまさに1つの村と成すような来るべきネットワーク社会に向けて、コンテンツの利用法に関する新しいルールの基礎を構築するMPEG-21の成果など、まもなく開発が完了するこれらの成果の恩恵を、MPEG-4ユーザは受けられるであろう。