なんとなく綴ってみた

アクセスカウンタ

zoom RSS NHKの8K放送で始まる「22.2chサラウンド」は ・・・・今、売れないものを作る技術は世界一

<<   作成日時 : 2017/06/20 12:05   >>

ナイス ブログ気持玉 1 / トラックバック 0 / コメント 0

最近、オーディオフォーマットの仕様研究にも着手しているのだが、そんな中でこのAV Watchの記事を見た。
記事は面白かったが、数年前からコンセプトは変わっていないのかとも思った。3-1ステレオとMUSEを見ているような微妙な印象でもあった。これを読む限り、22.2chは、MPEG-H Part.3ベースではないということだろう。残念だ。
http://av.watch.impress.co.jp/docs/series/dal/1065976.html

単に他国が開発する実用オーディオ技術の土台になっただけのようにも見えるのは、ななな何でだろう。
http://www.nhk.or.jp/strl/publica/rd/rd148/PDF/P45-54.pdf

<欧州DVBはDolby AC-4で7.1.4/300Kbps未満サラウンドを予定>

これを見て思ったのは、一度始めたら最後まで同じもので突き進むんだなということだ。時代に沿わなくても、時代の流れも無視して没頭する傾向があるのは、日本においてはどの業界も似ている。特に官や独立行政法人などが関わる、巨大プロジェクトや長年のプロジェクトだと、う〜んと首を傾げるものがちょいちょいある。
全部じゃない。あくまで、大小はともかくちょいちょいであるが、これはその一つだ。

日本ではあまり知られていないが、欧州のDVB(Digital Video Broadcasting)ではAC-4がオーディオコーデックとして標準化された。2014年〜15年頃の話だ。Immersive Audioとなる7.1.4サラウンドは224Kbps〜288Kbpsで実現できる低ビットレートテレビサラウンドシステムである。
https://www.dolby.com/us/en/technologies/ac-4/Next-Generation-Entertainment-Services.pdf


これの素晴らしい点は最初からオブジェクトベースのオーディオ(メタデータ)に対応していることだ。簡単に言えばAtomsやDTS:Xのテレビ向け廉価版がこの製品ではサポートされている。もちろん、簡易デコーダーもサポートしており、2chステレオ相当での再生も可能だ。

さらに、このAC-4は機能拡張オプションを最初から備えている。最初の製品が、288Kbps〜320Kbps程度でもそれを拡張する形で、より高品質のオーディオやメタデータを追加出来るかもしれない。要は、コアストリームを残した状態で、増築できるようになっている訳だ。これが、本当の消費者目線という奴だ。

日本は枠を決めて、オーディオ・映像規格を作るが、それはそういう企業と研究機関が多いからであり、予算があるからという恵まれた状況も作用してきた。一方で、それの研究が今となっては、消費者のニーズとマッチせず、一部のマニア向けに喜ばれるが、実用化したときに日本独自で一つ古いとか、売れないものに陥る原因にもなり始めている。

海外では、企業が提案する形で成立するケースも多い。消費者との相性を見てそれに合わせた枠を必要性に応じて作っている訳だ。今回もその差がハッキリと見えてくる。その結果、家電業界で日本製品は売れなくなる。消費者を見て開発しているのではなく、技術者や官庁、政府にとって自己満足となる開発が目的であり、消費者がそのうちついてくると思っているからだ。

ついてくるのは、実は消費者ではなく他国の技術者である。そのアイデアの成否を見て、これを元に消費者として不満がある部分と良い部分のバランスを見直し、落とし込もうという流れになる。結果的に、日本は研究開発費やM&A費用が沢山投じられる一方で、世界的にその成果は低い企業が多いことは、90年の終わり頃からいわれ始めたが、最近は顕著に言われるようになった。


<22.2chは開発に時間を掛けた割に、柔軟性がなく遅れつつある技術>

下の記事にはある程度仕様が書かれているが、日本の22.2chオーディオは実は、オブジェクトモデルが出回る前に、規格化されたものであり、無駄に時間を掛けた割に、時代遅れになりつつある。
http://www.nhk.or.jp/strl/publica/rd/rd155/PDF/P14-21.pdf

その理由は、多チャンネル時のオブジェクトモデルが標準化し始めたからだ。

そもそも、10chオーバーのサラウンドは、実は狭い家庭では構築が難しいオーディオ技術になっているというのは多くの人が知らないことだ。海外では知っている人が多いが、日本では知らない人の方が多い。日本は商用ベースの記事が多いため、大きいほど良いみたいな流れが多いのだ。ものには限度があるというのに。

何故難しいのかというと、22.2chほどになると、スピーカー同士の干渉(残響によって音が埋もれたりする現象)が起きやすくなるからだ。もし、これほどのマルチチャンネル音声を、正確に調整する場合は、調整用マイク1つでは不可能で、視聴する人数を想定し、複数のマイクを使って、スピーカーの音量や周波数特性を一つ一つ細かく調整する必要がある。

映画館でも、同じサラウンドシアターでAとBの劇場は音が違うというのはあるが、それはサラウンドシアターの残響調整が十分に行われているかどうかの違いだ。稀に幸運の女神がいて調整しなくても、質が高くなることもあるが、細かく調整すればするほど定位感は良くなる。何より難しいのは狭いスペースで沢山のスピーカーを使うと、スポットから離れたときに微妙なばらつき(音の一部が他の音にかき消されること)も強くなるということだ。特に視聴ポジションが変わると、その傾向が極端に出るのが、22.2chなどの欠点なのだ。

実はそれを低減(ゼロには出来ない)するために開発されたのが、オブジェクトとメタデータを組み合わせたマルチサラウンドモデルである。MPEG-H Part.3 3D Audioの事が上記のNHK記事には書かれているが、それがこれまでのサラウンドオーディオから培われた次世代オーディオだったりする。日本もAuro3Dの頃に方向修正すれば違っただろうに。
http://mpeg.chiariglione.org/standards/mpeg-h/3d-audio


何故、オブジェクトが重要になるかというと、これはスピーカーのチャンネル数が増えたときに、発生するリスニングポジションのずれによる音の埋もれを、軽減するからだ。

一般にAVアンプの既存手法であるスピーカー音量等の調整を用い、ディスクリート(独立して)収録された生音声を再生するモデルには、サラウンドチャンネル数が増えるほど、定位感の限界と、リスニングポジションが狭まるという問題がある。小さなスペースで100%完璧なサラウンドを作るのは難しい。

具体的にいえば、AVアンプのポジショニング設定(マイク音量調整)でAスピーカーが100、Bというスピーカーは90という音量設定になっているとき、Bの方から出る音はどこで聞いても90以下なのだ。リスニングポジションが中央から外れている場合で、A側によっている人が、B側からしか出ない音、Xを聞き取ろうとすると、音は籠もって聞こえるか、聞こえにくくなることがある。ポジショニング設定をした場所に対して、音量は調整されるため、そういう現象が起きやすいのだ。
画像


しかし、オブジェクトモデルでその都度音をポジションに合わせて作ると、スピーカーの設置予測から、Aに近い人にも聞こえるように、複数のスピーカーに音を配置できる。簡単に言えば、Aのスピーカーからも音量は少ないがXに相当する音を出すことで、A側の人にもある程度届くようになる。
それでも、埋もれる可能性はあるわけで、絶対ではないが、それでも違いはある。まあ、最終的には部屋の広さやスピーカーの性質、設置の方が重要だが。

ちなみに、家庭用のDolby Atomsでは、リアルタイムの物理音響合成はしていない。サブストリームの音声配置を位置モデル(メタデータ)で配分する手法が使われている。これは、演算性能に起因するものである。


一応、部屋の広さとチャンネル数の関係も書いておくと、5.1chモデルの部屋で、6.1chの音源を再生するスピーカーをただ入れても、スイートスポットが狭まることがある。これは、モノラルスピーカーはどこで聞いてもモノラル、ステレオなら、スピーカーとスピーカーの間に座れば、音の強弱は違えど、ステレオというのと同じだ。モノラルはどこで聞いても音は同じだ。ステレオは右よりで聞けばバランスが右に傾く。即ち、スイートスポットは左右のスピーカーから見て、中間点の前後になる。スピーカーの数が増えるほどスイートスポットは狭くなるのだ。

5.1chと6.1chというスピーカーの差でも、同じ部屋の広さであれば、真後ろから出る音とのバランスが難しくなり、正面方向または後ろ方向のスポットエリアが狭くなる傾向がある。
画像


それが、22.2chで例えば6畳間になるとどうなるかは、誰でも検討がつくだろう。
これらの問題を防ぐために、家庭用のAVアンプの一部には、DSPによるシアター補完機能(EQ/HRTF)をマルチチャンネルオーディオ時にも使える機能があるわけだが、それを使うとネイティブに意図した音にはならないというジレンマが発生する。

AtomsやDTS:Xが映画館ではDolby Surround 7.1ベースに物理音響を加えているのは、ディスクリート音源の設置限界が見えてきたからであると同時に、シアターでは同じ音を出すサラウンドスピーカーの数を増やすことで、定位をどこでも一定に取れるように研究しているという点がある。簡単に言えば、音の成分は7.1ch分だが、スピーカーの数は20も30もあり、いくつかからは同じ音が出ているわけだ。Atomsのような物理音響を入れる際には、その音響モデルだけを、7.1chとは分離し、もう少し細かくスピーカーの場所に分配してやることも出来る。すると、一部の音がよりリアルに聞こえるようになり、埋もれる音は出ないという理屈が生まれる。

この発想が欠如しているのが、22.2chだ。愛地球博時代に生まれたどちらかというと大きな専用シアター向けの演出オーディオのため、欠如している。

<12年前のまま、22.2という数字を売り込むなら>

22.2chがいけないとは言わない。ただ、開発の姿勢には疑問を感じる。
EQ/HRTF、さらには既に数年前に仕様として出されたものについて、述べている辺りは、技術としては未だにニッチに留めるつもりだなという印象だ。それなら、5.1chスピーカー内蔵の重たいヘッドホンが昔あったが、それを片耳11.1ch両耳22.2chにした軽量ヘッドホンの開発でも出来れば、世界市場で22.2chが主流になる日は来るかも知れない。そういうネイティブを家庭で楽しめる安価な技術もセットでNHKが中心となって開発しないと、ダメだろう。

フロントサラウンドで「っぽい(バーチャル)」ってのは、22.2chである必要がないことを意味する。また、屋外イベントや映画館のイベントでというのは、Dolby Cinema(日本には対応劇場はない)より凄いと言えるかどうか?そして、そういう機材や施設が世界に沢山出来るのかどうかも踏まえないと……NHKのイベント用に留まる。

そもそも、EQ/HRTFにかけるなら、7.1chでもバイノーラルなステレオでも別に良いわけだ。
このスペックだから、最初から仮想化があるというのは、そもそも22.2chを売り込むコンセプトとしては最悪の流れだろう。下手をすれば、7.1.4の方が普及してしまえば、家で使えない22.2chより、7.1.4のサラウンドフォーマットの方が安くて実用的で普及し、3-1ステレオの二の舞になる。

それを、皆が望んでいるなら良いが、NHKは視聴料というものを国民から徴収して経営している組織だ。数字だけの自己満足と一部のオーディオマニアが、仕様だけで喜ぶなら微妙なところだ。

ちなみに、これを凄いという人は、この技術が12年前(当時は最先端で、その数年前にフォーマットは決まった)の愛地球博で登場したことを考えないといけない。12年間(11年間)かけて、ほぼそのままを製品化したわけだ。その間にAC-4やAtoms、DTS:Xが物理音響を加えた。

今更ではあるが、8K/4Kでも言えるがテレビ関連は何だかな〜と思うのは、実直といえば響きは良いが、10年の歳月を考慮して、方向転換をしていない辺りが、一頃のSHARPみたいだ。






PIONEER/パイオニア VSX-832-B(ブラック) AVレシーバー
エムスタ
 PIONEER/パイオニア VSX-832-B(ブラック) AVレシーバー (VSX832) 発売


楽天市場 by PIONEER/パイオニア VSX-832-B(ブラック) AVレシーバー の詳しい情報を見る / ウェブリブログ商品ポータル



テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ
気持玉数 : 1
ナイス

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
NHKの8K放送で始まる「22.2chサラウンド」は ・・・・今、売れないものを作る技術は世界一 なんとなく綴ってみた/BIGLOBEウェブリブログ
文字サイズ:       閉じる