VRにおける「技術実現レベル」を無想する【西田宗千佳氏・特別寄稿】

2017年03月04日 11:302017年03月04日 03:42 kawauso3 HoloLens, HTC VIVE, Oculus Rift, スマホxR, レポート

本稿は2月に発行された「小寺・西田の『金曜ランチビュッフェ』Volume 116」に、ITジャーナリストの西田宗千佳氏が寄稿した「VRにおける『技術実現レベル』を無想する」の転載になります。VR・ARを広める上で、コンテンツをどう解説すれば適切に伝わるのか。業界にとって非常に大切な議論のため、広くシェアできるようにPANORAでも掲載させていただきました。

西田氏は「内容への意見をうけつけています。多くの方の意見を取り入れ、妥当と思える基準づくりをしてみたい」と呼びかけていますので、ぜひ読後に西田氏に感想を寄せて下さい。

<br />

PCが存在していなかった昔から、「こんな技術はおもちゃ。あれとは違う」という判断に基づく失敗は繰り返されてきた。35年前のPCはまさにそういう状況だったし、スマートフォンが生まれた時も、i-modeが生まれたときもそうだった。インターネットにしても、「あんな信頼性の低い技術は電話と比べてはいけない」という電話会社の人がいた。

現在、自動運転車やバーチャルリアリティ（VR）、IoTなどの登場で、また「こんなのはおもちゃ」的な論が増えてきた。特にVR周りでは、どうにも「いまできること」と「可能性」のバランスが取れず、論が発散しがちだと感じる。

そこで今回は、自動運転車の「レベル設定」を一つの指針とし、「VRのレベル設定」を考えてみたい。これはあくまで試案だが、それがVRを考える上で重要な階段になるのでは……と考えている。

自動運転車における「レベル設定」とは

自動運転車には色々な側面がある。自動的に駐車してくれたり、高速道路で道なりに一定の車間距離・速度で走る「オートクルーズ」も自動運転車だが、多くの人が脳裏に描く「ナイトライダー」のナイト2000や「新世紀GPXサイバーフォーミュラ」のアスラーダといった「ロボットカー」も自動運転車である。

産業的な位置付けや、法的な規制を考えて行く上で、そうしたイメージにブレが大きいと、対話に齟齬で出やすい。そこで現在、日本やアメリカなど各国が「自動運転」を語るときには、同じ「レベル設定」を指針とし、その中でどのレベルに応じたものなのかを前提に議論するようになっている。

具体的に、自動運転には以下のようなレベル設定が行われている。これは日本やアメリカの政府が採用しているレベル設定で、より細かな設定を行っている組織も存在する。

●レベル0

ドライバーが常に操作を行う。衝突警告などの運転支援システムの存在も含む。

●レベル1

加速・操舵・制動のいずれかをシステムが行う状態。自動ブレーキなどの安全運転支援システムの存在はここに含める。

●レベル2

加速・操舵・制動のうち複数の操作をシステムが行う状態。ただし、ドライバーは常時運転状況を監視し、システムが担当しない操作を担当する。オートクルーズがこれにあたる。ハンドルから完全に手を離した状態では、自動運転システムが解除される。

●レベル3

加速・操舵・制動を全てシステムが行い、システムが要請した場合に、ドライバーが対応する。ドライバーは通常時はドライバーが常時運転操作をする必要はないが、緊急時には運転操作切り替え要請に伴い、ドライバーが対応する。緊急対策はドライバーが行うため、事故責任はドライバーにある。

●レベル4

完全自動運転。加速・操舵・制動の全てをシステムが制御し、ドライバーがまったく関与しない。ドライバーが乗っている必要はなく、外部からの監視でも良い。ドライバーが関与しないため、法的な責任はシステムの運用者（通常はメーカーやサービスを提供する事業者）となる。

現状、いわゆる自動運転車としては、レベル2までの機能を搭載した自動車が市販されている状況で、各社にて研究・テストが進められているのはレベル3のもの。レベル4については、まだ研究の初期段階であり、実用的なものはSFの中の存在に近い。レベル4的な要素を持つものも、ごく緩やかな速度でしか走れない状況にある。現状、レベル3であれば走行についての法的規制はさほど厳しくないものの、実際に実験を行う場合には、最悪の事態を想定し、私有地内や「特区」内に限定されている。

この区分は決して厳密なものではない。各レベルの境目は若干曖昧で、「技術的な定義」というのは正しくない、とも思う。

しかし、「技術的になにが必要か」「それでなにが実現されるのか」「責任の所在はどこにあるか」といった条件がシンプルに理解できて、自動運転というテクノロジーがどういう階段を伴って進化していくかがわかりやすい。

こうしたものは、他のテクノロジーでも必要ではないだろうか？そこで、筆者はVRについて、それを考えてみることにした。冒頭で挙げたように、VRは人によって目指すレベルやイメージがバラバラであり、統一感が弱い。だからこそ、ビジョンを統一して、階段のイメージをもってもらうことが大切だと思うのだ。

VRとARのレベル設定を「試作」する

というわけで、VRに関する「レベル設定」を考えてみよう。ここでは、自動運転車よりひとつ段階の多い「6レベル」で考えてみたい。

＜VRレベル＞

●レベル0

固定された映像を見ている。ただし、人はそこに没入感を感じる。没入感を上げるために、映像を3D化したり、イスを動かしたりすることはあり得る。一般的な3DCGによる映像やアトラクションなどはここに含む。

●レベル1

自分の視界に合わせて映像が変化する。映像は視界の方向に合わせたものがリアルタイムに表示可能。没入感を高めるために、向きだけでなく上下や奥行きをトラッキングすることを含む。スマートフォン向けVRはもっとも初歩的なレベル1・VR。現在の360写真・動画の体験はここ。

●レベル2

現実感（Sense of Presence）を高めるために、視覚以外の要件を複数追加したもの。匂いや振動、オブジェクト・オーディオによる立体音響がここに含まれる。さらに、ハンドコントローラーによって手や指、上半身の一部の動きを取り入れること、限定的なルームスケールセンサーによるポジショントラッキングも含む。PlayStation VRやOculus Rift、HTC Viveはレベル2の要件を満たす。スマホVRでは、まだここを満たすものはない。

●レベル3

現実空間に近い動きを仮想空間に取り込むための「位置把握」「動作認識」が限定的ながら実現される。現実空間にあるものの位置を正確に把握して位置を合わせ、自分が移動しながら仮想空間内のコンテンツを利用できる。この要素の実現により、自分が仮想空間内である程度、自由に移動できるようになる。

ただし部屋一つだけではまだ不完全であり、最低でも建物1フロア程度の移動を実現する必要がある。すなわち、「仮想空間に立っている」のではなく、「仮想空間で活動する」ことを限定的ながら実現可能になる。その際、完全に仮想空間内であるか、実景と重ねるかは問わない。Microsoft HoloLensはVR機器としての能力は低いものの、この要素をある程度実現している。

●レベル4

人間の感覚器が把握できる内容を、より正確に再現可能になり、移動なども再現可能になる。映像についても、フレームバッファによる写像を見るのでなく、立体空間を把握可能になる。移動については、なんらかの感覚器置き換えにより、実際の移動に近いものになる。ただし、「ここが仮想空間である」ことは、映像のクオリティや音の情報の不足、匂いや触感の欠如など、「感覚を完全再現するために必要な帯域の不足」により、まだはっきりと認識可能である。

●レベル5

仮想空間と現実空間の差が非常に小さくなる。五感のすべてが完全とは言わないまでもすべて再現され、仮想空間の中でほぼ同じ活動が可能になる。物理的制約がない分、自由度は仮想空間の方が高い（ただし、生命維持活動は仮想空間内では行えない。それは別の定義となる）。

また、Augmented Reality（AR）についても、同様にレベルを考えてみた。こちらは4レベルで考えている。

＜ARレベル＞

●レベル0

映像の中でCGと現実を重ねられる。この時、位置合わせは完璧ではなく、マーカーなどを使う場合もある。ただし、リアルタイムである必要はない。

●レベル1

リアルタイムに位置合わせを行い、映像の中にCGを重ねる。ただし、重ねるCGは目の前の空間を大まかに把握して重ねている「ローカル位置合わせ」である。現在のスマホにおけるARや、Snapchat・Snowなどの顔認識加工はこのレベル。シースルーか映像ベースかは問わない。

●レベル2

周囲の空間を立体的に把握し、ある程度「グローバルな位置合わせ」を行い、物体を重ねる。物体とずれはあまり感じられない、小さなものになる。現在のMicrosoft HoloLensはこの初期段階。

●レベル3

空間把握の能力が高くなり、目の前にある物体をかなり正確に把握し、それらを映像などに置き換えてしまうことが可能に。グローバルな位置合わせの範囲も広くなり、街中・建物全体で「配置した物体の絶対位置」を活用可能。これが実現されると、VRレベル3もほぼ実現されたものとみなせる。

VRとARは「合流する」、階段設計への意見求む

このレベル設定は、「感覚のどこまでを再現しうるか」ということを重要な指針において定めている。現在は視覚情報・聴覚情報の一部を利用しているに過ぎないが、今後は「平衡感覚」「触感」「腕や足を動かした感覚」「嗅覚」「味覚」など、多彩な感覚がVRの中に持ち込まれていくことになるだろう。そうしないと、最終的な目的である「仮想空間と現実空間の差を小さなものにする」ことが果たせない。

現在はレベル2とレベル3の中で技術開発が進められている状況で、「いかに精度が高く、快適なVRレベル2を実現するか」という状況である、と理解している。最終的な目的のなかでは、「いかに酔わないか」「いかに画質を上げるか」「どのようなデバイスを使うか」といったことは、手法の違いに過ぎない。

ARはVRと区別して語られることが多いが、その本質を考えれば、最終的な目的はVRと同じく「仮想空間と現実空間の差を小さなものにする」ということになる。だから、レベル3においてARとVRの目指すところが同じになり、統合されるのは当然の帰結である。

このように整理してみると、VR・ARの課題も見えてくる。現状、感覚のうち視覚・聴覚に頼る部分が大きいため、ある程度のレベルを超えると、今度は現実とのギャップが出てくる。利用者の位置を正確に把握したり、利用者の動きや仕草を正確に読み取るすべがないため、どうしても「今いる場所の周囲」を中心とした空間に限定されてしまう。

レベル4を目指すには、カメラなどを活用し、利用者の周囲を正確に把握する技術が必須になる。その時には当然、ケーブルにつながったままでは使うのが難しくなる。普通のメガネやゴーグルに近い形が求められることになる。あるいは、脳神経をのっとって感覚器をハックする「ジャックイン」状態にするか。その辺、現実的にはまだまだ課題が多すぎる。

現在のVR・ARについては、レベル3が快適に実現できる製品が出来た段階で、かなり満足できるものになるだろう。その先は、まだまだSFの世界の話ではある。現状、レベル4・レベル5は物語の中の世界だ。例えば、VRものとして有名な「ソードアート・オンライン」はレベル5、もしくは非常に高度なレベル4が実現された世界であり、同じくVRものとして著名で、2018年にスピルバーグが映画化する「Ready Player One」（日本では「ゲームウォーズ」という題で、SBクリエイティブより刊行）は、完全にレベル5が舞台である。とはいえ、今後数十年、あるいは100年をかけて追いかけていくテーマになるのではないか、というのが筆者の予想である。

レベル設定については、ぜひみなさんの意見もうかがいたく思う。現在は理想的なVRをトップレベルに据えているが、もう少し別の設定もあり得るだろう。どちらにしろ、社会にこうした技術が認められ、広まるには、「どういうことができるものか」がある程度正確に認識されることが重要である。VRはまさに、いまそういう段階だと考えている。

<br />

（TEXT by Munechika Nishida）

Pocket