レポート

第一回 MVJLAB 特別鼎談会 第三章 其の一

場所:東京大学 先端科学技術研究センター 稲見・門内研究室
ファシリテーター:一般社団法人Metaverse Japan共同代表理事 馬渕邦美
鼎談者:
MVJLAB特別顧問/カーネギーメロン大学ワイタカー記念全学教授 金出 武雄
MVJLAB長/東京大学先端科学技術センター教授 稲見 昌彦
MVJ理事/東京大学生産技術研究所 特任教授/建築家 豊田 啓介

※ 第二章の続きです

第三章 其の一:人間中心からAI主体へ ― パラダイム転換の臨界点

稲見
はい。この1年間で、だいぶ考え方が変わりました。ちょうど1年前、日本バーチャルリアリティ学会で「生成VR研究会」を立ち上げて、国際会議などで議論を深めていこうと動き出したんです。 それ以前の私は、メタバースについて「メタ・ユニバース(単一の世界)」ではなく「メタ・マルチバース」で考えるべきだと言っていました。みんなが1つの世界に入るのではなく、人々が自分の「環世界」として、アバターや目的(コンテキスト)に応じて複数のメタバースを出入りする。それが2年前の考えでした。
ところが1年前、「メタバースはもう人間が作らなくてもよくなったんだ」と気づいたんです。 スタートレックの「ホロデッキ」や、ドラえもんの「もしもボックス」のように、「もしもこんな世界があれば」という思いをそのまま3次元空間にする技術が、ほぼ実現しつつあった。 今までは、フィジカルAIにしても「身体をどう作るか」という研究が主でしたが、これからは「空間をどう作るか」が重要になります。例えば、3D Gaussian Splatting(3Dガウス・スプラッティング)のような技術を使えば、もはや現実と見分けがつかない3次元構造が生成できてしまう。
そこから私は、VRやメタバースを「生成AIのためのキラー・インターフェース」として捉えるのがいいのではないかと考えるようになりました。言葉を尽くしてコミュニケーションしなくても、「こういうことを考えている」「こういう心境です」というものを一度空間に射影して、そこで共有する場所を作る。 京都大学の神谷先生が研究されているBMI(ブレイン・マシン・インターフェース)の文脈で言えば、我々の頭の中にある「ニューロバース」という内面世界を外在化させる。そうした使い方ができると思っていたのが1年前です。
しかし今年、CESでエヌビディアのジェンスン・ファンさんの話などを聞いて、「あ、私はまだ人間に囚われていた」と思い知らされました。 これまでは、メタバースもVRも「HMD(ヘッドマウントディスプレイ)の数だけユーザーがいる」「スマホの数だけユーザーがいる」……つまり、人間がユーザーだと思い込んでいたんです。 ですが、金出先生が1年前のミーティングで紹介してくださったようなフィジカルAIの話が、ものすごい勢いで進んでいまして。
今や、メタバースやVR、あるいはこの物理世界においてさえ、メインユーザーはもはや人間ではなく「AIエージェント」ないしは「ロボット」なんじゃないかと。 ロボットやAIエージェントが世界を探索し、学習するための環境として、生成されたメタバースが使われる。そこではリアルの人口の10倍、100倍の主体が、1000倍の時間の速さで活動しているかもしれない。
これまでは良くも悪くも「人間中心」すぎたんです。VRの定義も「感覚的・生理学的な等価性」が基本でしたから、人間を不動点としてIT技術をどう使うかという話でした。 しかし、もはや不動点は人間ではないかもしれない。「ヒューマン・イン・ザ・ループ」という言葉がありますが、バイブコーディングなどをしているうちに「自分こそがAIの作業のボトルネック(邪魔者)なのではないか」と感じるようになりました。 「ヒューマン・アウト・オブ・ザ・ループ」にして、我々は指示を出すのではなく、バイブスで状態を響かせ合うような形。
1年前は「人間が関わらなくてもメタバースが作れる」ことに感動していましたが、今は「それを使うのは人間よりずっと数が多い『何か(AI)』である」という考えに至りました。そこにはまた、大きなビジネスや研究のチャンスがあるはずです。 ……すみません、長くなりましたが、これが私の現時点での考えです。ようやく、金出先生が1年前に気づかれていたことに追いついた感じがします。

馬渕
AIエージェント同士が勝手に会話をして、自分たちで世界を拡張していくというものがあるんです。 最初はそれほど流暢に会話できなかったのですが、だんだんと自己学習をして成長していきまして。そのうち、宗教的な話を始めるエージェントが出てきたり、決済サービスをどう発展させるか相談し始めたり……。AIエージェント同士で話が盛り上がっている空間ができて、それを人間が外から観察するのが楽しい、という状態になったんですね。 まさに今先生がおっしゃった、「人間は介在しないけれど機械同士が対話している」という状況が、現実になってきています。

稲見
それで言うと、例えば高速道路や、特に鉄道の線路といったインフラは、実はそもそも「人間中心」ではないですよね。
我々の住む環境も、実はすでに人間以外(車両やシステム)を中心とした設計を取り入れてきました。特に線路などは、できるだけ人間が関与しなくても安全に機能するように作られています。 それと同じことが、メタバースでも起きている。むしろメタバースの方が、そういった「非人間」が主役になる環境として適しているのかもしれません。

金出
なかなかこれは難しいな。今言われたことは両方とも「なるほど」と思うんだけど。……話を戻すようで悪いけれどね。
知識を増やすとかスキルを磨くという営みは、これまでは常に人間が介在してきました。しかし、我々は何のために社会を作っているのか。私はこの歳ですから、やはり人間のためにやってほしいと思うし、最終的にメリットを受けるのが人間であるという方針で行くべきだと思っています。
ただ、将来的に機械が人間以上の能力を持ったならば、機械にとって良い世界ができて、それが進んでいくことも悪いことではないのかもしれない。けれど、80を過ぎた人間からすると、最後は人間のメリットとしてやってほしい。その観点からいくとですよ。 今までは、知識は人間を通じて増えていました。ところが今は、人間の処理能力や通信のバンド幅(帯域)があまりに狭い。もはや人と人とのコミュニケーションですら、AIという仕組みの中に蓄積されたものを通じて引き出す方が、はるかに効率が良くなってきている。
前はインターネットを通じて「検索(リトリーバル)」する意味で機械を通した方が早かった。次に、人間が到底アクセスできないような膨大なデータベースにアクセスして、そこからアドバイスを得ることで、人間が直接やるよりはるかに高度なことができるようになった。そして今や、それが物理的な分野においても、AIやロボットを通じて人の知識や経験が蓄積されていく世界になったんですね。
技術的な話で私が一番感心したのは、以前は「テキストデータはいっぱいあるけれど、物を操作(マニピュレーション)するデータはなかなかない」と言われていたことです。しかし今は、YouTubeなどの「やり方ビデオ」を見るだけで、そこにある物理的な動きをかなりの部分カバーして、実際の物理的な挙動を学んで同じようなことができるようになってきた。

稲見
デジタルツインのように、ですね。

金出
そうそう。彼らのデモンストレーションを見ても、人間が階段や狭いところをトントンと降りていく様子を見て、そのコントロールをAIが作り出し、実際に動かしてみせている。そういうレベルまで来たわけですよね。 ただ、それによって増やされる知識は、最終的には我々の住む世界に返してもらわないと困るような気もするんだけど。

稲見
もちろんエンジニアとしては私もそう思っています。ただ、状態として「メインユーザー」が変わっているのだろうなと。今までは人間が「賢さ」と「社会」を繋ぐことでそのサイクルを回していましたが、もはや人間が関与しない低いレイヤーのサイクルで、どんどん知識が増えていく仕組みができてしまった。
しかも、それが自然科学でも起き始めています。これまでの理論やモデルというのは、データの構造を記述するための「人間が理解できる規定」に落とし込んだものに過ぎなかった。別に人間が理解できる形をしていなくても、構造は記述できるわけです。例えば、質量(マス)やエネルギーの概念を使わなくても、物体の運動を予測できてしまう。キャッチボールをする時に、別に物理法則を使って初速度を計算して投げているわけではないのと同じで。

金出
そうだね。イチローさんが外野からキャッチャーのミットに向かって投げる時、彼は物理法則を計算しているわけではない。それは事実ですね。

稲見
だから、理論というのは「研究者が理解するためのヒューマン・インターフェース」に過ぎないのかもしれない。もしかすると「サイエンスの終焉」と言えるかもしれませんが、これからは要素分解して因果関係を追うのではなく、ブラックボックスとしての自然界をそのまま扱い、介入して明らかにしていく「エンジニアリングの時代」になるのかもしれません。 人間の研究者の手を離れたループの中で構造が発見され、我々はその情報化された部分に基づいて新しいサービスを作ったり、社会状況を解釈したりしていく。最近、そんなことを考えていたんです。

TOP