11/6(金)、11/7(土)と2日間開催されている第21回ビジュアリゼーションカンファレンスで明日11/7(土)に短い講演をするために神戸に来たのですが、すぐ近所で開催されていた神戸ITフェスティバル2015の今日のスケジュールを見たら、基調講演が現代の魔法使い&現在28歳にして筑波大学助教&異能vation仲間&SIGGRAPH仲間(これは僕の方が今年からでずっと後輩だけど)の落合陽一くんで、その次がUT-Heartシミュレーションの開発者の1人でいらっしゃる東大の杉浦清了先生、その次がポリゴンピクチュアズの塩田周三社長のご講演、ということで、ふらっと足を伸ばして神戸ITフェスティバル2015のほうに顔を出してみました。
落合くんと僕とは、お互い会う前から存在は認識していたのですが、実際に最初に会ったのは確か去年の今頃。だいぶ仲が良くて、2人で寿司食べに行っちゃうくらいの仲だったりします。
Los Angelesでも「変な人」記念ショット撮ったりした。
なんとこんなヤバい噂まで…wwww
落合さんと瀬尾さん、いつもホモホモしく見てる。時々星さん
— しらはま (@shiratamaXeins) 2015, 11月 6
んで、今日、初めて落合くんの1時間講演を聞いたのですが、とても良くまとまっていてメチャクチャ分かり易かったうえに、19世紀、20世紀の技術革新の歴史や哲学の変遷などにもとても精通していて、Alan Kayの相当昔の論文を自分自身で読んでいたりと、いやぁ、わかってはいたけれどもこれは太刀打ちできないわ、と痛感。
「情報量が多すぎて頭の回転が追いつかない!」みたいなコメントをよく見かけるのですが、彼の他の講演を聞いたことが無いのでわかりませんが、今日は一般向けにだいぶゆっくり且つ総論的に話したってことなのかな?
テレビには良く出るけれどもろくに論文も出さなければ一昔前の技術紹介をしているような「芸能人研究者()」も少なからずいる中で、彼はテレビ受けしてメディアから引っ張りだこにも関わらず、毎年国際学会で新技術や新作も発表するし、大学で学生教育もきちんとやっているし、誰もが見習うべき研究者の姿かと思います。
彼とは能力も専門性も違いますが、「僕も同じこと思ってたんだよね!」「いつも講演で僕も同じこと言ってるわ!」と感じたことが多く、見据えている方向はとても似ているなーと思ったので以下つらつらと。
CG表現の研究は、時間さえかければ既に大抵のものが出来るレベルまでになっているのではないか、という彼の意見には完全に同意。最近のハリウッド映画を見れば、大体のことは出来てますよね。まぁ、CGで出来ないこと、苦手なことを上手く回避できるように練られている部分ももちろんたくさんあるわけですが、上手く実写合成と合わせたり、金と時間を投入すれば本当に大抵のことは出来てしまうように思います。
で、そうなると、その先に人間がやりそうなこととしては、
・ちょっとでも実写に近づけるように毎年少しずつ発展し続ける(どの家電メーカーでも毎年ちょっとだけスペックの上がった新製品が出るのと同じ)
・敢えて2Dっぽくしたり、手描きっぽくするなど、画面内での最終出力の表現に幅を持たせることを試みる(トゥーンレンダリングとかまさにこれですね)
・最終出力は画面内で同じでも、全く別の分野に応用する(僕がずっとやっている、これからもやろうとしている医療への応用とかがまさにこれ)
・最終出力を画面以外のものにする(典型的なのが3Dプリンタ出力。落合くんが目指しているのがまさにこれ。3Dプリンタではないけれども)
くらいかな、と思います。
最初の2つは、まぁ誰でも考えると言いますか、いまの流行り。ってか普通に考えたらそうするしか無い。そして明らかにレッドオーション。より簡単な操作で、というUI的なものもここに含まれるかも。より高速に計算してリアルタイムに、というのもこの流れで出てくると思うのだけれども、それは後述。
3番目が僕が目指しているもので、これは、今まで結びつかなかった世界を結びつける、ということ。落合くんの今日の講演では、確か数学という手法と自然現象とを結びつけたのがニュートン、って話をしていたのだけれども(ニュートンで良かったっけ?違ったらごめん!)、まさにそれ。今でこそ当たり前に思えることだらけでも、最初に結び付けた人はやっぱり凄くて、これには一見結びつかなそうな2つの世界を両方知っていることが何よりも大切で、適切なところで適切な考察・推論が出来るためには、本人は例えそれぞれの二流であってもどちらの世界の一流の人たちとも会話できるくらいの知識・経験・能力が必要。
僕は(今のところ)これをずっとやっていきたい。
一流の3DCG研究者の方からすれば、僕なんて3DCGの基礎の基礎も知らない、って言うか、お前が偉そうに3DCG語るなよ!と間違いなくお叱りを受けてしまうレベルで、実際、SIGGRAPH論文見ても数式は全然理解できないし、自分で実装しろと言われてもまず無理。
でもそれでも、だいたいいま何が出来ていて、どこが難しくて、くらいは何となくはわかっているつもりで、バリバリのお医者さんからしたら遥かに3DCGのことは分かっている。
で、こうやって2つの分野を結びつけるときって、一方の課題を解決するために必要なもう一方の分野の知識や技術が必ずしも最新のものである必要があるとは限らない。寧ろ、分野的には枯れた技術や当たり前のことが、違う文脈ではとんでもない威力を発揮することが多い、ような気がしている。
医工連携がなかなか上手くいかない理由は大きく2つあると思っていて、1つは、
・そもそも言語が違ってお互いに理解できない
という、通訳がいなければどうしようもないことなのだけれども、もう1つは、
・医学面での課題を工学側が理解したときに、課題の解決手段として必要な知識・技術が、工学的に新規性の無い、既知の技術で十分なこ
とも意外と多い
ことだと思っている。こうなると、工学的には新規性が無いので論文にならない。つまり、そもそも大学で行うべき研究ではない、ということになる。だから、医学部と工学部とが連携するのではなくて、新規性の有無にかかわらず、実装するのが好きなエンジニアを医学側が最初から確保する、か、或いは民間のエンジニア集団と組むのが正しいのだと思う。
ちょっと脱線してしまった。
僕がやっているのは、全くの新規性があるものはたぶん1つも無くて、通訳がいなければ絶対に結び付かない医学とCGの2つを適切に繋げること、でも、どっちの文脈もわかる人というのが、基礎的な部分だけであってもなかなかいないので、1 + 1 = 3にも4にもなる。
ニュートンがそうだったように、50年後100年後には、「こんなの今思えば当たり前だよね。当時どうして誰も気づかなかったんだろうね?」って言われるようになりたい。
で、最終出力を画面以外のものにする、というのが落合くんの根幹(…の、はず)。但し、出力するための元データは3DCGとは限らなくて、コンピュータでなければはじき出せない計算結果なら基本的には何でも良い。
だから、あるときは光を自由に空間上に付けたり消したり、あるときは物を浮かせて動かしたり。コンピュータでないとそもそも絶対に処理できない計算をして、その結果を画面ではなく実空間上に出力する。彼はそれを「映像の世紀から魔法の世紀へ」と呼んでいる。「魔法」という表現が本当に最適な表現なのかは議論の余地があると思うけれども、まぁそういうことだ。
マシンパワー自体が上がってきたり、コンピュータ上での効率的な計算手法などもそれなりのものが出来るようになってきた。
そうすると、結果が出るまでに何時間も何日も待ったり、完成した1つのものを大量コピーしたりするのではなく、リアルタイム且つカスタマイズ可能な形でコンピュータを活用できるようになる。
CGの世界では、これを「プリレンダーからリアルタイムレンダリングへ」と呼ぶし、落合くんはこれを「モノ<場」と言っている。
モノというのは、大量生産される同じ「モノ」、という意味。最初から陳列棚に置いてある、誰か自分ではない人が作った最終出力物の中で、自分が最も気に入ったものを買う。完全なる既製品。
一方、場というのは、個々にその「場」でカスタマイズされるもの。リアルタイム性があり且つインタラクティブ性がある、ともいう。落合くんの今日の講演でも「インタラクティブ」はキーワードの1つだった。高速に計算できることでそれが可能になる。彼の文脈で言えば、例えば自分のお気に入りの図柄を自由に、或いはその場で手書きで書いた、世界でそこにしかない絵を空間上に自由に光の像として作り出す、とかそういうやつ。
コンピュータの例にはならないけれども、彼はこれを今日の講演で「100万人が松田聖子の同じCDを買っていた」時代と「メンバー1人につき1万人のファンがいるAKBとかNMBとかのアイドルが合計100人いる」時代で例えていた。
CGの世界も全く同じで、プリレンダーはもはや古い時代のものとなりつつあって、リアルタイムの波がどんどん押し寄せている。
医療の世界では、映像というプリレンダー、つまり、何日も何か月も計算させて出力された、その場での修正が出来ないものはあまり役に立たないと思っている。見る人がその場で出来ることと言えばせいぜい「再生」「一時停止」くらい。
「いやいや、一般的な手術の手順説明とかはわかりやすい映像があればそれで十分でしょ」と思うかもしれないけれども、確かに映像しか出来ない時代はそうだったのだけれども、いまは違うと思っている。
たとえ説明映像だとしても、「うーん、ここは映像では正面から見ているけれども後ろがどうなっているのか知りたいんだよなぁ。」とか、「外側は消しちゃって心臓の内部だけ見たいなぁ」とか、そういう欲求は絶対にあるはず。手術は執刀医と助手が患者を挟んで対面の位置に立つことがほとんどだから、人によっては180度回転させた状態で見たいかもしれない。
患者さんやその家族だったら、人によっては映像の進みが速過ぎるから、一時停止をした上でさらに色んな角度から自由に見て立体構造を把握したり、或いはCGが存在する3次元空間内に印をつけたり書き込みをしたいかもしれない。
これも、1つの完成されたモノの大量コピーから、その場でカスタマイズされるもの、「モノ<場」そのもの。
でも、じゃあ全部が全部ユーザーが最初から自由に操作できるようにしておくことが良いかというと全くそうではない。
CGの文脈で言えば、CGのド素人が秀逸なカメラワークやライティングを施すことは出来ないし、落合くんの文脈で言えば、API公開しとくから後は皆さんでご自由にどうぞ!と言われてもほとんどの人は何も出来ない。
だから、ユーザーが自由自在に何でも動かせるように見えて、実は作り手が巧妙に操っていて、しかもそれをユーザーに全く感じさせないように出来るかどうかが、プロとしての腕の見せ所になる。
落合くんは今日の講演で、これからの僕らに必要なものは「WOWを産み出す能力」「数学・物理」「デザインセンス」だと言っていたけれども、これは「ユーザーにWOWと思わせるためには作り手側として数学・物理が必須だし、ユーザーを巧妙に操るデザインセンスが最後にものを言う」という意味だ(たぶん…)。
なんかだいぶ長くなってきてしまったのでこれくらいにしておこうと思うけれども、画面内に留まるのか、それとも画面外に飛び出すのか、という点で僕と落合くんとは最終出力のスタンスが全く異なるのだけれども、でも最終出力が違うだけで、思考回路としてはきわめて似ているなぁ、という気がした。
画面外に飛び出すほうが、「実体がある」という意味で人間にとって説得力も感動も測りきれないほど増すわけで、そこはとても羨ましいのだけれども、画面内に留まるという、最終出力手段としては20世紀的な、一昔前の手法でも、まだまだ出来ることはたくさんあるし、見た目的には地味で派手さは無いにしても、上手くCGと医学とを結びつけることで少しでも医学そのものが良くなって、少しでも手術成績が上がったり、手技施行時間が少なくなって患者さんへの負担が少なるようなことがあるとすれば、それも(科学的にしっかりと裏付けされた)「魔法」って言っても良いんじゃないかな、と思う。
今度は僕の講演にも来てね!
おまけ:
ついでに言うと瀬尾さんはイケメンなのに服が残念だから是非パリッとしたの着てほしい
— しらはま (@shiratamaXeins) 2015, 11月 6
wwwwwwwwwwwwwww