ホーム > ヒカリスト > Vol.04 石川 正俊

Vol.04 石川 正俊

超高速・超並列の画像処理技術で
未来を探りあてる

石川 正俊 Masatoshi ISHIKAWA

東京大学大学院 情報理工学系研究科
創造情報学専攻・システム情報学専攻教授

プロフィール 1977年東京大学工学部計数工学科卒業。1979年東京大学大学院工学系研究科計数工学専門課程修士課程修了。1988年工学博士(東京大学)。通商産業省工学技術院(現 国立研究開発法人 産業技術総合研究所)主任研究官、東京大学理事・副学長などを歴任し、現職。2011年紫綬褒章を受賞、その他受賞多数

百戦百勝のじゃんけんロボットがある。じゃんけんぽんの“ぽん”のタイミングで人間の出した手の形状をもとにグー・チョキ・パーを認識し、1ミリ秒(1/1000秒)後に人間に勝つ「手」をロボットハンドが出すシステムだ。1秒に30コマしか認識できない人間には“後出し”の判別はできない。YouTubeにアップされるや驚異的なアクセスを達成したという超人気ロボット。第4回のヒカリストでは、じゃんけんロボットを始め次々と意表を突く技術を生み出す東京大学の石川正俊先生をクローズアップする。

鳥を見てジェット機を作る

「学生時代は、生体工学という分野で、人間の脳と同じものを工学的に作る研究をしていました。生体工学にはいろいろあって、生体のほうに興味がある人と、生体の機能と同じものを作る方に興味がある人と両方いる。私は後者のほうだったんですね」と石川先生。ただ同じものをつくるのではなく、その機能を極限まで突き詰めて再構成するから、結果として人間を超えたものが生まれてくる。「鳥を見て鳥を作るんじゃなくて、鳥を見てジェット機を作る」のが石川先生の流儀なのである。

石川先生の研究室から生まれてきた技術は、じゃんけんロボットが代表する高速ロボットをはじめ、FA(ファクトリーオートメーション)検査、自動車・交通など8分野。これらを貫く高速画像処理技術が“人間の機能・知能を超える”鍵を握っている。その多くはYoutubeに投稿されているので、ぜひご覧いただきたい。ちなみに現在最も閲覧数が多いのは、上記のじゃんけんロボットで約415万ビュー。2位の「高速書籍スキャニングシステム」は約96万ビューと1位より閲覧数はかなり少ないが、1分間に250ページをスキャニングするという機能は驚異的だ。

勝率100%のじゃんけんロボット

勝率100%のじゃんけんロボット
https://www.youtube.com/watch?v=3nxjjztQKtY

勝率100%のじゃんけんロボット

高速書籍スキャニングシステム
https://www.youtube.com/watch?v=03ccxwNssmo

キャッチアップの時代に、あえて変なものに挑む。

インタビューの端々で、屈託のないすてきな笑顔を見せてくれました

さて、今を時めく技術を次々に世に送り出す石川先生、どんな子供時代を送られたのだろう。

「ものを作るのは好きでしたよ。でも人と違うものを作っていました。例えばクラスで工作するじゃないですか、そうすると一番変なものを作るのはいつも私です(笑)。みんな『きれいなものを作ろう』とするんだけど、私はそういう意思があまりなくて、とにかく『変なものを作ろう』と……。」

大学を卒業した石川先生は「変なことをやるというのは、新しいことをやるというのと大体同じだから」と研究の道を選んだ。ところが当時の日本は欧米のキャッチアップに走っていて、既存のものの性能を上げて勝負するということにやっきになっていた。

「それじゃ面白くないだろうと思って、キャッチアップじゃない楽しさは何だろうと考えました。すると『キャッチアップじゃない』と言った瞬間に、既存のものは作れないわけです。違うものを作らなきゃいけない。違うもの、新しいものを作らなきゃいけないという想いと〝研究〟は、私の中ではイコールなんですね。」

少し脱線するが、辞書で「研究」という言葉を調べると、「ある特定の物事について、人間の知識を集めて考察し、実験、観察、調査などを通して調べて、その物事についての事実を深く追求する一連の過程のことである」(Wikipedia)と載っている。日本における研究は長らく「物事を究める」ことに終始してきた。ところが、石川先生は「研究」に「新価値を創出する」ニュアンスを込めないと意味がないと強調する。「日本の文化の中で新しい価値を創出すること、それこそが研究だと私は思っている。だから変なことを一杯やるんです」と笑う。

戦後すぐから70年代のキャッチアップの時代を経て、欧米に追いついてしまった日本は90年から2000年代と時代が進むにつれて「新しい価値の創造」を担う側になった。最先端を走る者にはもはや真似をするものがない。ところが日本の研究は「物事を究める」ことに終始したため、新しいものを生み出す力が残っていなかった。「そこを私は、変なことを一杯やるという方法で、新しいものの方に向かって加速させることをやってきたのです」と石川先生は言う。

成否を決めるのは研究者ではなく社会

石川先生の研究室では、応用がちゃんとあるかどうかが、研究の成否を決める一つの基準になっているという。何かに応用できると見定めたら具体的にどのように応用できるか試作して世に問う。これが研究室のグランドルールだ。

石川先生は言う。「あのね、POCっていうんですよ。プルーフオブコンセプト(Proof of Concept)って。我々の研究室で今、一番重要なのは高速画像処理の技術を磨くことです。どんどん磨いて良い部品を世の中に出していきます。それと同時に、例えば『自動車にこの技術を応用したらこのくらいのことができますよ』というのを提示するんです。それをPOC=プルーフオブコンセプトと言います。そのままじゃ使い物にならないんだけど、それがその分野に応用されたときにどの程度の性能が出るか、あるいはどの程度使い勝手が良いかを『ちょっと作ってみました』と見せるのがPOCです。」

プルーフの意味は「証明」。その技術コンセプトが、実際に世の中で使えることを証明するからPOC=プルーフオブコンセプトなのだ。

「うちの研究室は、自動車に使えそうだと思ったら自動車のPOCを、ロボットに使えそうだったらロボットのPOCを作る。書籍のスキャニングマシンとかバイオ分野の装置とかみんなPOCを作ってみるわけです。研究というのは、POCを出してみないと、それが良いかどうかはわからないのです。研究者の主観として『良い、悪い』はあるけれど、客観は真っ白にしておかないと見誤ります。どんなPOCでも作り手は『これは面白いだろう』と思って作るけど、客観的に見ると、どれが当たるかはわからないです。というか、正直に言うと大体は外れます(笑)。」

冒頭に登場したじゃんけんロボットは、当初誰も評価していなかった。「あんなくだらない研究は誰も興味を持たない」と研究室では思われていた。ところが蓋を開けてみたら、爆発的なヒットになった。世間がどう反応するかは全くもってわからない。

「わからないからPOCを出してそれに対して社会がどれだけ反応するかを見るというのが、我々の研究の基本スタンスなんですね。社会の側から『一押ししてくれる』ことを待っているんです。」

石川先生の研究室の今年の成果集に掲載されている成果は、100以上。YouTubeにアップされた動画の中では、じゃんけんロボット、書籍の電子スキャン、プロジェクションマッピングに加え、二足走行ロボットや高速対象物トラッキング撮像システムなどの閲覧数が多かったという。

二足走行ロボット(閲覧数6位)
https://www.youtube.com/watch?v=n0xRcFqwnCM

高速対象物トラッキング撮像システム(閲覧数7位)
https://www.youtube.com/watch?v=9Q_lcFZOgVo

社会が変化して突如脚光を浴びる

POCに対する反応が芳しくないものは、その先の展開はしない。ところが、中にはだいぶ時間がたってから急に脚光をあびるものもある。

「この間あったのが、8、9年前にやった、バッティングロボットの逆。バッティングロボットというのは、飛んできたボールを100パーセント打ち返すんです。ボールに100パーセント当てることができるなら、ボールから100パーセント逃げる、つまり当たらないようにすることもできると考えたものですが、これ、あまり面白くないですよね(笑)。」

案の定、ボールを完璧に外すバッティングロボットはほとんど評価されず、あえなくお蔵入りになったが、昨年ごろから突如として注目を集めるようになった。

「ロボットの安全基準が変わったんです。今までは『80ワット以上のモーターを使ったロボットを使用する際は柵を設け、その中に人間が入ってはいけない』というガイドラインがありました。それが、『80ワット以上のモーターを使ったロボットでも、人間が近づいたら確実に停止できるロボットであれば、人間は柵の中に入っても良い』となったんです。 人間の動きをちゃんと的確に捉えて、ロボットを止めることができれば良いわけで。」

POCを提示した時点で受けが悪い技術も、しばらく大切に持ち続けると社会の方が変化して、切望される技術に急変する。そんな驚くようなこともここでは起こっている。「そうしたら10年くらい前の研究成果を、いかにも最近つくりましたという顔をして出します。もちろん嘘をついてはいけませんので、何年につくった技術ということは言わないわけですが」と石川先生。「でもバレちゃうなぁ。最近のはハイビジョン撮影だから、4対3の縦横比だと明らかに昔だと……」と笑って付け加えた。

ソーシャルメディアを巧みに使い、社会に問う

POCを作って社会の評価を待つのが石川先生率いる研究室のメソッドなら、社会の評価を得るためには、まず社会に対して技術を見せなければいけない。そこで活用しているのがYouTubeやFacebookなどのソーシャルメディアだ。

「アメリカはすぐ反応が来ますね。日本は1ヵ月くらいかかるけど、アメリカ人は驚くような物事を賞賛するんです。じゃんけんロボットのときは、1週間から10日で300万アクセスありましたが、ほとんどが欧米人で日本人は1割もいませんでした。」

またこんな分析もされている。

「反応が300万あるとすると、その0.1パーセント、この場合は3000のメールが来るんですよ。そのメールのうち10%つまり300通が“読むに足る”メールで、そのまた1割、つまり30通くらいが“読んで意味がある”ものですね。『ここはこういう風に直したらどうか』とか書いてあるわけです。だから300万ヒットすると30通くらい気の利いたメールがもらえます」と石川先生。こうしたざっくりとした数字の把握も経験が培ったノウハウといえる。

ところで動画の出来映えによって反応の良し悪しは分かれるのだろうか。

「研究の内容が良くてもビデオ映りの悪いものは反応も良くありません。逆に内容がなくてもビデオ映りがいいと、爆発的な反応をとることもありますが、実は、サイエンスの場合は、YouTubeに凝った映像を投稿すると逆に信憑性を疑われるのであまり受けが良くないんです。」

確かに爆発的なヒットとなったじゃんけんロボットの動画は、人間とロボットが延々とじゃんけんを繰り返して、ロボットが勝ち続けるのを見せるだけ。編集者はほとんど何もやっていない。このわかりやすさが直感的に面白いという反応に結びつくのだろう。

変なことをするためのルール

石川先生の研究室には、変なもの、新しいものを生み出すための方法があるという。それは、「課題を見つけて解決策を考える」という従来型の方法論ではなく、今までになかったことを見つけ出すためのルールともいえる。

「課題があると思った瞬間に、そこに大きなビジネスはありません。例えばFacebookやGoogleみたいに大きなビジネスにするんだったら、『今ないこと』をやらない限り無理です。うちの研究室には『今ないこと』を見つけるためにいくつかの秘伝の方法があります。例えば、『難度10を達成するのが課題です』と言われたとしますよね。これは『難度10を達成する』ことが『課題』だから、難度10を達成したところで大きなビジネスにはならないんです。小さなビジネスにはなるんだけど、それだと世界のトップを走れない。その場合はどうするかというと、意味もなく難度10を難度100にするんですね。」

意味もなく難度10を難度100にすると、当然、誰もやってないし、質的変化も必要になるから、新しいことをやらないと到達しない。「だから10を思い切って100にすれば、それを考えることで新しい領域に到達できるはず」というのが石川先生からのアドバイスだ。たとえば、自動車のある部品の性能が8だとして、次の目標性能が10となれば、簡単に解決方法にたどりつけるかもしれない。でも、目標性能を100に設定すると、今までとは全く違ったところから発想せざるを得なくなる。結果として従来の延長線上ではない、別の新しいものが生まれる可能性が広がっていく。

並列性と高速性に優れた光をシステムにして使いこなす

さて、今までにないこと、という未踏の海を前に広く多方面の成果を出されている石川先生だが、本企画のテーマである「光」をどのようにとらえておられるのか。

「我々のところは高速画像処理をやっていますから、二次元の情報をそのまま並列に処理して結果を出すというのが目的なわけですね。そこは光が主役です。処理した結果はコンピュータにつなぐので最後は電子に変換するんですが、以前はコンピュータにつなぐところの処理まで光でやったほうがいい、という主張をしていました。それはどうも違うということになって、今はこの部分の処理は電子でやろうとなっています。」

ダイナミックプロジェクションマッピングの例
https://www.youtube.com/watch?v=p7IL0Gvux7U

二次元情報の処理は光で、その後の演算処理は電子で、と棲み分けるようになった理由は、光と汎用性の関係にあるらしい。「光で汎用の演算機能を実現しようとしても、なかなか汎用性が出しにくい。過去に試みたことがあったのですが、その時は学習機能をもって汎用性を出していたんですね。でも結局、光デバイスの汎用性の低さが電子デバイスに負けてしまった。だから光の特徴が最も発揮できる部分は、やはり二次元の情報を並列に処理できる二次元並列性だと思います。」

その二次元並列性を活かして“汎用的”に光を使っている例として挙げていただいたのが、前にも登場したダイナミックプロジェクションマッピングだ。これまでのプロジェクションマッピングはディズニーランドにしても東京駅にしても、動いていないものに画像を表示した。ダイナミックプロジェクションマッピングは、動くものに対して画像を表示する。たとえば上下左右に動く白いボールに対して自転する地球の様子を映し出すことができるのだ。

「これは光軸を動かせる光学系を作ったらできたんです。そうすると今までは固定したものにしか映せなかったのに、動くものに対して映せるようになったわけで、少し“汎用的”になるわけですよね。ここには演算の汎用性ではなくて物理構造の汎用性みたいなところがある。光はこういうところを狙っていくのが良いのではと思いますね。」

(写真左)ダイナミックプロジェクションマッピングの装置。最上部にあるカメラでボールをトラッキングし、コンピュータで超高速・超並列画像処理を行う。ボールの位置情報を下部(写真右)にあるミラーにフィードバックすることでボールに追従した映像が投影される

 

並列性に加えて光の力量が発揮できるのは「高速性」だと石川先生は続ける。

「汎用性で電子に負けたとしても、高速性では光は絶対勝ちます。我々の研究室でも、1秒間に1000フレーム映せるプロジェクタを開発したりして、すべて高速性側で勝とうとしているんですよ。光の優れた特徴としての高速性を、システムの力で引き出そうとしています。」

原理を学んだら、それで何ができるかを考えてほしい

理想の科学の道を突き進む石川先生の熱いまなざしが印象的でした

最後にこれからの社会を担う中学生・高校生に向けて先生から一言お願いした。

「光で社会を変える、生活を変えるっていうことを考えてみませんか、と言いたいですね。光を使うと社会はどう変わるだろうって。それは山ほど考えられる。その山ほどあるものの中から何か『変なもの』を解決しようと考えると、そこから新しい研究が生まれるはずです。」

また「学校でニュートンの運動方程式を教えたら、必ず『この運動方程式は何に使える』と付け加えるべきだ」と石川先生は続ける。新しい科学の知識を教えたときに、その原理と共に応用の可能性を教え、またその応用を発展させるように仕向けること。それがいまの学校教育に欠けているものではないかと石川先生は強調する。

「学校では、新しい知識が新しい価値を生み出すことを教えてほしい。物事がどうなっているかを知るサイエンスの観点を教えたら、それを何にどう使うかというエンジニアリングに発展させようと。それがPOCを生み、そのPOCのいくつかは失敗し、いくつかが成功して発展していくというのが新しい時代の科学の道なんですよ。」

 

このページの動画は東京大学 石川渡辺研究室の「Ishikawa Watanabe Laboratoryチャンネル」(YouTube)に掲載されているものです。

東京大学 石川渡辺研究室「Ishikawa Watanabe Laboratory チャンネル」
https://www.youtube.com/user/IshikawaLab