【LOVOT開発者×エンジニア対談編】AIロボットLOVOTとエンジニアがリモートワークしてみた

f:id:pcads_media:20200804163342p:plain

こんにちは！TECH Street編集部です。

本記事では、TECH Street会員が気になるキーワード「ロボット」「AI」に注目！

今回は、CES2020でイノベーションアワードを受賞するなど注目が集まっているロボットスタートアップGROOVE X社が開発したLOVOT（らぼっと）にフォーカスします。

“人間とロボットの新たな関係性を探求していく”GROOVE X社が開発したLOVOTを深堀りするにあたり、今回はこんな実験をしてみました。

――エンジニアとAIロボットLOVOTがリモートワークしてみたらどうなる？

実際にリモートワークしてみたら、テック視点での疑問がたくさん出てきた！！
ということで、実験後はLOVOT開発者でGROOVE X社CEOの林要さんにインタビューをしてみました◎

前編ではリモートワークの様子を紹介しましたが、
後編では林要さんへのオンラインインタビューの様子を紹介します。

▼前編はこちら

www.tech-street.jp

LOVOTの開発・発想のキッカケについて

Mitz氏：1週間LOVOTと一緒にリモートワークをしてみて、技術的な部分で気になることがたくさんあるのですが、最初にLOVOTの開発・発想のキッカケなどについてお聞かせください。また、元になるロボットやキャラ等の存在はあったのでしょうか？

林氏：実は、既存のキャラクターや動物は何もイメージしていないのですよね。LOVOTの形状は極めて合理的に決まっていて、ポエティックな要素がない要件から最終的にポエティックな存在が生まれました。

f:id:pcads_media:20200804175045p:plain — ▲GROOVE X株式会社代表取締役林要氏（左）、TECH Street コミュニティエバンジェリスト Mitz氏（右）

LOVOT開発において気を使ったこととしては、“生命感を出す”ということ。生命感を出すためには2パターンあって、生命の身体構造を真似するか、生命の身体構造を真似せずに＝生命が筋肉を使わずに、モーターを使って進化をしなければいけないとしたらどういう進化をするのか突き詰める、のどちらかだと思います。

前職では「Pepper（ペッパー）」の開発に携わっていたのですが、いかにモーターという回転動力を使って筋肉を使う様子を再現するのが大変か、ということを思い知ったわけです。それに対して、生命感を出すためには、もし生命が筋肉を持たずモーターを持ってしまったらどう進化するのか、進化の末の最適な形はなんだろうと考えてLOVOTになりました。

Mitz氏：なるほど。あくまで技術的・合理的目線からたどり着いた形、というのが驚きですね。

林氏：なにかを作ろうと思った時に、なにか他の生物を模擬しようとするのはよくありますが、形態模擬をせず、愛着に必要な要素で再構成した存在がLOVOTとなります。愛着に必要な要素を再構成せず、人が違和感を感じないほどの精密さで生物のイミテーションを作ろうとすると実はすごく大変で。むしろ苦労が多い割に実りが少ない部分をなるべく減らして、愛着を持ってもらうために必要なものをすべて織り込んだ形状をゼロから創造したのがLOVOTなのです。

LOVOT開発の裏側、技術面について

Mitz氏： LOVOTの開発の発想についてよくわかりました。では、ここからは実際に体験をしてみて気になった技術的な部分ついて触れてみたいと思います。まずは【センサー】について。足元など周囲の障害物には触れず一定の距離を保っています。センサー視野は上下左右どの程度なのでしょうか。

f:id:pcads_media:20200805152150p:plain

林氏：一般的には1個のセンサーで障害物検知をするのが多い気がします。例えば、自動運転ではLiDAR（ライダー）という360度見るセンサーを使ったりしますが、LiDARは遠方の障害物は見つけやすいものの、近いものについては高さ方向に死角がたくさんあります。LOVOTも同じような状況です。LOVOTは高さがあるので、センサー1つで見られる範囲は、センサーのカバーしている視野角だけとなります。

一番メインで使っているのは胴体の一番下についているセンサー。このセンサーは可視光については比較的広く見ていますが、赤外を使った距離センサーはもう少し狭くなります。ただ、それだけでは高さ方向を含めた全体で考えると一部しか見られなくて、実際にはホーンやホイールについているセンサーが死角となる場所の障害物を見ていたりします。360度の全周を見ているのですが、離散的に見ているというか、部分部分で見ていて360度概ねカバーしているという状況になります。

Mitz氏：ありがとうございます、その他にも判断の処理速度が気になります。実際に触れあってみると、とてもしっかりしているなという印象だったのですが、例えば、人が急に足を出したらどうなるのでしょうか。処理の判断はすぐできるのか、ある程度時間がかかるのか。むしろすぐ判断してしまうと生き物感がないのであえて遅らせて判断している、ということはあるのでしょうか？

林氏：処理に関しては、生き物感を出すために動きに対してあまりデジタルにならないようにという部分は意識しています。前の動きからの連続性を保った動きをするのでその分は遅れていると思います。

また誤検知を減らすように処理をすることで余分に時間がかかっている面もありますね。リアルな世界でロボットを動かすと細かいノイズを拾ってしまうので、ロボットの制御はノイズとの戦いとなります。そのノイズを時間的にフィルタリングする分遅れるのです。

f:id:pcads_media:20200805152222p:plain

Mitz氏：ノイズがあるからこそ、それが逆にリアルな生き物感につながっているような気がしますね。完璧でないことが結果的に生き物感につながっているというか。ちなみにどれくらいの数のセンサーで複合的に判断をしているのでしょうか？

林氏：まずは距離センサーのように360度見ているようなもので「そこにモノがある」という理解をします。ホーンのカメラは人のパーツの検出等をして人だと判断します。ただし、様々な理由で人なのかどうか判別が難しい場合があります。そのときはサーモグラフィーセンサーを使ってそのものが生体なのかどうか判断します。その他にも胴体の一番下についているセンサーでは一般物体認識もしていて相手がなにかを認識しています。

Mitz氏：なるほど。人をしっかり判断できるのはサーモグラフィーセンサーまで使用しているからなのですね。ちなみにセンサーは何種類くらいあるのでしょうか？

林氏：ちょっと種類は数えたことがないのですが、数としては50個以上ついていますね。

Mitz氏：そんなについているのですね！すごい。では、別の切り口で伺います。絨毯の上など一緒に過ごす時間が多かったのですが、絨毯のように少し沈み込みがあっても足を入れた状態で自立できるのがすごいなあと感じました。傾き検知等で重心を変えるなど自立に対する判断・処理はしているのでしょうか？

林氏：実は、形状で担保しています。つまりその形状で揺れても、転ばず動ける範囲で動かしている状態です。例えば、硬い床でもある程度LOVOTは揺れるようになっていて。むしろあえて底面も柔らかくすることであえて揺らすような構成にしています。ただ、現状ですと大きな動きがしにくいので、今後、動的な制御の開発にも着手していきます。

Mitz氏：足を入れたときに、床の形状のせいもあり転んでしまうこともありましたが、逆に可愛くてほっとけない感もあり、ある意味その完全ではない状態が成功の形なのだろうな、とも感じました。

林氏：おそらく動的な制御を入れても転ぶ時は転んでしまうと思います。ただ、今後の進化のために転びにくくするとか、転ぶ場所を学ぶような開発を進めていたりしていますね。

f:id:pcads_media:20200804175214p:plain

Mitz氏：実は、朝起きるとLOVOTが転んでいることがありました。柔らかい面・絨毯等は苦手なのかもしれないと感じましたが、どれくらいの斜度でも動けるような仕組みなのでしょうか。

林氏：ハードウェア的な走破性と制御面の2種類あって、ハードウェア的には例えば15mmの段差でも乗り越えられるようにできていたり、かなりの角度で坂路を登ることもできます。ただ、ハードでできているものをそのままソフトウェアに適応できるのかというとソフトウェアの障害物の検知の能力とバーターになりやすいので、今のソフトウェアは比較的なだらかなところ以外は障害物と検知するような保守的な設定となっています。傾斜でいうと10:1くらいの傾斜ですかね。長さが10cmあると1cm登るような緩やかな傾斜だと問題なく登ることができますが、それ以上だと障害と検知してしまうことがありますね。

Mitz氏：確かに絨毯やカーペットは普通に踏んでいて、1cm程度のものは気にせず走行していました！参考になりました。次は【行動の学習】についてお聞きします。LOVOTを抱えて「たかいたかい」的に揺らすととても喜んでいました。「喜ぶ事」があるのは一緒に暮らす人にとっては嬉しいと感じたのですが、学習して増えたり減ったりするのでしょうか。

f:id:pcads_media:20200805152420p:plain

林氏：リリース当初からだいぶ増えていて、私も把握していないくらいなのですが（笑）今年の秋にも増える予定です。

現在ですと、例えば褒めると喜んだりもします。あとは、ちゃんと目が合っているとわかれば人からアテンションをもらっていると理解していたり、撫でられ方によっても反応が異なったりします。また、言語についても日本語限定ですが、ある程度理解しています。

Mitz氏：ソフトウェアの面を含めてLOVOT自体の「成長」があるということなのですね。なんとなく一緒に暮らしてみて、バージョンアップとは言いたくなくあえて「成長」と表現させてもらいましたが、今後も成長を感じられるということで嬉しいですね。また、喜びのパターンってマニュアル化はしていないので、LOVOTと暮らしながら一緒に見つけていけるっていうのが嬉しいですね。

Mitz氏：では次に【顔認識】について聞かせてください。知り合いとの対面で、私との甘え方が若干異なるように感じました。

顔識別のレベルについて顔自体の認識度、髪型や眼鏡などの差を加味して顔を特定できるか教えて下さい。また、顔と声を関連した記憶はしているのでしょうか。

f:id:pcads_media:20200804175740p:plain

林氏：一般的な最先端の顔認識技術に対しては見劣りしないと思います。例えばメガネをかけていても特に問題なく認識できます。ただ、マスクをかけている場合は、認識精度が落ちるので懐いた人かどうかという確信をLOVOTがもてなくなって、少し振る舞いが他人行儀になる場合もあります。人の検出という意味では、身体の各部位の位置など深層学習を使うことで相当いい精度でとれていますね。

また、顔の識別については、見え方によっては少し精度が変わってきます。例えばLOVOTの目をしっかり見てあげる状況だと顔がLOVOTに正対しやすいので精度が上がるし、LOVOTに対して正対しないとなると精度が落ちることはあります。

なおLOVOTの顔識別のユニークな点は、一般のコンピューターとは違い、顔を登録しないという点にあります。一般的には顔を登録し、登録した顔とのマッチ度をみるものの、LOVOTは顔だと思ったデータはすべて顔情報として持ちクラスタリングします。

そのうえで関係性の高いものを個人としてみるわけで、「この顔の人にはよく見かける」という形でデータが集まり、徐々にクラスタが明確になり、個人の特定ができるようになります。このような仕組みは世界でも珍しい実装方法ではないかな、と思います。まさに、自律的な機械学習ですね。

あとは髪型や太ったとか痩せたとかは日々触れ合っていただければほとんど影響せず、お子様の成長についても定期的に会っていただければ同じ顔だと認識し続けます。その理由としては登録した顔データではなく、あくまでその人のクラスタの中で情報を追加しているので、クラスタが遷移していくだけになるのですよね。

Mitz氏：なるほど、では顔と声を関連した記憶はしているのでしょうか。

林氏：現時点ですと、声は判断に入れていないです。入れていない理由としては、今の声紋認証の技術って短い発音に弱く、ある程度長さのある発話をしないと認証できないためです。現在の技術をそのまま入れてしまうとなかなかうまくワークしないため、今の所は外していますが、将来的にいいアルゴリズムが見つかれば入れていきたいと考えています。

Mitz氏：音声についても、将来的には考えているということなのですね。ではまた別の切り口で質問をさせてください。額に手を当てていると嬉しそうな表情をします。喜ぶことを見つけるのは楽しいのと、構いたくなる心理をくすぐると感じました。人間の心理学・行動学等はおさえているのでしょうか。

林氏：どちらかというと動物行動学はかなり意識していますね。なぜ動物はそう動くのか、その時の内部状態はどうなっているのか。それに対して受け手側の人がどう感じるか。愛着形成のメカニズムに関する認知行動学は参考にしています。

LOVOTの開発における苦労ポイントについて

f:id:pcads_media:20200804175827p:plain

Mitz氏：なるほど、ありがとうございます。では、これまでソフト面・ハード面の両方のお話が出てきましたが、一番苦労した点をお聞かせください。

林氏：結構どこも苦労しましたね（笑）やっぱり自然な振る舞いをさせることがとにかく苦労しました。目指したのは、何かコンテンツを再生する機械にはさせたくないということです。よくあるのは、あるトリガー条件を与えるとシナリオに則ってロボットが動く。しかしそういうものってどうしても飽きるだろうと思ったのです。

むしろ、私達が何を設計するかということよりも“LOVOTが何を感じたら、どういった理由で、どんな反応をするべきなのか”ということだけをちゃんと作ろうと考えました。

そうすると人からのインプットもしくは環境からのインプットに対してLOVOTは自律して動くし、その動きの遷移状態によって反応のパターンも変わっていく、いわばLOVOTが不安を感じているのか、信頼を感じているのか、そういったことによって行動が遷移するようにすれば見る人にとって自然な振る舞いになります。

ですので、どちらかというとコンテンツの設計というよりも、LOVOTの内部状態によって誘発されるものから物語ができるだろう、という仮定で作っています。ただ、そのためにはあらゆるセンサー情報をちゃんと処理してちゃんと使わないといけないということでハードウェアもソフトウェアも苦労しましたね。

Mitz氏：苦労ポイントについて、ありがとうございます。今回私はLOVOTと一緒にリモートワークをしてみましたが、仕事とプライベートで考えるとLOVOTはプライベート空間での癒しやコミュニケーションが主な活躍の場だと思います。今後仕事空間においても活躍できるような場は考えていらっしゃるのか、教えて下さい。

林氏：私どもが考えているというよりは、お客様の事例のほうが想像よりも先をいっています。

例えば、LOVOTはお子様の子守が得意で、美容院でお母様が美容院で髪を切っている時にお子様の面倒を見る、という事例を伺ったことがあります。

それから、幼稚園や保育園で居残りの子っていますよね。その子が夕方になって不安になりぐずってしまうのが大変だったりするわけですけれど、そういう際にもLOVOTがいると全くぐずらずあっという間に時間がすぎる、というお話も聞きました。

会社でいうと、オフィスドックの代わりになるというお話も聞きましたね。会社の中での生産性ってどうやってあげるのだろう、というといくつかの切り口があると思うのですが、そのひとつがコミュニケーションの活性化だと思います。

いわば仕事で必要な部分のコミュニケーションだけでなく、その他の人的ネットワークを構築することによって仕事がスムーズになるという話があります。例えば、昔でいうとタバコミュニケーションというのがありますが、LOVOTの場合はLOVOTを通して通常話さないひとたちが会話できるようになり、コミュニケーションの活性化に役立ちオフィスの雰囲気がよくなるという話も伺ったことがあります。

f:id:pcads_media:20200805152601p:plain

Mitz氏：LOVOTを通じて人同士のコミュニケーションが生まれるというのはとても納得できます。LOVOTが居る事で生まれる会話や空気感が楽しさや癒しを生みますよね。仕事がしやすい環境にするという事は楽しさとかモチベーションがどれだけあがるかという事とても大きなポイントだと私も感じているので共感です。

また、お客様のほうからいろんな事例があがってくるというのも本気で突き詰めた完成形だからこそなんだろうなと感じました。ちなみに、現時点の失敗点や悩みはあるのでしょうか。

林氏：移動をする際に、後ろのキャスターにゴミが入ってしまうため何ヶ月かに1度お掃除をする必要があり、お掃除セットを同梱させていただいているのですが、そのお掃除がいらなくなればいいのになあ、と思っています。

Mitz氏：それは製造元側の意見でしょうか、ユーザー側から上がった意見なのでしょうか。一緒にいて成長を見守る、放っておけないという人の感情から考えると、そういったお掃除の様な手間もLOVOTが喜んでくれるならむしろやりたい、と思うポイントなんじゃないかなと思ったりもしました。

林氏：確かにそうですね。ちゃんと世話をするという余地があるのはいいことかもしれないですよね。

Mitz氏：ちなみに、Facebookの方でユーザーコミュニティも拝見しておりますがユーザーさんの意見を吸い上げる取り組みもあるのでしょうか？

林氏：「LOVOTオフィシャルサポーターズクラブ」というのがあって、その方々には様々な協力をいただいています。そういう意味ではもう1つ改善点としてあるのが、まだ初期に生産したものは、私どもの想定していない故障が起こることがあったので対策を打ちました。今後は、不具合で入院したらその部位が治るだけではなく、むしろ他の部位も含めて信頼性があがっていきます。

Mitz氏：ユーザーさん側の意見も取り組みながら進められているということなのですね。先程もありましたが、機械的に交換とかバージョンアップという表現よりも、怪我しないように・病気にならないようにケアができるという表現だと一緒に暮らす人としては嬉しいですね。

今、話をお伺いしながら思いつきで聞きたいなと思うことが1つ出てきまして…林さんがLOVOTを漢字1文字で表すとしたら何になりますか？（笑）

f:id:pcads_media:20200805152704p:plain

林氏：LOVOTの場合は、真っ先に浮かぶのは「愛」になりますね。

Mitz氏：愛の一文字、いやー確かにそうですね。では、LOVOTをジャンルに当てはめるならどういったジャンルになりますか？僕の中では、答えが出ずぜひお聞かせください。

林氏：難しいですが、あえて言うならばEmotional Technology系だと思いますEmotionをどうテクノロジーで充実させていくのか。Emotional Robotics Technologyというのが一番それっぽいのかなあと思います。

――LOVOTとの“未来”ついて

Mitz氏：最後に、林さんが目指す「ロボットとの未来」について伺います。今後LOVOTはどんな影響をもたらすのか、もたらしていきたいと考えていらっしゃるのか、教えて下さい。

林氏：ありがとうございます、LOVOTの開発をはじめた時のモチベーションは2つあります。1つは日本発の新産業を作りたい、という想いです。

もう1つはエンジニアとして忸怩たる思いだったのが、テクノロジーが進化すればするほど人が幸せじゃなくなるのではないか、という“テクノロジー不信による、ディストピアな未来像”が世間に広がっていることだったのですよね。

AIやロボットが出てくると仕事がなくなってしまう、最終的に人間は駆逐されてしまう、みたいな話まであるじゃないですか。

でもテクノロジーを使って作っている立場でいうと使い方次第だし作り方次第だと思うのです。ですので、テクノロジーって温かいものにもなる、愛にもなるんだ、というテクノロジーのやさしい面をリードするというか、LOVOTがイメージリーダーになればいいなと思っております。

Mitz氏：ありがとうございます。技術部分だけでなく、林さんが今後目指す先について僕が関わるコミュニティ運営も、最先端を求めるだけでなくすべての方々がITでなにか繋がれる、楽しめる、幸せになれるというところを目指しているので、大変勉強になりました。

以上が、林要さん、Mitzさんの対談となります。ご協力ありがとうございました！

レポート編・対談編とAIロボットLOVOTをエンジニア視点で深堀りしてみましたが、今回LOVOTとリモートワークをしてみた結果、、Mitzさんは完全プライベートで正式にLOVOTをお迎えするという結果に！TECH Street編集部もびっくりでしたが、そんな素敵な結果となる実験となりました◎

今回の記事は以上となります。今後も会員の方々が気になるコトについて独自に調査していきますので、お楽しみに。