年々、国内外の企業によるデジタルトランスフォーメーション(以下DX)の取り組みが増えています。DXというと多くの企業がテキストデータや購買データなどの構造化データを活用してデータドリブンなビジネスモデルを構築していますが、音声・画像・動画・時系列データなどの非構造化データはどのように活用されているのでしょうか。
今回は、構造化の難しい音声や画像、動画等の“非構造化データ”をテーマとした「DX時代に求められる非構造化データ(音声データ・時系列データ)の最新活用事例」というイベントに参加してきました。本イベントは、2020年1月22日(水)渋谷TECH PLAYにて開催され、クラウドエース株式会社、セコム株式会社、パーソルキャリア株式会社の3社による事例の紹介とともにパネルディスカッションが実施されました。
本記事では、飲んで、聞いて、交流して楽しめた約2時間半の様子をレポートしていきます!
イベントの様子
開場とともに続々と参加者が集まり、ほぼ満員の状態でスタート。
イベントのタイムスケジュールは以下の通りでした。
・19:30〜オープニング、そして乾杯
・19:40〜プレゼンテーション
『GCPではじめる非構造化データ分析』
クラウドエース株式会社 / 高野 遼氏
・20:00〜パネルトーク
『Cloud Speech APIを活用した対面音声(非構造化データ)のビジネス適用』
パーソルキャリア株式会社/橋本 久氏
『人の生活に関わる時系列データとの付き合い方 ~プライバシーへの配慮が生み出す良質なユーザー体験~』
セコム株式会社 / 松永 昌浩氏
パネルディスカッション、会場Q&A
・21:00〜懇親会
今回のイベントはカジュアルに行こうぜ、とのことでお酒を飲みながらの進行。堅苦しくなく、筆者的にはとても参加しやすい雰囲気でした!ここからは、プレゼンテーションとパネルトークをレポートしていきます。
『GCPではじめる非構造化データ分析』 / クラウドエース 高野 遼氏
クラウドエース株式会社取締役兼CTOの高野遼氏は、Google Cloud コンサルタント・Google 認定トレーナーとして活動中。猫好きだけど猫アレルギーという自己紹介に会場がくすりとさせられたところでプレゼン開始。
高野氏のプレゼンは、Googleの機械学習APIを使った非構造化データの分析方法をデモを使いながら紹介するというもので、こんなクイズからスタート。
これらに関連するのは「干支」で、この画像の中から今年の干支の画像を抽出するにはどうしたらいいか、という問題を投げかけられました。画像だけでなくテキストや音声などの「非構造化データ」は、そのままでは検索や集計がかなり難しいため、事前にこの画像がねずみである、この画像はねこである、等のラベル付けが必要とのこと。
GCP(Google Cloud Platform)には非構造化データのためのラベル付けを行う「ML APIs」があり実際のデモでは、Googleのホームページで公開されている「Vision API」「Speech API」「カスタムモデル」を実演。
「Vision API」は画像をドラッグアンドドロップするだけで画像の情報を取得できるというもの。今回は高野氏自身のプロフィール写真を使ったデモで、感情分析や、何が写っているかを分析。めがねをかけていることからObjectsに“めがね”と表示され会場からは笑いが起きる場面も。
続いて「Speech API」では実際の音声データを読み取り、音声のテキスト化を実演。最後はニッチなモデルでもAPIを作ることができる「カスタムモデル」で、簡単に非構造化データを構造化データにする方法を実演し、最後はクラウドエース社の詳細を紹介してプレゼン終了。
ここからはパーソルキャリア社の橋本久氏とセコム株式会社の松永昌浩氏によるパネルトーク。モデレーターにはパーソルキャリア社の斉藤氏が加わり、リアルタイムで参加者からの質問やコメントをプレゼンターに投げかけながら進行しました。
『Cloud Speech APIを活用した対面音声(非構造化データ)のビジネス適用』 / パーソルキャリア 橋本久氏
同社ではdodaを使った転職支援や転職希望者に対する対面カウンセリングを行っています。キャリアカウンセリングにおいて、キャリアアドバイザーから転職希望者へのカウンセリング内容に対するフィードバックが難しいという課題があり、カウンセリングの音声をスピーカーに集音。GoogleのSpeech APIを使ってテキスト化をすることで以下の効果を練らているとのこと。
①キャリアアドバイザーの育成
育成担当がこれまでの経験・勘でメンバーを育成していたことを、ハイパフォーマーの音声から良い点を見つけ出し、メンバー自身で自分がどううまく行かなかったのかコツを見つけ、内省できるようにする。
②カウンセリングの音声データを活用したマッチング精度向上
既存の基幹システムを使い会話の中のワードや文脈をとらえマッチング率が上がるか、トライアルを実施中。
本取り組みの中でクラウドを使うメリットについては書き起こしが必要ないこと、と橋本氏は語っていました。Cloud Speech APIは事前学習のAPIが用意されており、導入後のチューニングが必要なく、さらには音声認識率が初回でも70%以上と非常に高いとのことでした。
橋本氏によると、「個人がいかに転職活動をスムーズにおこなうために支援したい。そのためには近未来的には音声・テキスト・表情を機械やAIの仕組みを使ってヒトが介在しない世界を目指す。」という。
『人の生活に関わる時系列データとの付き合い方 ~プライバシーへの配慮が生み出す良質なユーザー体験~』 / セコム 松永 昌浩氏
本トークでは、「部屋の温度」「エアコンの稼働状況」など生活に関わるデータを利用してサービサーとユーザー間のコミュニケーションのあり方、良質なユーザー体験を生み出すための仕組みづくりが語られました。
同社では、2000年前後から画像を使って侵入者を検知する、位置情報データで車両を監視するなどのセキュリティサービスの実用化をしているそう。最近では、電力や音声などの生活に関わる時系列データ(=非構造化データ)を利用した見守りに取り組んでおり、2018年からはセンサー情報等IoTを活用した“ゆるやかな見守り”やコミュニケーションサービスの実証実験を開始しました。生活の見守りに関する取り組みの発端は、超高齢社会において高齢者の方の「住み慣れた自宅で暮らし続けたい」という想いに対して、同社がどういうサービスを提供していくべきかという問いであったとのこと。
実証実験では、電力センサーを使い家電の利用状況と高齢者の生活リズムの関連性を分析。例えば、猛暑日であるにもかかわらずエアコンを使用していないなどの生活リズムの変化をキャッチし、実際にスタッフが訪問して確認するというもの。しかし、この実証実験では2つの課題が見つかったそうです。一つ目は、データから変化をキャッチすることができるが「なぜ変化が起こったのか」がわかりづらく、構造化データにするための“正解ラベル”が貼りづらいこと。二つ目は、お客様によっては「提供した情報」と「提供したつもりの情報」にギャップが生まれてしまう場合もあり、不要な驚きを与えてしまう可能性があること。
これらの課題の解決につながるものが、音声(コミュニケーションロボット)を利用したもう一つの実証実験。同社のスタッフがロボットを通じて家族やケアマネ等の関係者に代わって声かけを行ったり、生活リズムに変化があった際にロボットを通じて「なぜ?」を質問したり、コミュニケーションをとるというもので、ロボットとお客様とで生活の場を共有していることで、情報の発信・入手がしやすい仕組みとなっているとのことです。今後、DX時代においては、お客様ごとに「提供したつもりの情報」と「提供していないつもりの情報」との感覚が異なるため、IoT機器で情報を収集していること、AI技術で情報が推論されうることを認識できる仕組みを構築し(今回の例のようにロボットを利用するなど)、不要な驚きを軽減させて良い驚きに変えることが重要、と語られました。コミュニケーションロボットについては、過去の履歴をもとにした会話ができるように今後も改良を進めていくとのこと。
パーソルキャリア社、セコム社の事例紹介が終わった後はモデレーターの斉藤氏が加わりパネルディスカッションのスタート。最終的に参加者のコメントやプレゼンターへの質問が約100件集まり実際に登壇者達に投げかけられました。今回は最後の質問のみ抜粋してご紹介。
斉藤氏:今後の非構造化データの活用の仕方・将来についての考えをお聞かせください
橋本氏:人が提供するサービスのプロセスを評価するために非構造化データとして現在は音声を使っているが、音声に限らず、画像・動画・センサーアドバイスを含めた活用を考えています。例えば、動画データを活用をして、音声のテキスト化だけでは分かりづらいイントネーション・抑揚・大小のボリューム・間をとることで個人の感情に訴える話し方の工夫をし、マッチングの精度を向上させる。そのために音声だけでなく、顔のセンサーを使用した研究や動画でのチャット形式のカウンセリングの検証を進めており、個人の音以外の動きをあわせてデータを活用していくことを考えています。
いかに心地よく我々のサービスを使ってもらえるか、いかにマッチングに満足してもらえるかに必要なデータとして考えています。
松永氏:セコムの場合は大きく二つの使い方があります。一つ目は、防犯目的でカメラを使い侵入者をとらえる等の「認識系の使い方」での発展、もう一つは「いつもと違う」を検知すること。人ごとに違う定常状態を把握することで今日は昨日と違う、という変化を検知するロジックに非構造化データを入れる使い方がある。セコムの警備員は異常を見つけるのではなく、普段ないものに対して“いつもと違う”を検知している、これと同じような概念でデータ活用を進めていきたいと考えています。
イベント終了後の懇親会では登壇者と参加者の交流だけでなく、参加者同士のコミュニケーションも垣間見え、盛況のうちに約2時間半のイベントは終了しました。
終わりに
今回のイベントでは、「非構造化データ」と聞いて難しいワードのようにも思えましたが、我々の身近にあるものであり、初心者でも簡単に分析できるものであるとわかりました。また、各社の事例においては顧客の行動だけでなく、行動の裏にはどういう意図があるのかまでを非構造化データを使って理解することで、より最適なUXを生み出す努力をしているように感じ、顧客と一緒にPoCを繰り返すことで企業とユーザー間の新しい関係値が生まれているとも感じました。