スポーツ/ヘルスケア

「レザバーコンピューティング×ActSence」少量の画像データで精度の高い機械学習を実現

2020.09.16

コンピュータ処理能力向上とストレージ拡大によるビックデータを背景に、ロボティクス・自動運転分野などの自動化手法としてディープラーニングがベースになりつつあります。しかし、大量データが存在しないケースには対応できないという課題が。そこで今回イノラボでは、少量データかつ高速な計算によって特徴を抽出できるQuantum Core社のレザバーコンピューティングに着目しました。この技術と、イノラボが提供している画像解析によって特定の動作や姿勢を抽出する「ActSence」を掛け合わせ、少量のデータから人の行動推定ができるようになれば、「ActSence」の応用範囲の拡大が期待できると考えています。本プロジェクトについてプロジェクトマネージャーの藤木隆司が語ります。

 

fujiki

 
 
 
 

藤木隆司
Human & Information AIテクノロジスト

少量データかつリアルタイム学習ができるレザバーコンピューティング

大量の画像やテキスト、音声などのデータをあらかじめ学習させることで、自動的に特徴を抽出するディープラーニングの技術があり、ロボティクスや自動運転などの自動化の手法として、広く使われるようになりました。しかし、大量のデータがないと成立しないため、データが少ない領域には適用できないことが課題でした。

 

それに対応する技術として挙げられるのが、「少量データ」で「リアルタイム学習」ができる「レザバーコンピューティング」です。1990年頃から研究開発されていたものの、ディープラーニングに比べると圧倒的に精度が低いという致命的な課題があって、陽の目を浴びずにいました。

 

しかしQuantum Core社は研究開発を進め、独自の技術によって、レザバーコンピューティングの精度をディープラーニングと同等以上に高めることに成功。その話を聞いて、イノラボが提供している、動画を解析して人の動作や姿勢を抽出する「ActSence(アクトセンス)」とレザバーコンピューティングを掛け合わせれば、多種多様かつ少量データしか有さない領域にも応用範囲を拡大できるのではないかと考え、共同での実証実験に至りました。

 

Act Sence

 

レザバーコンピューティングのレザバーとは、“溜め池”を意味しています。実際の溜め池に石を投げると、石の重さや大きさ、形状、また投げ入れる順番などによって異なる波紋が生じますよね。

 

この仕組みを応用して、溜め池にいくつかの石(=教師データ)を連続して投げ込み、波紋のパターンを学習させておきます。そして、新たに投げ入れた石(入力)の波紋を見て、どの波紋のパターンに近いのかを判断することで、答えを導く(出力)のがレザバーコンピューティングの概念です。

 

一方で、ディープラーニングの場合は、教師データとして大きさや形状、材質の異なる石をあらかじめ大量に用意して、Aの石を投げ入れたら「Aの石である」と機械が間違いなく特徴を抽出して判断できる状態まで学習させる必要があります。

 

ディープラーニングの学習には膨大なデータ量をもとに特徴を抽出するため、その分計算に時間を要しますが、レザバーコンピューティングは少量のデータで特徴を抽出できるため、素早い計算が可能です。低コストで個別ニーズに応えられるのです。

 

レザバーコンピューティング概念図

 

今回協業したQuantum Core社のレザバーコンピューティングが画期的だったのは、少量データかつリアルタイム学習によって、精度の高い新たな価値を生み出せるようになったことです。

 

たとえば、5人の会議の議事録を自動的に作りたい場合、ディープラーニングなら5人の音声データをあらかじめ大量に用意して、個別の特徴を抽出できるまで何十時間も計算させる必要があります。でも、レザバーコンピューティングなら、会議の前に5人それぞれの音声を数秒ほど学習させるだけで話者が判別できるのです。

 

少量の教師データから、動画の人間の動作パターンを推論可能

今回の実証実験では、Quantum Core社のレザバーコンピューティングに、ISID が提供している「Act Sense(アクトセンス)」を組み合わせると、どのような成果を得られるかを検証しました。

 

Act Senseとは、画像から姿勢を検知する技術OpenPoseで取得した「人の姿勢情報」に、自社開発のアルゴリズムを組み合わせて、特定の動作や姿勢を検出するソリューションです。たとえば、工場で作業者の姿勢に無理がないか、正しい動作をしているかを、動画から骨格情報を取ることで可視化できます。

 

ただ、動作や姿勢を検出するためには、「腰の関節と首の関節が何度以上だと曲げすぎている」といったルールを手動で大量に用意する必要があります。それが手動のルールを作らずに、「走っている」「座っている」といった教師データから、「その人はどんな行動を取っているのか」を判断できるようになれば、Act Senseの応用範囲は確実に広がります。

 

実際の実験では、「手足をバタバタさせる」「回転する」「逆回転する」「ジャンプする」という行動が、少ない教師データからちゃんと判断できるかを検証しました。それに加えて、自動で学習するディープラーニングツールのAutoMLでも同じ実験を行ない、レザバーコンピューティングとディープラーニングの精度も比較しました。

 

実証実験風景
図:実証実験風景

 

その結果、少量の教師データでも、レザバーコンピューティングなら動画から得られる時系列の特徴を解析するのに有効であり、非常に高い精度で人間の動作パターンを推論できることが実証されました。ディープラーニングなら数千、数万のデータが必要なものでも、レザバーコンピューティングなら一桁や二桁の少ないデータ量で成果を出せたのです。

 

個別具体的なデータしかない領域にも活用可能に

今回の実証実験から、リアルタイムに学習できて、かつユーザーに使ってもらうのに大掛かりな仕組みを必要としないことがわかったため、あらかじめ大量の動作パターンを作成するのが難しい領域にも導入しやすくなり、今後の研究開発の可能性が広がりました。

 

たとえば多様な動作パターンが登場するヘルスケアの領域でも、その場で教師データを追加できるため、その時々でチェックしたい動作や姿勢を確認できるようになります。工場などでも作業工程が変わって「作業員が作業を間違えずにできているか」をチェックしたいときにも活用できるでしょう。

 

作業ごと・動作ごとに対応できるソリューションを作れるのはもちろんのこと、あらかじめ学習したパターン以外の動作は「異常行動」として検出可能なので、危険な現場などでの事故を未然に防ぐことにもつながると考えています。

 

ビジネスへの応用は検討段階に入ったばかりですが、研究開発を続けて、動作や姿勢に個別の柔軟性を要する領域に対して、Act Senseとレザバーコンピューティングを掛け合わせたソリューション開発を実現させたいと思っています。大量データがなくて、自動化できなかった領域の課題を解決できたら嬉しいです。

 

今回の実証実験のように、イノラボでは自分たちで最新技術を扱うだけでなく、スタートアップが開発した新しい技術の情報も常にキャッチアップして、いかに自分たちの技術と融合させていくかも重視しています。

 

今回はまさにお互いが持つ特異な技術を掛け合わせて、新しい価値を創出できた良い例です。今後も尖った技術を持つ企業と組んで、私たちのソリューションやアセットとつなぎ合わせながら、世の中を良くしていける新たな価値を創出し続けたいです。