助成研究者情報（猿渡洋先生2）｜セコム科学技術振興財団

音源分離を、災害現場でどのように役立てるのですか。

災害時の救助において、音データは極めて有用です。

地震によって倒壊した建物の中に、人が埋もれてしまったとしましょう。身動きがとれない状況下で、被災者が救助隊に対して自身の存在をアピールする手段は「大声を出して助けを求めること」以外にありません。人の生存係数は７２時間以内と言われています。助けを求める声を迅速に拾うことができれば、それだけ助かる確率は上がります。

しかし、音は「混ざり合う」性質を持っています。災害が発生した現場には、大勢の救助隊が作業をする音や、ヘリコプターの爆音、車が出入りする音など、さまざまな種類の騒音が満ちているため、被災者の声がかき消されてしまいます。

そこで、音源分離の出番となるわけですね。

通常行われている音源分離では、マイクを所定の位置に等間隔で設置し、かつ分離する音源も一定のものでなければなりません。位置の特定ができない複数のマイクが取得した音のデータを取り扱う信号処理体系が、未だ確立されていないためです。

しかし災害現場では、マイクを所定の位置に正確に設置することは難しく、収集できる音データも刻一刻と変化します。何の加工もせず、災害現場の音を拾ってきても、役に立てようがないのです。さらに、危険な災害地域であれば、近づくことすら困難です。

これを解決するためには、不特定の超多数・多次元音波動センサ情報を取り扱うことができる数理的パラダイムシフトと、それに貢献する基礎理論が必要です。そこで私たちは、広範囲に配置した位置不定の多数マイクロフォンを用いて、周囲の音環境をセンシングし、微小な音声や発話、環境音を高精度に検出・認識できるシステムの開発に着手しました。災害時に上空から多数のマイクをばらまき、音データを収集し、私の提唱する音源分離法を行えば、助けを求める被災者の声だけを明瞭にして抽出することができます。

ばらまきマイクによる災害救援補助

通常は実行できないことが、なぜ先生の研究では可能になるのでしょうか。

スパース信号表現を使うからです。スパース信号表現とは機械学習などに用いられることが多い概念で、多次元のデータから有用な情報を効率的に取り出すことができます。本研究では、スパース信号表現の一種である「独立成分分析（independent component analysis: ICA）」「独立ベクトル分析（independent vector analysis: IVA）」「非負値行列因子分解（nonnegative matrix factorization: NMF）」の数理について研究し、音源分離への応用を図っています。

災害現場で不特定多数のマイクを使用する場合、人の声を拾うことができるマイクは全体のごく一部に限られているため、少ない情報から全体像を的確に表すスパース信号表現は、本研究との相性が良好なのです。

使用しているアルゴリズムは９０年代後半から提唱されていましたが、私は２００８年にスパース信号表現を用いたマイクの製品化に成功しました。このマイクは警察から製作を依頼され、納品したものです。当時は、何に使ったのか明かしてもらえませんでしたが、おそらく第３４回主要国首脳会議（通称、洞爺湖サミット）の要人警護に使用されたのではないかと思います。