世界中の研究者が、さまざまな方法を模索してきましたが、実用化には至っていません。その中で私は、スパース信号表現に着目しました。現象が疎に出現することを「スパース性」といい、多次元のデータから有用な情報を効率的に取り出すことを目的とする手法です。
実は、過決定条件(音源数≦観測チャネル数)のBSSにおいては、ICA(独立成分分析)やIVA(独立ベクトル分析)に基づく手法が主流であり、盛んに研究されてきました。モノラル信号等を対象とした劣条件設定(音源数>観測チャネル数)下では、非負値行列因子分解(Non-negative Matrix. Factorization:NMF)を応用した手法が注目を集め、このNMFは2011年に多チャンネルNMF(Multichannel NMF)へと進化しました。
私が昨年度の研究に導入した独立低ランク行列分析(Independent low-rank matrix analysis:ILRMA)は、このICA・IVAの流れと、NMFの流れを統合した音源分離理論です。NMFが持つ柔軟な音源モデリング能力と補助関数法(収束を保証した新しい最適化アルゴリズム)に基づく高速の分離行列計算を併せ持っています。
ILRMAは、ICA・IVA・NMFを統合した、新しい形の人工知能であると語る猿渡先生




