北陸先端科学技術大学院大学 情報科学研究科 教授 赤木正人先生インタビュー「災害時に必要な情報を音声により確実に伝える」インテリジェント避難誘導音声呈示システムの研究開発(第1回)


普段何気なく聞いている車中アナウンスのなかに、科学的な裏付けがあり、新しい知見を得ることができることに驚きました。音の世界は、奥が深いですね。もう一つのパラ言語情報とは何でしょうか。

 たとえば、キャッチボールをしているとき、あなたがボールを投げた瞬間、相手がよそ見をしていたとします。このままでは、相手にボールが直撃してしまう、そんなときあなたはどうしますか。

「しゃがんで!」と大きく、かつ語気を強めて、相手に危機が迫っていることを伝えます。

「しゃがんで」が言語情報で、「大きく強い語気」が付加されたパラ言語情報です。ヒトは、緊急性を要する発話においてその発話内容(言語情報)を補助するように、発話に緩急・強弱などの言語情報を補助する情報(パラ言語情報)を巧みに付加し、聴取者に対して注意喚起を行うことができます。

つまり、災害時に事前に録音されたものを流すと、そこにはパラ言語情報が付加されていないため、伝わりにくいということなのですね。

 はい。パラ言語情報を付加するには、生身の人間が現地の雰囲気を感じ取りライブで行うことが一番よいのですが、大地震などいつ起こるかわからない事態に対して、アナウンサーを常に待機させておくというのは、コストの問題などを考えると現実的ではありません。

また、アナウンサーが、避難誘導を終えるまで災害現場近くに留まるのは危険ですね。

 そうですね。現状の避難誘導では、録音音声・合成音声が使用されていますが、これらの固定されたアナウンス音声では、刻々と変化する災害現場の音環境において常に聞き取りやすい音声を呈示することはできません。
 そこで私達の研究グループでは、音声了解度向上のために、災害現場における雑音や残響の状況に即してアナウンス音声の適応的変形を行い、より安全に避難誘導が行える「インテリジェント避難誘導音声呈示システム」の提案・構築をすすめているわけです。

この分野の先行研究や類似研究と、赤木先生のご研究とは、具体的にどこが違うのでしょうか。

 これまでの研究では、特定の場所だけに有効な方法でした。つまり、事前に専門家がスピーカーの配置など細部にわたって実験し、準備しておかなければ、実際の災害時に役に立つ可能性が低かったということです。さらに、実際に測定した音声を「評価する基準」がよくありませんでした。

類似研究では、評価する基準がよくなかったとのことですが、先生の研究では、何を基準として用いられているのですか。

 音声了解度については、現場の音環境と音声そのものが持つ了解度に影響する特徴、両方を考慮した新しい基準を考えています。
 現場の音環境の基準としては、従来から使われているSTI値を導出するための特徴を用いています。STIとは、音声伝達指標(Speech Transmission Index)の略であり、IECという国際電気標準会議(International Electrotechnical Commission)にて厳しい基準が定められています。
 これに加えて、音声そのものが持つ了解度に影響する特徴として、音声の変調スペクトルを用いています。