所属
東京大学大学院大学院情報理工学研究科

職名
助教

キーワード
音声合成 音声パラメータ ランダム発生

助成期間
平成29年4月─平成32年3月

研究室ホームページ
2016年3月

奈良先端科学技術大学院大学 情報科学研究科 博士後期課程修了


2014年2月

カーネギーメロン大学 Language Technologies Institute客員研究員


同 年 4月

日本学術振興会(JSPS)特別研究員(DC2)


2016年4月

奈良先端科学技術大学院大学 情報科学研究科 非常勤講師


同 年 4月

東京大学大学院 大学院情報理工学系研究科 特任助教


2018年5月

東京大学大学院 大学院情報理工学系研究科 助教



もし機械が自分の声で話してくれるようになったら

私は学生時代、英語を話すことが苦手で、よく自動翻訳サービスを使用していました。当時から、Google翻訳の音声読み上げサービスは存在しました。しかし、機械音声では、人間が日常的に行う言外の意味、話者の心情まで伝えることができません。人間の会話音声には、語気が荒ければ怒っている、楽しそうに話せば機嫌がよいなど、別の種の情報が多く含まれているのです。

そこで「もし機械が、もともとプリセットされている単調な音声ではなく、感情まで伝わるような話し方をしてくれたら」と思いました。この技術が実現すれば、たとえ自分が英語を話せなくても、高度な異文化コミュニケーションが可能になります。このようにコンピューターが話す声の質を上げる研究を「音声合成」といいます。

プリセットの音源ではなく、使用者の音声で発話できる機械を作ろうとしたのが、研究者になるきっかけプリセットの音源ではなく、使用者の音声で発話できる機械を作ろうとしたのが、研究者になるきっかけ

相反する音声合成技術と音声認証技術

音声の研究は、これまで「コンピューター音声を限りなく人間の声に近づける」と「機械の認証で音声を判定する」の、どちらか片方のテーマに特化したものしかありませんでした。

機械の認証というのは、なりすまし防止のために、機械に登録された個人の音声と入力された音声を比較し、本物かどうか判定することをいいます。
これら二つの技術は、相反するものです。「コンピューター音声を限りなく人間の声に近づける」音声合成技術は、機械による人間の声へのなりすましを助長する危険性を孕むものの、自然な声を合成して人間のコミュニケーションを拡張してくれます。一方で「機械の認証で音声を判定する」認証技術は、音声合成の応用発展の障壁となるものの、生体認証として有効な手段のひとつです。

これまで、音声合成技術と認証技術を別々に扱っていたため、これらの技術の高度化には限界があったのです。

数ある言語のなかでも、日本語は他の言語と異なるイントネーションを持つ数ある言語のなかでも、日本語は他の言語と異なるイントネーションを持つ