音声合成

2018年5月10日 (木) 14:35時点におけるTakahashi (トーク | 投稿記録)による版

当Wikiで扱う音声合成は主にTTS(Text To Speech)エンジンです。
音声合成機能をAsteriskと併用/統合することで次のようなことが出来ます。

  • 外部から取り込んだテキストを読み上げる
例えばWebコンテンツや電子メールなどを電話で『聞く』ことができます。
  • IVRメニューを吹き込みなしで構築できる
通常、IVRのメニューは音声の吹き込み/調整が必要ですが音声合成を使うことで、テキスト記述するだけでメニューが構築できるため維持/管理が簡単かつ安価に行えます。
音声認識機能と併用することにより、ダイヤル操作などを伴わないインタラクティブなシステムを構築することができます。

Festival

Festival(英語)は以前からAsteriskに統合されているTTSのひとつです。対象言語は英語です。
Festivalそのものは別途入手/インストールする必要がありますが、アプリケーション・インタフェースはAsteriskに統合されています。

AquesTalk

AquesTalk(日本語)はAquest社による軽量の日本語TTSです。オープンソースではありませんが、ライブラリが非常にコンパクトで使いやすくなっています。いかに人の声に似せるかを目的としてはおらず、機械音声でありながら『聞き取りやすい』ことを目的とした合成音声です。
VoIP-Info.jpではこのAquesTalkをAsteriskに統合するマクロを提供しており、日本国内における独自プロジェクトのひとつとして進めています。
詳しくは AquesTalk のページを参照してください。

Cepstral

Cepstral(英語)もAsteriskに簡単に追加することができるTTSのひとつです。
バイナリ提供のapp_cepstralをインストールすることで、かなり簡単にTTSを実現することが可能です。
対応言語は英語、フランス語、ドイツ語、イタリア語。(US English, French Canadian and Americas' Spanish, UK English, German, and Italian)
Voice of AsteriskのAllisonさんの音声もあり。 http://www.cepstral.com/