「音声合成」の版間の差分
(新しいページ: '当Wikiで扱う音声合成は主にTTS(Text To Speech)エンジンです。<br> 音声合成機能をAsteriskと併用/統合することで次のようなことが出来ま...') |
(→Cepstral) |
||
(2人の利用者による、間の4版が非表示) | |||
5行目: | 5行目: | ||
*IVRメニューを吹き込みなしで構築できる | *IVRメニューを吹き込みなしで構築できる | ||
:通常、IVRのメニューは音声の吹き込み/調整が必要ですが音声合成を使うことで、テキスト記述するだけでメニューが構築できるため維持/管理が簡単かつ安価に行えます。 | :通常、IVRのメニューは音声の吹き込み/調整が必要ですが音声合成を使うことで、テキスト記述するだけでメニューが構築できるため維持/管理が簡単かつ安価に行えます。 | ||
− | *[音声認識]機能との併用 | + | *[[音声認識]]機能との併用 |
− | :[音声認識]機能と併用することにより、ダイヤル操作などを伴わないインタラクティブなシステムを構築することができます。 | + | :[[音声認識]]機能と併用することにより、ダイヤル操作などを伴わないインタラクティブなシステムを構築することができます。 |
==Festival== | ==Festival== | ||
Festival(英語)は以前からAsteriskに統合されているTTSのひとつです。対象言語は英語です。<br> | Festival(英語)は以前からAsteriskに統合されているTTSのひとつです。対象言語は英語です。<br> | ||
Festivalそのものは別途入手/インストールする必要がありますが、アプリケーション・インタフェースはAsteriskに統合されています。 | Festivalそのものは別途入手/インストールする必要がありますが、アプリケーション・インタフェースはAsteriskに統合されています。 | ||
− | ==AquesTalk== | + | ==[[AquesTalk]]== |
− | [AquesTalk](日本語)はAquest社による軽量の日本語TTSです。オープンソースではありませんが、ライブラリが非常にコンパクトで使いやすくなっています。いかに人の声に似せるかを目的としてはおらず、機械音声でありながら『聞き取りやすい』ことを目的とした合成音声です。<br> | + | [[AquesTalk]](日本語)はAquest社による軽量の日本語TTSです。オープンソースではありませんが、ライブラリが非常にコンパクトで使いやすくなっています。いかに人の声に似せるかを目的としてはおらず、機械音声でありながら『聞き取りやすい』ことを目的とした合成音声です。<br> |
− | VoIP-Info. | + | VoIP-Info.jpではこのAquesTalkをAsteriskに統合するマクロを提供しており、日本国内における独自プロジェクトのひとつとして進めています。<br> |
− | 詳しくは [AquesTalk] のページを参照してください。<br> | + | 詳しくは [[AquesTalk]] のページを参照してください。<br> |
+ | ==Cepstral== | ||
+ | Cepstral(英語)もAsteriskに簡単に追加することができるTTSのひとつです。<br> | ||
+ | バイナリ提供のapp_cepstralをインストールすることで、かなり簡単にTTSを実現することが可能です。<br> | ||
+ | 対応言語は英語、フランス語、ドイツ語、イタリア語。(US English, French Canadian and Americas' Spanish, UK English, German, and Italian)<br> | ||
+ | Voice of AsteriskのAllisonさんの音声もあり。 | ||
+ | http://www.cepstral.com/ | ||
+ | ==Google Cloud Platform(GCP)== | ||
+ | Google CloudでもTTSが提供されています。<br> | ||
+ | https://cloud.google.com/text-to-speech?hl=ja<br> | ||
+ | Asterisk 18以降用に提供している日本語音声はGCP TTSで生成しています。<br> | ||
+ | https://github.com/takao-t/asterisk-sound-ja |
2024年8月14日 (水) 10:33時点における最新版
当Wikiで扱う音声合成は主にTTS(Text To Speech)エンジンです。
音声合成機能をAsteriskと併用/統合することで次のようなことが出来ます。
- 外部から取り込んだテキストを読み上げる
- 例えばWebコンテンツや電子メールなどを電話で『聞く』ことができます。
- IVRメニューを吹き込みなしで構築できる
- 通常、IVRのメニューは音声の吹き込み/調整が必要ですが音声合成を使うことで、テキスト記述するだけでメニューが構築できるため維持/管理が簡単かつ安価に行えます。
- 音声認識機能との併用
- 音声認識機能と併用することにより、ダイヤル操作などを伴わないインタラクティブなシステムを構築することができます。
Festival
Festival(英語)は以前からAsteriskに統合されているTTSのひとつです。対象言語は英語です。
Festivalそのものは別途入手/インストールする必要がありますが、アプリケーション・インタフェースはAsteriskに統合されています。
AquesTalk
AquesTalk(日本語)はAquest社による軽量の日本語TTSです。オープンソースではありませんが、ライブラリが非常にコンパクトで使いやすくなっています。いかに人の声に似せるかを目的としてはおらず、機械音声でありながら『聞き取りやすい』ことを目的とした合成音声です。
VoIP-Info.jpではこのAquesTalkをAsteriskに統合するマクロを提供しており、日本国内における独自プロジェクトのひとつとして進めています。
詳しくは AquesTalk のページを参照してください。
Cepstral
Cepstral(英語)もAsteriskに簡単に追加することができるTTSのひとつです。
バイナリ提供のapp_cepstralをインストールすることで、かなり簡単にTTSを実現することが可能です。
対応言語は英語、フランス語、ドイツ語、イタリア語。(US English, French Canadian and Americas' Spanish, UK English, German, and Italian)
Voice of AsteriskのAllisonさんの音声もあり。
http://www.cepstral.com/
Google Cloud Platform(GCP)
Google CloudでもTTSが提供されています。
https://cloud.google.com/text-to-speech?hl=ja
Asterisk 18以降用に提供している日本語音声はGCP TTSで生成しています。
https://github.com/takao-t/asterisk-sound-ja