我现在正在寻找Java Text to Speech(TTS)框架.在我的调查过程中,我发现JSAPI实现页面上列出了几个与JSAPI1.0(部分)兼容的框架,以及一对看起来不符合JSAPI规范的Java TTS框架(Mary,Say-It-Now) .我还注意到目前JSAPI没有参考实现.
我为FreeTTS做的简短测试(在JSAPI impls页面中列出的第一个)表明它远远没有阅读简单明了的单词(例如:ABC,黑板).其他测试目前正在进行中.
这就是问题(实际上是6):
您使用了哪些基于Java的TTS框架?
根据您的意见,哪些能够读取最大的wordbase?
他们的语音质量怎么样?
他们的表现怎么样?
现场有哪些带有Java绑定的非Java框架?
你会推荐哪一个?
提前感谢您的意见和建议.
我实际上和FreeTTS一样好运
谷歌翻译有一个秘密tts api:https://translate.google.com/translate_tts ? ie = ut-8 & tl = en & q =你好20世界
我之前使用过玛丽,我对声音的质量印象非常深刻.不幸的是,我没有使用任何其他的.
实际上,没有一个很大的选择:
节日,最古老的.用C++编写但绑定到Java.
eSpeak,快速而简单,由谷歌翻译使用
mbrola
纯Java:
FreeTTS,代码从Festival移植,然后是开源的,开发停止了.
MaryTTS - 更强大,看起来生产就绪.
还有其他专有程序,如:
阿卡贝拉
Nuance Vocalizer
如果您的软件仅限Windows,则可以使用Microsoft Speech API.
我使用了AT&T Natural Voices,提供JSAPI和MS SAPI钩子.它提供优质的声音,良好的"通用"语音字典,多种语音控制和多种语言.它有点贵,但效果很好.
我用它来向移动传感器应用中的驱动程序读取重要的传感器遥测.我们没有关于语音质量的抱怨.通过科学术语,它具有大约75%的开箱即用精度,而对于正常的对话,它具有更高的(可能是90%以上).我们通过使用标记来获得高达99%以上的准确度(大多数错误都是用不同的音素组合的科学术语).
这对处理器来说有点困难(我们在Pentium-III等效机器上运行,它推动了50%-75%的峰值CPU).这使用具有Java接口的本机语音引擎(Windows,Linux和Mac兼容).
有各种各样的声音和语言......