有人知道已经托管的任何好的服务器端语音识别引擎吗?即我希望能够调用一个简单的Web API发布一些声音数据并获取文本.不必是免费的 - 但希望可以免费试用.
有几种IVR服务作为完整的应用程序托管整个VOIP会话(电话呼叫),而不是提供单个服务交易"àlacarte".如果您要使您的程序看起来像VOIP呼叫,您可以使用其中一些服务完成它.
Voxeo发布了一份免费(和低成本)IVR托管服务提供商列表,旨在帮助开发人员有限使用.毫不奇怪,所有都需要注册.
VoiceGenie开发者研讨会(吸收到Genesys)
Loquendo C @fé 状态未知
Nuance的咖啡厅(Bevocal)现在 Nuance的按需
梅花语音托管现在 Plum DEV
VOICE社区的VOICE Testcenter
另一种可能性是直接向Vlingo,Twilio或Tropo询问,因为他们可能会向您推销您所需的产品.
AT&T宣布推出Speech API.您发送音频 - 它返回XML或JSON数据格式的文本.另见开发者网站.
另一种可能性是来自Nuance 的Dragon Mobile SDK,它针对寻求API的个人开发者,使消费者应用程序具有语音和/或文本到语音功能.
似乎有几个新的供应商提供准确你在找什么:在文本进行语音样本.可编程网络上列出了以下内容:
iSpeech
SpeechAPI
OneTok
AISpeech API
NexiWave
另请注意,Loquendo现在是Nuance的一部分.
AT&T的Speech API有一些有针对性的SDK(Android,iOS,PhoneGap,Titanium,Windows) - 其中一些是托管的GitHub
.Unity 3D演示甚至还有源代码.
OneTok已将其产品重新配置为SDKiOS
和Android
.
显然,Voice Genie产品已被Genesys彻底消化,因此可以找到它的一点痕迹.鉴于Genesys对大型企业的定位,很难知道他们是否有任何小批量或商品.
Plumvoice似乎扩大了他们的产品.
和之前的许多人一样,Vlingo现在是Nuance的一部分.
(我试图在原始答案中更新任何损坏的链接.)
让这个答案保持最新是一个Sisyphean任务.
Voxeo的免费(和低成本)IVR托管服务提供商的名单现在重新发布到AT&T Speech API,在完全公开的情况下,我现在已经在其中进行了实质性的参与,因此,取消了我提供链接到几乎任何东西而没有受到质疑的资格我的信誉.
也就是说,演讲/ NLP市场中有很多玩家.尽职尽责.
所以现在谷歌完全打乱了苹果推车.