当前位置:  开发笔记 > 编程语言 > 正文

服务器端语音识别

如何解决《服务器端语音识别》经验,为你挑选了1个好方法。

有人知道已经托管的任何好的服务器端语音识别引擎吗?即我希望能够调用一个简单的Web API发布一些声音数据并获取文本.不必是免费的 - 但希望可以免费试用.



1> David J. Lis..:

有几种IVR服务作为完整的应用程序托管整个VOIP会话(电话呼叫),而不是提供单个服务交易"àlacarte".如果您要使您的程序看起来像VOIP呼叫,您可以使用其中一些服务完成它.

Voxeo发布了一份免费(和低成本)IVR托管服务提供商列表,旨在帮助开发人员有限使用.毫不奇怪,所有都需要注册.

VoiceGenie开发者研讨会(吸收到Genesys)

Loquendo C @fé 状态未知

Nuance的咖啡厅(Bevocal)现在 Nuance的按需

梅花语音托管现在 Plum DEV

VOICE社区的VOICE Testcenter

另一种可能性是直接向Vlingo,Twilio或Tropo询问,因为他们可能会向您推销您所需的产品.

更新:2012年7月25日

AT&T宣布推出Speech API.您发送音频 - 它返回XML或JSON数据格式的文本.另见开发者网站.

更新:2012年8月27日

另一种可能性是来自Nuance 的Dragon Mobile SDK,它针对寻求API的个人开发者,使消费者应用程序具有语音和/或文本到语音功能.

更新:2012年9月21日

似乎有几个新的供应商提供准确你在找什么:在文本进行语音样本.可编程网络上列出了以下内容:

iSpeech

SpeechAPI

OneTok

AISpeech API

NexiWave

另请注意,Loquendo现在是Nuance的一部分.

更新:2013年6月27日

AT&T的Speech API有一些有针对性的SDK(Android,iOS,PhoneGap,Titanium,W​​indows) - 其中一些是托管的GitHub.Unity 3D演示甚至还有源代码.

更新:2014年1月23日

OneTok已将其产品重新配置为SDKiOSAndroid.

显然,Voice Genie产品已被Genesys彻底消化,因此可以找到它的一点痕迹.鉴于Genesys对大型企业的定位,很难知道他们是否有任何小批量或商品.

Plumvoice似乎扩大了他们的产品.

和之前的许多人一样,Vlingo现在是Nuance的一部分.

(我试图在原始答案中更新任何损坏的链接.)

更新:2015年10月31日

让这个答案保持最新是一个Sisyphean任务.

Voxeo的免费(和低成本)IVR托管服务提供商的名单现在重新发布到AT&T Speech API,在完全公开的情况下,我现在已经在其中进行了实质性的参与,因此,取消了我提供链接到几乎任何东西而没有受到质疑的资格我的信誉.

也就是说,演讲/ NLP市场中有很多玩家.尽职尽责.

更新:2016年4月8日

所以现在谷歌完全打乱了苹果推车.


感谢您保持最新!
推荐阅读
爱唱歌的郭少文_
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有