4赞

Google语音识别API:每个字的时间戳？

作者：周扒pi | 2023-09-11 10:04

如何解决《Google语音识别API:每个字的时间戳？》经验，为你挑选了2个好方法。

可以使用Google的语音识别API通过执行请求来获取音频文件(WAV,MP3等)的转录 http://www.google.com/speech-api/v2/recognize?...

示例:我在WAV文件中说过" 一二三五 ".谷歌API给了我这个:

{
  u'alternative':
  [
    {u'transcript': u'12345'},
    {u'transcript': u'1 2 3 4 5'},
    {u'transcript': u'one two three four five'}
  ],
  u'final': True
}

问题:是否可以获得每个单词的时间(以秒为单位)？

用我的例子:

['one', 0.23, 0.80], ['two', 1.03, 1.45], ['three', 1.79, 2.35], etc.

即,
在时间00:00:00.23和00:00:00.80之间已经说过"一个"字样,在时间00:00:01.03和00:00:01.45(以秒为单位)之间说出了"两个"字样.

PS:寻找支持除英语之外的其他语言的API,尤其是法语.

1> deweydb..：

我相信另一个答案现在已经过时了.现在可以使用Google Cloud Search API:https: //cloud.google.com/speech/docs/async-time-offsets

2> Nikolay Shmy..：

谷歌API无法实现.

如果需要单词时间戳,可以使用其他API,例如:

CMUSphinx - 免费的离线语音识别API

SpeechMatics SaaS语音识别API

来自IBM的语音识别API

我们尝试使用IBM BlueMix Speech API来实现此目的,并发现其准确性非常糟糕.甚至像"勺子"这样简单明确的孤立词语也会以"月亮","房间","厄运","绽放","谁"的形式回归.这是在我预先指定了具有低接受概率的关键字设置为("勺子")之后.正如OP所提到的,IBM确实提供了每个单词的开始和停止时间(Google显然没有),但是准确性太低而无法使用.

推荐阅读

程序员
将10的幂写为紧凑的常数

如何解决《将10的幂写为紧凑的常数》经验，为你挑选了1个好方法。 ... [详细]
程序员
ToolBarAndroid无法在ReactNative中渲染

如何解决《ToolBarAndroid无法在ReactNative中渲染》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何取消AsyncTaskLoader工作？

如何解决《如何取消AsyncTaskLoader工作？》经验，为你挑选了0个好方法。 ... [详细]
程序员
R -apply-将许多列从数字转换为因子

如何解决《R-apply-将许多列从数字转换为因子》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有可能在Haskell中筑巢？

如何解决《是否有可能在Haskell中筑巢？》经验，为你挑选了4个好方法。 ... [详细]
程序员
将<IMG>转换为base64 Javascript

如何解决《将<IMG>转换为base64Javascript》经验，为你挑选了0个好方法。 ... [详细]
程序员
Windows PATH中的某些字符串导致错误

如何解决《WindowsPATH中的某些字符串导致错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
具有Webview UI的Java桌面应用

如何解决《具有WebviewUI的Java桌面应用》经验，为你挑选了0个好方法。 ... [详细]
程序员
在光标位置放大NSScrollView

如何解决《在光标位置放大NSScrollView》经验，为你挑选了0个好方法。 ... [详细]
程序员
在angular2中,如何在为@Input发送的对象上更改属性的onChanges

如何解决《在angular2中,如何在为@Input发送的对象上更改属性的onChanges》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Crypto Node.js获取错误"数据对于密钥大小而言太大"

如何解决《使用CryptoNode.js获取错误"数据对于密钥大小而言太大"》经验，为你挑选了1个好方法。 ... [详细]
程序员
AzureWebJobsDashboard配置错误

如何解决《AzureWebJobsDashboard配置错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Rails中使用Postgres UUID时,在Join记录上创建,保存,更新和销毁

如何解决《在Rails中使用PostgresUUID时,在Join记录上创建,保存,更新和销毁》经验，为你挑选了1个好方法。 ... [详细]
程序员
用于计算百分位数的条件数组

如何解决《用于计算百分位数的条件数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
我可以使用R data.table连接功能来选择行并执行某些操作吗？

如何解决《我可以使用Rdata.table连接功能来选择行并执行某些操作吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
这个简单的C++程序使用<locale>是否正确？

如何解决《这个简单的C++程序使用<locale>是否正确？》经验，为你挑选了1个好方法。 ... [详细]
程序员
从两个8位整数计算16位整数值？

如何解决《从两个8位整数计算16位整数值？》经验，为你挑选了2个好方法。 ... [详细]
程序员
更改Bluemix帐户默认区域？

如何解决《更改Bluemix帐户默认区域？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java我不明白为什么在更改switch语句的顺序时会得到不同的输出

如何解决《Java我不明白为什么在更改switch语句的顺序时会得到不同的输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
神秘的ESLint解析错误

如何解决《神秘的ESLint解析错误》经验，为你挑选了2个好方法。 ... [详细]

周扒pi

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章