18赞

使用SAPI 5.3 Speech API进行声学训练

作者：女女的家_747 | 2023-09-02 18:14

如何解决《使用SAPI5.3SpeechAPI进行声学训练》经验，为你挑选了1个好方法。

在Vista上使用Microsoft的SAPI 5.3 Speech API,您如何以编程方式对RecoProfile进行声学模型培训？更具体地说,如果您有一个文本文件和一个用户说出该文本的音频文件,您将使用该文本和音频训练用户的个人资料进行什么样的SAPI调用？

更新:

关于这个问题的更多信息我还没有解决:你在"开头"调用ISpRecognizer2.SetTrainingState(TRUE,TRUE),在"结尾"调用ISpRecognizer2.SetTrainingState(FALSE,TRUE).但目前还不清楚这些行动何时必须相对于其他行动发生.

例如,您必须进行各种调用以设置语法,其中包含与您的音频匹配的文本,以及其他用于连接音频的调用,以及对各种对象的其他调用,以表示"您现在可以开始使用".但是什么是相互依赖性 - 在其他什么之前必须发生什么？如果您使用音频文件而不是系统麦克风进行输入,这是否会使相对时间变得不那么宽容,因为识别器不会继续坐在那里听,直到说话者正确？

1> Eric Brown..：

实施SAPI培训相对比较困难,文档并没有真正告诉您需要了解的内容.

ISpRecognizer2 :: SetTrainingState将识别器切换到训练模式或从训练模式中切换出来.

当你进入训练模式时,所有真正发生的事情是识别器为用户提供了更多关于识别的余地.因此,如果您正在尝试识别短语,则引擎对识别的严格程度会低得多.

在您离开训练模式之前,引擎并未真正进行任何调整,并且您已设置fAdaptFromTrainingData标志.

当引擎适应时,它扫描存储在配置文件数据下的训练音频.培训代码负责将新的音频文件放在引擎可以找到它以进行改编的地方.

这些文件也必须贴上标签,以便引擎知道所说的内容.

那你怎么做的？您需要使用三个鲜为人知的SAPI API.特别是,您需要使用ISpRecognizer :: GetObjectToken和 SpObjectToken :: GetStorageFileName来获取配置文件令牌以正确定位文件.

最后,您还需要使用ISpTranscript生成正确标记的音频文件.

要将它们放在一起,您需要执行以下操作(伪代码):

创建一个inproc识别器并绑定适当的音频输入.

确保您保留音频以供您识别; 你以后需要它.

创建包含要训练的文本的语法.

设置语法的状态以在识别发生时暂停识别器.(这也有助于从音频文件进行培训.)

识别时:

获取已识别的文本和保留的音频.

使用CoCreateInstance(CLSID_SpStream)创建流对象.

使用ISpRecognizer :: GetObjectToken和ISpObjectToken :: GetStorageFileName创建训练音频文件,并将其绑定到流(使用ISpStream :: BindToFile).

将保留的音频复制到流对象中.

QI是ISpTranscript接口的流对象,并使用ISpTranscript :: AppendTranscript将识别的文本添加到流中.

更新下一个话语的语法,恢复识别器,然后重复,直到您没有训练文本.

你在这里描述的是什么示例代码？

推荐阅读

程序员
Find()的Javascript代码优化

如何解决《Find()的Javascript代码优化》经验，为你挑选了0个好方法。 ... [详细]
程序员
矢量化代码时缓存未命中数增加

如何解决《矢量化代码时缓存未命中数增加》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在JavaFX的Textfield中添加提示文本

如何解决《如何在JavaFX的Textfield中添加提示文本》经验，为你挑选了1个好方法。 ... [详细]
程序员
哪个版本的Windows支持/需要哪些CPU多媒体扩展？

如何解决《哪个版本的Windows支持/需要哪些CPU多媒体扩展？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java:如何调用主类中的方法,该方法在另一个扩展抽象类的类中

如何解决《Java:如何调用主类中的方法,该方法在另一个扩展抽象类的类中》经验，为你挑选了1个好方法。 ... [详细]
程序员
大纲文字Android Studio

如何解决《大纲文字AndroidStudio》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用数组作为索引增加numpy数组元素

如何解决《使用数组作为索引增加numpy数组元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
线程安全事件 - 这是一种"干净"的方式吗？

如何解决《线程安全事件-这是一种"干净"的方式吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
DDD-使用Doctrine 2的有界上下文之间的关联映射

如何解决《DDD-使用Doctrine2的有界上下文之间的关联映射》经验，为你挑选了1个好方法。 ... [详细]
程序员
FirefoxDriver始终在"firstrun"页面上启动,打破所有测试脚本

如何解决《FirefoxDriver始终在"firstrun"页面上启动,打破所有测试脚本》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Spark DataFrames查询JSON数据列？

如何解决《如何使用SparkDataFrames查询JSON数据列？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在断开事件中重新连接套接字

如何解决《在断开事件中重新连接套接字》经验，为你挑选了1个好方法。 ... [详细]
程序员
更新Liferay用户锁定

如何解决《更新Liferay用户锁定》经验，为你挑选了1个好方法。 ... [详细]
程序员
Linux内核 - "放置"inode是什么意思？

如何解决《Linux内核-"放置"inode是什么意思？》经验，为你挑选了1个好方法。 ... [详细]
程序员
尝试从命令行获取星号*作为main的输入

如何解决《尝试从命令行获取星号*作为main的输入》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在Swift中调用AWS Lambda函数

如何解决《如何在Swift中调用AWSLambda函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Visual Studio Code中调试从Grunt运行的Jasmine测试？

如何解决《如何在VisualStudioCode中调试从Grunt运行的Jasmine测试？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Symfony 3,DI - 为参数添加服务

如何解决《Symfony3,DI-为参数添加服务》经验，为你挑选了1个好方法。 ... [详细]
程序员
将所有模型添加到管理站点django 1.9

如何解决《将所有模型添加到管理站点django1.9》经验，为你挑选了1个好方法。 ... [详细]
程序员
用于ServerBootstrap的AbstractBootstrap#handler与ServerBootstrap#childHandler？

如何解决《用于ServerBootstrap的AbstractBootstrap#handler与ServerBootstrap#childHandler？》经验，为你挑选了1个好方法。 ... [详细]

女女的家_747

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章