7赞

如何在音频文件/流中搜索内容？

作者：无名有名我无名_593 | 2023-09-06 10:24

如何解决《如何在音频文件/流中搜索内容？》经验，为你挑选了1个好方法。

我一直想知道有多少种不同的搜索技术,用于搜索文本,搜索图像甚至视频.

但是,我从未遇到过搜索音频文件内容的解决方案.

例如:假设我有大约200个播客以mp3,wav和ogg文件的形式下载到我的电脑上.它们都被命名为podcast1.mp3,podcast2.mp3等等.因此,如果没有实际听到内容,就无法知道内容是什么.让我们说,我有兴趣发现,播客谈论"游戏编程".我希望结果显示为:

Podcast1.mp3 - 时间索引(s)的3个结果 - 0:16:21,0:43:45,1:12:31

Podcast21.ogg - 在时间索引(0) - 0:12:01获得1个结果

所以我的问题:

怎么能解决这个问题呢？

是否有合适的算法开发来做这样的事情？

在我的脑海中出现的一个想法是,可以使用"语音到文本"软件来获取每个音频文件的时间索引的成绩单,然后解析成绩单以获得输出.

我认为这是我的业余爱好项目之一.谢谢!

1> Anders Sandv..：

如果要在音频流中搜索文本(即所说的内容),则必须使用某种语音识别算法对其进行处理,并将文本存储为与文件关联的元数据.对于视频,您还可以对视频内的文本进行文本识别.Evernote已针对图像文件中的文本执行此操作,但据我所知,它不支持音频.

使用音频搜索音频时可能会出现类似情况.我不知道这些算法的细节,但我猜它们涉及某种频率分析.Shazam正在使用这种技术来识别基于音频剪辑的歌曲.

以下是一些可能有用的维基百科文章:

语音识别

快速傅立叶变换

频率分析(频谱)

光学字符识别(OCR)

推荐阅读

程序员
如何在HTML中链接JavaScript程序并使其运行？

如何解决《如何在HTML中链接JavaScript程序并使其运行？》经验，为你挑选了1个好方法。 ... [详细]
程序员
AWS API-Gateway与SNS通信

如何解决《AWSAPI-Gateway与SNS通信》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Intellij IDEA,PhpStorm或WebStorm中导入设置

如何解决《在IntellijIDEA,PhpStorm或WebStorm中导入设置》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以通过datastax驱动程序向Cssandra集群提交CQL脚本？

如何解决《是否可以通过datastax驱动程序向Cssandra集群提交CQL脚本？》经验，为你挑选了0个好方法。 ... [详细]
程序员
控制器上的多个路由

如何解决《控制器上的多个路由》经验，为你挑选了1个好方法。 ... [详细]
程序员
ORA-01810:格式代码出现两次

如何解决《ORA-01810:格式代码出现两次》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用ID作为名称从json对象创建强类型c#对象

如何解决《使用ID作为名称从json对象创建强类型c#对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法识别的命令行选项"-std = c ++ 11"

如何解决《无法识别的命令行选项"-std=c++11"》经验，为你挑选了1个好方法。 ... [详细]
程序员
在iOS中的UITableViewCell中,setHighlighted和setSelected有什么区别？

如何解决《在iOS中的UITableViewCell中,setHighlighted和setSelected有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误：无法完成Gradle执行。原因：未知的命令行选项“ -X”

如何解决《错误：无法完成Gradle执行。原因：未知的命令行选项“-X”》经验，为你挑选了1个好方法。 ... [详细]
程序员
在data.table上使用geosphere distm函数来计算距离

如何解决《在data.table上使用geospheredistm函数来计算距离》经验，为你挑选了1个好方法。 ... [详细]
程序员
从Python NLTK调用斯坦福NER崩溃

如何解决《从PythonNLTK调用斯坦福NER崩溃》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使$ q等待多个异步任务？

如何解决《如何使$q等待多个异步任务？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Dockerfile:将RUN指令输出到变量中

如何解决《Dockerfile:将RUN指令输出到变量中》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用node.js child_process调用python脚本

如何解决《使用node.jschild_process调用python脚本》经验，为你挑选了1个好方法。 ... [详细]
程序员
Pyspark RDD首先收集163排

如何解决《PysparkRDD首先收集163排》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android蓝牙低功耗代码兼容API> = 21 AND API <21

如何解决《Android蓝牙低功耗代码兼容API>=21ANDAPI<21》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在python中获取SQL查询的表列名/标题

如何解决《如何在python中获取SQL查询的表列名/标题》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Python的scikit-learn中访问树深度？

如何解决《如何在Python的scikit-learn中访问树深度？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Linq反向字符串c#

如何解决《Linq反向字符串c#》经验，为你挑选了1个好方法。 ... [详细]

无名有名我无名_593

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章