当前位置:  开发笔记 > 人工智能 > 正文

如何从音频文件(c ++或java)中分割男声和女声

如何解决《如何从音频文件(c++或java)中分割男声和女声》经验,为你挑选了1个好方法。

我想区分一个音频文件中的男性和女性声音,然后将它们分开.作为输出,我希望将两个声音分开.你能帮我解决n编码可以用java或c ++完成



1> thomasrutter..:

这可能是一个非常复杂的问题,它类似于编写自己的语音识别(或识别)算法.

您可以首先将音频转换为频域,这是使用快速傅立叶变换完成的.

对于您采用FFT的每个切片时间,这将为您提供频率列表及其幅度.你会以某种方式通过分析谐波来检测基音.二次和三次谐波最清晰.很难弄清楚它们是哪种谐波,尤其是背景噪声以及人们声音中谐波最大的自然差异.然后,您可以尝试通过您猜测的基本音调来确定说话者是男性还是女性.

请记住,在许多词性中,如s s('s','t'等),没有语气,只有噪音.它需要非常聪明.

希望能为您提供正确的总体方向.

注意:如果两个声音是同时发生的并且您想要将它们分开,那么这对您没有帮助.我不相信任何活着的人都解决了这个问题.


+1.只是为了备份其他声音,分离同时声音是一个难题,即使是同类最佳的音频处理器仍然无法解决任何高可靠性.
推荐阅读
jerry613
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有