我正在制作一个复音音乐转录项目.我已经阅读了一些论文,并阅读了解释类似任务的文章.我对问题领域的许多方面感到非常困惑.希望有人能够帮助我.
到目前为止,我已经从给定的mp3获得了解码音频数据流.
我已经了解起病检测是转录的第一步..是否有可用的Java库可用于检测开始.
接下来,如我所读,使用FFT也可以检测基频.
我想知道在这些任务中使用FFT.(我对FFT不熟悉).是否必须执行FFT以进行起始检测和F0检测.如果不是其他方式.我可以在我的音频流上执行FFT,或者是否需要执行其他操作才能操作这些音频数据.
非常感谢.
此字段称为机器侦听.
数字编码音乐的复音转录是机器收听的圣杯之一.这是一个尚未解决的问题,也是一个积极研究的领域.子领域包括:
发起检测
节拍提取(检测度量结构,时间标签等)
音高检测(可能使用自动相关和其他方法,对单声道信号,但在应用于复杂的复音音乐时是一个未解决的问题)
密钥检测(密钥签名检测).
根据项目的性质,您可能会发现探索SuperCollider编程环境很有用.SC是一种专为此类项目设计的语言,已经拥有大量的机器监听插件(ugens),以及用于处理FFT,音频信号等的综合框架.