我不确定Youtube是否是唯一拥有此技术的网站,但YT(Content ID)中的内容识别基本上是一种自动识别和删除版权侵权的技术.你可以在这里读更多关于它的内容:
http://www.youtube.com/t/contentid
好吧,当我的一个视频(包含一个特定的音乐曲目)被标记并删除版权侵权时,我认为[内容ID系统]可能是愚蠢的.所以我做了一些实验:没有一个骗过过滤器〜
在歌曲中间添加了一系列哔哔声
通过歌曲多次改变音高
改变了音量几次
调整速度
添加了音频叠加层
添加了一些音频效果
另一方面,我不知道任何材料被错误地匹配为受版权保护的.例如,钢琴版的歌曲不会错误地触发审查员.
我不是在咆哮我的视频被删除.我很惊讶内容审查员的效率如何.我想知道这个算法如何正确地将这首歌识别为侵犯版权,即使在我努力绕过它之后.任何直接匹配的尝试都会立即被击败,任何涉及音符模式的算法都可能被哔哔声和音高变化所欺骗.
嗯,这更多是我的好奇心,而不是一个紧急的问题.
Pedro Moreno和其他人在谷歌/ Youtube上工作.他们使用有限状态传感器来识别音乐电话单元的序列,类似于自动语音识别中的音素.
看看这篇文章:
Eugene Weinstein,Pedro J. Moreno; 加权有限状态传感器的音乐识别,声学,语音和信号处理国际会议论文集(ICASSP),2007年.
如果你在整首歌曲中改变速度或音高,我会惊讶于这些算法仍能识别这首歌.但也许它们可以将音高和速度(使用节拍之间的时间)标准化,以便能够识别覆盖的版本,而不仅仅是原始版本.但是它可以忽略你添加的嘟嘟声并不奇怪,因为你的音频流有足够的相似性.
(实际上,基于有限状态的算法可以很好地应用于我的iTunes库,正确标记文件.因为像MusicBrainz这样的服务依赖于音频和数据库条目的或多或少精确的哈希匹配,而传感器方法似乎在识别文件方面更具差异性.)