不是很技术,但是......我必须在我们正在开发的新网站中实现一个坏词过滤器.所以我需要一个"好的"坏词列表来为我的数据库提供...任何提示/方向?环顾四周谷歌我找到了这个,这是一个开始,但仅此而已.
是的,我知道这种过滤器很容易逃脱......但客户端将是客户端!:-)
该网站将不得不过滤掉英语和意大利语单词,但对于意大利语,我可以让我的同事帮助我建立社区建立的"parolacce"列表:-) - 一封电子邮件即可.
谢谢你的帮助.
小心克隆错误.
"苹果公司犯下了强迫他们有远见的错误 - 我的意思是,看看NeXT一直在做什么!"
嗯."clbuttic".
谷歌"clbuttic" - 成千上万的点击!
有人把他的汽车称为"clbuttic".
有"Clbuttic Steam Engine"留言板.
韦伯斯特的字典 - 没有帮助.
嗯.这可能是什么?
提示:那些对正则表达式脚本做出假设的人,在重复这种错误的时候会受到谴责.
我没有看到任何指定的语言,但是你可以将它用于PHP,它将为每个输入的作品生成一个RegEx,这样即使是故意的错误拼写(即@ss,i3itch)也会被捕获.
"; $i++; } echo 'List Words
'; } ?>RegEx Generator
Shutterstock有一个Github仓库,里面有一个用于过滤的坏词列表.
你可以在这里查看:https://github.com/shutterstock/List-of-Dirty-Naughty-Obscene-and-Otherwise-Bad-Words
如果有人需要API,Google目前会提供错误的字词指示符.
http://www.wdyl.com/profanity?q=naughtyword { response: "false" }
更新:Google现已删除此服务.