当前位置:  开发笔记 > 编程语言 > 正文

"坏话"过滤器

如何解决《"坏话"过滤器》经验,为你挑选了4个好方法。

不是很技术,但是......我必须在我们正在开发的新网站中实现一个坏词过滤器.所以我需要一个"好的"坏词列表来为我的数据库提供...任何提示/方向?环顾四周谷歌我找到了这个,这是一个开始,但仅此而已.

是的,我知道这种过滤器很容易逃脱......但客户端将是客户端!:-)

该网站将不得不过滤掉英语和意大利语单词,但对于意大利语,我可以让我的同事帮助我建立社区建立的"parolacce"列表:-) - 一封电子邮件即可.

谢谢你的帮助.



1> AgentConundr..:

小心克隆错误.

"苹果公司犯下了强迫他们有远见的错误 - 我的意思是,看看NeXT一直在做什么!"

嗯."clbuttic".

谷歌"clbuttic" - 成千上万的点击!

有人把他的汽车称为"clbuttic".

有"Clbuttic Steam Engine"留言板.

韦伯斯特的字典 - 没有帮助.

嗯.这可能是什么?

提示:那些对正则表达式脚本做出假设的人,在重复这种错误的时候会受到谴责.


我打开这个帖子的目的是添加同样的响应...然后我意识到我很久以前给了你一个upvote :)

2> UnkwnTech..:

我没有看到任何指定的语言,但是你可以将它用于PHP,它将为每个输入的作品生成一个RegEx,这样即使是故意的错误拼写(即@ss,i3itch)也会被捕获.

";
        $i++;
     }
     echo '
'; } ?> RegEx Generator
Word:
List Words


在非天or-day ig-pay inin-lay.Urse-cay ords-way是一种错误的可靠的射线.(AOL的前老板尼克伊莎).
你的意思是"On't-day orget-fay"

3> 小智..:

Shutterstock有一个Github仓库,里面有一个用于过滤的坏词列表.

你可以在这里查看:https://github.com/shutterstock/List-of-Dirty-Naughty-Obscene-and-Otherwise-Bad-Words


虽然这有点多 - "先生之手"显然是令人反感的.
法国DB很糟糕......

4> Tony..:

如果有人需要API,Google目前会提供错误的字词指示符.

http://www.wdyl.com/profanity?q=naughtyword

{
response: "false"
}

更新:Google现已删除此服务.


似乎不再活跃.
推荐阅读
手机用户2402852387
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有