19赞

朴素的贝叶斯垃圾邮件过滤效果

作者：jerry613 | 2023-09-01 23:33

如何解决《朴素的贝叶斯垃圾邮件过滤效果》经验，为你挑选了2个好方法。

天真贝叶斯过滤对过滤垃圾邮件的效果如何？

我听说垃圾邮件发送者可以通过填充额外的非垃圾邮件相关词语来轻松绕过它们.您可以使用哪些编程技术与贝叶斯过滤器进行预防？

1> danieltalsky..：

2002年8月,保罗·格雷厄姆(Paul Graham)真正将他的原创文章"垃圾邮件计划"(A Plan for Spam)引入网络,真实地引入了网络垃圾邮件过滤的想法.然后,他在一年左右的后续工作中引入了许多问题.迅速起来.这些仍然是关于这个主题的非常好的作品.

在第二篇文章中,格雷厄姆提到使用CRM114,它可以在更广泛的模式集上工作,而不仅仅是空格分隔的单词.CRM114很酷,但对垃圾邮件过滤系统没有太多实施帮助.

有针对Bayesian垃圾邮件过滤的开源powertools,如Death2Spam和SpamProbe.

我发现没有什么比通过Gmail帐户过滤邮件更有效了.快乐狩猎.

2> Norman Ramse..：

我认为,为了击败你提到的那种垃圾邮件攻击,重要的不是学习方法,而是你训练的功能.我使用Fidelis Assis的OSBF-Lua这是一个非常成功的过滤器:它一直在赢得垃圾邮件过滤器的竞争.它使用贝叶斯学习,但我认为它成功的真正原因是三个原则:

它不是用单个词训练,而是用稀疏的双字母训练:一对由0到4分开的单词"不关心"单词.垃圾邮件发送者必须将他们的信息放在某个地方,而稀疏的双子星座非常善于将它们排除在外.它甚至发现附带垃圾邮件!

它对邮件标题进行了额外的培训,因为垃圾邮件发送者难以伪装.示例:源自您的网络但从不通过网络外中继主机的邮件可能不是垃圾邮件.

如果垃圾邮件过滤器对其分类的置信度较低,则它会请求来自人的输入.(在实践中,它添加了一个标题字段,说"请训练我这条消息";人类可以忽略该请求.)这意味着随着垃圾邮件发送者不断发展新技术,您的过滤器会逐渐变得匹配.

这种技术组合非常有效.

免责声明:我曾与Fidelis合作重构某些软件,以便将其用于其他目的,例如将常规邮件分组或可能有一天试图在博客评论和其他地方检测垃圾邮件.

推荐阅读

程序员
Arquillian和wildfly - 如何从独立开始？

如何解决《Arquillian和wildfly-如何从独立开始？》经验，为你挑选了1个好方法。 ... [详细]
程序员
语法上的甜蜜快速回调来自c

如何解决《语法上的甜蜜快速回调来自c》经验，为你挑选了0个好方法。 ... [详细]
程序员
浏览器支持Javascript中的类语法

如何解决《浏览器支持Javascript中的类语法》经验，为你挑选了1个好方法。 ... [详细]
程序员
OpenGL在发布模式下呈现,但不在调试模式下呈现

如何解决《OpenGL在发布模式下呈现,但不在调试模式下呈现》经验，为你挑选了1个好方法。 ... [详细]
程序员
我怎么能理解这些析构函数？

如何解决《我怎么能理解这些析构函数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Nest温控器温度未更新

如何解决《Nest温控器温度未更新》经验，为你挑选了0个好方法。 ... [详细]
程序员
ruby/splitting数组到列中

如何解决《ruby/splitting数组到列中》经验，为你挑选了1个好方法。 ... [详细]
程序员
Ruby Regex MatchData对象捕获奇怪的行为方法

如何解决《RubyRegexMatchData对象捕获奇怪的行为方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
ckeditor - 未捕获的TypeError:无法读取null的属性"icons"

如何解决《ckeditor-未捕获的TypeError:无法读取null的属性"icons"》经验，为你挑选了0个好方法。 ... [详细]
程序员
MATLAB中的图像卷积 - 如何比我的手动编码版本快360倍？

如何解决《MATLAB中的图像卷积-如何比我的手动编码版本快360倍？》经验，为你挑选了1个好方法。 ... [详细]
程序员
从调用方法返回

如何解决《从调用方法返回》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用vue.js获取调用元素

如何解决《使用vue.js获取调用元素》经验，为你挑选了1个好方法。 ... [详细]
程序员
JDOM2 xpath在不同的命名空间中查找节点

如何解决《JDOM2xpath在不同的命名空间中查找节点》经验，为你挑选了0个好方法。 ... [详细]
程序员
正则表达式匹配一个数字后跟一个重复多次的符号？

如何解决《正则表达式匹配一个数字后跟一个重复多次的符号？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将Android支持v7库加载到SBT Android项目中？

如何解决《如何将Android支持v7库加载到SBTAndroid项目中？》经验，为你挑选了0个好方法。 ... [详细]
程序员
导入语句和Babel

如何解决《导入语句和Babel》经验，为你挑选了1个好方法。 ... [详细]
程序员
交互式通知未显示按钮ios 9.2

如何解决《交互式通知未显示按钮ios9.2》经验，为你挑选了0个好方法。 ... [详细]
程序员
注入MessageApi并使用I18nSupport Trait时如何传递消息

如何解决《注入MessageApi并使用I18nSupportTrait时如何传递消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在边框上放置文字？(HTML,CSS)

如何解决《如何在边框上放置文字？(HTML,CSS)》经验，为你挑选了0个好方法。 ... [详细]
程序员
NestedScrollView和Horizontal RecyclerView平滑滚动

如何解决《NestedScrollView和HorizontalRecyclerView平滑滚动》经验，为你挑选了1个好方法。 ... [详细]

jerry613

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章