Stack Overflow相关问题算法

作者：echo7111436 | 2023-08-26 10:34

如何解决《StackOverflow相关问题算法》经验，为你挑选了4个好方法。

输入标题后出现的相关问题,以及查看问题时右侧栏中显示的相关问题似乎表明非常恰当的问题.

Spolsky在一次演讲中表示,Stack Overflow只对它进行SQL搜索并且不使用任何特殊算法.

在这种情况下,存在哪些算法可以给出好的答案.在这种情况下,你如何进行数据库搜索？使标题可搜索并搜索关键字或搜索标签和那些在顶部有很多投票的问题？

1> Nick Fortesc..：

如果您收听Stack Overflow播客32(不幸的是成绩单中没有多少内容),您可以听到Jeff Atwood对他如何做到这一点的一些说法.

似乎算法类似于:

提出问题

删除最常用的英文单词(从他从谷歌获得的列表)

提交全文搜索到SQL Server 2008全文搜索引擎

有关全文搜索的更多详细信息,请访问:http://msdn.microsoft.com/en-us/library/ms142571.aspx

这可能已经过时了 - 他们正在谈论转向更好/更快的全文搜索,例如Lucene,我依稀记得杰夫在播客中说这已经完成了.

2> workmad3..：

相关问题边栏将建立在每个问题的标签上(可能是基于标签重叠对它们进行排名,因此共有5个标签>共同的4个标签等).

其余的将基于适用于自然语言处理的启发式算法和算法.这些在通用语言中通常不是很好,但是一旦词汇表减少到单个技术领域(例如编程),它们中的大多数都非常好.

3> aleemb..：

如果您想要进入"相关"算法,请查看Porter干扰词汇算法.

例如,英语的词干分析器应该根据根"cat"和"stemmer","stemming","stemmed"识别字符串"cats"(可能还有"catlike","catty"等).基于"干".词干算法将词语"钓鱼","钓鱼","鱼"和"渔夫"简化为词根"鱼".

处理完文档并完成后,您可以按计数索引词干,然后与其他文档进行比较.这是解决此问题的最基本方法.

还要注意忽略像"the","an","of"等停止词.

4> victor hugo..：

这篇文章将帮助你是否有一个算法,告诉两个短语的语义相似性

事实上,这是现在排名最高的相关问题;)

推荐阅读

程序员
我可以使Realm Results类使用协议作为泛型吗？

如何解决《我可以使RealmResults类使用协议作为泛型吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在具有隐式参数的函数上调用Private

如何解决《如何在具有隐式参数的函数上调用Private》经验，为你挑选了1个好方法。 ... [详细]
程序员
什么可以使std :: map找不到它的一个键？

如何解决《什么可以使std::map找不到它的一个键？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Linq加入查询错误

如何解决《Linq加入查询错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将预先填充的文本消息发送给特定(预期)Whats-App用户/用户？

如何解决《如何将预先填充的文本消息发送给特定(预期)Whats-App用户/用户？》经验，为你挑选了0个好方法。 ... [详细]
程序员
学习Netsuite

如何解决《学习Netsuite》经验，为你挑选了1个好方法。 ... [详细]
程序员
包括头文件进行分析之后，请告诉我有关cppcheck的用途或工作方式

如何解决《包括头文件进行分析之后，请告诉我有关cppcheck的用途或工作方式》经验，为你挑选了1个好方法。 ... [详细]
程序员
JDBC是否在将日期插入Oracle DB之前调整日期？我该如何防止这种情况？

如何解决《JDBC是否在将日期插入OracleDB之前调整日期？我该如何防止这种情况？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在类"对象"中定义的==运算符在哪里？

如何解决《在类"对象"中定义的==运算符在哪里？》经验，为你挑选了2个好方法。 ... [详细]
程序员
有没有办法在babelify中关闭"超级之前不允许这样的规则"？

如何解决《有没有办法在babelify中关闭"超级之前不允许这样的规则"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Bootstrap 3无法在Symfony3中运行

如何解决《Bootstrap3无法在Symfony3中运行》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Javascript下载HTML5 mp4视频

如何解决《使用Javascript下载HTML5mp4视频》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在android中的数组列表中获取特定值的索引

如何解决《如何在android中的数组列表中获取特定值的索引》经验，为你挑选了1个好方法。 ... [详细]
程序员
在带有colspan和rowspan的表中重复

如何解决《在带有colspan和rowspan的表中重复》经验，为你挑选了1个好方法。 ... [详细]
程序员
安装perl模块和复制整个文件夹有什么区别？

如何解决《安装perl模块和复制整个文件夹有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
@Bean和@Autowired之间的区别

如何解决《@Bean和@Autowired之间的区别》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何将UTF-8数据与Latin1 MySQL数据库表中保存的相同数据进行比较

如何解决《如何将UTF-8数据与Latin1MySQL数据库表中保存的相同数据进行比较》经验，为你挑选了1个好方法。 ... [详细]
程序员
Django/WSGI应用程序中的持久数据库连接

如何解决《Django/WSGI应用程序中的持久数据库连接》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么Stream.limit在此代码段中没有按预期工作？

如何解决《为什么Stream.limit在此代码段中没有按预期工作？》经验，为你挑选了4个好方法。 ... [详细]
程序员
Python：如何获取用MySQLdb删除的行数

如何解决《Python：如何获取用MySQLdb删除的行数》经验，为你挑选了1个好方法。 ... [详细]

echo7111436

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章