我网站上的用户和页面都有ID.当用户访问某个页面时,他们的userID和pageID将被写入MySQL表中:
userID | pageID 3 | 1 2 | 1 3 | 2 etc...
在这个被称为的表中,user_pages
我最终会得到一堆可以转换为推荐引擎的原始数据.我的意思是推荐引擎 - 我想分析历史数据,并能够根据一组查看的页面预测用户可能喜欢的下一页.假设在转到ID为4,9,15的页面之后,访问ID为3的页面之间存在强烈的相关性.如果用户进入第4,9和15页,则引擎应该推荐第3页.
我想我拥有创建它所需的所有数据输入代码.我如何写一些分析数据以便页面相关的内容(即几乎每个访问过第5页的人都访问过第1页),并以某种方式使用它来预测用户最终可能喜欢的页面?
推荐系统是人工智能研究的重要组成部分.我相信你对一系列称为协同过滤的算法很感兴趣.自2007年netflix奖项以来,这个领域发展很快.我建议去这里读一读.它以简洁明了的方式解释了推荐系统的基本概念,并提供了一个指向Netflix项目MemReader方法的Java源代码的链接.您可以检查此源代码并推断构建推荐引擎的基本算法.
或者,如果您想要对所用算法进行更多数学解释,请转到此处.
实施起来不应该花太长时间.