请耐心等待我的写作,因为我的英语不够精通.
作为程序员,我想了解在推荐系统或基于相关系统下实现的算法或机器学习智能.例如,最明显的例子来自亚马逊.他们有一个非常好的推荐系统.他们知道:如果你喜欢这个,你可能也喜欢这样,或者其他类似的东西:有多少人喜欢这个和那个在一起.
当然,我知道亚马逊是一个大型网站,他们在这些系统上投入了大量的资金和资金.但是,在最基本的核心上,我们如何在数据库中实现类似的东西呢?我们如何识别一个物体与其他物体的关系?我们如何建立一个处理这种事情的统计单位?
如果有人可以指出一些算法,我会很感激.或者,基本上,指出一些我们都可以学习的好的直接参考/书籍.谢谢你们!
这是两种不同类型的推荐引擎.
最简单的是基于项目,即"购买产品A的客户也购买产品B".这很容易实现.存储稀疏对称矩阵nxn(其中n是项目数).每个元素(m [a] [b])是任何人购买项目'a'和项目'b'的次数.
另一个是基于用户的.那就是"像你这样的人经常喜欢这样的东西".该问题的可能解决方案是k均值聚类.即构建一组集群,其中具有相似品味的用户被放置在同一集群中并基于同一集群中的用户提出建议.
一个更好的解决方案,但更复杂的解决方案是一种名为Restricted Boltzmann Machines的技术.这里有一个介绍,他们在这里