这是我到目前为止在我的名单上的内容.我想以同样的方式了解其他人,也许更具技术性,也许更少
吹到比特:数字爆炸后你的生活,自由和幸福 - Ableson,Leeden和Lewis
Glut:通过年龄掌握信息 - Wright
信息规则 - Varian和Shapiro
Web Dragons:内部搜索引擎技术的神话 - Witten, Gori和Numerico
我在文本挖掘中看到过一些,包括
Web数据挖掘 - 刘
现代信息检索 - Baeza-Yates,Ribiero-Neto
也在寻找
http://www.stat.columbia.edu/~gelman/blog/ http://www.econlib.org/library/Enc/Information.html等博客文章
.
或者像结构形式的发现这样的论文
"SIGIR" - 会议
"TREC" - 会议
Baeza-Yates,Ribeiro-Neto,"现代信息检索"(1999)
Witten,"管理千兆字节"(1999)
van Rijsbergen,"信息检索"(1979)
是明显的"圣经"(如上所述).
Büttcher,Clarke,Cormack,"信息检索:实施和评估搜索引擎"(2010)
是一本有趣的新教科书(学生级),充满了文献参考.它包含对并行检索算法的良好解释(示例章节).
Croft,Metzler,Strohman,"搜索引擎:实践中的信息检索"(2009)
有很好的评论; 我不太喜欢它(阅读Croft主页上的示例章节).
Voorhees,Harman,"Trec:信息检索中的实验和评估"(2009)
是评估IR的TREC方法的一个很好的介绍.
Langville,Meyer,"Google的Pagerank及其他:搜索引擎排名的科学"(2006)
解释了如何有效地计算PageRank.