给你256M的内存,对10G的文件进行排序(文件每行1个数字),如何实现? 对10G的文件进行查找如何实现?统计10G文件每个关键字出现的次数如何实现
用时间换空间呗
具体的实现都是分批载入文件,然后计算
java吗 用nio和用mapreduce的思想
不懂php
,但是看这个题目似曾相识。
说说思路吧。
1、排序的实现
这是一个单机外部排序的典型题目。具体的方法就是先分块进行排序
然后多路归并
成输出文件。
2、查找
如果不能对文件进行处理的话,只能遍历进行查找。
如果是可以对文件进行处理的话,那么上面已经排序好了文件,就可以进行二分查找
。
3、统计
如果不能对文件进行处理的话,还是没有好的办法,只能是遍历一遍。
如果已经拍好序了,那么就可以直接二分查找。在找到的位置向两头搜索出现的个数。
可以看看《编程珠玑》这本书,好像就有这个问题。