当前位置:  开发笔记 > 编程语言 > 正文

面试题,给你256M的内存,对10G的文件进行排序(文件每行1个数字)

给你256M的内存,对10G的文件进行排序(文件每行1个数字),如何实现?对10G的文件进行查找如何实现?统计10G文件每个关键字出现的次数如何实现
给你256M的内存,对10G的文件进行排序(文件每行1个数字),如何实现? 对10G的文件进行查找如何实现?统计10G文件每个关键字出现的次数如何实现

回复内容:

给你256M的内存,对10G的文件进行排序(文件每行1个数字),如何实现? 对10G的文件进行查找如何实现?统计10G文件每个关键字出现的次数如何实现

用时间换空间呗
具体的实现都是分批载入文件,然后计算

java吗 用nio和用mapreduce的思想

不懂php,但是看这个题目似曾相识。
说说思路吧。
1、排序的实现
这是一个单机外部排序的典型题目。具体的方法就是先分块进行排序然后多路归并成输出文件。
2、查找
如果不能对文件进行处理的话,只能遍历进行查找。
如果是可以对文件进行处理的话,那么上面已经排序好了文件,就可以进行二分查找
3、统计
如果不能对文件进行处理的话,还是没有好的办法,只能是遍历一遍。
如果已经拍好序了,那么就可以直接二分查找。在找到的位置向两头搜索出现的个数。

可以看看《编程珠玑》这本书,好像就有这个问题。

推荐阅读
大大炮
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有