与hadoop接近实时

作者：wangtao | 2023-07-09 15:39

如何解决《与hadoop接近实时》经验，为你挑选了2个好方法。

我需要一些很好的参考资料,以便将Hadoop用于实时系统,例如在很短的响应时间内进行搜索.我知道hadoop有hdfs的开销,但最好用hadoop做这个.

1> SquareCog..：

您需要提供有关系统目标和挑战的更多信息,以获得良好的建议.也许Hadoop不是你需要的,你只需要一些分布式系统foo？(哦,你完全确定你需要一个分布式系统吗？你可以用几个大内存机器上的复制数据库做很多事情).

什么都不知道你的问题,我会给你几个在黑暗中尝试回答的尝试.

看看HBase,它在HDFS之上提供了一个结构化的可查询数据存储区,类似于Google的BigTable.http://hadoop.apache.org/hbase/

您可能需要一些管理复制和数据分片的帮助.看看Gizzard,这是一个中间件:http://github.com/twitter/gizzard

处理总是可以事先完成.如果这意味着你实现了太多数据,那么像Lucandra这样的东西可以提供帮助 - Lucene作为后端运行在Cassandra之上？http://github.com/tjake/Lucandra

如果你真的需要在查询时进行认真的处理,那么这样做的方法是运行专门的进程来执行你需要的特定类型的计算,并使用类似Thrift的东西来发送计算请求并接收结果.优化它们以将所有需要的数据存储在内存中.然后,接收查询本身的进程只能将问题分解为碎片,将碎片发送到计算节点并收集结果.这听起来像Hadoop,但不是因为它是用于计算预加载数据的特定问题而不是用于任意计算的通用计算模型.

2> Marcelo Cant..：

对于这种要求,Hadoop完全是错误的工具.它针对大批量作业进行了明确优化,这些作业可运行几分钟甚至几小时甚至几天.

FWIW,HDFS与开销无关.事实上,Hadoop作业将jar文件部署到每个节点,设置工作区域,启动每个作业运行,在计算阶段之间通过文件传递信息,与作业运行器通信进度和状态等等.

推荐阅读

程序员
最小比较时间.持续时间？

如何解决《最小比较时间.持续时间？》经验，为你挑选了1个好方法。 ... [详细]
程序员
正则表达式提取字符串后的第二个"." 字符串末尾的点字符

如何解决《正则表达式提取字符串后的第二个"."字符串末尾的点字符》经验，为你挑选了1个好方法。 ... [详细]
程序员
Safari自动"display:none!important"不会加载图片

如何解决《Safari自动"display:none!important"不会加载图片》经验，为你挑选了1个好方法。 ... [详细]
程序员
理解Beautiful Soup中的Find()函数

如何解决《理解BeautifulSoup中的Find()函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么`getNumPartitions()`没有给我"repartition"指定的正确数量的分区？

如何解决《为什么`getNumPartitions()`没有给我"repartition"指定的正确数量的分区？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在页面刷新时保留Chrome DOM断点？

如何解决《如何在页面刷新时保留ChromeDOM断点？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Web Audio API中AudioWorkerNode的状态

如何解决《WebAudioAPI中AudioWorkerNode的状态》经验，为你挑选了1个好方法。 ... [详细]
程序员
Loop没有捕获重复项并在Android(Java)中删除它们

如何解决《Loop没有捕获重复项并在Android(Java)中删除它们》经验，为你挑选了0个好方法。 ... [详细]
程序员
我应该为我写的每一个javascript函数'使用严格'吗？

如何解决《我应该为我写的每一个javascript函数'使用严格'吗？》经验，为你挑选了3个好方法。 ... [详细]
程序员
在facebook sdk服务文件上启用压缩以优化网站

如何解决《在facebooksdk服务文件上启用压缩以优化网站》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何为eclipse安装最新版本的ADT插件

如何解决《如何为eclipse安装最新版本的ADT插件》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Swift(iOS应用程序)中,何时需要使用其他整数类型？

如何解决《在Swift(iOS应用程序)中,何时需要使用其他整数类型？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用node.js将查询字符串参数传递给Smartsheet API？

如何解决《如何使用node.js将查询字符串参数传递给SmartsheetAPI？》经验，为你挑选了1个好方法。 ... [详细]
程序员
TensorFlow LSTM生成模型

如何解决《TensorFlowLSTM生成模型》经验，为你挑选了1个好方法。 ... [详细]
程序员
Double Sapply嵌套功能

如何解决《DoubleSapply嵌套功能》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在不嵌套其他容器的情况下垂直对齐内容？

如何解决《如何在不嵌套其他容器的情况下垂直对齐内容？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Bash脚本中隐藏输出

如何解决《在Bash脚本中隐藏输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从Google Apps脚本项目属性中存储和检索对象？

如何解决《如何从GoogleApps脚本项目属性中存储和检索对象？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Qt C++我怎么不用信号垃圾邮件我的UI线程

如何解决《QtC++我怎么不用信号垃圾邮件我的UI线程》经验，为你挑选了1个好方法。 ... [详细]
程序员
与Docker共享设备(网络摄像头,USB驱动器等)

如何解决《与Docker共享设备(网络摄像头,USB驱动器等)》经验，为你挑选了2个好方法。 ... [详细]

wangtao

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章