这是我在阅读之后想出的一个问题: Storm并行性中的"任务"是什么
如果我需要在bolt的内部状态中保留一些信息,例如,在经典的单词计数用例中,保持在hashmap中看到的每个单词的计数.在执行"rebalance"命令之后,许多螺栓的任务被移动到另一个执行器,该执行器可能在另一个JVM或甚至另一台机器中.将bolt的内部状态(本例中的字数hashmap)转移到新环境(实例/ JVM /机器)吗?
当然,将字数哈希映射放在像Zookeeper这样的中心位置不会有这个问题.但出于性能的考虑,似乎我们有时需要将内容保存在内存中.
运行重新平衡后,将发生以下情况
它将首先停用当前拓扑
然后,它将在集群内均匀分配工作人员
然后,拓扑将返回其先前的激活状态
以下是Nathan Marz 的评论,应该有助于消除您的疑虑.
重新平衡等同于那些在另一台机器上被杀死并从头开始创建的工人.如果你想要维持"状态",我建议你使用像Trident这样的东西,让你的状态在DFS上同步