JBoss 4.2.2节点开始集群然后互相怀疑

作者：刘美娥94662 | 2023-07-03 10:43

如何解决《JBoss4.2.2节点开始集群然后互相怀疑》经验，为你挑选了0个好方法。

我在现有的Red Hat服务器上运行了一个运行JBoss 4.2.2的网站.我正在设置第二台服务器,以便拥有一个群集对(然后将进行负载平衡).但是,我无法让它们成功集群.

现有服务器启动JBoss:

run.sh -c default -b 0.0.0.0

(我知道'默认'配置不支持开箱即用的集群 - 我正在使用它的修改版本,其中包括集群支持.)当我用相同的命令启动第二个JBoss实例时,它形成了自己的集群没有注意到第一个.两者都使用相同的分区名称和多播地址和端口.

我尝试了McastReceiverTest和McastSenderTest程序来检查机器是否可以通过多播进行通信; 他们可以.

然后我注意到http://docs.jboss.org/jbossas/docs/Clustering_Guide/beta422/html/ch07s07s07.html上的信息,说JGroups不能绑定到所有接口,而是绑定到默认接口; 所以大概是它绑定到127.0.0.1,从而没有得到消息.所以我设置实例来告诉JGroups使用内部IP:

run.sh -c default -b 0.0.0.0 -Djgroups.bind_addr=10.51.1.131
run.sh -c default -b 0.0.0.0 -Djgroups.bind_addr=10.51.1.141

(.131是现有服务器,.141是新服务器).

节点现在互相注意并形成一个集群 - 首先.但是,在尝试部署.ear时,服务器日志会说:

2010-08-07 22:26:39,321 DEBUG [org.jgroups.protocols.FD] sending are-you-alive msg to 10.51.1.131:46294 (own address=10.51.1.141:47629)
2010-08-07 22:26:45,412 WARN  [org.jgroups.protocols.FD] I was suspected by 10.51.1.131:48733; ignoring the SUSPECT message and sending back a HEARTBEAT_ACK
2010-08-07 22:26:49,324 DEBUG [org.jgroups.protocols.FD] sending are-you-alive msg to 10.51.1.131:46294 (own address=10.51.1.141:47629)
2010-08-07 22:26:49,324 DEBUG [org.jgroups.protocols.FD] heartbeat missing from 10.51.1.131:46294 (number=0)
2010-08-07 22:26:49,529 DEBUG [org.jgroups.protocols.MERGE2] initial_mbrs=[[own_addr=10.51.1.141:60365, coord_addr=10.51.1.141:60365, is_server=true]]
2010-08-07 22:26:52,092 WARN  [org.jboss.cache.TreeCache] replication failure with method_call optimisticPrepare; id:18; Args: ( arg[0] = GlobalTransaction:<10.51.1.131:46294>:5421085 ...) exception org.jboss.cache.lock.TimeoutException: failure acquiring lock: fqn=/Yudu_ear,Yudu-ejb_jar,Yudu-ejbPU/com/yudu/ejb/entity, caller=GlobalTransaction:<10.51.1.131:46294>:5421085, lock=read owners=[GlobalTransaction:<10.51.1.131:46294>:5421081] (activeReaders=1, activeWriter=null, waitingReaders=0, waitingWriters=1, waitingUpgrader=0)

...而.ear无法部署.

如果我将ejb3-entity-cache-service.xml中的CacheMode从REPL_SYNC更改为LOCAL,则.ear会正确部署,但当然实体缓存复制不会发生.但是,日志仍然显示出同样问题的有趣迹象.

看起来像:

首先,新节点找到现有节点并形成一个集群

然后FD检查失败,并且在一定数量的故障之后,新节点从群集中分离并形成其自己的群集

然后它再次找到它,重新聚类,这次FD检查工作.

日志文件的相关位:

2010-08-07 23:47:07,423 INFO  [org.jgroups.protocols.UDP] socket information: local_addr=10.51.1.141:35666, mcast_addr=228.1.2.3:45566, bind_addr=/10.51.1.141, ttl=2 sock: bound to 10.51.1.141:35666, receive buffer size=131071, send buffer size=131071 mcast_recv_sock: bound to 0.0.0.0:45566, send buffer size=131071, receive buffer size=131071 mcast_send_sock: bound to 10.51.1.141:59196, send buffer size=131071, receive buffer size=131071
2010-08-07 23:47:07,431 DEBUG [org.jgroups.protocols.UDP] created unicast receiver thread
2010-08-07 23:47:09,445 DEBUG [org.jgroups.protocols.pbcast.GMS] initial_mbrs are [[own_addr=10.51.1.131:48888, coord_addr=10.51.1.131:48888, is_server=true]]
2010-08-07 23:47:09,446 DEBUG [org.jgroups.protocols.pbcast.GMS] election results: {10.51.1.131:48888=1}
2010-08-07 23:47:09,446 DEBUG [org.jgroups.protocols.pbcast.GMS] sending handleJoin(10.51.1.141:35666) to 10.51.1.131:48888
2010-08-07 23:47:09,751 DEBUG [org.jgroups.protocols.pbcast.GMS] [10.51.1.141:35666]: JoinRsp=[10.51.1.131:48888|61] [10.51.1.131:48888, 10.51.1.141:35666] [size=2]
2010-08-07 23:47:09,752 DEBUG [org.jgroups.protocols.pbcast.GMS] new_view=[10.51.1.131:48888|61] [10.51.1.131:48888, 10.51.1.141:35666]
...
2010-08-07 23:47:10,047 INFO  [org.jboss.ha.framework.interfaces.HAPartition.DefaultPartition] Number of cluster members: 2
2010-08-07 23:47:10,047 INFO  [org.jboss.ha.framework.interfaces.HAPartition.DefaultPartition] Other members: 1
...
2010-08-07 23:47:20,034 DEBUG [org.jgroups.protocols.FD] sending are-you-alive msg to 10.51.1.131:48888 (own address=10.51.1.141:35666)
2010-08-07 23:47:30,037 DEBUG [org.jgroups.protocols.FD] sending are-you-alive msg to 10.51.1.131:48888 (own address=10.51.1.141:35666)
2010-08-07 23:47:30,038 DEBUG [org.jgroups.protocols.FD] heartbeat missing from 10.51.1.131:48888 (number=0)
2010-08-07 23:47:40,040 DEBUG [org.jgroups.protocols.FD] sending are-you-alive msg to 10.51.1.131:48888 (own address=10.51.1.141:35666)
2010-08-07 23:47:40,040 DEBUG [org.jgroups.protocols.FD] heartbeat missing from 10.51.1.131:48888 (number=1)
...
2010-08-07 23:48:19,758 WARN  [org.jgroups.protocols.FD] I was suspected by 10.51.1.131:48888; ignoring the SUSPECT message and sending back a HEARTBEAT_ACK
2010-08-07 23:48:20,054 DEBUG [org.jgroups.protocols.FD] sending are-you-alive msg to 10.51.1.131:48888 (own address=10.51.1.141:35666)
2010-08-07 23:48:20,055 DEBUG [org.jgroups.protocols.FD] [10.51.1.141:35666]: received no heartbeat ack from 10.51.1.131:48888 for 6 times (60000 milliseconds), suspecting it
2010-08-07 23:48:20,058 DEBUG [org.jgroups.protocols.FD] broadcasting SUSPECT message [suspected_mbrs=[10.51.1.131:48888]] to group
...
2010-08-07 23:48:21,691 DEBUG [org.jgroups.protocols.pbcast.NAKACK] removing 10.51.1.131:48888 from received_msgs (not member anymore)
2010-08-07 23:48:21,691 INFO  [org.jboss.ha.framework.server.DistributedReplicantManagerImpl.DefaultPartition] I am (127.0.0.1:1099) received membershipChanged event:
2010-08-07 23:48:21,691 INFO  [org.jboss.ha.framework.server.DistributedReplicantManagerImpl.DefaultPartition] Dead members: 0 ([])
2010-08-07 23:48:21,691 INFO  [org.jboss.ha.framework.server.DistributedReplicantManagerImpl.DefaultPartition] New Members : 0 ([])
2010-08-07 23:48:21,691 INFO  [org.jboss.ha.framework.server.DistributedReplicantManagerImpl.DefaultPartition] All Members : 1 ([127.0.0.1:1099])
...
2010-08-07 23:49:59,793 WARN  [org.jgroups.protocols.FD] I was suspected by 10.51.1.131:48888; ignoring the SUSPECT message and sending back a HEARTBEAT_ACK
2010-08-07 23:50:09,796 WARN  [org.jgroups.protocols.FD] I was suspected by 10.51.1.131:48888; ignoring the SUSPECT message and sending back a HEARTBEAT_ACK
2010-08-07 23:50:19,144 DEBUG [org.jgroups.protocols.FD] Recevied Ack. is invalid (was from: 10.51.1.131:48888),
2010-08-07 23:50:19,144 DEBUG [org.jgroups.protocols.FD] Recevied Ack. is invalid (was from: 10.51.1.131:48888),
...
2010-08-07 23:50:21,791 DEBUG [org.jgroups.protocols.pbcast.GMS] new=[10.51.1.131:48902], suspected=[], leaving=[], new view: [10.51.1.141:35666|63] [10.51.1.141:35666, 10.51.1.131:48902]
...
2010-08-07 23:50:21,792 DEBUG [org.jgroups.protocols.pbcast.GMS] view=[10.51.1.141:35666|63] [10.51.1.141:35666, 10.51.1.131:48902]
2010-08-07 23:50:21,792 DEBUG [org.jgroups.protocols.pbcast.GMS] [local_addr=10.51.1.141:35666] view is [10.51.1.141:35666|63] [10.51.1.141:35666, 10.51.1.131:48902]
2010-08-07 23:50:21,822 INFO  [org.jboss.ha.framework.interfaces.HAPartition.lifecycle.DefaultPartition] New cluster view for partition DefaultPartition (id: 63, delta: 1) : [127.0.0.1:1099, 127.0.0.1:1099]
2010-08-07 23:50:21,822 DEBUG [org.jboss.ha.framework.interfaces.HAPartition.DefaultPartition] membership changed from 1 to 2
...
2010-08-07 23:50:31,825 DEBUG [org.jgroups.protocols.FD] sending are-you-alive msg to 10.51.1.131:48902 (own address=10.51.1.141:35666)
2010-08-07 23:50:31,832 DEBUG [org.jgroups.protocols.FD] received ack from 10.51.1.131:48902

但我不知道为什么FD检查在第一轮失败了; 虽然它最终似乎与另一个节点集群,但是当它试图共享实体状态时,最初的失败似乎足以弄乱部署,从而阻止它实际以有用的方式工作.

如果有人能够阐明这一点,我将非常感激!

推荐阅读

程序员
Django-Filer:如何在管理员之外调用上传小部件

如何解决《Django-Filer:如何在管理员之外调用上传小部件》经验，为你挑选了0个好方法。 ... [详细]
程序员
显示D3链接文本正面朝上

如何解决《显示D3链接文本正面朝上》经验，为你挑选了1个好方法。 ... [详细]
程序员
不完整的模式匹配此表达式

如何解决《不完整的模式匹配此表达式》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用勾选/复选标记符号(✓)而不是无序列表中的项目符号？

如何解决《如何使用勾选/复选标记符号(✓)而不是无序列表中的项目符号？》经验，为你挑选了3个好方法。 ... [详细]
程序员
C malloc字符串

如何解决《Cmalloc字符串》经验，为你挑选了2个好方法。 ... [详细]
程序员
断言抛出磁带 - 节点

如何解决《断言抛出磁带-节点》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Access Query中创建日期列表

如何解决《在AccessQuery中创建日期列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
功能(e)和功能()之间的区别

如何解决《功能(e)和功能()之间的区别》经验，为你挑选了1个好方法。 ... [详细]
程序员
在pymongo中使用explain（“ executionStats”）进行查询

如何解决《在pymongo中使用explain（“executionStats”）进行查询》经验，为你挑选了1个好方法。 ... [详细]
程序员
animate.css:重复动画

如何解决《animate.css:重复动画》经验，为你挑选了1个好方法。 ... [详细]
程序员
从cookie创建和读取列表<>

如何解决《从cookie创建和读取列表<>》经验，为你挑选了0个好方法。 ... [详细]
程序员
这是代码中的一种僵局吗？

如何解决《这是代码中的一种僵局吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Node.js中使用进度信息快速复制文件？

如何解决《在Node.js中使用进度信息快速复制文件？》经验，为你挑选了0个好方法。 ... [详细]
程序员
从Node.js中Object的键值中提取值

如何解决《从Node.js中Object的键值中提取值》经验，为你挑选了1个好方法。 ... [详细]
程序员
显示名称列表在Recyclerview下的每个字母下按字母顺序Android

如何解决《显示名称列表在Recyclerview下的每个字母下按字母顺序Android》经验，为你挑选了3个好方法。 ... [详细]
程序员
WordPress重定向插件不区分大小写的正则表达式

如何解决《WordPress重定向插件不区分大小写的正则表达式》经验，为你挑选了1个好方法。 ... [详细]
程序员
从Javascript中的两个嵌套数组中获取一个对象

如何解决《从Javascript中的两个嵌套数组中获取一个对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将字段添加到log4j2的JSON日志

如何解决《如何将字段添加到log4j2的JSON日志》经验，为你挑选了0个好方法。 ... [详细]
程序员
从对象数组中删除重复项

如何解决《从对象数组中删除重复项》经验，为你挑选了1个好方法。 ... [详细]
程序员
numpy dot()和Python 3.5+矩阵乘法之间的区别@

如何解决《numpydot()和Python3.5+矩阵乘法之间的区别@》经验，为你挑选了2个好方法。 ... [详细]

刘美娥94662

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章