我试图在集群计算环境(运行CentOS版本6.2 Final的IBM LSF)上运行Java应用程序,它可以为我提供高达1TB的RAM空间.
我可以创建一个具有高达300GB最大内存(Xmx)的JVM,虽然我需要更多内容(如果需要,我可以提供详细信息).
但是,使用Xmx选项创建具有超过300GB最大内存的JVM似乎是不可能的.更具体地说,我收到了经典的错误消息:
VM初始化期间发生错误.
无法为对象堆保留足够的空间.
我的(64位)JVM的详细信息如下:
OpenJDK运行时环境(IcedTea6 1.10.6)(rhel-1.43.1.10.6.el6_2-x86_64)
OpenJDK 64位服务器VM(内置20.0-b11,混合模式)
我也尝试过使用Java 7 64位JVM,但我遇到了完全相同的问题.
此外,我尝试创建一个JVM来运行HelloWorld.jar,但是如果你要求超过-Xmx300G,JVM创建仍然会失败,所以我认为它与特定应用程序没有任何关系.
有谁知道为什么我不能创建超过300G的最大内存的JVM?
任何人都可以建议解决方案/解决方法吗?
我可以想到几个可能的解释:
您系统上的其他应用程序使用了大量内存,目前还没有300Gb 可用.
每个进程的内存大小可能存在资源限制.你可以用它来检查ulimit
.(请注意,根据此错误,如果每个进程资源限制停止JVM分配堆区域,您将收到错误消息.)
这也可能是"过度提交"问题; 例如,如果您的应用程序在虚拟环境中运行,并且整个系统无法满足需求,因为来自其他虚拟机的竞争太多.
建议的其他一些想法(IMO)不太可能:
切换JRE不太可能有任何区别.我从未在特定的64位JVM中听到或看到任意内存限制.
它不太可能是由于没有足够的连续内存.当然不需要连续的物理内存.唯一的可能是交换设备上的连续空间,但我不记得这是典型Linux操作系统的问题.
任何人都可以建议解决方案/解决方法吗?
检查一下ulimit
.
编写一个小C程序,尝试malloc
大量内存并查看在失败之前可以分配多少内存.
向系统(或管理程序)管理员寻求帮助.
(已编辑,请参阅有关交换空间的添加部分)
由于您使用CentOS的,你可能会碰到有关类似的问题SHMMAX
和SHMALL
所描述的内核设置这里配置Oracle DB.在同一链接下是获取和设置正确SHMALL
设置的示例计算.
某些用户已经报告说没有足够的连续内存,其他用户表示这是无关紧要的.
我不确定CentOS上的JVM是否需要连续的内存块.根据SAS的说法,碎片化的内存可能会阻止您的JVM以较大的最大值Xmx
或启动Xms
内存设置启动,但互联网上的其他声明称无关紧要.我尝试在我的48GB Windows工作站上证明或取消该声明,但设法以初始和最大设置40GB启动JVM.我很确定没有这种大小的连续块可用,但是不同操作系统上的JVM可能表现不同,因为每个操作系统的内存管理可能不同(即,Windows通常会隐藏单个进程的物理地址).
使用/proc/meminfo
查找最大的连续内存块可用,请参阅下的值VmAllocChunk
.这是所有价值观的指南和解释.如果您看到的值小于300GB,请尝试一个低于值的值VmAllocChunk
.
但是,通常这个数字高于物理可用内存(因为它是可用的虚拟内存值),它可能会给你误报.这是您可以保留的值,但一旦开始使用它,可能需要交换.因此,您还应检查MemFree
和Inactive
值.相反,您还可以查看整个列表,看看哪些值不超过300GB.
我不知道为什么你似乎遇到300GB的内存限制问题.有那么一刻,我以为你可能会打到最多的页面.默认值为4kB,300GB提供78,643,200
页面.看起来不像一些众所周知的神奇数字.例如,如果2^24
是最大值,那么16,777,216
页面或64GB应该是理论上可分配的最大值.
但是,假设为了论证你需要更大的页面(事实证明,对于大型内存Java应用程序的性能更好),你应该参考JBoss上的这个手册页,它解释了如何使用-XX:+UseLargePages
和设置kernel.shmmax
(在那里它)再次),vm.nr_hugepages
并且vm.huge_tlb_shm_group
(不确定后者是否必需).
其他人已经提出过这个建议.要找出问题在于JVM而不是操作系统,你应该对它进行压力测试.您可以使用的一个工具是Stresslinux.在本教程中,您将找到可以使用的一些选项.您特别感兴趣的是以下命令:
stress --vm 2 --vm-bytes 300G --timeout 30s --verbose
如果该命令失败或锁定了您的系统,您就会知道操作系统正在限制使用该内存量.如果成功,我们应该尝试调整JVM,以便它可以使用可用内存.
具有非常大的内部存储器大小的系统,使用很少或没有交换空间的情况并不少见.对于许多应用程序,这可能不是问题,但JVM要求交换可用交换空间大于请求的内存大小.根据这个错误报告,JVM将尝试增加交换空间本身,但是,正如这个SO线程中的一些答案所暗示的那样,JVM可能并不总是能够这样做.
因此:使用cat /proc/swaps # free
和检查当前可用的交换空间,如果小于300GB,请按照此CentOS联机帮助页上的说明增加系统的交换空间.
注1:我们可以从bugreport#4719001中扣除一个连续的可用交换空间块不是必需的.但是如果您不确定,请删除所有交换空间并重新创建它,这应该删除任何碎片.
注2:我见过几个职位像这样一个报告0MB
的交换空间,并能够运行的JVM.这可能是由于JVM增加了交换空间本身.尝试手动增加交换空间以确定它是否能解决您的问题仍然没有坏处.
我意识到上述情况不是你问题的开箱即用的答案.我希望它能为您提供一些指导,但您可以尝试使JVM正常工作.您可能还尝试其他JVM,如果问题证明是您当前使用的JVM的限制,但从我到目前为止所读到的,对64位JVM不应施加限制.
你在初始化JVM时得到的错误让我相信问题不在于JVM,而在于操作系统无法满足300GB内存的预留.
我自己的测试表明,JVM可以访问所有虚拟内存,而不关心可用的物理内存量.如果虚拟内存低于物理内存会很奇怪,但VmAllocChunk
设置应该给你一个方向的提示(它通常要大得多).