我有兴趣掌握与预取相关的功能,如
_mm_prefetch(...)
因此,当我执行循环遍历数组的操作时,内存带宽得到充分利用.了解这一点的最佳资源是什么?
我正在使用英特尔Linux平台上的GCC 4系列在C中完成这项工作.
Ulrich Drepper还有一篇优秀的论文,"每位程序员都应该了解记忆的内容".他介绍了预取,以及处理内存性能优化的许多其他主题.它于2007年11月发布,与当今的处理器极为相关.如果您在非常大的阵列上执行操作并且认为您的瓶颈是记忆,那么您应该阅读它.