今天我在计算机组织课上,老师谈到了一些有趣的事情.谈到为什么缓存有效时,他说:
for (i=0; i用第二行改变第一行是不好的.你对此有何看法?为什么会这样?
1> DGentry..:Red Hat的Ulrich Drepper和glibc成名有一篇非常好的论文,每个程序员都应该知道记忆.一节非常详细地讨论了缓存.例如,在SMP系统中存在缓存效应,其中CPU可能最终来回颠倒修改的缓存线的所有权,从而极大地损害性能.
2> tvanfosson..:参考地点.因为数据是按行存储的,所以对于每一行,j列都在相邻的存储器地址中.操作系统通常会将整个页面从内存加载到缓存中,相邻的地址引用可能会引用同一页面.如果你通过内部循环中的行索引递增,那么这些行可能会在不同的页面上(因为它们被每个j分开),并且缓存可能必须不断地引入并丢弃内存页面数据.这称为颠簸,对性能不利.
在实践中以及较大的现代缓存中,行/列的大小需要相当大才能发挥作用,但它仍然是很好的做法.
[编辑]以上答案特定于C,可能因其他语言而异.我所知道的唯一不同的是FORTRAN.FORTRAN按列主要顺序存储事物(上面是行主要部分),更改FORTRAN中语句的顺序是正确的.如果您想/需要效率,了解您的语言如何实现数据存储非常重要.
3> unwind..:这就像是因为像地方一样的缓存.访问的内存数量相同但间隔较远,将会遇到缓存的不同"行",或者甚至可能完全错过缓存.因此,只要您有选择,就可以组织数据,以便及时在彼此附近发生的访问也可以在空间中进行.这会增加缓存命中的几率,并为您提供更高的性能.
当然有关于该主题的大量信息,例如参见本维基百科关于参考地点的条目.或者,我猜,你自己的课程教科书.:)