按行遍历的效率大概是是按列遍历的0.5倍
在c语言中,数组在内存中是按行存储的,按行遍历时可以由指向数组第一个数的指针一直向后遍历,由于二维数组的内存地址是连续的,当前行的尾与下一行的头相邻,所以可以直接到下一行
我们眼中的二维数组:
内存中的二维数组:
按行遍历比按列遍历的效率高体现在这些方面:
1. CPU高速缓存:在计算机系统中,CPU高速缓存(英语:CPU Cache,在本文中简称缓存)是用于减少处理器访问内存所需平均时间的部件。在金字塔式存储体系中它位于自顶向下的第二层,仅次于CPU寄存器。其容量远小于内存,但速度却可以接近处理器的频率。当处理器发出内存访问请求时,会先查看缓存内是否有请求数据。如果存在(命中),则不经访问内存直接返回该数据;如果不存在(失效),则要先把内存中的相应数据载入缓存,再将其返回处理器。缓存之所以有效,主要是因为程序运行时对内存的访问呈现局部性(Locality)特征。这种局部性既包括空间局部性(Spatial Locality),也包括时间局部性(Temporal Locality)。有效利用这种局部性,缓存可以达到极高的命中率。(百度百科解释)。
2. 缓存从内存中抓取一般都是整个数据块,所以它的物理内存是连续的,几乎都是同行不同列的,而如果内循环以列的方式进行遍历的话,将会使整个缓存块无法被利用,而不得不从内存中读取数据,而从内存读取速度是远远小于从缓存中读取数据的。随着数组元素越来越多,按列读取速度也会越来越慢。
可以用以下代码自行测试:
#include <iostream>
#include <iomanip>
#include <ctime>
using namespace std;
int main()
{const int MAX_ROW = 2000;const int MAX_COL = 2000;int(*a)[MAX_COL] = new int[MAX_ROW][MAX_COL];clock_t start, finish;//先行后列start = clock();for (int i = 0; i<MAX_ROW; i++)for (int j = 0; j<MAX_COL; j++)a[i][j] = 1;finish = clock();//totaltime=(double)()/CLOCKS_PER_SEC;cout << "先行后列遍历时间为:" << finish - start << "ms" << endl;//先列后行start = clock();for (int i = 0; i<MAX_COL; i++)for (int j = 0; j<MAX_ROW; j++)a[j][i] = 1;finish = clock();//totaltime=(double)()/CLOCKS_PER_SEC;cout << "先列后行遍历时间为:" << finish - start << "ms" << endl;return 0;
}