现在市面上,主流的C/C++编译器包括M$的CL、gcc、Intel的icl、PGI的pgcc及Codegear的bcc(原来属于Borland公司)。Windows上使用最多的自然是cl,而在更广阔的平台上,gcc则是C/C++编译器的首选。但要提到能力优化,排名就未必与它们的市场占有率一致了。
今天一时兴起,便做了一个各编译器数值性能的比较。测试的代码是一个求积分的程序,来源于intel编译器的例子程序,修改了一个头文件,以便每个编译器都能编译。
#include <stdio.h> // Function to be integrated // Prototype timing function int main(void) // Start timing for the entire application printf(" \n"); // Compute the number of (internal rectangles + 1) // Compute stepsize for N-1 internal rectangles // Approx. 1/2 area in first rectangle: f(x0) * [step/2] // Apply midpoint rule: for (i=1;i<N;i++) // Approx. 1/2 area in last rectangle: f(xN) * [step/2] printf(" %10d | %14e | \n", N, sum); return 0; |
当然,这个代码来自于intel,当然非常适合intel的编译器。以下的测试在Intel Core 2 Duo上进行。
gcc (GCC TDM-2 for MinGW) 4.3.0 VC 9.0 (cl 15.00.21022.08) Intel (icl 10.1) PGI (pgcc 7.16) CodeGear (bcc32 6.10)
禁止优化
-O0 /Od -Od -O0 -Od
17161 14461 12441 10514 13400
17133 14430 11687 9956 12917
17155 14476 11871 10099 13026
编译选项 -O2
13011 7737 4540 9348 12636
16571 7706 4185 9148 13026
16573 7706 4042 9183 13057
针对平台的优化
-march=core2 -O2 /arch:SSE2 /O2 -QxT -tp core2 -O2 无
16060 7710 1938 9578
测试的结果说明,在数值计算方法,intel的编译器是非常利害的,特别是针对某CPU的优化,能提高很多性能。GCC表现却有些让人失望。在禁止优化到-O2级优化的对比中,可以看出intel与m$的编译器的优化效果是非常明显的,而其它编译器优化后的提高非常有限。如果给个排名,那么将是 icl>cl>pgcc>bcc>gcc.
另外,在一台P4 1.5G的机器,linux环境下,测试得到
gcc icc pgCC
-O2 -O2 -O2
24920000 10840000 22270000
-O0 -O0 -O0
28290000 19210000 24320000
-march=pentium4 -O2 -xN -tp piv -O2
24990000 6640000 22150000
同样,还是intel的表现最好,而gcc最差。
又在Athlon X2 4800+, Linux上测试,得到下表
gcc icc pgcc
-O0 -O0 -O0
9390000 14950000 9950000
-O2 -O2 -O2
8910000 9240000 9400000
-march=amdfam10 -O2 -msse3 -O2 -tp k8-32 -O2
8800000 3800000 9030000
虽然icc主要是针对intel的处理器,但只要优化选项找对,同样能带给amd cpu性能的巨大提高。gcc也回归到普通水平。奇怪的是pgi的编译器,估计是我还没找到好的选项吧。
总结看来,在数值计算方法,“最快”的选择应该属于intel.