Test architektur

Obsah

Maly test - uplne ten samy zdrojak a pouze spusteny na ruznych kombinacich stroju/prekladacu. Nelze ovsem porovnavat dobu vypoctu, protoze kvuli zachovani uplne stejnych podminek jsme napriklad na jednom procesoru AMD spustili 16 procesu - zajimala nas tedy spise kvalita vysledku. Vsechno je provadene na narrow bandu.

Nejdrive porovnani na 16 procesech v plne prekladacske polni. Vzajemne hausdorfy vysledku. Hodnoty kolem e-3 jsou pocatecni hladina, e-6 je vysledna hladina. Opet pripominam, ze e-6 je nejpresnejsi rad, ktery se uklada.


IBM
KFE
AMD
IBM
X
4.28e-6
5.39e-6
KFE
1.51e-3
X
2.69e-6
AMD
1.51e-3 1.26e-3
X

A ted to same, ale s komplet vypnutyma optimalizacema - tentokrat uz i pocatecni podminka je "korekt".


IBM
KFE
AMD
IBM
X
3.6e-6
1.4e-6
KFE
1.8e-10
X
3.7e-6
AMD
1.8e-10
1.8e-10
X


Test IBM prekladace:
Parametry
Doba
-O3 -qnostrict -qarch=pwr3 -qipa -Q
2633
-O3 -qstrict -qarch=pwr3 -qipa -Q
2816
-O3 -qstrict -qarch=pwr3 -qnoipa
3146
-O2 -qarch=pwr3 -qnoipa
3262
-O -qarch=pwr3 -qnoipa
3369
-qarch=pwr3 -qnoipa
4503
<nic>
4659

Test ICC prekladace (KFE):
Parametry
Doba
-O3 -ipo -ip -xW -tpp7 580
-O3 -ipo -ip -xW
578
-O3 -ipo -ip 648
<nic>
869

Test GCC (v2.96 - nelze predat parametr arch=p4) prekladace [KFE]:
Parametry
Doba
-O3 -Wall
1202
<nic>
1193

Test GCC (v3.2.2) [Jerryho pokusny komp]:
Parametry
Doba
-O3 -Wall -mcpu=athlon-xp -fast-math
4883
-O3 -Wall -mcpu=athlon-xp
6062
<nic>
9945

Volba -fast-math muze trochu menit numericke vysledky oproti ISO, takze se doporucuje spise nepouzivat - podivali jsme se tedy, jak se od sebe lisi verze -O3 bez a s -fast-math.

Hladina
Zmena
0.0000
1.79e-10
0.7000
9.49e-7
1.4000
1.25e-6
2.1000
1.37e-6
2.8000
1.00e-6
3.5000
1.00e-6

Myslim, ze neni duvod tuto volbu nepouzivat - ciste pro jistotu jsme se ale rozhodli je vypustit (stejne na AMD napocitame temer nic)