c -----------------------------------------------------------------
c Corridas con el "machi.dat":
c
c [ node4 node10 node11 node2 node3 node5 node6 node7 node8 ]
c
c 1 Caso 1: Linpack Benchmark en el pentium IV:
c
c 1.1 Linpack BenchMark para n=100 modificado (por Mario)
c para una mejor estadistica en la medicion de los
c tiempos:
c
c programa: lb100dl.exe para n=100 (modificado)
c
c [jdelia@node4 MARIO]$ lb100dl.exe
c
c On iter 1 ttot: 29.30421999789542
c On iter 2 ttot: 30.86016397777712
c On iter 3 ttot: 32.51111894520000
c Elapsed: 27.74828 per iter: 2.7748274E-03 rate:
c 247.4628235224679 [mflops]
c FORTRAN STOP
c
c 1.2 Linpack BenchMark para n=100 provisto por PGI y con una
c modificacion parecida a la de Mario para una mejor
c estadistica en la medicion de los tiempos:
c
c programa: linpkrd.exe para n=100 (provisto por PGI)
c
c jdelia@node4 LINPACK]$ linpkrd.exe
c
c norm. resid resid machep x(1)-1 x(n)-1
c 1.89264926E+0 8.39916E-14 2.22045E-16 -6.2284E-14 -4.163E-14
c
c times are reported for matrices of order 100
c sgefa sgesl total Kflops unit ratio
c
c times for array with leading dimension of 201
c 0.00269 0.00012 0.00280 244897. 0.00817 0.05007
c 0.00267 0.00011 0.00278 246561. 0.00811 0.04973
c 0.00278 0.00011 0.00289 237268. 0.00843 0.05168
c 0.00278 0.00000 0.00278 246971. 0.00810 0.04965
c
c times for array with leading dimension of 200
c 0.00272 0.00011 0.00284 242038. 0.00826 0.05066
c 0.00268 0.00011 0.00278 246647. 0.00811 0.04971
c 0.00267 0.00011 0.00278 246736. 0.00811 0.04970
c 0.00278 0.00000 0.00278 246734. 0.00811 0.04970
c
c ROLLED DOUBLE PRECISION LINPACK PERFORMANCE 246734 KFLOPS
c FORTRAN STOP
c
c 2 Caso 2: Solucion por Gauss del Sistema de Ecuaciones
c Algebraicas Lineales (SEAL) A x = b de
c dimension "n", por distribucion de datos con
c HPF, como programa fuente, y MPI como paso de
c mensajes (indirectamente por uso de libreria):
c
c 2.1 corridas para 11 valores de "n" en p = 8 procesadores,
c con "tpo" en [seg.]
c n tpo MFlops
c 1 1000 14 47
c 2 1200 21 56
c 3 1400 29 64
c 4 1600 39 71
c 5 1800 50 78
c 6 2000 66 83
c 7 2200 83 86
c 8 2400 103 90
c 9 2600 125 95
c 10 2800 149 98
c 11 3000 185 98
c
c 2.2 Speedup en solucion por Gauss (bajo por intensa comunicacion):
c
c n = 2500 ; numero de incognitas
c p ; numero de procesadores
c r = 50 ; MBytes para toda la matriz A
c d = r / p ; MBytes de la matriz A en cada nodo
c
c p 1 2 3 4 5 6 7 8 9
c d 50 25 16.7 12.5 10.0 8.4 7.2 6.3 5.6
c MFlops 28.1 41.9 58.1 70.8 82.6 89.1 91.6 92.4 90.9
c speedup 1.0 1.5 2.1 2.6 2.9 3.3 3.3 3.2 3.2
c
c -----------------------------------------------------------------
--
MarioStorti - 25 Mar 2002