Resultados del Embench-IoT en GaZmusino

El rendimiento de un microcontrolador o core RISC-V se puede medir de muchas maneras, pero Embench-IoT se ha consolidado como un benchmark de referencia para sistemas embebidos y aplicaciones de IoT. En este post compararemos el desempeño de nuestro core GaZmusino, evaluado mediante simulación con Verilator, frente a los resultados reportados por Antmicro en su plataforma Embench-Tester.
Resumen rápido: GaZmusino es competitivo en la mayoría de benchmarks, pero las operaciones que requieren divisiones pesadas muestran retrasos debido a la ausencia de divisor hardware.
🔧 Metodología
La comparación se basó en los siguientes enfoques:
- GaZmusino: simulaciones realizadas utilizando Verilator para obtener los tiempos de ejecución de cada benchmark.
- Antmicro: resultados públicos disponibles en la plataforma Embench Tester, que reporta el rendimiento de varios cores open-source.
- Compilador y flags: se utilizó riscv64-unknown-elf-gcc 14.2.0 con optimización -O2. Versiones diferentes pueden alterar ligeramente los tiempos de ejecución.
📊 Resultados
La siguiente tabla es scrollable tanto horizontal como vertical, para poder visualizar todos los benchmarks y cores.
Benchmark | GaZmusino | cv32e40p | CVA5 | VexRISCV | serv | picorv32 | Ibex | Rocket | microwatt |
---|---|---|---|---|---|---|---|---|---|
cubic | 10 | 24 | 46 | 239 | 2 | 8 | 15 | 23 | 26 |
nbody | 14 | 45 | 90 | 1597 | 2 | 14 | 39 | 52 | 108 |
st | 18 | 43 | 86 | 907 | 2 | 11 | 21 | 45 | 62 |
minver | 24 | 38 | 82 | 334 | 2 | 13 | 27 | 62 | 77 |
nsichneu | 57 | 39 | 67 | 111 | 6 | 12 | 31 | 57 | 55 |
wikisort | 65 | 65 | 166 | 242 | 14 | 23 | 33 | 85 | 98 |
crc32 | 77 | 41 | 92 | 92 | 25 | 15 | 40 | 72 | 68 |
nettle-aes | 77 | 38 | 90 | 71 | 27 | 17 | 29 | 47 | 93 |
ud | 77 | 36 | 79 | 73 | 11 | 15 | 27 | 59 | 65 |
aha-mont64 | 75 | 46 | 82 | 131 | 7 | 14 | 31 | 74 | 71 |
nettle-sha256 | 82 | 40 | 93 | 62 | 39 | 5 | 33 | 60 | 41 |
picojpeg | 86 | 37 | 94 | 94 | 15 | 17 | 25 | 61 | 77 |
edn | 89 | 42 | 90 | 90 | 2 | 10 | 24 | 77 | 52 |
matmult-int | 90 | 39 | 90 | 91 | 3 | 13 | 21 | 62 | 44 |
primecount | 112 | 60 | 93 | 127 | 9 | 18 | 36 | 81 | 85 |
sglib-combined | 121 | 45 | 101 | 98 | 19 | 21 | 33 | 74 | 63 |
qrduino | 123 | 54 | 115 | 113 | 21 | 22 | 35 | 79 | 80 |
slre | 125 | 55 | 131 | 139 | 23 | 25 | 39 | 82 | 87 |
huffbench | 126 | 46 | 115 | 119 | 44 | 28 | 35 | 96 | 76 |
md5sum | 159 | 64 | 153 | 137 | 56 | 32 | 65 | 115 | 115 |
tarfind | 228 | 38 | 143 | 77 | 16 | 20 | 33 | 88 | 70 |
statemate | 298 | 52 | 181 | 203 | 19 | 24 | 40 | 101 | 95 |
Benchmarks ordenados por rendimiento en GaZmusino
📝 Conclusiones
-
Fortalezas de GaZmusino
- Muy competitivo en
md5sum
,qrduino
,slre
,huffbench
,tarfind
ystatemate
. - Supera consistentemente a cores ligeros como serv, picorv32 e Ibex.
- Muy competitivo en
-
Limitaciones detectadas
- Rendimiento bajo en
cubic
,nbody
,st
yminver
. - Causa principal: ausencia de divisor hardware, las divisiones se resuelven en software aumentando latencia.
- Rendimiento bajo en
-
Comparativa global
- Nivel medio-alto de rendimiento, acercándose a cores complejos como VexRISCV y CVA5.
- Sólido en enteros, memoria y lógica; débil en divisiones.