No es una empresa muy conocida pero Graphcore ya tenía un procesador dedicado a este tipo de tareas numéricas y ahora da varios pasos adelante con su GC200 que se transforma en el CPU de cómputo más complejo en el mercado, unos 59.400 millones de transistores, 1472 núcleos y 8832 threads en un tamaño de “apenas” 823 milímetros cuadrados.
Está fabricado por TSMC en su proceso de 7nm e integrado en la IPU Machine M2000, el equipo que lleva varios de estos procesadores orientado especialmente a Machine Learning y AI, con un petaflop por cada rack.
Según la firma se pueden interconectar hasta 64.000 IPU en paralelo alcanzando unos 16 exaflops. Sus principales rivales como NVidia o Intel no son precisamente pequeños y esta empresa tiene todavía mucho por demostrar (porque los números van y vienen, los resultados en el mundo real importan).
Al parecer son equipos listos para usar y no se requiere un cambio relevante de infraestructura para sumarlos a nodos existentes, eso es importante porque aparecer de la nada sin compatibilidad sería un suicidio en este mercado tan particular.
Cada procesador tiene unos 900MB de memoria interna (lo que es una rareza) y eso permite menores latencias además de un interconectado 3D para stackear más núcleos con la ventaja de estar hecho en 7nm. Pero, obviamente, es un anuncio de prensa donde falta MUCHA información relevante como la performance por watt que, en este sentido, suele ser lo más relevante. Los primeros equipos llegarán a los clientes para el Q4 2020 así que, al menos, habrá forma de ver benchmarks este año.