Que las placas de video hacen cálculos de punto flotante más rápido que un procesador de uso general ya lo hemos comentado varias veces, así será que en el TOP500 de supercomputadoras la más potente de todas, la Titan – Cray XK7 cuenta con unos 18000 Opteron 6274 16C de 2.200GHz pero también con unos 18688 NVIDIA K20x logrando 17.59 Petaflops
La NVidia K20X consiste de un GPU GK110 dedicado para HPC con 7100 millones de transistores, una bestialidad considerando que el GK104 tiene 3540 millones, además suma la capacidad de emparejar operaciones de doble precisión (la Fermi anterior no podía), y el número de registros en cada thread se ha cuadruplicado de 63 a 255, los threads pueden compartir datos y además suma operaciones como Dynamic Parallelism e Hyper-Q. El Dynamic Parallelism es básicamente poder abrir nuevos threads sin avisarle al CPU reduciendo la latencia notablemente.
El Hyper-Q es un poco más complejo pero en síntesis permite trabajar con múltiples GPU sin cuellos de botella cuando se serializan los datos artificialmente, distribuye correctamente y en vez de hacer una cosa a la vez permite sacarle provecho al GPU haciendo hasta 32 a la vez.
Cada core tiene 15 SMX y dentro de cada uno de estos hay 192 núcleos CUDA, unos 2688 en total, 32 unidades de carga y almacenamiento, 16 unidades de textura y 4 schedulers warp, el bus de datos es de 384bits (la K20 queda en 360 bits). Está claro que no es una placa de video para jugar, es una placa de cálculo, con unos 1.31 Teraflops en punto flotante de doble precisión, 3.95 teraflops en los de simple precisión, con el modelo K20 un poco menor para workstations y el K20X para servers, a diferencia del K10 anterior aquí tenemos un sólo GPU (contra dos), por ende menos consumo, y mucha más potencia en punto flotante doble (diez veces más potencia ya que la K10 llegaba a 0.19 teraflops solamente) aunque un ancho de banda de 250GBytes/segundo contra los 320GB anteriores. La placa cuenta con 6GB de memoria GDDR5.
Por su parte AMD también está a full lanzando la FirePro S10000, una bestialidad que pueden comprobar en la imagen, con doble GPU Tahiti, core a 825Mhz, y potencia en el rango de los 1.48 Teraflops para doble precisión y unos bestiales 5.91 Teraflops en precisión simple.
También con interfaz de 384 bits pero un ancho de banda de 480GB/s (contra 250 del rival), 6 GB de GDDR5, y un consumo energético elevado por utilizar dos GPUs, 375Watts (la K20X ronda los 250W), pero AMD no está apuntando al mercado HPC en sus GPU, estan con suficientes problemas como para evitar competir directamente con Intel y NVidia así que apuntan al mercado de virtualización de video, esta sí es una placa de video.
Para AMD está más complicado, hasta que no apunten la línea de GPUs HD8000 para este lado se le va a hacer cada vez más cuesta arriba alcanzar las placas de Nvidia, no es que no tengan el potencial, es que no tienen el dinero y estan en una situación económica complicada aun teniendo a la mejor supercomputadora con procesadores Opteron, no alcanza.
Via Slashdot
but, can it run crisis?
AMD no viene haciendo las cosas bien en el mercado hogareño, rinde menos en CPU y vende mal sus GPU, una pena, mientras, le pegan por todos lados
las desventajas de abrir competencias en distintos frentes y perder fuerza
todavia pueden aprovechar la movida de OpenGL y apoyar el desarrollo de algo que les conviene, pero no librandose de sus desa en GNU/Linux como hizo
http://www.phoronix.com/scan.php?page=news_item&px=MTIyMDQ
y tomar envion despues del dedo-Torvalds vendiendo compatibilidad y buen rendimiento
como el HPC es otra historia y no me dedico, no opino, despues llamare al que sabe
http://paralelizados.com