Nvidia Quadro GP100, más cálculo, Big Pascal, HBM2 y NVLink

Publicado por Fabio Baccaglioni el 07/02/2017 a las 12:03 (865)


No toda placa de video se utiliza para jugar, las Quadro de NVidia son para trabajar (bueno, algún tirito cada tanto), y hoy anunciaron el lanzamiento y disponibilidad de la Quadro GP100 que lleva el mismo GPU de la Tesla P100 pero con varios cambios para ser utilizadas en workstations.

Con un formato similar a las demás placas, interfaz PCIe estándar, tiene varios cambios con respecto a la anterior Quadro P6000 que fue la última top-end de la marca. La GP100 cambia en arquitectura donde antes se tenían núcleos CUDA de precisión simple FP32, ahora integran en los Streaming Multiprocessor los FP64 de doble precisión, 32 por SM, esto, siempre según la marca, implica unos 5 Teraflops en FP64.

La memoria utilizada también cambia, ahora son 16GB ECC HBM2 con un ancho de banda de 720GB/s cuando la P6000 tenía 24GB. Esto puede implicar problemas para aquellos que venían trabajando con set de datos enormes pero para ello NVidia apuesta al NVLink para conectar múltiples GPUs en vez del conector SLI que tienen las placas gamers, mejorando el intercambio de datos (y la latencia) sin afectar la compatibilidad con PCIe.

Quadro GP100 Quadro P6000 Quadro P5000 Quadro P4000 Quadro P2000 Quadro P1000 Quadro P600 Quadro P400
CUDA Cores 3,584 3,840 1,792 2,560 1,024 640 384 256
Texture Units 224 240 160 TBC TBC TBC TBC TBC
ROPs TBC 96 64 TBC TBC TBC TBC TBC
Boost Clock ~1430MHz ~1560MHz ~1730MHz ~1480MHz ~1470MHz ~1400MHz ~1430MHz ~1170MHz
Memory Bus Width 4096-bit 384-bit 256-bit 256-bit 160-bit 128-bit TBC TBC
Memory Speed 1.4GHz 9GHz 9GHz TBC TBC TBC TBC TBC
Memory Bandwidth 720GB/s 432GB/s 288GB/s TBC TBC TBC TBC TBC
Memory Size 16GB HBM2 24GB GDDR5X 16GB GDDR5X 8GB GDDR5 5GB GDDR5 4GB GDDR5 2GB GDDR5 2GB GDDR5
TDP 235W 250W 180W 105W 75W 75W 40W 30W


Toda la línea Quadro recibe varias versiones menores más aprovechando el lanzamiento, las P4000, P2000, P1000, P600 y P400 en un variado set de cores y TDPs para todos los gustos, incluyendo varias lo suficientemente pequeñas para servidores con poco espacio, todas con fechas a partir de Marzo.

La GP100, obviamente la que será más cara, estará disponibile a partir de marzo con un precio que rondará los USD 6200, si, nunca barato esto.

Via ARSTechnica

AMD anuncia nuevos procesadores gráficos para Machine Learning y AI

Publicado por Fabio Baccaglioni el 12/12/2016 a las 17:00 (5167)
Uno de los nichos más interesantes para los procesadores gráficos son, curiosamente, los servidores orientados a inteligencia artificial. AMD está lanzando su línea Instinct, nombre bien marketinero para definir la línea de productos orientados a deep learning, inteligencia y entrenamiento.

Los GPU van acompañados de librerías y frameworks open source, algo imprescindible para ganar mercado, llamado MIOpen.



Las placas nuevas son las Radeon Instinct MI6, MI8 y MI25 donde el número es más o menos un indicador de la performance en TeraFLOPS (FP16), La MI6 está basada en el GPU Polaris y cuenta con 16GB de memoria con un máximo de 224GB/s de ancho deb anda y alcanzando unos 5.7TFLOPS por debajo de los 150 Watts. La MI8 se basa en las Fiji alcanzando los 512GB/s con 4GB de memorias HBM, la performance alcanza los 8.2TFLOPS con un consumo menor a 175Watts.

El modelo mayor es la MI25 que se basa en el nuevo GPU Vega que todavía no ha visto la luz, aquí hablamos de unos 300Watts por placa, unos 25 TFLOPS y HBM2 para las memorias aunque AMD no entró en mucho más detalle. Todas las placas brindan soporte para AMD MultiGPU (MxGPU), direccionamiento de 64-bit PCIe (Large Base Address Register) para comunicaciones entre múltiples GPUs.



Las plataformas soportadas son X86, OpenPOWER, y ARM AArch64 y además de lanzar placas obviamente AMD está trabajando con proveedores directos para que el lanzamiento incluya equipos como el de Inventec que cuenta con 120 MI25 para ofrecer hasta 3 PetaFLOPS, una barbaridad.

Más datos en Hot Hardware

NVidia Titan X llega a 10 TFlops en un chip

Publicado por Fabio Baccaglioni el 22/07/2016 a las 14:30 (6081)


Todo comenzó como una apuesta entre uno de los mayores ingenieros de NVidia, Brian Kelleher, al CEO de la empresa, Jen-Hsun Huang para ver si podían meter de alguna forma 10 TFlops de capacidad en un solo chip. Y aparentemente lo lograron.

La nueva Titan X basada en el GPU Pascal GP102 cuenta con 12.000 millones de transistores, una bestialidad para cualquier procesador, tengan en cuenta que un i7 Skylake tiene 1750 millones y el CPU con más transistores, el SPARC M7, tiene 10.000 millones.

La nueva placa Titan X supera a la anterior en cantidad de núcleos CUDA pasando de 3072 a 1.08GHz a unos 3584 con un clock en 1.53GHz, además de 44 TOPS INT8 (instrucciones para deep learning), 12GB de memoria GDDR5X (un ancho de banda de 480GB/s), todo esto le da un máximo de 11 TFlops en FP32.

Estará disponible a partir de agosto a USD 1200 y su uso no es precisamente jugar, la idea de esta placa es procesamiento e inteligencia artificial.

Via Hot Hardware

NVidia lanza la GTX 1060

Publicado por Fabio Baccaglioni el 07/07/2016 a las 19:07 (5325)


Para competir con la AMD RX480 nada mejor que tomar la última placa y vender una en ese rango, aun así la GTX1060 es más cara, en el rango de los USD 250, pero a ese precio está entregando la potencia de una GTX980 de la generación anterior a una fracción del precio.

Para darles una idea, la GTX 980 de 2014 costaba unos USD 550 al lanzamiento, la evolución es más que interesante y empezará a llegar al mercado a partir del 19 de Julio con una edición "Founders" a USD 300.

Por dentro utiliza el GPU Pascal fabricado a 16nm, 6GB de GDDR5, clock máximo de 1.7GHz, 1920 cores ccontra las GTX1080 y 1070 que tienen 2560 núcleos. La GTX 980 tenía 2048.

Desde ya que es competencia directa contra la RX480, habrá que esperar los benchmarks no oficiales para ver quien sale airoso, o la de AMD levemente más barata o la nueva de NVidia.

AMD responde a las críticas de consumo de la RX480 con actualización rápida de drivers

Publicado por Fabio Baccaglioni el 06/07/2016 a las 15:30 (6328)


Desde hace unos días varios blogs comentan un detalle no menor de la AMD Radeon RX480, exceso de consumo en conectores que no estan diseñados a tal efecto.

La nueva placa de AMD toma más corriente del puerto PCI-E del que está definido en las especificaciones y, si bien la mayoría de los motherboards de alta calidad tienen cierta tolerancia, es un riesgo muy alto para todo el hardware del equipo.

El diseño de la placa indicaba 150W de consumo pero en varios juegos supera ampliamente los 170W y toma del slot PCI-E 90W cuando el máximo es 75W, en algunos juegos como Witcher 3 la placa consume hasta 190W si se la overclockea , algo habilitado desde el panel de control de la app de AMD.

Del slot PCI-E, donde el amperaje máximo es de 5.5 Amperes llega a tomar 7 Amperes, en el caso de motherboards económicos es casi una sentencia de muerte en el mediano plazo, por ende AMD publicó hoy un nuevo update de sus drivers.

En un comunicado hizo saber que no sólo bajarán por driver el consumo en dichos puertos del motherboard (la energía en exceso debería tomarse de los conectores directo a la fuente, no del mother) con el Radeon Software 16.7.1 y que empezará a distribuirse en las próximas 48 horas.

La reacción de la firma fue rápida y si se configura la placa momentáneamente en rangos de calidad o velocidad menores no debería quemar nada, además el update, según AMD, trae varias optimizaciones para mejorar performance en general por lo que lo que se quite de energía, según ellos no impactará en la performance de la placa.

AMD Radeon RX 480, VR y performance a precio accesible

Publicado por Fabio Baccaglioni el 29/06/2016 a las 20:31 (6798)


No todo es super GPUs, para el resto de los humanos acceder a una placa de video decente no debería implicar la venta de un órgano, la RX 480 es la solución.

Con un costo de apenas USD 200 puede entregar 1440p para VR, algo que normalmente requiere casi el doble (alrededor de USD350) por placa.

La RX 480 es simple por fuera pero por dentro el proceso de fabricación del GPU es de 14nm para la arquitectura Polaris con clock de 1120Mhz y turbo de 1266Mhz, en modelos de 4GB u 8GB (USD 239).

Specs en detalle, 36 unidades de cómputo, 144 unidades de textura, 32 ROPS, core a 1120Mhz, bus de 256 bits, memoria a 8 o 7GHz, GDDR5,



Posee salida HDMI 2.0b, 3x DisplayPort 1.3 HBR3, FreeSync para 4K, 5K a 60Hz, HEVC de 10 bits con soporte para VP9, HEVC y MJPEG, soporte para DirectX12.

Además habrá modelos más simples como la RX470 y RX460 con precios más bajos todavía, pero la 480 abre la puerta de un VR accesible en alta calidad. ¿Y NVidia? Tranquilos, que esto siempre implica respuesta de su rival, ¡obvio!

Nvidia GTX 1080 y 1070

Publicado por Fabio Baccaglioni el 09/05/2016 a las 19:05 (2137)


Como siempre que se hace un anuncio de un nuevo equipo de última línea uno espera mayor potencia, NVidia promete y dice cumplir no sólo con mayor potencia que la Titan X sino la mitad de precio, y eso sí suena raro, canibalizando su propia línea de productos.

La arquitectura Polaris ofrecería performance para VR a un precio accesible (en la 1070) pero según la marca ambas placas son más potentes que la GTX Titan X y la GTX 980 Ti (USD 1000 y USD 650 cada una), Nvidia inclusive afirma que la GTX 1080 tiene el doble de performance que la Titan X.

La combinación entre el GPU Pascal, con un proceso de 16nm FinFET de TSMC, sumado a memorias GDDR5X es el punto fuerte de esta placa dando hasta un ancho de banda de hasta 10Gbps.

La performance según NVidia no sólo es el doble en lo absoluto sino que en consumo eléctrico bajaría hasta un tercio, gracias al nuevo proceso de TSMC. En total ofrecerá 9 TFLOPS (punto flotante, precisión simple) con 7.200 millones de transitores, comparado con los 7 TFLOPS de la Titan X que cuenta con 8.000 millones de transistores. La GTX 1070 estaría en los 6.5 TFLOPS pues cuenta sólo con GDDR5.

Los precios son super interesantes, si bien son un poco más caros que los modelos que vienen a reemplazar, en costo/performance son más baratos que los que verdaderamente reemplazan (si es que cumplen con la promesa de performance).

La GTX1080 se venderá a USD 599 a partir del 27 de Mayo y la GTX1070 a partir de los USD 379 desde el 10 de Junio, esta última es la que seguro más interés generará por estar en un costo relativamente mediano y con una performance mucho más alta que varias de gama alta actuales.

Via ARStechnica

Nvidia Tesla P100 y su sistema de Deep Learning

Publicado por Fabio Baccaglioni el 08/04/2016 a las 18:40 (1748)
Esta semana NVidia anunció dos cosas, primero y principal su nuevo núcleo para trabajo profesional, la Tesla P100, y segundo el sistema donde usar varias de éstas, el NVIDIA DGX-1.



El P100 es un GPU para investigación y procesamiento numérico, no es para jugar claramente, utilizando la arquitectura "Pascal" y el nuevo proceso de TSMC de 16nm FinFET.

Esto último es lo que le permitió a NVidia incorporar la bestialidad de 15.300 millones de transistores porque al salir de 28nm en vez de achicar aprovecharon el nuevo espacio disponible para agregarle más.

La memoria soportada es la última versión, la segunda, de High Bandwidth Memory, con HMB2 buscan aumentar considerablemente la capacidad aunque son memorias más caras que recién ahora produce en masa Samsung.

La P100 alcanza unos 21.2 teraflops en FP16, 10.6 teraflops para FP32 y 5.3 teraflops en FP64, un 30% más que la Tesla X o la M40.

El ancho de banda de las memorias alcanza los 720GB/s con un bus de 4096 bits, y todavía no es la versión final del core Pascal, el GP100 es más completo, con 60SMs en vez de 56, pero es casi el modelo final.



Todo esto aplicado en paralelo en el nuevo DGX-1, el Deep Learning System de Nvidia que cuenta con dos Intel Xeon E5-2698 v3 de 16 núcleos a 2.3GHz cada uno, 512GB de RAM DDR4, 4 unidades SSD con 1.92TB, dual 10GbE y ocho Tesla GP100, unos 28672 núcleos CUDA en un sólo equipo, ofreciendo unos 170 teraflops en total.

Esta besia es también una barbaridad de consumo, 3200W por unidad pero el precio es enorme tabién, USD 129.000 cada DGX-1.

El DGX-1 se lanza en Junio, y considerando el volumen pequeño de espacio es fácil poder tener un gran centro de cómputo y cálculo en un espacio pequeño. Claramente 130k es mucho para cualquiera de nosotros, pero a nivel granja de servidores es normal y el foco de NVidia es proveer de hardware para las herramientas de Deep Learning que estan muy de moda últimamente.

En el mediano plazo la arquitectura Pascal pasará también a las placas de video normales para consumidores, la rumoreada GTX1080 por ejemplo, pero lo más probable es que utilicen GDDR5 o GDDR5X en vez de HBM.

Más data en ARS

Razer Core

Publicado por Fabio Baccaglioni el 18/03/2016 a las 19:09 (1741)
Razer no sólo apunta a notebooks para gamers, hay algo más gamer todavía, el Core es un chasis para eGFX (external graphics) y es lo más gamer que he visto para aquellos que contamos con una notebook con GPU limitado.

Esta "caja" permite conectar varias placas de video profesionales vía Thunderbolt 3 sean tanto de NVidia como AMD.



Cabe aclarar que no todas las placas entrarán pero si son simples o de doble ranura ya entran, no las que tienen radiadores externos, claro

El gabinete mide 310x152x44mm, acepta hasta un consumo de 375W en un PSU de 500W, cuenta con cuatro puertos USB 3.0, salida Gigabit Ethernet, carga de notebooks desde el Thunderbolt 3, incluye el cable y obviamente no es, todavía, para cualquier notebook ni placa de video, tiene un rango limitado de posibles usuarios, pero eso no implica que no tenga soporte para más equipos en la medida que certifiquen más marcas.

A ver, es relativamente portable, pero la idea de Razer no es que lleves una caja enorme con placas de video de aquí para allá el Core carece de una manija para levantarlo, la idea es que la portabilidad esté en la notebook y el Core sirva como el docker que tenés en casa para jugar y separar.



Las dos notebooks que lo soportan, por el momento, son la Razer Blade Stealth y la Blade de 2016 y, obviamente, todas las futuras máquinas de Razer que tendrán certifiación para eGFX.

Las placas de video que acepta son las GeForce GTX Titan X, GTX 980 Ti, GTX 980, GTX 970, GTX 960, GTX 950, GTX 750 Ti de NVidia y las Radeon R9 Fury, R9 Nano, R9 300 Series, R9 290X, Radeon R9 290, Radeon R9 280 de AMD.

A partir de Abril estarán en el mercado y aquellos que compren el Core junto a una notebook de Razer pagarán "sólo" USD 399, por separado costará USD 499, nada barato pero considerando el público de nicho al que apunta y que, además, necesita una o dos placas de video bestiales por dentro, es obvio que no es para el que tenga probemas económicos.

Via Anandtech

AMD Lanza nuevas placas en E3, R9 Fury X, Fury y Nano

Publicado por Fabio Baccaglioni el 17/06/2015 a las 19:43 (3437)
Todos los modelos estan basados en la última versión de su GPU, el Fiji, que provee mayor performance por watt, mejoras en la arquitectura GCN y soporte para la memoria estackeada HBM. El monstruo en este lanzamiento es la R9 Fury X de USD 649 que saldrá al mercado el 24 de Junio.



La Fury X apunta directamente a la NVidia GTX 980 Ti y cuenta con 4096 stream processors saltando de los 2816 de la R9 290X, el clock hasta 1050MHz junto a 256 unidades de texturas, 64 ROPs, memoria HBM (hasta 512GB/s de ancho de banda), 67.2 Gigapixeles/s, regulador de voltaje de seis fases y posibilidad de overclocking.

El TDP no es tan pesado como se podría esperar, ronda los 275W, aunque soporta overclocking hasta los 375W. El cooler es de aluminio con terminaciones nickeladas negras y el tamaño se achica notablemente gracias al uso de memorias apiladas HBM en vez de GDDR5, se achica a apenas 19cm aun empacando unos 8900 millones de transistores. Luego de acortar lo que sigue es un sistema de watercooling con caños que llevan a un radiador de 120mm con soporte hasta 500W máximo.

Cuenta con tres salidas DisplayPort y una HDMI 2.0.

El modelo que le sigue es la R9 Fury de USD 549 que, si bien es una placa más bien normal, cuenta también con cuerpo de aluminio pero sin mayores detalles por parte de AMD, también se espera en algún momento un GPU doble en esta arquitectura.



Pero lo más llamativo es, sin dudas, la R9 Fury Nano, con apenas seis pulgadas de largo (15cm), un tamaño típico de placas de baja potencia, y obviamente gracias a las memorias HBM y con un sólo conector de 8 pines y slot PCIE normal y un diseño de 175W

Lo único malo de la Nano es que en vez de venderla directamente AMD enviará el diseño a los fabricantes de placas de video para que comercialicen ellos la mini super placa, una pena porque estaría bueno verla por parte de AMD.

Además de estos lanzamientos presentaron una PC con diseño extravagante llamada Project Quantum con dual Fury X con dos módulos separadosm uno para CPU y otro para GPU, pero es otro diseño que le pasan a fabricantes para que éstos decidan qué hacer con él.

Para usuarios con menores presupuestos AMD también anunció renovación en la línea R9 y R7 con varios modelos 300 que son los 200 remarcados con idénticas specs, aumentando memoria solamente.

Via ExtremeTech y Arstechnica

87 Noticias (9 páginas, 10 por página)



Powered by
Cake Division