Intel presenta un Xeon integrado a un FPGA

Publicado por Fabio Baccaglioni el 19/06/2014 a las 14:52 (1851)


Ayer Intel anunció uno de los mayores cambios en su línea Xeon con el nuevo modelo en formato FPGA para el socket estandar E5 LGA2011 pero integrado con un FPGA ¿Qué es FPGA?

Los procesadores FPGA (field-programmable gate array) permiten ser reprogramados para funciones específicas, son típicos para GPGPU y aceleradores, ASIC, y para controladores programables, ahora bien, aquí estamos hablando de un procesador de uso general utilizado de esta forma.

Piensen en un procesador creado específicamente para una tarea, no para muchas, una en particular, esto acelera procesos muchísimo, un ejemplo son los ASIC dedicados a Bitcoin.

Estos Xeon+FPGA irían acompañados de procesadores normales de uso general para ordenarle qué tareas realizar pero lo interesante de esta forma de presentarlo es que son reprogramables, es decir, una vez terminada la tarea específica se puede reorganizar su estructura para el siguiente trabajo y no gastar en nuevo hardware.

No será un procesador similar a un Xeon actual, seguramente fabricado por Altera pero con el soporte y diseño de Intel y el packaging para el slot LGA2011 dentro de un E5 integrando por una interfaz coherente de baja latencia.

Una vez más Intel busca que los usuarios no se vayan de x86 y eviten pasarse completamente a OpenCL u otras alternativas de GPGPU. En un futuro hasta podría ser algo común tener un CPU con partes programables, veremos si funciona este proyecto de Intel que ya ha intentado algo parecido con los Xeon Phi pero nunca tan dedicado en un mismo socket.

Via Extreme Tech

Adiós a los smartphones para NVidia

Publicado por Fabio Baccaglioni el 26/05/2014 a las 11:04 (1198)


Los Tegra ya no los veremos en ningún celular, tampoco es que los tengamos a nuestra disposición, hace tiempo que Qualcomm, Samsung, Mediatek, TI y tantos otros compitiendo en el mercado de los ARM hace casi imposible operar en ese mercado. Lamentablemente para el ecosistema estamos en un punto donde la gran variedad de oferta no parece ser lo que los fabricantes desean, simplifican, achican.

Los Tegra parecen tener futuro en los dispositivos móviles para jugar pero no mucho más, los GPU de NVidia, en cambio, tienen bastante potencial todavía y ni hablar en los casos de HPC para procesamiento de punto flotante masivo como para cálculo numérico o bitcoins.

Pero de bitcoins y consolitas baratas no vivirá NVidia, según el CEO Jen-Hsun Huang el foco se dedicará completamente al gaming pero ¿Cómo podrá sobrevivir si las consolas de videojuegos utilizan productos de AMD exclusivamente?

Otro mercado donde el CEO indica que se enfocarán es el de automóviles donde el Tegra tiene más chances, pero para Huang el hecho de haberse dedicado a procesadores de alto nivel y performance ha hecho que el Tegra 4i no sea exitoso en celulares donde el mercado se estabilizó en procesadores limitados pero rentables como los Cortex-A7 de cuatro núcleos (ej: Moto G), y sólo un segmento muy pequeño en los de alto perfil (Exynos, Snapdragon 800), lo que no les dejó margen.

¿Habrá un Tegra 5? Huang no lo confirma porque dice que no habla de proyectos futuros que no anunciaron pero todo hace entender que si bien habrá no estará orientado a teléfonos, esa batalla ya se ha perdido.

Nota completa a Huang en CNET via Celularis

Para Julio los Intel Broadwell de 14nm al mercado masivo

Publicado por Fabio Baccaglioni el 20/05/2014 a las 13:19 (1568)


Con algunos atrasos en la cadena de producción que los obligaron a reagrupar, mejorar y atrasar el lanzamiento, los Intel Broadwell llegan para mediados de año con su proceso de 14nm, único en el mercado, nadie está en semejante proceso todavía.

El delay acercó los tiempos de Samsung, TSMC y GlobalFoundries en sus propios procesos de 14nm pero éstos llegarán igualmente 18 meses después, aunque no 24 como antes. Ahora bien, esta ventaja de tiempos le puede permitir quebrar la barrera de los ARM que se han apropiado de todo el mercado móvil.

Por otra parte el reducir el proceso no va a aumentar notablemente la performance pura, más bien la de consumo, en el CPU para desktop hablamos de una cache de 128MB L4 que probablemente termine también en los móviles, algo nunca visto hasta ahora y que le dará una ventaja con respecto a Qualcomm aunque la falta de una radio integrada sigue siendo el mayor problema.

De Clover Trail a Bay Trail hubo interesantes cambios pero ahora con Cherry Trail la cuestión busca superar notablemente esto y ser más tentador en smartphones y tablets para fabricantes, justamente tocando el tema del GPU con ocho cores basados en los que usa el Ivy Bridge, el CPU aumenta los clocks y suma mayor ancho de banda para la memoria, aun siendo una arquitectura basada en Bay Trail.

Para fin de año se hará el paso a Braswell, la nueva arquitectura Atom, aunque no hay datos conociendo el proceso histórico de Intel primero hacen cambio de proceso luego de arquitectura y siempre han sido saltos cualitativos importantes, este seguramente estará mucho mejor situado para competir contra ARM en los equipos high-end donde Intel necesita sí o sí posicionarse.

Actualmente con Bay Trail estan un 40% por debajo de un Apple A7 o un Snapdragon ¿Podrá el proceso de 14nm acercar a Intel a la cima en procesadores móviles?

AMD y ARM el dúo más extraño

Publicado por Fabio Baccaglioni el 07/05/2014 a las 11:54 (1655)
AMD está rotando totalmente su estrategia de procesadores y eso me agrada mucho, para mi es el movimiento correcto ya que quedándose solamente en procesadores x86 nunca podrán salir de la sombra de Intel, pero este "matrimonio" con ARM es extraño y jugado, y cuando alguien arriesga, para mi vale la pena prestarle atención.



El proyecto "Skybridge" busca implementar en un mismo SoC tanto un core x86 como un ARM en un mismo formato, es decir, pin compatible poder cambiar entre uno u otro depenidendo el dispositivo a usar, utilizando un A57 de bajo consumo como opción pero compatible 100% con el socket, el motherboard y todos los complementos.

Para 2015 tendremos entonces el primer SoC ARM de AMD oficial orientado a plataformas Android en vez de servidores como el proyecto Seattle que verá la luz este año (uno de ocho nucleos orientado a HPC, Cortex A-57 a 28nm), el hecho de ser compatible en pines permite una reducción notable de costos a la hora de implementación, el proceso de fabricación será de 20nm, y no es de extrañar que veamos alguna tablet de una marca que tenga una versión ARM y otra x86 en un mismo modelo porque sólo habrá que cambiar el SoC para ofrecer dos modelos distintos.



Una de las limitaciones de AMD y sus x86 es con la complejidad para fabricarlos en procesos menores a 20nm, por esta razón usar diseños de ARM tiene sentido, poder utilizar a futuro el proceso FinFET de 14/16nm, por esto para 2016 ya estan planeando el K12, un ARMv8 de 64 bits junto a un core x86 nuevo (todavía sin nombre) que iran en el mismo silicio.

Esto implica crear un nuevo diseño de x86 para reemplazar los Puma actuales pero para aprovechar además la posibilidad de alta velocidad de los dos diseños, en todos los casos incluirán GPU integrado así que AMD se está abriendo poco a poco paso en el mercado más jugoso de los últimos tiempos: móviles.

Por el momento no esperaría a ver un celular con estos SoC, hay mucho camino para competir contra monstruos como Qualcomm que tienen otra ventaja, los chips de banda base ya incorporados en el SoC, algo que AMD ni por asomo tiene e Intel está implementando poco a poco. Pero si NVidia pudo entrar a este negocio no veo por qué no AMD.

Más detalles en Anandtech

AMD Beema y Mullins, la competencia de bajo consumo contra Bay Trail

Publicado por Fabio Baccaglioni el 29/04/2014 a las 12:16 (1908)
AMD se alejó bastante del mercado mobile porque sencillamente no podía enfocarse en tantas cosas a la vez como su gran rival Intel, pero derivando el desarrollo de los Temash y Kabini han nacido dos opciones de low power que estan bastante bien posicionadas contra los Atom de Intel, los Bay Trail, ya que aprovechan la ventaja de tener un GPU potente y de mejor diseño que las opciones de Intel.



El foco de AMD ahora sí puede orientarse a el bajo consumo, algo que le ha costado mucho incluyendo la pérdida de casi todo el mercado móvil que tenían el cual sólo sostienen a base de precios mucho más accesibles, pero nada más.

Los APUs Beema son SoCs con un TDP de no más de 15Watts, desde dos núcleos a 1.35GHz a cuatro núcleos con un clock a 2.4GHz, GPU de 128 cores con velocidades de 350 a 800MHz y soporte para memorias DDR3L-1333 a DDR3L-1866. La gama de nombres E1, A4, A6 y A10 forman esta primer familia.

Pero hay otra camada, los APU Mullins con TDPs mucho más pequeños, el mayor ejemplo es el A10 Micro-6700T con un TDP de 4.5W, cuatro núcleos a 2.2GHz, el GPU a 500MHz y soporte para memorias DDR3L-1333 y el más pequeño, E1 Micro-6200T de dos núcleos, 3.95W y 1.4GHz.

En todos los casos el GPU es el GCN de 128 núcleos Radeon donde lo único que cambia es el clock y obviamente la interfaz de memoria, esto es interesante porque marca un estándar de GPU para el desarrollo entre todos los procesadores, el GPU es una gran parte del área de procesador.

Los núcleos Puma+ van acompañados de un ARM A5 de 32 bits como procesador de seguridad, con su propia ROM y RAM, ofreciendo Trusted Execution Environment (TEE), para booteo seguro en equipos rooteados y aceleración criptográfica.



En HotHardware realizaron los benchmarks mano a mano con un Intel Core i3-2377M a 1.5GHz , el Atom Z3770 a 2.4GHz y el Atom Z2760 a 1.8GHz mostrando unos resultados más que sorprendentes principalmente en el área gráfica pero también como CPU. En GPU es obvio que Intel queda muy atrás en su solución integrada aunque no hay que creer que esto es definitivo considerando el trabajo que estan realizando en los GPUs integrados de los procesadores más grandes tipo Haswell.

Vean los benchmarks en HotHardware

Los nuevos lanzamientos de Qualcomm dejan en claro que tu móvil es obsoleto

Publicado por Fabio Baccaglioni el 07/04/2014 a las 15:16 (2337)


Si creían que con un Galaxy S5 tenían todo el poder posible tan sólo esperen unos meses y ya será "viejo". Aunque soy de la teoría de que todo equipo informático llega a una meseta cuando se supera ampliamente la "necesidad" del usuario (véase desktops y notebooks, por ejemplo) los celulares todavía parecen tener un margen aunque aparente llegar también a dicho estancamiento.

Qualcomm en cambio parece querer darle un empujoncito más con el Snapdragon 810 (y el 808 en el mid range) pensados para el año que viene y con soporte de 64 bits y ocho núcleos Cortex-A57/A53.

Estos nuevos SoC serían la versión más potente de lo que hasta ahora se presentó como 610 y 615, para darles una idea de crecimiento, el proceso de fabricación será de 20nm, el objetivo son pantallas 2K a 4K de resolución, el GPU será el Adreno 430 con un 30% más de performance que el 420 que al día de hoy ni siquiera llegó al mercado todavía. El soporte de memorias es LPDDR4 y sumará procesadores de activación de voz y procesamiento de imagen dual.

Como se puede ver en el diagrama de diseño el área utilizada por los núcleos (8 en el 810, 6 en el 808) es ínfima en comparación con el resto, el GPU Adreno 430 ocupa un buen lugar pero la mayor parte se la lleva el Modem de cuarta generación LTE-Advanced Cat 6 ya integrado en el silicio con MIMO de dos canales para el WiFi.



El 808 está pensado para llevar dos cores A57 y cuatro A53 con soporte de video 2K y LPDDR3 más un Adreno 418, sería la versión intermedia entre el 810 y los 610/605. La era de los 64 bits en móviles está en casi todas las marcas aunque ningún software pueda sacarle provecho actualmente (ni el iPhone 5S que ya lo incorpora tiene RAM como para usarlo), pero si pensamos en dispositivos intermedios como tablets poderosas y demás, es posible que tengan sentido de aquí a 2015.

Con esta evolución de los procesadores basados en ARM yo miraría más hacia Intel y el "problema" que le significa que se le aproximen tanto los ARM a los x86 cuando hasta ahora la mayor diferencia era que éstos eran mucho menos potentes.

Via Engadget

Apple Cyclone, el core del A7 mucho más complejo que un Krait

Publicado por Fabio Baccaglioni el 31/03/2014 a las 17:45 (2770)
Apple liberó parte del código de LLVM y esto permitió conocer en detalle varias características del procesador A7 de 64 bits que actualmente potencia al iPhone 5S.

Lo interesante es comparar con la tecnología utilizada en el A6, una de las críticas hacia el A7 el día de su lanzamiento fue que no aumentaba la cantidad de núcleos y sólo ofrecía 64 bits como diferencial, pero por dentrgo los cambios eran más notables y si bien en performance no es muy grande la diferencia, sí lo es en arquitectura.

El A7 con los núcleos Cyclone es más parecido a un Haswell de Intel que a un Krait de Qualcomm y eso es más que relevante. El tema de los 64 bits es anecdótico y con utilidad a futuro, estos cambios también pero se notará su diferencia en las generaciones inmediatamente posteriores. La razón es que un núcleo más complejo no puede utilizar un clock tan acelerado... hasta que se cambia el proceso de fabricación. Y eso es lo que se le viene a Apple para su siguiente generación al pasar al proceso de 20nm de TSMC.



En detalle un Cyclone puede procesar hasta seis hilos simultáneamente en un diseño out-of-order, el doble que los otros diseños, el buffer de reorden pasó de 45 micro-ops a 192 micro-ops necesario para poder manejarlo así, esto agrega dos ciclos más, 16 en vez de 14, pero duplicaron las unidades ALU de enteros, además de extender hasta una tercer caché con la L3.

La diferencia no se nota en los clocks actuales pero la realidad es que fácilmente un A7 con un clock más fuerte podría desplazar sin problemas a un Octa Core aun con menos núcleos, el tema es que en el proceso actual no se puede sin quemara la batería. Lo ideal será en el ciclo A8-A9 al pasar a los ya mencionados 20nm.

Apple Custom CPU Core Comparison
  Apple A6 Apple A7
CPU Codename Swift Cyclone
ARM ISA ARMv7-A (32-bit) ARMv8-A (32/64-bit)
Issue Width 3 micro-ops 6 micro-ops
Reorder Buffer Size 45 micro-ops 192 micro-ops
Branch Mispredict Penalty 14 cycles 16 cycles (14 - 19)
Integer ALUs 2 4
Load/Store Units 1 2
Load Latency 3 cycles 4 cycles
Branch Units 1 2
Indirect Branch Units 0 1
FP/NEON ALUs ? 3
L1 Cache 32KB I$ + 32KB D$ 64KB I$ + 64KB D$
L2 Cache 1MB 1MB
L3 Cache - 4MB


Por ejemplo otra limitación era lanzarlo con memorias RAM de apenas 1GB, es un procesador que podría manejar tranquilamente 16GB si quieren, pero Apple fue extremadamente conservadora en su primer versión. Si proyectamos este diseño a futuro es plausible la idea de una total independencia de la empresa de los proveedores de microprocesadores para la mayoría de sus líneas.

Es decir, no sería de extrañar ver una Apple con procesador propio y no me refiero ni a los iPhone ni iPads sino las Macbook, algo que se ve a lo lejos pero que necesita sí o sí de una performance similar a la de un Haswell para tener sentido. Al menos en la arquitectura general se parecen.

Intel, el principal "complicado" ante estas maniobras de Apple ya ha hecho algo parecido, pasar en un sólo ciclo a tres versiones con los Saltwell/Silvermont/Airmont en el rango de apenas dos años y sigue sin poder proveer a sus clientes móviles en la cantidad que lo hace Qualcomm. Apple optó por sus propios diseños, una medida nada extraña para alguien con semejante billetera, pero ¿Podrá Intel convencerla de volver? muy difícil, ahora Apple tiene el control real.

Por otra parte el cambio de proceso a 20nm cambiará notablemente las velocidades conservadoras del A7 (entre 1.3 y 1.5GHz) y lo hará más competitivo con los Exynos y Tegras, pero con estas modificaciones de arquitectura probablemente no necesite superar los 2GHz para lograr una mayor eficiencia por ciclo, y esa será una de las mayores ventajas en el largo plazo.

Via Extremetech

Intel por dos: Iris Pro desbloqueado para desktops y un i7 de ocho núcleos

Publicado por Fabio Baccaglioni el 20/03/2014 a las 11:30 (9485)


Dos interesantes anuncios de Intel, primero el lanzamiento del Iris Pro para desktops y desbloqueado, el procesador con el GPU más potente a la fecha de Intel que hasta ahora sólo se conseguía en algunas plataformas en particular.

Esta es la primera vez que se puede acceder a un Broadwell con Iris Pro en formato socket en vez del BGA al cual podían acceder algunos OEM como Apple y Gigabyte, esto permitirá a cualquier fabricante o ensamblador hasta hogareño crear su propia PC con este particular procesador.

Lo que no aclaró Intel es si será el mismo Iris Pro HD 5200 o será uno totalmente nuevo. El Broadwell se produce en el más extremo de los procesos actuales, el de 14nm. Y no sólo eso es la noticia, vendrá completamente desbloqueado para overclockers, tanto con el multiplicador como el strap, la memoria, y los núcleos totalmente ajustables junto a un set de aplicaciones de overclocking.

El segundo anuncio es un i7 de ocho núcleos "Devil's Canyon" junto a la plataforma Intel X99. Este bestial procesador y el chipset proveeran también de soporte DDR4, siendo el primer procesador dedicado al escritorio con ocho núcleos (hay de más pero son fabricados para servers o workstations, no para este segmento aunque se pueden usar a tal fin). Ah, obviamente procesa 16 threads, el CPU ideal para los que estan renderizando 3D.

Desde ya que no existe un rival para esta plataforma, simplemente será durante unos años más la más potente para escritorio de manera indiscutida. El motherboard basado en X99 podrá ofrecer todo lo que el X79 se había dejado a mitad de camino pero todavía Intel no quiere entrar en detalles aun cuando lo está anunciando en la GDC.

Lanzar un procesador para un mercado que no existe es medio raro, pero por otra parte Intel está marcando el futuro del desktop para entusiastas, para overclockers y gamers serios, no les importa si hay o no competencia, tienen que empujar los límites más allá.

Más datos en Intel

TSMC anuncia sus primeros movimientos hacia los 16nm FinFET

Publicado por Fabio Baccaglioni el 26/02/2014 a las 16:05 (1244)
TSMC y ARM anunciaron un hito más en el camino hacia la producción de chips en un proceso FinFET de 16nm al revelar un SoC que combina cuatro Cortex-A53 y dos Cortex-A57 en configuración big.LITTLE y 16nm.



Los actuales procesadores para móviles, que no son de Intel, se producen bajo 28nm , con un 40% menos de tamaño se puede dar también un 40% más de velocidad y reducir un 55% el consumo total a la misma velocidad, al menos así lo indica ARM.

Hasta ahora la configuración típica de big.LITTLE eran entre Cortex-A7 y Cortex-A15, poder combinar los A53 y A57 es una excelente noticia para la mayoría de los fabricantes y vale aclarar que TSMC fabrica no para uno sino para casi todos los desarrolladores de ARM salvo Samsung.

Obviamente no veremos este nodo tan pronto, hasta Intel va lento con la producción de 14nm, es realmente difícil crear integrados en este proceso y tanto TSMC como GlobalFoundries se habían complicado con los 20nm pero pudieron avanzar dejando espacio para poder dedicarse a 16nm, el tema aquí es si realmente la industria puede pagar lo que vale una transición a nuevas maquinarias y costos elevados para los nuevos SoC.

Mientras tanto ARM trabaja con TSMC en otro proceso FinFET, llamado 16FF para darle un 15% adicional de performance.

Por el momento los 20nm llegarán para fin de año, esto empujaría los 16nm para, como muy temprano, finales de 2015 o hasta 2016 para ver productos reales usándolo. El 16FF por su parte requeriría un rediseño de los chips por parte de ARM lo que llevaría su producción hasta el 2017 recién.

Via ExtremeTech

Intel Xeon E7 v2

Publicado por Fabio Baccaglioni el 21/02/2014 a las 15:59 (1247)


El diseño interno del E7 V2 es muy interesante, son 15 cores Ivy Bridge, una evolución importantísima desde los Westmere de la E7 v1, interconectados con tres canales de alta velocidad QuickPath que se aseguran que las L3 de cada core, 2.5MB cada una, actúen como una unificada de 37.5MB con un ancho de banda de 450GB/s. La latencia es menor al Westmere pasando de 20ns a 15.5ns a 2.8GHz contra los 2.4GHz previos.

El soporte PCIe está en el mismo silicio, con unas 32 líneas PCI, la memoria aumenta el soporte de dos a tres DIMM por canal, es posible lograr hasta 6TB de RAM usando memorias LRDIMM de 64GB, si, dije 6 TeraBytes! pero está claro que hablamos de un procesador para el mercado corporativo.



Su principal rival son los RISC y es ahí donde Intel viene robando lo último que le queda del mercado corporativo, ya no hay mucho lugar para Oracle e IBM y los precios parecen ser determinantes ya que las soluciones de Intel, al adoptar Ivy Bridge, llevan el costo por performance a valores que no pueden aclanzar los POWER o SPARC.

El modelo más grande cuenta con 15 núcleos, un TDP de 155W, está producido en 22nm, un clock a 2.8GHz, costando alrededor de USD 6800 por procesador, la familia es bien completa con unidades para cada segmento.



Me deja preguntando esto ¿qué será de Oracle? porque IBM ya está claro que abandonó los x86 para poner foco en POWER pero que tampoco parecen tener precios tan altos como Oracle. El Xeon evidentemente responde a esta era de big data y HPC, en configuraciones de quad socket, 6TB de RAM está al mismo costo que un RISC de 2TB y aplicaciones como SAP o SQL Server estan apuntando a estos entornos llenos de RAM.

Pueden ver el benchmark completo en Anandtech
213 Noticias (22 páginas, 10 por página)



Powered by
Cake Division