AMD y ARM el dúo más extraño

Publicado por Fabio Baccaglioni el 07/05/2014 a las 11:54 (1591)
AMD está rotando totalmente su estrategia de procesadores y eso me agrada mucho, para mi es el movimiento correcto ya que quedándose solamente en procesadores x86 nunca podrán salir de la sombra de Intel, pero este "matrimonio" con ARM es extraño y jugado, y cuando alguien arriesga, para mi vale la pena prestarle atención.



El proyecto "Skybridge" busca implementar en un mismo SoC tanto un core x86 como un ARM en un mismo formato, es decir, pin compatible poder cambiar entre uno u otro depenidendo el dispositivo a usar, utilizando un A57 de bajo consumo como opción pero compatible 100% con el socket, el motherboard y todos los complementos.

Para 2015 tendremos entonces el primer SoC ARM de AMD oficial orientado a plataformas Android en vez de servidores como el proyecto Seattle que verá la luz este año (uno de ocho nucleos orientado a HPC, Cortex A-57 a 28nm), el hecho de ser compatible en pines permite una reducción notable de costos a la hora de implementación, el proceso de fabricación será de 20nm, y no es de extrañar que veamos alguna tablet de una marca que tenga una versión ARM y otra x86 en un mismo modelo porque sólo habrá que cambiar el SoC para ofrecer dos modelos distintos.



Una de las limitaciones de AMD y sus x86 es con la complejidad para fabricarlos en procesos menores a 20nm, por esta razón usar diseños de ARM tiene sentido, poder utilizar a futuro el proceso FinFET de 14/16nm, por esto para 2016 ya estan planeando el K12, un ARMv8 de 64 bits junto a un core x86 nuevo (todavía sin nombre) que iran en el mismo silicio.

Esto implica crear un nuevo diseño de x86 para reemplazar los Puma actuales pero para aprovechar además la posibilidad de alta velocidad de los dos diseños, en todos los casos incluirán GPU integrado así que AMD se está abriendo poco a poco paso en el mercado más jugoso de los últimos tiempos: móviles.

Por el momento no esperaría a ver un celular con estos SoC, hay mucho camino para competir contra monstruos como Qualcomm que tienen otra ventaja, los chips de banda base ya incorporados en el SoC, algo que AMD ni por asomo tiene e Intel está implementando poco a poco. Pero si NVidia pudo entrar a este negocio no veo por qué no AMD.

Más detalles en Anandtech

AMD Beema y Mullins, la competencia de bajo consumo contra Bay Trail

Publicado por Fabio Baccaglioni el 29/04/2014 a las 12:16 (1791)
AMD se alejó bastante del mercado mobile porque sencillamente no podía enfocarse en tantas cosas a la vez como su gran rival Intel, pero derivando el desarrollo de los Temash y Kabini han nacido dos opciones de low power que estan bastante bien posicionadas contra los Atom de Intel, los Bay Trail, ya que aprovechan la ventaja de tener un GPU potente y de mejor diseño que las opciones de Intel.



El foco de AMD ahora sí puede orientarse a el bajo consumo, algo que le ha costado mucho incluyendo la pérdida de casi todo el mercado móvil que tenían el cual sólo sostienen a base de precios mucho más accesibles, pero nada más.

Los APUs Beema son SoCs con un TDP de no más de 15Watts, desde dos núcleos a 1.35GHz a cuatro núcleos con un clock a 2.4GHz, GPU de 128 cores con velocidades de 350 a 800MHz y soporte para memorias DDR3L-1333 a DDR3L-1866. La gama de nombres E1, A4, A6 y A10 forman esta primer familia.

Pero hay otra camada, los APU Mullins con TDPs mucho más pequeños, el mayor ejemplo es el A10 Micro-6700T con un TDP de 4.5W, cuatro núcleos a 2.2GHz, el GPU a 500MHz y soporte para memorias DDR3L-1333 y el más pequeño, E1 Micro-6200T de dos núcleos, 3.95W y 1.4GHz.

En todos los casos el GPU es el GCN de 128 núcleos Radeon donde lo único que cambia es el clock y obviamente la interfaz de memoria, esto es interesante porque marca un estándar de GPU para el desarrollo entre todos los procesadores, el GPU es una gran parte del área de procesador.

Los núcleos Puma+ van acompañados de un ARM A5 de 32 bits como procesador de seguridad, con su propia ROM y RAM, ofreciendo Trusted Execution Environment (TEE), para booteo seguro en equipos rooteados y aceleración criptográfica.



En HotHardware realizaron los benchmarks mano a mano con un Intel Core i3-2377M a 1.5GHz , el Atom Z3770 a 2.4GHz y el Atom Z2760 a 1.8GHz mostrando unos resultados más que sorprendentes principalmente en el área gráfica pero también como CPU. En GPU es obvio que Intel queda muy atrás en su solución integrada aunque no hay que creer que esto es definitivo considerando el trabajo que estan realizando en los GPUs integrados de los procesadores más grandes tipo Haswell.

Vean los benchmarks en HotHardware

Los nuevos lanzamientos de Qualcomm dejan en claro que tu móvil es obsoleto

Publicado por Fabio Baccaglioni el 07/04/2014 a las 15:16 (2284)


Si creían que con un Galaxy S5 tenían todo el poder posible tan sólo esperen unos meses y ya será "viejo". Aunque soy de la teoría de que todo equipo informático llega a una meseta cuando se supera ampliamente la "necesidad" del usuario (véase desktops y notebooks, por ejemplo) los celulares todavía parecen tener un margen aunque aparente llegar también a dicho estancamiento.

Qualcomm en cambio parece querer darle un empujoncito más con el Snapdragon 810 (y el 808 en el mid range) pensados para el año que viene y con soporte de 64 bits y ocho núcleos Cortex-A57/A53.

Estos nuevos SoC serían la versión más potente de lo que hasta ahora se presentó como 610 y 615, para darles una idea de crecimiento, el proceso de fabricación será de 20nm, el objetivo son pantallas 2K a 4K de resolución, el GPU será el Adreno 430 con un 30% más de performance que el 420 que al día de hoy ni siquiera llegó al mercado todavía. El soporte de memorias es LPDDR4 y sumará procesadores de activación de voz y procesamiento de imagen dual.

Como se puede ver en el diagrama de diseño el área utilizada por los núcleos (8 en el 810, 6 en el 808) es ínfima en comparación con el resto, el GPU Adreno 430 ocupa un buen lugar pero la mayor parte se la lleva el Modem de cuarta generación LTE-Advanced Cat 6 ya integrado en el silicio con MIMO de dos canales para el WiFi.



El 808 está pensado para llevar dos cores A57 y cuatro A53 con soporte de video 2K y LPDDR3 más un Adreno 418, sería la versión intermedia entre el 810 y los 610/605. La era de los 64 bits en móviles está en casi todas las marcas aunque ningún software pueda sacarle provecho actualmente (ni el iPhone 5S que ya lo incorpora tiene RAM como para usarlo), pero si pensamos en dispositivos intermedios como tablets poderosas y demás, es posible que tengan sentido de aquí a 2015.

Con esta evolución de los procesadores basados en ARM yo miraría más hacia Intel y el "problema" que le significa que se le aproximen tanto los ARM a los x86 cuando hasta ahora la mayor diferencia era que éstos eran mucho menos potentes.

Via Engadget

Apple Cyclone, el core del A7 mucho más complejo que un Krait

Publicado por Fabio Baccaglioni el 31/03/2014 a las 17:45 (2638)
Apple liberó parte del código de LLVM y esto permitió conocer en detalle varias características del procesador A7 de 64 bits que actualmente potencia al iPhone 5S.

Lo interesante es comparar con la tecnología utilizada en el A6, una de las críticas hacia el A7 el día de su lanzamiento fue que no aumentaba la cantidad de núcleos y sólo ofrecía 64 bits como diferencial, pero por dentrgo los cambios eran más notables y si bien en performance no es muy grande la diferencia, sí lo es en arquitectura.

El A7 con los núcleos Cyclone es más parecido a un Haswell de Intel que a un Krait de Qualcomm y eso es más que relevante. El tema de los 64 bits es anecdótico y con utilidad a futuro, estos cambios también pero se notará su diferencia en las generaciones inmediatamente posteriores. La razón es que un núcleo más complejo no puede utilizar un clock tan acelerado... hasta que se cambia el proceso de fabricación. Y eso es lo que se le viene a Apple para su siguiente generación al pasar al proceso de 20nm de TSMC.



En detalle un Cyclone puede procesar hasta seis hilos simultáneamente en un diseño out-of-order, el doble que los otros diseños, el buffer de reorden pasó de 45 micro-ops a 192 micro-ops necesario para poder manejarlo así, esto agrega dos ciclos más, 16 en vez de 14, pero duplicaron las unidades ALU de enteros, además de extender hasta una tercer caché con la L3.

La diferencia no se nota en los clocks actuales pero la realidad es que fácilmente un A7 con un clock más fuerte podría desplazar sin problemas a un Octa Core aun con menos núcleos, el tema es que en el proceso actual no se puede sin quemara la batería. Lo ideal será en el ciclo A8-A9 al pasar a los ya mencionados 20nm.

Apple Custom CPU Core Comparison
  Apple A6 Apple A7
CPU Codename Swift Cyclone
ARM ISA ARMv7-A (32-bit) ARMv8-A (32/64-bit)
Issue Width 3 micro-ops 6 micro-ops
Reorder Buffer Size 45 micro-ops 192 micro-ops
Branch Mispredict Penalty 14 cycles 16 cycles (14 - 19)
Integer ALUs 2 4
Load/Store Units 1 2
Load Latency 3 cycles 4 cycles
Branch Units 1 2
Indirect Branch Units 0 1
FP/NEON ALUs ? 3
L1 Cache 32KB I$ + 32KB D$ 64KB I$ + 64KB D$
L2 Cache 1MB 1MB
L3 Cache - 4MB


Por ejemplo otra limitación era lanzarlo con memorias RAM de apenas 1GB, es un procesador que podría manejar tranquilamente 16GB si quieren, pero Apple fue extremadamente conservadora en su primer versión. Si proyectamos este diseño a futuro es plausible la idea de una total independencia de la empresa de los proveedores de microprocesadores para la mayoría de sus líneas.

Es decir, no sería de extrañar ver una Apple con procesador propio y no me refiero ni a los iPhone ni iPads sino las Macbook, algo que se ve a lo lejos pero que necesita sí o sí de una performance similar a la de un Haswell para tener sentido. Al menos en la arquitectura general se parecen.

Intel, el principal "complicado" ante estas maniobras de Apple ya ha hecho algo parecido, pasar en un sólo ciclo a tres versiones con los Saltwell/Silvermont/Airmont en el rango de apenas dos años y sigue sin poder proveer a sus clientes móviles en la cantidad que lo hace Qualcomm. Apple optó por sus propios diseños, una medida nada extraña para alguien con semejante billetera, pero ¿Podrá Intel convencerla de volver? muy difícil, ahora Apple tiene el control real.

Por otra parte el cambio de proceso a 20nm cambiará notablemente las velocidades conservadoras del A7 (entre 1.3 y 1.5GHz) y lo hará más competitivo con los Exynos y Tegras, pero con estas modificaciones de arquitectura probablemente no necesite superar los 2GHz para lograr una mayor eficiencia por ciclo, y esa será una de las mayores ventajas en el largo plazo.

Via Extremetech

Intel por dos: Iris Pro desbloqueado para desktops y un i7 de ocho núcleos

Publicado por Fabio Baccaglioni el 20/03/2014 a las 11:30 (9073)


Dos interesantes anuncios de Intel, primero el lanzamiento del Iris Pro para desktops y desbloqueado, el procesador con el GPU más potente a la fecha de Intel que hasta ahora sólo se conseguía en algunas plataformas en particular.

Esta es la primera vez que se puede acceder a un Broadwell con Iris Pro en formato socket en vez del BGA al cual podían acceder algunos OEM como Apple y Gigabyte, esto permitirá a cualquier fabricante o ensamblador hasta hogareño crear su propia PC con este particular procesador.

Lo que no aclaró Intel es si será el mismo Iris Pro HD 5200 o será uno totalmente nuevo. El Broadwell se produce en el más extremo de los procesos actuales, el de 14nm. Y no sólo eso es la noticia, vendrá completamente desbloqueado para overclockers, tanto con el multiplicador como el strap, la memoria, y los núcleos totalmente ajustables junto a un set de aplicaciones de overclocking.

El segundo anuncio es un i7 de ocho núcleos "Devil's Canyon" junto a la plataforma Intel X99. Este bestial procesador y el chipset proveeran también de soporte DDR4, siendo el primer procesador dedicado al escritorio con ocho núcleos (hay de más pero son fabricados para servers o workstations, no para este segmento aunque se pueden usar a tal fin). Ah, obviamente procesa 16 threads, el CPU ideal para los que estan renderizando 3D.

Desde ya que no existe un rival para esta plataforma, simplemente será durante unos años más la más potente para escritorio de manera indiscutida. El motherboard basado en X99 podrá ofrecer todo lo que el X79 se había dejado a mitad de camino pero todavía Intel no quiere entrar en detalles aun cuando lo está anunciando en la GDC.

Lanzar un procesador para un mercado que no existe es medio raro, pero por otra parte Intel está marcando el futuro del desktop para entusiastas, para overclockers y gamers serios, no les importa si hay o no competencia, tienen que empujar los límites más allá.

Más datos en Intel

TSMC anuncia sus primeros movimientos hacia los 16nm FinFET

Publicado por Fabio Baccaglioni el 26/02/2014 a las 16:05 (1193)
TSMC y ARM anunciaron un hito más en el camino hacia la producción de chips en un proceso FinFET de 16nm al revelar un SoC que combina cuatro Cortex-A53 y dos Cortex-A57 en configuración big.LITTLE y 16nm.



Los actuales procesadores para móviles, que no son de Intel, se producen bajo 28nm , con un 40% menos de tamaño se puede dar también un 40% más de velocidad y reducir un 55% el consumo total a la misma velocidad, al menos así lo indica ARM.

Hasta ahora la configuración típica de big.LITTLE eran entre Cortex-A7 y Cortex-A15, poder combinar los A53 y A57 es una excelente noticia para la mayoría de los fabricantes y vale aclarar que TSMC fabrica no para uno sino para casi todos los desarrolladores de ARM salvo Samsung.

Obviamente no veremos este nodo tan pronto, hasta Intel va lento con la producción de 14nm, es realmente difícil crear integrados en este proceso y tanto TSMC como GlobalFoundries se habían complicado con los 20nm pero pudieron avanzar dejando espacio para poder dedicarse a 16nm, el tema aquí es si realmente la industria puede pagar lo que vale una transición a nuevas maquinarias y costos elevados para los nuevos SoC.

Mientras tanto ARM trabaja con TSMC en otro proceso FinFET, llamado 16FF para darle un 15% adicional de performance.

Por el momento los 20nm llegarán para fin de año, esto empujaría los 16nm para, como muy temprano, finales de 2015 o hasta 2016 para ver productos reales usándolo. El 16FF por su parte requeriría un rediseño de los chips por parte de ARM lo que llevaría su producción hasta el 2017 recién.

Via ExtremeTech

Intel Xeon E7 v2

Publicado por Fabio Baccaglioni el 21/02/2014 a las 15:59 (1194)


El diseño interno del E7 V2 es muy interesante, son 15 cores Ivy Bridge, una evolución importantísima desde los Westmere de la E7 v1, interconectados con tres canales de alta velocidad QuickPath que se aseguran que las L3 de cada core, 2.5MB cada una, actúen como una unificada de 37.5MB con un ancho de banda de 450GB/s. La latencia es menor al Westmere pasando de 20ns a 15.5ns a 2.8GHz contra los 2.4GHz previos.

El soporte PCIe está en el mismo silicio, con unas 32 líneas PCI, la memoria aumenta el soporte de dos a tres DIMM por canal, es posible lograr hasta 6TB de RAM usando memorias LRDIMM de 64GB, si, dije 6 TeraBytes! pero está claro que hablamos de un procesador para el mercado corporativo.



Su principal rival son los RISC y es ahí donde Intel viene robando lo último que le queda del mercado corporativo, ya no hay mucho lugar para Oracle e IBM y los precios parecen ser determinantes ya que las soluciones de Intel, al adoptar Ivy Bridge, llevan el costo por performance a valores que no pueden aclanzar los POWER o SPARC.

El modelo más grande cuenta con 15 núcleos, un TDP de 155W, está producido en 22nm, un clock a 2.8GHz, costando alrededor de USD 6800 por procesador, la familia es bien completa con unidades para cada segmento.



Me deja preguntando esto ¿qué será de Oracle? porque IBM ya está claro que abandonó los x86 para poner foco en POWER pero que tampoco parecen tener precios tan altos como Oracle. El Xeon evidentemente responde a esta era de big data y HPC, en configuraciones de quad socket, 6TB de RAM está al mismo costo que un RISC de 2TB y aplicaciones como SAP o SQL Server estan apuntando a estos entornos llenos de RAM.

Pueden ver el benchmark completo en Anandtech

Samsung le deja la posta a TSMC en los procesadores de Apple

Publicado por Fabio Baccaglioni el 17/02/2014 a las 16:00 (1149)


El A8 ya no será un tema para Samsung, le deja el trabajo de crear los siguientes procesadores de Apple a TSMC quien, según un informe, está en capacidad de producir a 20nm los procesadores derivados de ARM de la firma americana.

Durante 2014, según TechNews de Taiwan, Samsung le dejará este negocio bastante rentable a TSMC porque estan teniendo problemas con ese esquema de producción, ahora bien, esto no implica que se caiga el negocio para los A9.

TSMC también producirá los A9 pero en un proceso de 16nm, Samsung retomaría en el proceso de 14nm, algo que Apple seguramente tiene en interés debido a la reducción de consumo.

Según el Wall Street Journal para mediados de año TSMC asumirá el 70% de la producción de los SoC A de Apple, pero vieron como es esto, siempre vuelven a Samsung que tiene, por lo general, una capacidad masiva inigualable.

Via Electronista

Crece la familia ARM, Cortex A17

Publicado por Fabio Baccaglioni el 11/02/2014 a las 12:37 (1273)
Poco a poco ARM, el diseñador de los SoC más usados en móviles, sigue lanzando modelos y diversificando sus propuestas, recordemos que ARM, a diferencia de Intel o AMD, no fabrica nada, sólo diseña y licencia sus especificaciones a cada fabricante como Qualcomm, Samsung y tantos otros.



El Cortex A17 busca completar la oferta agregando un SoC en el rango medio de los 32 bits, con un diseño ARMv7-A como evolución del Cortex A12.

El CPU toma el diseño básico del A12 de doble ancho out-of-order y lo mejora aunque conserva el engine de ejecución del anterior pero mejora performance y eficiencia dándole, según ARM, un 60% más de velocidad que un A9, y un 40% más que un A12 bajo las mismas condiciones.

En síntesis buscan al menos un 20% de mejora de performance total del ya clásico A9, el diseño está preparado para el proceso de fabricación de 28nm con la posibilidad de pasara 20nm. A diferencia del A12 el A17 ofrecerá big.LITTLE para combinarlo con, por ejemplo, el A7.



El target es obviamente el rango medio, llama la atención que ARM no promueva un procesador de 64 bits para este segmento dejando solamente el A53 y el A57 para estos casos, pero esos estan orientados a servidores o high-end.

Esperen este nuevo SoC para 2015, antes el A12 y el A15 cubrirán el espectro que busca completar esta evolución y probablemente el A12 sea el que sufra las consecuencias del poco tiempo en mercado antes del A17.

Via Anandtech

AMD presenta su primer CPU ARM "Seattle", el Opteron A1100

Publicado por Fabio Baccaglioni el 30/01/2014 a las 14:33 (1421)
¿Será algo así como el Nokia 1100 de los procesadores? El Opteron A1100 es un procesador de 64 bits basado en la arquitectura ARM Cortex-A57 con ocho núcleos. Y sí es noticia porque sale de la marca que es la única rival que queda en x86 contra Intel, ahora sumando ARM en su portfolio.



Desde ya que un procesador basado en ARM para servidores no está a la altura de un Xeon o un Opteron x86 pero donde buscan entrar en un nicho es para servidores de bajo coste y consumo ínfimo. En este sentido el A1100 está a la altura de un Opteron X2150 en consumo (mismo TDP, 25 Watts) pero según AMD obtiene una performance 2.5X veces mayor.

El clock es a 2GHz y cada par de núcleos comparte una caché L2 de 1MB y entre los ocho comparten una L3 de 8MB, el controlador de memoria soporta DDR3 y DDR4 siendo de 128bits, tanto memorias con buffer registrado o no, usando las registradas en formato DIMM se puede utilizar hasta 128GB de RAM.

El procesador es fabricado en GlobalFoundries bajo el proceso de 28nm que ya dominan hace un tiempo, obviamente no es sólo un CPU, es todo un SOC como la mayoría de los procesadores ARM, así que incorpora varios subsistemas más como controlador para PCIe 3.0 de 8 canales, 8 puertos SATA 3 (6Gbps), red dual-10GbE, encripción TrustZone de ARM, etc.



El objetivo son servidores web, memchache y clouds, principalmente almacenamiento donde no hay un uso intensivo de CPU pero sí de memoria y disco, algo para lo que viene perfectamente preparado por lo antes mencionado, AMD asegura que puede sostener el ancho de banda de todos los ocho puertos SATA al mismo tiempo. ¿El costo por cada Opteron A1100? no más de USD 100 la unidad.

AMD no indicó si hay o no GPU pero considerando el TDP de 25W y el uso dedicado a servidores es muy poco probable que incluya algo más allá de un VGA, igualmente el objetivo del procesador no es competir en móviles, es exclusivo para servidores.

La movida es interesante pero ¿Hay mercado? lo hay en algunos nichos pero migrar de x86 a ARM no es lo más interesante para ningún sysadmin, es que no hay tanto software portado para esta arquitectura aunque toda aquella basada en software libre funciona desde el vamos. Casi todas las distros usadas para servidores tienen soporte de ARM, por ejemplo Debian.

Así que si estamos montando un servicio de cloud computing este tipo de SoC tienen mucho sentido para abaratar los costos, para un Oracle, olvídense.

Vía ExtremeTech

210 Noticias (21 páginas, 10 por página)



Powered by
Cake Division