Apple Cyclone, el core del A7 mucho más complejo que un Krait

Publicado por Fabio Baccaglioni el 31/03/2014 a las 17:45 (2421)
Apple liberó parte del código de LLVM y esto permitió conocer en detalle varias características del procesador A7 de 64 bits que actualmente potencia al iPhone 5S.

Lo interesante es comparar con la tecnología utilizada en el A6, una de las críticas hacia el A7 el día de su lanzamiento fue que no aumentaba la cantidad de núcleos y sólo ofrecía 64 bits como diferencial, pero por dentrgo los cambios eran más notables y si bien en performance no es muy grande la diferencia, sí lo es en arquitectura.

El A7 con los núcleos Cyclone es más parecido a un Haswell de Intel que a un Krait de Qualcomm y eso es más que relevante. El tema de los 64 bits es anecdótico y con utilidad a futuro, estos cambios también pero se notará su diferencia en las generaciones inmediatamente posteriores. La razón es que un núcleo más complejo no puede utilizar un clock tan acelerado... hasta que se cambia el proceso de fabricación. Y eso es lo que se le viene a Apple para su siguiente generación al pasar al proceso de 20nm de TSMC.



En detalle un Cyclone puede procesar hasta seis hilos simultáneamente en un diseño out-of-order, el doble que los otros diseños, el buffer de reorden pasó de 45 micro-ops a 192 micro-ops necesario para poder manejarlo así, esto agrega dos ciclos más, 16 en vez de 14, pero duplicaron las unidades ALU de enteros, además de extender hasta una tercer caché con la L3.

La diferencia no se nota en los clocks actuales pero la realidad es que fácilmente un A7 con un clock más fuerte podría desplazar sin problemas a un Octa Core aun con menos núcleos, el tema es que en el proceso actual no se puede sin quemara la batería. Lo ideal será en el ciclo A8-A9 al pasar a los ya mencionados 20nm.

Apple Custom CPU Core Comparison
  Apple A6 Apple A7
CPU Codename Swift Cyclone
ARM ISA ARMv7-A (32-bit) ARMv8-A (32/64-bit)
Issue Width 3 micro-ops 6 micro-ops
Reorder Buffer Size 45 micro-ops 192 micro-ops
Branch Mispredict Penalty 14 cycles 16 cycles (14 - 19)
Integer ALUs 2 4
Load/Store Units 1 2
Load Latency 3 cycles 4 cycles
Branch Units 1 2
Indirect Branch Units 0 1
FP/NEON ALUs ? 3
L1 Cache 32KB I$ + 32KB D$ 64KB I$ + 64KB D$
L2 Cache 1MB 1MB
L3 Cache - 4MB


Por ejemplo otra limitación era lanzarlo con memorias RAM de apenas 1GB, es un procesador que podría manejar tranquilamente 16GB si quieren, pero Apple fue extremadamente conservadora en su primer versión. Si proyectamos este diseño a futuro es plausible la idea de una total independencia de la empresa de los proveedores de microprocesadores para la mayoría de sus líneas.

Es decir, no sería de extrañar ver una Apple con procesador propio y no me refiero ni a los iPhone ni iPads sino las Macbook, algo que se ve a lo lejos pero que necesita sí o sí de una performance similar a la de un Haswell para tener sentido. Al menos en la arquitectura general se parecen.

Intel, el principal "complicado" ante estas maniobras de Apple ya ha hecho algo parecido, pasar en un sólo ciclo a tres versiones con los Saltwell/Silvermont/Airmont en el rango de apenas dos años y sigue sin poder proveer a sus clientes móviles en la cantidad que lo hace Qualcomm. Apple optó por sus propios diseños, una medida nada extraña para alguien con semejante billetera, pero ¿Podrá Intel convencerla de volver? muy difícil, ahora Apple tiene el control real.

Por otra parte el cambio de proceso a 20nm cambiará notablemente las velocidades conservadoras del A7 (entre 1.3 y 1.5GHz) y lo hará más competitivo con los Exynos y Tegras, pero con estas modificaciones de arquitectura probablemente no necesite superar los 2GHz para lograr una mayor eficiencia por ciclo, y esa será una de las mayores ventajas en el largo plazo.

Via Extremetech

Intel por dos: Iris Pro desbloqueado para desktops y un i7 de ocho núcleos

Publicado por Fabio Baccaglioni el 20/03/2014 a las 11:30 (7434)


Dos interesantes anuncios de Intel, primero el lanzamiento del Iris Pro para desktops y desbloqueado, el procesador con el GPU más potente a la fecha de Intel que hasta ahora sólo se conseguía en algunas plataformas en particular.

Esta es la primera vez que se puede acceder a un Broadwell con Iris Pro en formato socket en vez del BGA al cual podían acceder algunos OEM como Apple y Gigabyte, esto permitirá a cualquier fabricante o ensamblador hasta hogareño crear su propia PC con este particular procesador.

Lo que no aclaró Intel es si será el mismo Iris Pro HD 5200 o será uno totalmente nuevo. El Broadwell se produce en el más extremo de los procesos actuales, el de 14nm. Y no sólo eso es la noticia, vendrá completamente desbloqueado para overclockers, tanto con el multiplicador como el strap, la memoria, y los núcleos totalmente ajustables junto a un set de aplicaciones de overclocking.

El segundo anuncio es un i7 de ocho núcleos "Devil's Canyon" junto a la plataforma Intel X99. Este bestial procesador y el chipset proveeran también de soporte DDR4, siendo el primer procesador dedicado al escritorio con ocho núcleos (hay de más pero son fabricados para servers o workstations, no para este segmento aunque se pueden usar a tal fin). Ah, obviamente procesa 16 threads, el CPU ideal para los que estan renderizando 3D.

Desde ya que no existe un rival para esta plataforma, simplemente será durante unos años más la más potente para escritorio de manera indiscutida. El motherboard basado en X99 podrá ofrecer todo lo que el X79 se había dejado a mitad de camino pero todavía Intel no quiere entrar en detalles aun cuando lo está anunciando en la GDC.

Lanzar un procesador para un mercado que no existe es medio raro, pero por otra parte Intel está marcando el futuro del desktop para entusiastas, para overclockers y gamers serios, no les importa si hay o no competencia, tienen que empujar los límites más allá.

Más datos en Intel

TSMC anuncia sus primeros movimientos hacia los 16nm FinFET

Publicado por Fabio Baccaglioni el 26/02/2014 a las 16:05 (1122)
TSMC y ARM anunciaron un hito más en el camino hacia la producción de chips en un proceso FinFET de 16nm al revelar un SoC que combina cuatro Cortex-A53 y dos Cortex-A57 en configuración big.LITTLE y 16nm.



Los actuales procesadores para móviles, que no son de Intel, se producen bajo 28nm , con un 40% menos de tamaño se puede dar también un 40% más de velocidad y reducir un 55% el consumo total a la misma velocidad, al menos así lo indica ARM.

Hasta ahora la configuración típica de big.LITTLE eran entre Cortex-A7 y Cortex-A15, poder combinar los A53 y A57 es una excelente noticia para la mayoría de los fabricantes y vale aclarar que TSMC fabrica no para uno sino para casi todos los desarrolladores de ARM salvo Samsung.

Obviamente no veremos este nodo tan pronto, hasta Intel va lento con la producción de 14nm, es realmente difícil crear integrados en este proceso y tanto TSMC como GlobalFoundries se habían complicado con los 20nm pero pudieron avanzar dejando espacio para poder dedicarse a 16nm, el tema aquí es si realmente la industria puede pagar lo que vale una transición a nuevas maquinarias y costos elevados para los nuevos SoC.

Mientras tanto ARM trabaja con TSMC en otro proceso FinFET, llamado 16FF para darle un 15% adicional de performance.

Por el momento los 20nm llegarán para fin de año, esto empujaría los 16nm para, como muy temprano, finales de 2015 o hasta 2016 para ver productos reales usándolo. El 16FF por su parte requeriría un rediseño de los chips por parte de ARM lo que llevaría su producción hasta el 2017 recién.

Via ExtremeTech

Intel Xeon E7 v2

Publicado por Fabio Baccaglioni el 21/02/2014 a las 15:59 (1103)


El diseño interno del E7 V2 es muy interesante, son 15 cores Ivy Bridge, una evolución importantísima desde los Westmere de la E7 v1, interconectados con tres canales de alta velocidad QuickPath que se aseguran que las L3 de cada core, 2.5MB cada una, actúen como una unificada de 37.5MB con un ancho de banda de 450GB/s. La latencia es menor al Westmere pasando de 20ns a 15.5ns a 2.8GHz contra los 2.4GHz previos.

El soporte PCIe está en el mismo silicio, con unas 32 líneas PCI, la memoria aumenta el soporte de dos a tres DIMM por canal, es posible lograr hasta 6TB de RAM usando memorias LRDIMM de 64GB, si, dije 6 TeraBytes! pero está claro que hablamos de un procesador para el mercado corporativo.



Su principal rival son los RISC y es ahí donde Intel viene robando lo último que le queda del mercado corporativo, ya no hay mucho lugar para Oracle e IBM y los precios parecen ser determinantes ya que las soluciones de Intel, al adoptar Ivy Bridge, llevan el costo por performance a valores que no pueden aclanzar los POWER o SPARC.

El modelo más grande cuenta con 15 núcleos, un TDP de 155W, está producido en 22nm, un clock a 2.8GHz, costando alrededor de USD 6800 por procesador, la familia es bien completa con unidades para cada segmento.



Me deja preguntando esto ¿qué será de Oracle? porque IBM ya está claro que abandonó los x86 para poner foco en POWER pero que tampoco parecen tener precios tan altos como Oracle. El Xeon evidentemente responde a esta era de big data y HPC, en configuraciones de quad socket, 6TB de RAM está al mismo costo que un RISC de 2TB y aplicaciones como SAP o SQL Server estan apuntando a estos entornos llenos de RAM.

Pueden ver el benchmark completo en Anandtech

Samsung le deja la posta a TSMC en los procesadores de Apple

Publicado por Fabio Baccaglioni el 17/02/2014 a las 16:00 (1086)


El A8 ya no será un tema para Samsung, le deja el trabajo de crear los siguientes procesadores de Apple a TSMC quien, según un informe, está en capacidad de producir a 20nm los procesadores derivados de ARM de la firma americana.

Durante 2014, según TechNews de Taiwan, Samsung le dejará este negocio bastante rentable a TSMC porque estan teniendo problemas con ese esquema de producción, ahora bien, esto no implica que se caiga el negocio para los A9.

TSMC también producirá los A9 pero en un proceso de 16nm, Samsung retomaría en el proceso de 14nm, algo que Apple seguramente tiene en interés debido a la reducción de consumo.

Según el Wall Street Journal para mediados de año TSMC asumirá el 70% de la producción de los SoC A de Apple, pero vieron como es esto, siempre vuelven a Samsung que tiene, por lo general, una capacidad masiva inigualable.

Via Electronista

Crece la familia ARM, Cortex A17

Publicado por Fabio Baccaglioni el 11/02/2014 a las 12:37 (1192)
Poco a poco ARM, el diseñador de los SoC más usados en móviles, sigue lanzando modelos y diversificando sus propuestas, recordemos que ARM, a diferencia de Intel o AMD, no fabrica nada, sólo diseña y licencia sus especificaciones a cada fabricante como Qualcomm, Samsung y tantos otros.



El Cortex A17 busca completar la oferta agregando un SoC en el rango medio de los 32 bits, con un diseño ARMv7-A como evolución del Cortex A12.

El CPU toma el diseño básico del A12 de doble ancho out-of-order y lo mejora aunque conserva el engine de ejecución del anterior pero mejora performance y eficiencia dándole, según ARM, un 60% más de velocidad que un A9, y un 40% más que un A12 bajo las mismas condiciones.

En síntesis buscan al menos un 20% de mejora de performance total del ya clásico A9, el diseño está preparado para el proceso de fabricación de 28nm con la posibilidad de pasara 20nm. A diferencia del A12 el A17 ofrecerá big.LITTLE para combinarlo con, por ejemplo, el A7.



El target es obviamente el rango medio, llama la atención que ARM no promueva un procesador de 64 bits para este segmento dejando solamente el A53 y el A57 para estos casos, pero esos estan orientados a servidores o high-end.

Esperen este nuevo SoC para 2015, antes el A12 y el A15 cubrirán el espectro que busca completar esta evolución y probablemente el A12 sea el que sufra las consecuencias del poco tiempo en mercado antes del A17.

Via Anandtech

AMD presenta su primer CPU ARM "Seattle", el Opteron A1100

Publicado por Fabio Baccaglioni el 30/01/2014 a las 14:33 (1333)
¿Será algo así como el Nokia 1100 de los procesadores? El Opteron A1100 es un procesador de 64 bits basado en la arquitectura ARM Cortex-A57 con ocho núcleos. Y sí es noticia porque sale de la marca que es la única rival que queda en x86 contra Intel, ahora sumando ARM en su portfolio.



Desde ya que un procesador basado en ARM para servidores no está a la altura de un Xeon o un Opteron x86 pero donde buscan entrar en un nicho es para servidores de bajo coste y consumo ínfimo. En este sentido el A1100 está a la altura de un Opteron X2150 en consumo (mismo TDP, 25 Watts) pero según AMD obtiene una performance 2.5X veces mayor.

El clock es a 2GHz y cada par de núcleos comparte una caché L2 de 1MB y entre los ocho comparten una L3 de 8MB, el controlador de memoria soporta DDR3 y DDR4 siendo de 128bits, tanto memorias con buffer registrado o no, usando las registradas en formato DIMM se puede utilizar hasta 128GB de RAM.

El procesador es fabricado en GlobalFoundries bajo el proceso de 28nm que ya dominan hace un tiempo, obviamente no es sólo un CPU, es todo un SOC como la mayoría de los procesadores ARM, así que incorpora varios subsistemas más como controlador para PCIe 3.0 de 8 canales, 8 puertos SATA 3 (6Gbps), red dual-10GbE, encripción TrustZone de ARM, etc.



El objetivo son servidores web, memchache y clouds, principalmente almacenamiento donde no hay un uso intensivo de CPU pero sí de memoria y disco, algo para lo que viene perfectamente preparado por lo antes mencionado, AMD asegura que puede sostener el ancho de banda de todos los ocho puertos SATA al mismo tiempo. ¿El costo por cada Opteron A1100? no más de USD 100 la unidad.

AMD no indicó si hay o no GPU pero considerando el TDP de 25W y el uso dedicado a servidores es muy poco probable que incluya algo más allá de un VGA, igualmente el objetivo del procesador no es competir en móviles, es exclusivo para servidores.

La movida es interesante pero ¿Hay mercado? lo hay en algunos nichos pero migrar de x86 a ARM no es lo más interesante para ningún sysadmin, es que no hay tanto software portado para esta arquitectura aunque toda aquella basada en software libre funciona desde el vamos. Casi todas las distros usadas para servidores tienen soporte de ARM, por ejemplo Debian.

Así que si estamos montando un servicio de cloud computing este tipo de SoC tienen mucho sentido para abaratar los costos, para un Oracle, olvídense.

Vía ExtremeTech

AMD gana gracias a las consolas y se vienen procesadores de 16 cores

Publicado por Fabio Baccaglioni el 23/01/2014 a las 14:39 (1690)
Tan mal no le fue durante el año pasado a AMD aun habiendo vendido menos en procesadores de escritorio, es que las consolas de videojuegos salvaron el negocio y lo seguirán haciendo en los años por venir.

Con pocas ganancias, no más de 0,11 centavos por acción, pero ¡ganancias en fin! la empresa logró superar las pérdidas netas gracias a sus varios frentes, que no son pocos, que operaron más o menos bien y el manejo del dinero correcto parece haberle dado un respiro.



Las consolas de videojuegos de Sony y Microsoft le inyectaron bastante efectivo durante el 2013 y lo seguirán haciendo durante 2014, aun así no es probable que mantengan los ingresos altos porque normalmente el dinero fluye inicialmente, luego decrece con el tiempo, pero este respiro puede ayudar mucho a la compañía.

Por otra parte AMD agregó un par de nuevos Opterons 6300, con el nombre código de Warsaw y con 12 y 16 núcleos (6 y 8 bloques cada uno) siguen apuntando a las clouds y centros de cómputo aunque en ese sentido los Haswell de Intel siguen siendo los mejores (más que nada en punto flotante).

Estos dos nuevos procesadores tienen un TDP de 99W, son de bajo consumo comparados con los 6380 de 115W y 6386SE de 140W, aun así aumentan la performance por watt un 27% comparados con la generación anterior.

El 6370P es de 16 núcleos a 2.0GHz con un turbo hasta 2.5GHz, el de 12 núcleos es el 6338P a 2.3GHz con turbo a 2.8GHz, utilizan los cores Piledriver y estan frabricados a 32nm.



Ahora bien, esto abre también el negocio a los nuevos Kaveri de 16 núcleos que ya estan en camino, en este caso con un diseño muy parecido pero unificando la comunicación en un SRI (system request interface) con un crossbar que conecta a seis distintos canales de comunicación a los distintos subsistemas de PCIe3, HT, MCT y demás.

El Behemont tendrá no sólo 16 cores, los mismos estarán en el mismo silicio, en vez de ser dos de ocho unidos.

Estos estarían basados en los cores Steamroller y el método de fabricación sería de 20nm o de 14nm si se llega a tiempo para 2015-2016. La idea de AMD es crecer hasta los 32 núcleos utilizando más cores de este tipo aumentando la performance a razón de 10 a 15% cada año.

Via XBitLabs 1 y 2 y ARSTechnica

Tegra K1, primeros benchmarks demuestran una ventaja notable

Publicado por Fabio Baccaglioni el 15/01/2014 a las 19:00 (1140)
Al parecer en el CES había un sólo equipo utilizando el hardware de NVidia, el Tegra K1, que pasó desapercibido para muchos, resulta que Lenovo presentaba también un panel de 28", el Thinkvision de 4K y con un Tegra K1 con Android para manejarlo.



El K1 está basado en cuatro núcleos ARM Cortex-A15 más el masivo paquete de 192 cores para el GPU, la velocidad del clock de este primer modelo era de apenas 2.0GHz cuando Nvidia anunció que estarían lanzándolo al mercado a 2.3GHz. Sea como fuere y aun a una velocidad un 15% menor que la del producto final, la performance parece darle a NVidia la corona momentánea en procesadores móviles.

La gente de Toms Hardware realizó varios tests, el Kishonti GFX Benchmark 2.7, el Futuremark 3DMark, Atutu y otros, pero claro, es un hardware todavía en desarrollo y que no está precisamente pulido, en algunos benchs ha dado menos resultados que equipos muy inferiores, falta mucho trabajo de drivers seguramente.



Por ejemplo en el testeo OnScreen la performance es mucho menor porque estaba generando gráficos para una pantalla 4K, en Offscreen es para 1080p y se puede notar cómo logra un framerate alto bajo las mismas condiciones que el resto:



En tal caso lo que muestran estos benchs es que queda mucho margen para mejora pero que ya mismo el K1 está por encima que el resto ¿Y la performance de batería? ahí es donde me gustaría ver su relación costo-beneficio, porque una cosa es una tablet rápida y otra una que dure y dure

Via Toms Hardware

Intel, si no puedes con los smartphones, adelántate a los -wearable-

Publicado por Fabio Baccaglioni el 08/01/2014 a las 13:08 (3666)
Algo quedó claro en este CES 2014, es el hecho de que Intel demostró que no puede con el mercado de Smartphones, simplemente llegó tan tarde que no pudo y en vez de quedarse intentando optó por lo que, a mi entender, es la jugada más inteligente: adelantarse.

Así es, como no van a poder quebrar a Qualcomm, Samsung, NVidia y tantos otros fabricantes de CPUs ARM lo mejor que encontraron fue la miniaturización extrema del x86 para ir a lo que sigue, la informática que puedas vestir y ya no como un mero accesorio de un teléfono sino como un producto inteligente por sí mismo.



El mejor caso para ejemplificarlo fue el Edison presentado, una PC completa en el tamaño de una tarjeta SD, un concepto que va mucho más allá de un smartphone, pensemos en la próxima década no en el próximo trimestre, dentro de esta tarjeta un procesador Quark de dos núcleos fabricado a 22nm, memoria RAM, almacenamiento flash, WiFi, Bluetooth y microcontrolador para I/O en tiempo real. Por el momento ejecuta Linux pero eso es lo de menos, porque la cuestión está en las posibilidades que abre para desarrolladores.

El concepto detrás de cosas como Edison está en poder demostrar que actualmente Intel es el que puede brindar "inteligencia" a todo, desde una taza de café hasta unos anteojos, todo puede procesar datos y comunicarse, tan sólo tomen una tarjeta SD para entender lo que esto significa.

Los Atom para celulares seguirán exisitendo, dependen tanto de los fabricantes de equipos que no pueden hacer nada más, y por otra parte toda la estructura de Bay Trail sirve perfectamente para el mercado de tablets Android que este año tendrá mayor crecimiento y necesidad de potencia, así que en ese ámbito pueden pelear tranquilos con ARM, pero en el de los teléfonos ya está todo dicho, no tienen lugar porque simplemente nadie se quiere complicar implementando otra arquitectura.

El resto de las opciones de Intel van por las tablets, la idea del Dual OS, que personalmente me parece ridícula en una tablet, ya está instaurada y también AMD, su rival único en x86, está en el mismo camino, con el smartphone ya como un producto maduro y definido el nicho de innovación queda en la computación ínfima, sea "wearable" (vestible) o en todo tipo de cosas, lo que faltan ahora son developers queriendo incorporar chips en cada cosa, pero... esa es un área en la que ARM también tiene experiencia, lo que pasa es que nunca se usó de manera masiva en productos de consumo y es ahí donde habrá un interesantísimo campo de batalla entre ambas arquitecturas.

Bien por Intel por ver más allá y no quedarse varados en el hoy, algo que sólo pueden hacer ellos porque disponen del cash y del 75% del mercado de procesadores de PCs y Servidores, claro

207 Noticias (21 páginas, 10 por página)



Powered by
Cake Division