AMD presenta su nuevo APU: Carrizo

Publicado por Fabio Baccaglioni el 24/11/2014 a las 15:06 (3530)


Tal vez alejados del hype móvil, AMD necesita lanzar nuevos procesadores para tratar de darle pelea a su máximo rival, Intel, aunque esto sea una batalla perdida ¡No hay que perder las esperanzas! así que Carrizo es parte del trabajo de AMD para lograr robarle en un segmento donde Intel puede estar más flojo.

Los APU le han dado una muy buena chance, el combo CPU+GPU integrados no sólo abarata costos sino que baja consumo, algo que hoy en día está muy en boga. El Carrizo es un APU basado en la última iteración del core Bulldozer, llamada Excavator, producido en 28nm.



Al igual que los otros APU no se espera un incremento en la potencia por core, lugar que le queda a Intel como líder indiscutido, en cambio va por la performance. La única adición importante es el AVX de 256-bit. El GPU por su parte está basado en el core Tonga aunque no se estima que incorporen un High Bandwidth Memory (HBM), dentro del APU, no al menos en los modelos baratos, aun así sigue siendo más potente que el GPU integrado de Intel.

En síntesis lo importante para AMD es achicar el gap con los Haswell y para ello debería aumentar la eficiencia un 30% por core, algo difícil ya que en cada iteración AMD logra dar con un 10% de mejora solamente. Los primeros Carrizo seguramente se verán para comienzos de 2015, la siguiente generación, con cambio de arquitectura, está planificada para 2016.

¿Qué mantiene arriba a AMD? Obviamente ser el proveedor de APUs de la XBox One y la PS4, eso, por suerte, le dará ingresos importantes durante casi una década.

Via Extremetech

Intel amplía la línea de Broadwell M con pequeños y rápidos procesadores

Publicado por Fabio Baccaglioni el 05/11/2014 a las 16:00 (1351)


La línea Core M sigue creciendo y en esta oportunidad con turbo, son cuatro procesadores de dos núcleos con HyperThreading con un TDP de 4.5" pero con la posibilidad de casi duplicar su clock en modo turbo durante un tiempo limitado.

El mayor modelo, por ejemplo, el M-5Y71 ofrece un clock base de 1.2GHz pero el Turbo lo lleva a 2.9GHz, no el doble pero casi.

Además de esto el TDP es escalable dependiendo lo que el ensamblador necesite, así el modelo más básico de 900MHz puede bajarse a 600MHz con un TDP de 3.5W o si se decide por un TDP mayor se puede llevar a 6W y un clock base de 1.4GHz.



El GPU (IGP) tienen un clock a 300MHz (los Core M anteriores apenas a 100MHz, 200% de mejora), y al igual que con el CPU éste también puede modificar su clock en base a requerimiento llegando hasta los 900MHz. El M-5Y71 resulta así en un procesador extremadamente flexible, overclockeando su CPU y GPU manteniendo un TDP de 4.5"

Obviamente el segmento buscado es el ultraportátil y tablets, con este TDP y velocidades pasan por encima a la mayoría de los modelos de ARM, el tema es que los fabricantes lo adopten.

Más data en Hot Hardware

Intel ofrecerá sus HEDT a 14nm en 2016, AMD baja precios de APUs

Publicado por Fabio Baccaglioni el 22/10/2014 a las 15:29 (2044)
Intel empezará a mostrar poco a poco los HEDT de 14nm pero no los veremos en el mercado hasta 2016, los Broadwell-E de nueva generación utilizarán el socket LGA2011v3 que es compatible con los motherboards X99, la arquitectura cambia levemente con mejoras.

Ya el proceso de fabricación lo deja a kilómetros de su rival, con 14nm, sies a ocho núcleos, 20MB de caché L3 los "high-end desktop" tendrán soporte para DDR4 de cuatro canales, PCIe de 28 líneas para los entry level y 40 líneas para el full, el TDP estará por los 140W.



Con una rebaja entre un 15 y 20% los APU de AMD han tenido que bajar su precio aunque falte para que se note en Retail, lo cierto es que no podían competir ni con sus propios modelos CPU exclusivos ni mucho menos con el costo-performance de Intel. Así que con este cambio al menos pueden ser competitivos, eso sí, su margen de ganancias es muy bajo para la empresa, pero otra opción no tienen.

A-series APU Model

Compute Cores

Graphics

TDP (cTDP)

Suggested Etail Pricing (USD)

A10-7850K

12 (4CPU + 8GPU)

R7

95 (65/45)

$143

A10-7800

12 (4CPU + 8GPU)

R7

65 (45)

$133

A10-7700K

10 (4CPU  + 8GPU)

R7

95 (65/45)

$123

A8-7600

10 (4CPU + 8GPU)

R7

65 (45)

$92

A6-7400K

6 (2CPU+4GPU)

R5

65 (45)

$58



También Lisa Su la nueva CEO de AMD anunció que la siguiente arquitectura también estará para 2016, es la arquitectura Zen de x86 para servidores llegará recién en dos años, hasta el momento el detalle más importante de Zen es que abandona el diseño de clustered multi-thread (CMT) por uno más tradicional simultaneous multi-threaded (SMT).

Dentro del Apple A8

Publicado por Fabio Baccaglioni el 25/09/2014 a las 19:51 (1976)
Un poco de nerdada para los que nos gustan los procesadores y su desarrollo.



Apple hace rato que viene creando sus propios SOC basados en ARM al igual que sus rivales y ya no depende de Samsung para producirlos, el site Chipworks realizó el típico paseo de ingeniería inversa más en detalle posible con el nuevo SoC fabricado por TSMC en su nuevo proceso de 20nm que utilizan los iPhone 6 y el iPhone 6 Plus.

El A8 tiene pequeñas diferencias con el A7 anterior, empezando por el tamaño que pasó de 17.1mm2 para el CPU a 12.2mm2 y, al parecer, pasaron a tener una L2 individual por núcleo en vez de una compartida como en el modelo anterior, según Chipworks podrían ser, tanto L1 como L2, mayores en capacidad.

Por otra parte la SRAM L3 mantiene casi el mismo tamaño de 4MB pero achicándose un 33% en superficie, una ventaja enorme en el cambio de proceso.

Lo que no aumentó demasiado en tamaño es el GPU que contradijo las expectativas al disponer de los mismos cuatro núcleos en vez de los esperados seis, utilizando el PowerVR GX6450 en vez del GX6650 que se esperaba y si bien Apple aclama hasta un 50% más de performance hay que considerar que modelos como el iPhone 6 Plus ahora cuentan con mayor resolución y la performance, según benchmarks preliminares, no es más de un 25% en algunos casos, aunque siempre mejor que el iPhone 5S.



Según ARS Technica la performance en full screen cae bastante en el Plus. En términos generales el salto de performance es menor entre versiones pero desde mi punto de vista, al cambiar el proceso de fabricación, de 28nm a 20nm, es razonable, algo que sucede con las opciones de todas las marcas salvo con Intel que ya está por los 14nm FinFET, algo que pocos fabricantes pueden considerar de momento.

Durante 2015 casi todos los fabricantes estaran vendiendo SoC de 20nm con Intel llevándole la delantera a todos hasta 2016 donde se espera una mayor adopción de los métodos de 14 y 16nm FinFET.

Via ChipWorks

Intel NUC 2.0 se filtra una posible Steam Machine

Publicado por Fabio Baccaglioni el 25/08/2014 a las 18:07 (2282)
Si los papeles son tan positivos para el NUC de Intel hasta podríamos estar hablando de una Steam Machine realmente económica.



En la nueva versión del "Next Unit of Computing", el pequeño dispositivo con procesadores Intel y mucho más potente que la versátil Raspberry Pi, es que los nuevos NUC tendrán varios modelos con i3 e i5 tanto Broadwell como Braswell con soporte hasta 8GB y 16GB DDR3.

El tema del GPU sigue siendo el Intel HD de la marca pero estos vienen acelerando muchísimo su performance y la mayoría de los equipos utilizados en Steam poseen una similar.



Según los slides filtrados los nuevos NUC apuntan a resoluciones de hasta 4K para uso tipo home theater, puertos USB 3.0, mini HDMI, DisplayPort, y en el modelo más caro audio por fibra óptica.

Los modelos más sencillos apuntan a HTPC más livianos con procesadores Atom, pero los interesantes aquí son los realmente potentes. Veremos dichos modelos para 2015.

Via Slashgear

Samsung pasa el Exynos 5 a 20nm

Publicado por Fabio Baccaglioni el 15/08/2014 a las 16:09 (1914)
Samsung también apuesta por volver más eficientes sus Octa-Core, en este caso pasar el Exynos 5 5430 al proceso de 20nm, es el mismo procesador que utiliza el Galaxy Alpha.



La reducción del proceso de fabricación le permitirá bajar el consumo, punto clave en los Exynos, achicar el tamaño de silicio necesitado (baja los costos) o simplemente bajar el consumo utilizando el mismo tamaño o, la mejor combinación, menor consumo, mayor performance y menores costos.

El proceso de achicar de 28nm a 20nm tiene obvias ventajas pero también es complejo, a menor tamaño las pérdidas energéticas suelen ser un problema (electrones que saltan, las famosas "pérdidas") que se solucionan con nuevos materiales y eso también eleva costos de investigación y desarrollo.

Inicialmente el cambio podrá otorgar un 12.5% de mayor velocidad de clock al GPU, por ejemplo, el Mali-T628MP6 puede pasar de 533 a 600MHZ sin cambios en el consumo.

Pero el trabajo principal de Samsung para aprovechar la arquitectura big.LITTLE va más de la mano de los drivers y el software, actualmente el uso es ineficiente y se nota en el consumo de batería irregular, a veces performante, a veces no, que ofrece.

La idea no es mala en el papel, pero en la realidad es difícil de aplicar y los núcleos A15 son muy potentes en comparación con lols A7 pequeños, el salto de uno a otro es la cuestión.

El 5430 cuenta con un noveno núcleo adicional, un A5, para decodificar audio y video H.265, el GPU puede manejar 4K como resolución, sobra para el Galaxy Alpha pero por ahí vemos una tablet con estas resoluciones. El 5433 está planeado para la Galaxy Note 4, y ahí si veremos más performance en una tablet de la firma coreana que jamás vimos.

Via Toms Hardware

Intel Core M, 14nm y las ventajas de achicar más

Publicado por Fabio Baccaglioni el 12/08/2014 a las 18:03 (2552)


Broadwell es la siguiente iteración de Intel, el "tick" antes del "tock" en el proceso de desarrollo de Intel, los "tick" son los cambios en proceso de fabricación y los "tock" en arquitectura.

Así que, en este caso, la performance del CPU varía muy poco como en todos los "tick", un 5%, pero el proceso de fabricación pasa a ser de 14nm desde los 22nm del Haswell.

Los Core M son los dedicados exclusivamente al mercado de tablets y portables con TDPs que en Broadwell Y bajan hasta los 4.5W de los 11W anteriores.

Cambian muchas cosas para lograr este resultado agresivo en performance por watt, 25% menos consumo en general, reduciendo el tamaño físico de la SRAM en un 58%.



Hay un enorme trabajo en los niveles de ejecución y la performance del controlador de voltaje y el GPU es el que mayor mejora reporta con un aumento del 20% en cantidad de unidades de cálculo y 50% más shaders, habrá que esperar a los benchmarks para ver cómo se lleva con el Tegra K1, por lejos el más potente.

El target de Intel y los Broadwell Y es obviamente ARM, tratar de robarle el territorio Tablet ya que no hay ARM a menos de 22/28nm en el mercado, la diferencia puede ser notable.



El problema para Intel es que Qualcomm tiene todo el mercado LTE a sus pies e Intel carece de una radio LTE de la calidad de su rival en sus chipsets, de hecho, los Snapdragon incluyen la radio en el SOC por lo que son mucho más eficientes que utilizando un chip por separado, hasta Samsung utiliza los Snapdragon cuando necesitan teléfonos para mercados occidentales con LTE y dejan el Exynos octa core.

¿Podrá Intel quebrar la hegemonía de ARM? Yo creo que será un duro rival, tienen la billetera, tienen el músculo, pero tienen que, indefectiblemente, quebrar al costumbre de un mercado.

Via Extremetech

IBM presenta un procesador simulando el comportamiento neuronal

Publicado por Fabio Baccaglioni el 08/08/2014 a las 15:44 (2996)


Interesante desarrollo de IBM para lograr un CPU que funcione bajo un paradigma distinto al de von Newman, en vez de procesar y guardar en memoria, trabajar como las neuronas, almacenando en cada una e interconectándolas.

Este diseño es parecido en cierta manera a los APU actuales pero no del todo, en vez de basarse en una enorme memoria cada pequeño núcleo posee la propia.

De esta forma logran restar el consumo excesivo de energía que se requiere en el bus de datos y la memoria RAM, también disminuyendo las latencias, y por sobre todo eliminando partes en juego.

El procesador TrueNorth es un experimento, no posee la capacidad ni de aprender ni almacenar, es una idea para implementar un diseño, pero no es una inteligencia artificial ni nada parecido. La mayor ventaja de este diseño distribuido es la posibilidad de consumir muy poca energía por centímetro cuadrado, a razón de 25 miliwatts cuando un CPU tradicional de uso general consume unos 100W en la misma superficie.

Con 4096 núcleos simula unas 256 millones de sinapsis y un millón de "neuronas" que contra los 100.000 millones del cerebro humano dejan en claro que la cantidad está muy lejos de lo que la naturaleza nos brindó, pero tampoco es el objetivo de IBM.



El diseño cuenta con una grilla de 64x64 núcleos, cada uno implementa 256 neuronas y 65536 sinapsis, su propia SRAM y router de comunicación y puede entregar a razón de 46.000 millones de SOPS, operaciones de sinapsis por segundo por watt, que no se pueden comparar con los FLOPS directamente así que sólo se podrá realizar algún benchmark en base a resultados, pero para darse una idea un buen CPU está en 4500 MFLOPS por watt.

Por lo pronto el primer uso que le da IBM en su experimento es el reconocimiento de objetos y rostros en base a pequeñas imagenes de 400x240 a 30fps, reconociendo personas, vehículos, autos, camiones y demás desde ese feed de video en tiempo real.

No reemplaza ni a los CPU ni los GPU, los complementa, porque para otro tipo de operaciones no es ideal, lo interesante es que exista una nueva aproximación ya que no necesariamente el paradigma que utilizamos actualmente sea ni el único ni el mejor.

Más data en Wired y Popular Mechanics

Qualcomm compra Wilocity y se viene el WiFi en 60GHz

Publicado por Fabio Baccaglioni el 04/07/2014 a las 04:28 (2083)


Qualcomm ha comprado la empresa Wilocity que el año pasado durante el CES mostró su tecnología para transmitir WiFi en la banda de 60GHz para lograr velocidades enormes.

El WiGig, como lo llamaron, entra en el protocolo 802.11ad en prueba, es una combinación del 802.11ac en la banda de 5GHz, los "viejos" 802.11b/g/n en la de 2.4GHz y con esto logrando un máximo de hasta 7Gbps de transferencia. Si, todo eso en cortas distancias.

La banda de 60GHz es muy suceptible a las interferencias así que esto serviría para distancias más cortas que un WiFi tradicional, pero las velocidades logradas son bestiales.

Actualmente hay pocas redes que necesiten estas tasas pero obviamente Qualcomm tiene la mira en el futuro, la compra de USD 300 millones por Wilocity, empresa en la cual Qualcomm Atheros tenía inversión desd 2008, tiene mucho sentido para poder incorporar en los Snapdragon las tres radios en una.

Se espera esta tecnología tri-banda para el Snapdragon 810 que tieen fechs para la primer mitad de 2015, comparados con los únicos equipos tri-banda, que combinan una de 2.4GHz y dos de 5GHz, éstos otorgan no más de 3.2GBps de ancho de banda, ya con lograr los 4.6Gbps de las demos de Wilocity sería una ventaja enorme, ni hablar si llegan a los 7Gbps prometidos.

Via ARSTechnica

Intel presenta un Xeon integrado a un FPGA

Publicado por Fabio Baccaglioni el 19/06/2014 a las 17:52 (2090)


Ayer Intel anunció uno de los mayores cambios en su línea Xeon con el nuevo modelo en formato FPGA para el socket estandar E5 LGA2011 pero integrado con un FPGA ¿Qué es FPGA?

Los procesadores FPGA (field-programmable gate array) permiten ser reprogramados para funciones específicas, son típicos para GPGPU y aceleradores, ASIC, y para controladores programables, ahora bien, aquí estamos hablando de un procesador de uso general utilizado de esta forma.

Piensen en un procesador creado específicamente para una tarea, no para muchas, una en particular, esto acelera procesos muchísimo, un ejemplo son los ASIC dedicados a Bitcoin.

Estos Xeon+FPGA irían acompañados de procesadores normales de uso general para ordenarle qué tareas realizar pero lo interesante de esta forma de presentarlo es que son reprogramables, es decir, una vez terminada la tarea específica se puede reorganizar su estructura para el siguiente trabajo y no gastar en nuevo hardware.

No será un procesador similar a un Xeon actual, seguramente fabricado por Altera pero con el soporte y diseño de Intel y el packaging para el slot LGA2011 dentro de un E5 integrando por una interfaz coherente de baja latencia.

Una vez más Intel busca que los usuarios no se vayan de x86 y eviten pasarse completamente a OpenCL u otras alternativas de GPGPU. En un futuro hasta podría ser algo común tener un CPU con partes programables, veremos si funciona este proyecto de Intel que ya ha intentado algo parecido con los Xeon Phi pero nunca tan dedicado en un mismo socket.

Via Extreme Tech
222 Noticias (23 páginas, 10 por página)



Powered by
Cake Division