IBM presenta un procesador simulando el comportamiento neuronal

Publicado por Fabio Baccaglioni el 08/08/2014 a las 12:44 (2785)


Interesante desarrollo de IBM para lograr un CPU que funcione bajo un paradigma distinto al de von Newman, en vez de procesar y guardar en memoria, trabajar como las neuronas, almacenando en cada una e interconectándolas.

Este diseño es parecido en cierta manera a los APU actuales pero no del todo, en vez de basarse en una enorme memoria cada pequeño núcleo posee la propia.

De esta forma logran restar el consumo excesivo de energía que se requiere en el bus de datos y la memoria RAM, también disminuyendo las latencias, y por sobre todo eliminando partes en juego.

El procesador TrueNorth es un experimento, no posee la capacidad ni de aprender ni almacenar, es una idea para implementar un diseño, pero no es una inteligencia artificial ni nada parecido. La mayor ventaja de este diseño distribuido es la posibilidad de consumir muy poca energía por centímetro cuadrado, a razón de 25 miliwatts cuando un CPU tradicional de uso general consume unos 100W en la misma superficie.

Con 4096 núcleos simula unas 256 millones de sinapsis y un millón de "neuronas" que contra los 100.000 millones del cerebro humano dejan en claro que la cantidad está muy lejos de lo que la naturaleza nos brindó, pero tampoco es el objetivo de IBM.



El diseño cuenta con una grilla de 64x64 núcleos, cada uno implementa 256 neuronas y 65536 sinapsis, su propia SRAM y router de comunicación y puede entregar a razón de 46.000 millones de SOPS, operaciones de sinapsis por segundo por watt, que no se pueden comparar con los FLOPS directamente así que sólo se podrá realizar algún benchmark en base a resultados, pero para darse una idea un buen CPU está en 4500 MFLOPS por watt.

Por lo pronto el primer uso que le da IBM en su experimento es el reconocimiento de objetos y rostros en base a pequeñas imagenes de 400x240 a 30fps, reconociendo personas, vehículos, autos, camiones y demás desde ese feed de video en tiempo real.

No reemplaza ni a los CPU ni los GPU, los complementa, porque para otro tipo de operaciones no es ideal, lo interesante es que exista una nueva aproximación ya que no necesariamente el paradigma que utilizamos actualmente sea ni el único ni el mejor.

Más data en Wired y Popular Mechanics

Qualcomm compra Wilocity y se viene el WiFi en 60GHz

Publicado por Fabio Baccaglioni el 04/07/2014 a las 01:28 (1979)


Qualcomm ha comprado la empresa Wilocity que el año pasado durante el CES mostró su tecnología para transmitir WiFi en la banda de 60GHz para lograr velocidades enormes.

El WiGig, como lo llamaron, entra en el protocolo 802.11ad en prueba, es una combinación del 802.11ac en la banda de 5GHz, los "viejos" 802.11b/g/n en la de 2.4GHz y con esto logrando un máximo de hasta 7Gbps de transferencia. Si, todo eso en cortas distancias.

La banda de 60GHz es muy suceptible a las interferencias así que esto serviría para distancias más cortas que un WiFi tradicional, pero las velocidades logradas son bestiales.

Actualmente hay pocas redes que necesiten estas tasas pero obviamente Qualcomm tiene la mira en el futuro, la compra de USD 300 millones por Wilocity, empresa en la cual Qualcomm Atheros tenía inversión desd 2008, tiene mucho sentido para poder incorporar en los Snapdragon las tres radios en una.

Se espera esta tecnología tri-banda para el Snapdragon 810 que tieen fechs para la primer mitad de 2015, comparados con los únicos equipos tri-banda, que combinan una de 2.4GHz y dos de 5GHz, éstos otorgan no más de 3.2GBps de ancho de banda, ya con lograr los 4.6Gbps de las demos de Wilocity sería una ventaja enorme, ni hablar si llegan a los 7Gbps prometidos.

Via ARSTechnica

Intel presenta un Xeon integrado a un FPGA

Publicado por Fabio Baccaglioni el 19/06/2014 a las 14:52 (1917)


Ayer Intel anunció uno de los mayores cambios en su línea Xeon con el nuevo modelo en formato FPGA para el socket estandar E5 LGA2011 pero integrado con un FPGA ¿Qué es FPGA?

Los procesadores FPGA (field-programmable gate array) permiten ser reprogramados para funciones específicas, son típicos para GPGPU y aceleradores, ASIC, y para controladores programables, ahora bien, aquí estamos hablando de un procesador de uso general utilizado de esta forma.

Piensen en un procesador creado específicamente para una tarea, no para muchas, una en particular, esto acelera procesos muchísimo, un ejemplo son los ASIC dedicados a Bitcoin.

Estos Xeon+FPGA irían acompañados de procesadores normales de uso general para ordenarle qué tareas realizar pero lo interesante de esta forma de presentarlo es que son reprogramables, es decir, una vez terminada la tarea específica se puede reorganizar su estructura para el siguiente trabajo y no gastar en nuevo hardware.

No será un procesador similar a un Xeon actual, seguramente fabricado por Altera pero con el soporte y diseño de Intel y el packaging para el slot LGA2011 dentro de un E5 integrando por una interfaz coherente de baja latencia.

Una vez más Intel busca que los usuarios no se vayan de x86 y eviten pasarse completamente a OpenCL u otras alternativas de GPGPU. En un futuro hasta podría ser algo común tener un CPU con partes programables, veremos si funciona este proyecto de Intel que ya ha intentado algo parecido con los Xeon Phi pero nunca tan dedicado en un mismo socket.

Via Extreme Tech

Adiós a los smartphones para NVidia

Publicado por Fabio Baccaglioni el 26/05/2014 a las 11:04 (1251)


Los Tegra ya no los veremos en ningún celular, tampoco es que los tengamos a nuestra disposición, hace tiempo que Qualcomm, Samsung, Mediatek, TI y tantos otros compitiendo en el mercado de los ARM hace casi imposible operar en ese mercado. Lamentablemente para el ecosistema estamos en un punto donde la gran variedad de oferta no parece ser lo que los fabricantes desean, simplifican, achican.

Los Tegra parecen tener futuro en los dispositivos móviles para jugar pero no mucho más, los GPU de NVidia, en cambio, tienen bastante potencial todavía y ni hablar en los casos de HPC para procesamiento de punto flotante masivo como para cálculo numérico o bitcoins.

Pero de bitcoins y consolitas baratas no vivirá NVidia, según el CEO Jen-Hsun Huang el foco se dedicará completamente al gaming pero ¿Cómo podrá sobrevivir si las consolas de videojuegos utilizan productos de AMD exclusivamente?

Otro mercado donde el CEO indica que se enfocarán es el de automóviles donde el Tegra tiene más chances, pero para Huang el hecho de haberse dedicado a procesadores de alto nivel y performance ha hecho que el Tegra 4i no sea exitoso en celulares donde el mercado se estabilizó en procesadores limitados pero rentables como los Cortex-A7 de cuatro núcleos (ej: Moto G), y sólo un segmento muy pequeño en los de alto perfil (Exynos, Snapdragon 800), lo que no les dejó margen.

¿Habrá un Tegra 5? Huang no lo confirma porque dice que no habla de proyectos futuros que no anunciaron pero todo hace entender que si bien habrá no estará orientado a teléfonos, esa batalla ya se ha perdido.

Nota completa a Huang en CNET via Celularis

Para Julio los Intel Broadwell de 14nm al mercado masivo

Publicado por Fabio Baccaglioni el 20/05/2014 a las 13:19 (1617)


Con algunos atrasos en la cadena de producción que los obligaron a reagrupar, mejorar y atrasar el lanzamiento, los Intel Broadwell llegan para mediados de año con su proceso de 14nm, único en el mercado, nadie está en semejante proceso todavía.

El delay acercó los tiempos de Samsung, TSMC y GlobalFoundries en sus propios procesos de 14nm pero éstos llegarán igualmente 18 meses después, aunque no 24 como antes. Ahora bien, esta ventaja de tiempos le puede permitir quebrar la barrera de los ARM que se han apropiado de todo el mercado móvil.

Por otra parte el reducir el proceso no va a aumentar notablemente la performance pura, más bien la de consumo, en el CPU para desktop hablamos de una cache de 128MB L4 que probablemente termine también en los móviles, algo nunca visto hasta ahora y que le dará una ventaja con respecto a Qualcomm aunque la falta de una radio integrada sigue siendo el mayor problema.

De Clover Trail a Bay Trail hubo interesantes cambios pero ahora con Cherry Trail la cuestión busca superar notablemente esto y ser más tentador en smartphones y tablets para fabricantes, justamente tocando el tema del GPU con ocho cores basados en los que usa el Ivy Bridge, el CPU aumenta los clocks y suma mayor ancho de banda para la memoria, aun siendo una arquitectura basada en Bay Trail.

Para fin de año se hará el paso a Braswell, la nueva arquitectura Atom, aunque no hay datos conociendo el proceso histórico de Intel primero hacen cambio de proceso luego de arquitectura y siempre han sido saltos cualitativos importantes, este seguramente estará mucho mejor situado para competir contra ARM en los equipos high-end donde Intel necesita sí o sí posicionarse.

Actualmente con Bay Trail estan un 40% por debajo de un Apple A7 o un Snapdragon ¿Podrá el proceso de 14nm acercar a Intel a la cima en procesadores móviles?

AMD y ARM el dúo más extraño

Publicado por Fabio Baccaglioni el 07/05/2014 a las 11:54 (1718)
AMD está rotando totalmente su estrategia de procesadores y eso me agrada mucho, para mi es el movimiento correcto ya que quedándose solamente en procesadores x86 nunca podrán salir de la sombra de Intel, pero este "matrimonio" con ARM es extraño y jugado, y cuando alguien arriesga, para mi vale la pena prestarle atención.



El proyecto "Skybridge" busca implementar en un mismo SoC tanto un core x86 como un ARM en un mismo formato, es decir, pin compatible poder cambiar entre uno u otro depenidendo el dispositivo a usar, utilizando un A57 de bajo consumo como opción pero compatible 100% con el socket, el motherboard y todos los complementos.

Para 2015 tendremos entonces el primer SoC ARM de AMD oficial orientado a plataformas Android en vez de servidores como el proyecto Seattle que verá la luz este año (uno de ocho nucleos orientado a HPC, Cortex A-57 a 28nm), el hecho de ser compatible en pines permite una reducción notable de costos a la hora de implementación, el proceso de fabricación será de 20nm, y no es de extrañar que veamos alguna tablet de una marca que tenga una versión ARM y otra x86 en un mismo modelo porque sólo habrá que cambiar el SoC para ofrecer dos modelos distintos.



Una de las limitaciones de AMD y sus x86 es con la complejidad para fabricarlos en procesos menores a 20nm, por esta razón usar diseños de ARM tiene sentido, poder utilizar a futuro el proceso FinFET de 14/16nm, por esto para 2016 ya estan planeando el K12, un ARMv8 de 64 bits junto a un core x86 nuevo (todavía sin nombre) que iran en el mismo silicio.

Esto implica crear un nuevo diseño de x86 para reemplazar los Puma actuales pero para aprovechar además la posibilidad de alta velocidad de los dos diseños, en todos los casos incluirán GPU integrado así que AMD se está abriendo poco a poco paso en el mercado más jugoso de los últimos tiempos: móviles.

Por el momento no esperaría a ver un celular con estos SoC, hay mucho camino para competir contra monstruos como Qualcomm que tienen otra ventaja, los chips de banda base ya incorporados en el SoC, algo que AMD ni por asomo tiene e Intel está implementando poco a poco. Pero si NVidia pudo entrar a este negocio no veo por qué no AMD.

Más detalles en Anandtech

AMD Beema y Mullins, la competencia de bajo consumo contra Bay Trail

Publicado por Fabio Baccaglioni el 29/04/2014 a las 12:16 (1976)
AMD se alejó bastante del mercado mobile porque sencillamente no podía enfocarse en tantas cosas a la vez como su gran rival Intel, pero derivando el desarrollo de los Temash y Kabini han nacido dos opciones de low power que estan bastante bien posicionadas contra los Atom de Intel, los Bay Trail, ya que aprovechan la ventaja de tener un GPU potente y de mejor diseño que las opciones de Intel.



El foco de AMD ahora sí puede orientarse a el bajo consumo, algo que le ha costado mucho incluyendo la pérdida de casi todo el mercado móvil que tenían el cual sólo sostienen a base de precios mucho más accesibles, pero nada más.

Los APUs Beema son SoCs con un TDP de no más de 15Watts, desde dos núcleos a 1.35GHz a cuatro núcleos con un clock a 2.4GHz, GPU de 128 cores con velocidades de 350 a 800MHz y soporte para memorias DDR3L-1333 a DDR3L-1866. La gama de nombres E1, A4, A6 y A10 forman esta primer familia.

Pero hay otra camada, los APU Mullins con TDPs mucho más pequeños, el mayor ejemplo es el A10 Micro-6700T con un TDP de 4.5W, cuatro núcleos a 2.2GHz, el GPU a 500MHz y soporte para memorias DDR3L-1333 y el más pequeño, E1 Micro-6200T de dos núcleos, 3.95W y 1.4GHz.

En todos los casos el GPU es el GCN de 128 núcleos Radeon donde lo único que cambia es el clock y obviamente la interfaz de memoria, esto es interesante porque marca un estándar de GPU para el desarrollo entre todos los procesadores, el GPU es una gran parte del área de procesador.

Los núcleos Puma+ van acompañados de un ARM A5 de 32 bits como procesador de seguridad, con su propia ROM y RAM, ofreciendo Trusted Execution Environment (TEE), para booteo seguro en equipos rooteados y aceleración criptográfica.



En HotHardware realizaron los benchmarks mano a mano con un Intel Core i3-2377M a 1.5GHz , el Atom Z3770 a 2.4GHz y el Atom Z2760 a 1.8GHz mostrando unos resultados más que sorprendentes principalmente en el área gráfica pero también como CPU. En GPU es obvio que Intel queda muy atrás en su solución integrada aunque no hay que creer que esto es definitivo considerando el trabajo que estan realizando en los GPUs integrados de los procesadores más grandes tipo Haswell.

Vean los benchmarks en HotHardware

Los nuevos lanzamientos de Qualcomm dejan en claro que tu móvil es obsoleto

Publicado por Fabio Baccaglioni el 07/04/2014 a las 15:16 (2407)


Si creían que con un Galaxy S5 tenían todo el poder posible tan sólo esperen unos meses y ya será "viejo". Aunque soy de la teoría de que todo equipo informático llega a una meseta cuando se supera ampliamente la "necesidad" del usuario (véase desktops y notebooks, por ejemplo) los celulares todavía parecen tener un margen aunque aparente llegar también a dicho estancamiento.

Qualcomm en cambio parece querer darle un empujoncito más con el Snapdragon 810 (y el 808 en el mid range) pensados para el año que viene y con soporte de 64 bits y ocho núcleos Cortex-A57/A53.

Estos nuevos SoC serían la versión más potente de lo que hasta ahora se presentó como 610 y 615, para darles una idea de crecimiento, el proceso de fabricación será de 20nm, el objetivo son pantallas 2K a 4K de resolución, el GPU será el Adreno 430 con un 30% más de performance que el 420 que al día de hoy ni siquiera llegó al mercado todavía. El soporte de memorias es LPDDR4 y sumará procesadores de activación de voz y procesamiento de imagen dual.

Como se puede ver en el diagrama de diseño el área utilizada por los núcleos (8 en el 810, 6 en el 808) es ínfima en comparación con el resto, el GPU Adreno 430 ocupa un buen lugar pero la mayor parte se la lleva el Modem de cuarta generación LTE-Advanced Cat 6 ya integrado en el silicio con MIMO de dos canales para el WiFi.



El 808 está pensado para llevar dos cores A57 y cuatro A53 con soporte de video 2K y LPDDR3 más un Adreno 418, sería la versión intermedia entre el 810 y los 610/605. La era de los 64 bits en móviles está en casi todas las marcas aunque ningún software pueda sacarle provecho actualmente (ni el iPhone 5S que ya lo incorpora tiene RAM como para usarlo), pero si pensamos en dispositivos intermedios como tablets poderosas y demás, es posible que tengan sentido de aquí a 2015.

Con esta evolución de los procesadores basados en ARM yo miraría más hacia Intel y el "problema" que le significa que se le aproximen tanto los ARM a los x86 cuando hasta ahora la mayor diferencia era que éstos eran mucho menos potentes.

Via Engadget

Apple Cyclone, el core del A7 mucho más complejo que un Krait

Publicado por Fabio Baccaglioni el 31/03/2014 a las 17:45 (2907)
Apple liberó parte del código de LLVM y esto permitió conocer en detalle varias características del procesador A7 de 64 bits que actualmente potencia al iPhone 5S.

Lo interesante es comparar con la tecnología utilizada en el A6, una de las críticas hacia el A7 el día de su lanzamiento fue que no aumentaba la cantidad de núcleos y sólo ofrecía 64 bits como diferencial, pero por dentrgo los cambios eran más notables y si bien en performance no es muy grande la diferencia, sí lo es en arquitectura.

El A7 con los núcleos Cyclone es más parecido a un Haswell de Intel que a un Krait de Qualcomm y eso es más que relevante. El tema de los 64 bits es anecdótico y con utilidad a futuro, estos cambios también pero se notará su diferencia en las generaciones inmediatamente posteriores. La razón es que un núcleo más complejo no puede utilizar un clock tan acelerado... hasta que se cambia el proceso de fabricación. Y eso es lo que se le viene a Apple para su siguiente generación al pasar al proceso de 20nm de TSMC.



En detalle un Cyclone puede procesar hasta seis hilos simultáneamente en un diseño out-of-order, el doble que los otros diseños, el buffer de reorden pasó de 45 micro-ops a 192 micro-ops necesario para poder manejarlo así, esto agrega dos ciclos más, 16 en vez de 14, pero duplicaron las unidades ALU de enteros, además de extender hasta una tercer caché con la L3.

La diferencia no se nota en los clocks actuales pero la realidad es que fácilmente un A7 con un clock más fuerte podría desplazar sin problemas a un Octa Core aun con menos núcleos, el tema es que en el proceso actual no se puede sin quemara la batería. Lo ideal será en el ciclo A8-A9 al pasar a los ya mencionados 20nm.

Apple Custom CPU Core Comparison
  Apple A6 Apple A7
CPU Codename Swift Cyclone
ARM ISA ARMv7-A (32-bit) ARMv8-A (32/64-bit)
Issue Width 3 micro-ops 6 micro-ops
Reorder Buffer Size 45 micro-ops 192 micro-ops
Branch Mispredict Penalty 14 cycles 16 cycles (14 - 19)
Integer ALUs 2 4
Load/Store Units 1 2
Load Latency 3 cycles 4 cycles
Branch Units 1 2
Indirect Branch Units 0 1
FP/NEON ALUs ? 3
L1 Cache 32KB I$ + 32KB D$ 64KB I$ + 64KB D$
L2 Cache 1MB 1MB
L3 Cache - 4MB


Por ejemplo otra limitación era lanzarlo con memorias RAM de apenas 1GB, es un procesador que podría manejar tranquilamente 16GB si quieren, pero Apple fue extremadamente conservadora en su primer versión. Si proyectamos este diseño a futuro es plausible la idea de una total independencia de la empresa de los proveedores de microprocesadores para la mayoría de sus líneas.

Es decir, no sería de extrañar ver una Apple con procesador propio y no me refiero ni a los iPhone ni iPads sino las Macbook, algo que se ve a lo lejos pero que necesita sí o sí de una performance similar a la de un Haswell para tener sentido. Al menos en la arquitectura general se parecen.

Intel, el principal "complicado" ante estas maniobras de Apple ya ha hecho algo parecido, pasar en un sólo ciclo a tres versiones con los Saltwell/Silvermont/Airmont en el rango de apenas dos años y sigue sin poder proveer a sus clientes móviles en la cantidad que lo hace Qualcomm. Apple optó por sus propios diseños, una medida nada extraña para alguien con semejante billetera, pero ¿Podrá Intel convencerla de volver? muy difícil, ahora Apple tiene el control real.

Por otra parte el cambio de proceso a 20nm cambiará notablemente las velocidades conservadoras del A7 (entre 1.3 y 1.5GHz) y lo hará más competitivo con los Exynos y Tegras, pero con estas modificaciones de arquitectura probablemente no necesite superar los 2GHz para lograr una mayor eficiencia por ciclo, y esa será una de las mayores ventajas en el largo plazo.

Via Extremetech

Intel por dos: Iris Pro desbloqueado para desktops y un i7 de ocho núcleos

Publicado por Fabio Baccaglioni el 20/03/2014 a las 11:30 (9616)


Dos interesantes anuncios de Intel, primero el lanzamiento del Iris Pro para desktops y desbloqueado, el procesador con el GPU más potente a la fecha de Intel que hasta ahora sólo se conseguía en algunas plataformas en particular.

Esta es la primera vez que se puede acceder a un Broadwell con Iris Pro en formato socket en vez del BGA al cual podían acceder algunos OEM como Apple y Gigabyte, esto permitirá a cualquier fabricante o ensamblador hasta hogareño crear su propia PC con este particular procesador.

Lo que no aclaró Intel es si será el mismo Iris Pro HD 5200 o será uno totalmente nuevo. El Broadwell se produce en el más extremo de los procesos actuales, el de 14nm. Y no sólo eso es la noticia, vendrá completamente desbloqueado para overclockers, tanto con el multiplicador como el strap, la memoria, y los núcleos totalmente ajustables junto a un set de aplicaciones de overclocking.

El segundo anuncio es un i7 de ocho núcleos "Devil's Canyon" junto a la plataforma Intel X99. Este bestial procesador y el chipset proveeran también de soporte DDR4, siendo el primer procesador dedicado al escritorio con ocho núcleos (hay de más pero son fabricados para servers o workstations, no para este segmento aunque se pueden usar a tal fin). Ah, obviamente procesa 16 threads, el CPU ideal para los que estan renderizando 3D.

Desde ya que no existe un rival para esta plataforma, simplemente será durante unos años más la más potente para escritorio de manera indiscutida. El motherboard basado en X99 podrá ofrecer todo lo que el X79 se había dejado a mitad de camino pero todavía Intel no quiere entrar en detalles aun cuando lo está anunciando en la GDC.

Lanzar un procesador para un mercado que no existe es medio raro, pero por otra parte Intel está marcando el futuro del desktop para entusiastas, para overclockers y gamers serios, no les importa si hay o no competencia, tienen que empujar los límites más allá.

Más datos en Intel

215 Noticias (22 páginas, 10 por página)



Powered by
Cake Division