Meta lanza Llama 2, su segundo LLM y es Open Source

18 julio, 2023

264

Todos hablan de ChatGPT por ser el primero y exitoso pero Meta (Facebook) ya viene trabajando hace tiempo en su propia versión que se dio a llamar Llama. Lamentablemente Llama no tenía una licencia comercial para usar su contenido libremente, pero hoy publicaron Llama 2 con una licencia mucho más usable y abierta.

Y no sólo es abierto el resultado sino todo el modelo, Meta apunta a que uno pueda tener sus propias instancias con el modelo ya entrenado por ellos con capacidades superiores a ChatGPT-3 (4 no, es contra lo que compite justamente), y con muchos métodos para customizar los resultados.

El modelo viene en distintas variantes que se corresponden con el tamaño de los datos usados para entrenamiento, 7, 13, 34 y 70 mil millones de datos aumentando hasta un 40% el tamaño con respecto a la primera versión.

Obviamente lo más complejo es entrenar el modelo y es también lo más costoso, eso quedó del lado de Meta, y pueden entender un poco más del concepto interno leyendo el paper aquí aunque, aviso, es para mentes un poco más entrenadas en AI de lo que cualquier usuario normal esperaría.

El modelo se podrá descargar de Hugginface en cuanto dejen de tirarle el servidor 😁, eso sí, para poder ejecutar el modelo más pequeño de forma local necesitan una placa de video con más de 12GB de VRAM, 16GB si es posible o ya encarar a placas de video como las A100 de NVidia, especialmente si se busca entrenar modelos, para uso normal una RTX 4090 puede servir perfectamente bien para experimentos, y una “limitada” RTX 3060 con 6GB de VRAM, como la que tengo yo, lamentablemente se quedarán un poco cortas para estos modelos.

Meta lanza Llama 2, su segundo LLM y es Open Source

LEAVE A REPLY Cancel reply

Celulares

Motorola lanza en Argentina el Razr 50 Ultra

Huawei Mate XT, trifold!

Apple iPhone 16, más de lo mismo, más nuevo

Motorola Moto G85 en Argentina

Motorola Edge 50 Fusion – Review

Procesadores

AMD incorpora memoria variable para sus nuevos procesadores AI

Intel Core Ultra 200V la promesa de Intel para pelearle a...

AMD y un parche para mejorar el rendimiento de los Ryzen

Intel se carga a 15.000 empleados para evitar números rojos

Intel encontró qué hacía fallar sus procesadores de 13ª y 14ª...

EVEN MORE NEWS

Casio Moflin, tu peluche robot para que te acompañe a todos...

SpaceX hace historia con la Starship 5

AMD incorpora memoria variable para sus nuevos procesadores AI

POPULAR CATEGORY