Todos hablan de ChatGPT por ser el primero y exitoso pero Meta (Facebook) ya viene trabajando hace tiempo en su propia versión que se dio a llamar Llama. Lamentablemente Llama no tenía una licencia comercial para usar su contenido libremente, pero hoy publicaron Llama 2 con una licencia mucho más usable y abierta.
Y no sólo es abierto el resultado sino todo el modelo, Meta apunta a que uno pueda tener sus propias instancias con el modelo ya entrenado por ellos con capacidades superiores a ChatGPT-3 (4 no, es contra lo que compite justamente), y con muchos métodos para customizar los resultados.
El modelo viene en distintas variantes que se corresponden con el tamaño de los datos usados para entrenamiento, 7, 13, 34 y 70 mil millones de datos aumentando hasta un 40% el tamaño con respecto a la primera versión.
Obviamente lo más complejo es entrenar el modelo y es también lo más costoso, eso quedó del lado de Meta, y pueden entender un poco más del concepto interno leyendo el paper aquí aunque, aviso, es para mentes un poco más entrenadas en AI de lo que cualquier usuario normal esperaría.
El modelo se podrá descargar de Hugginface en cuanto dejen de tirarle el servidor 😁, eso sí, para poder ejecutar el modelo más pequeño de forma local necesitan una placa de video con más de 12GB de VRAM, 16GB si es posible o ya encarar a placas de video como las A100 de NVidia, especialmente si se busca entrenar modelos, para uso normal una RTX 4090 puede servir perfectamente bien para experimentos, y una “limitada” RTX 3060 con 6GB de VRAM, como la que tengo yo, lamentablemente se quedarán un poco cortas para estos modelos.