LLaMA sera disponible en plusieurs formats, de 7, 13, 33 ou 65 milliards de paramètres. Pour Meta, son modèle de langage à 13 milliards de paramètres pourrait être plus performant que GPT-3, pourtant entraîné à partir de 175 milliards de paramètres.

La société californienne fait un choix délibéré avec ses modèles de langage plus petits. Pour elle, « des modèles plus petits et plus performants tels que LLaMA permettent à d'autres membres de la communauté de recherche qui n'ont pas accès à de grandes quantités d'infrastructure d'étudier ces modèles, démocratisant ainsi davantage l'accès à ce domaine important et en évolution rapide ».

LLaMA, entraîné sur une vingtaine de langues, principalement des idiomes utilisant les alphabets latins et cyrilliques, sera ainsi ouvert à un public plus grand. Là où Google ou OpenAI gardent leur technologie à l'intérieur de l'entreprise, Meta veut la rendre accessible aux chercheurs et aux entités étatiques, du monde académique et de la société civile.