Modelo de lenguaje de frontera con pesos abiertos desarrollado por Arcee, construido como un Mixture-of-Experts (MoE) disperso de 400 mil millones de parámetros, con 13 mil millones de parámetros activos por token utilizando un enrutamiento de expertos 4 de 256.
Destaca en escritura creativa, narración de historias, juego de roles, escenarios de chat y asistencia por voz en tiempo real, superando lo que un modelo de razonamiento promedio suele ofrecer. Además, estamos introduciendo algunas de nuestras capacidades más recientes de rendimiento agente. Fue entrenado para navegar eficientemente en entornos de agentes como OpenCode, Cline y Kilo Code, y para manejar cadenas de herramientas complejas y prompts largos con restricciones.
Su arquitectura soporta de forma nativa contextos muy largos, de hasta 512k tokens, y la API Preview se ofrece actualmente con un contexto de 128k tokens utilizando cuantización de 8 bits para un despliegue práctico. Trinity-Large-Preview refleja la filosofía de diseño de Arcee centrada en la eficiencia, ofreciendo un modelo de frontera orientado a producción con pesos abiertos y licencia permisiva, adecuado tanto para aplicaciones reales como para experimentación.
