DeepSeek V3.2

DeepSeek-V3.2 es un modelo de lenguaje grande diseñado para combinar alta eficiencia computacional con un sólido desempeño en razonamiento y uso autónomo de herramientas. Incluye DeepSeek Sparse Attention (DSA), un mecanismo de atención selectiva de alta precisión que reduce los costos de entrenamiento e inferencia sin perder calidad, incluso en contextos muy largos.

Además, cuenta con un marco escalable de aprendizaje por refuerzo post-entrenamiento que mejora aún más el razonamiento, con un desempeño reportado dentro de la clase GPT-5, y ha logrado resultados de medalla de oro en la IMO y la IOI 2025.

La versión V3.2 también utiliza una tubería de síntesis de tareas autónomas a gran escala, que integra mejor el razonamiento en entornos donde se usan herramientas, aumentando la capacidad de cumplimiento y la generalización en entornos interactivos.