unslothai/unsloth View GitHub Homepage for Latest Official Releases

Unsloth: Herramienta eficiente para el ajuste fino y el aprendizaje por refuerzo de modelos de lenguaje grandes - Aumenta la velocidad de entrenamiento en 2 veces y reduce el uso de memoria en un 70%

Apache-2.0Pythonunslothunslothai 48.2k Last Updated: November 12, 2025

Introducción Detallada al Proyecto Unsloth

Resumen del Proyecto

Unsloth es una herramienta de código abierto centrada en el ajuste fino (fine-tuning) y el aprendizaje por refuerzo de modelos de lenguaje grandes (LLM), que permite aumentar la velocidad de entrenamiento de modelos como Qwen3, Llama 4, DeepSeek-R1, Gemma 3, TTS, etc., en 2 veces, al tiempo que reduce el uso de memoria de la GPU en un 70%. El proyecto tiene como objetivo hacer que la tecnología de IA sea más accesible y fácil de usar, proporcionando a investigadores y desarrolladores soluciones eficientes para el entrenamiento de modelos.

Características Principales

Optimización de Alto Rendimiento: Velocidad de entrenamiento aumentada en 2 veces, uso de memoria de la GPU reducido en un 70%.
Cero Pérdida de Precisión: No utiliza métodos de aproximación, garantizando la precisión del entrenamiento.
Amplia Compatibilidad: Soporta una variedad de modelos LLM y métodos de entrenamiento convencionales.
Fácil de Usar: Proporciona notebooks amigables para principiantes y documentación detallada.

Funcionalidades y Características Clave

1. Soporte de Modelos

Unsloth soporta numerosos modelos de lenguaje grandes convencionales, incluyendo:

Serie Llama: Llama 4, Llama 3.3 (70B), Llama 3.2, Llama 3.1
Serie Qwen: Qwen 3 (14B), Qwen 2.5 (incluyendo modelos Coder)
Serie Gemma: Gemma 3, Gemma 2 (9B/27B)
Otros Modelos: Phi-4 (14B), Mistral Small (22B), DeepSeek-R1, etc.

2. Métodos de Entrenamiento

Ajuste Fino (Fine-tuning):

Soporta ajuste fino de parámetros completos, pre-entrenamiento.
Entrenamiento de cuantificación de 4bit, 8bit, 16bit.
Ajuste fino QLoRA y LoRA.
Tecnología de cuantificación dinámica de 4bit.

Aprendizaje por Refuerzo:

DPO (Direct Preference Optimization)
GRPO (Razonamiento de contexto largo)
PPO (Proximal Policy Optimization)
Entrenamiento de modelos de recompensa
DPO en línea

3. Ventajas Técnicas

Optimización del Rendimiento:

Todos los núcleos están escritos en el lenguaje Triton de OpenAI, motor de retropropagación manual.
0% de pérdida de precisión - Sin métodos de aproximación - Todos los cálculos son precisos.
Soporte para entrenamiento de contexto largo (soporta hasta 342K de contexto).

Optimización de la Memoria:

Tecnología de cuantificación dinámica de 4bit, mejora la precisión al tiempo que aumenta el uso de memoria de la GPU en <10%.
Optimización de puntos de control de gradiente, reduce aún más el uso de memoria en un 30%.
Soporta ventanas de contexto 4 veces más largas.

4. Compatibilidad de Hardware

Requisitos de GPU: Soporta GPUs NVIDIA desde 2018, con una capacidad CUDA mínima de 7.0.
Modelos Soportados: V100, T4, Titan V, RTX 20/30/40 series, A100, H100, L40, etc.
Sistema Operativo: Linux y Windows
Soporte Especial: GTX 1070, 1080 pueden funcionar pero a menor velocidad.

5. Integración y Ecosistema

Integración de Frameworks:

Soporte oficial de la biblioteca 🤗 Hugging Face TRL.
Soporta Trainer, Seq2SeqTrainer.
Compatible con código nativo de PyTorch.

Opciones de Despliegue:

Exportar a formato GGUF.
Soporta despliegue con Ollama, vLLM.
Integración con el centro de modelos de Hugging Face.

Instalación y Uso

Instalación Rápida

Se recomienda utilizar pip para la instalación en dispositivos Linux:

pip install unsloth

Ejemplo de Uso Básico

from unsloth import FastLanguageModel
import torch
from trl import SFTTrainer, SFTConfig

# Cargar el modelo
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "unsloth/gemma-3-4B-it",
    max_seq_length = 2048,
    load_in_4bit = True,
)

# Añadir el adaptador LoRA
model = FastLanguageModel.get_peft_model(
    model,
    r = 16,
    target_modules = ["q_proj", "k_proj", "v_proj", "o_proj"],
    lora_alpha = 16,
    use_gradient_checkpointing = "unsloth",
)

# Comenzar el entrenamiento
trainer = SFTTrainer(
    model = model,
    train_dataset = dataset,
    tokenizer = tokenizer,
    # Otros parámetros de entrenamiento
)
trainer.train()

Pruebas de Rendimiento

Comparación de Eficiencia de Entrenamiento

Modelo	Memoria de la GPU	Velocidad de Unsloth	Reducción de Memoria	Longitud del Contexto	Hugging Face + FA2
Llama 3.3 (70B)	80GB	2x	>75%	13x más largo	1x
Llama 3.1 (8B)	80GB	2x	>70%	12x más largo	1x

Soporte de Contexto Largo

En las mismas condiciones de hardware, Unsloth soporta longitudes de contexto mucho mayores que los métodos tradicionales:

GPU de 8GB: Unsloth soporta 2,972 tokens, el método tradicional OOM (Out Of Memory).
GPU de 24GB: Unsloth soporta 78,475 tokens, el método tradicional solo 5,789 tokens.
GPU de 80GB: Unsloth soporta 342,733 tokens, el método tradicional solo 28,454 tokens.

Actualizaciones Recientes

Actualizaciones Importantes Recientes

Soporte de Llama 4: Los modelos Scout y Maverick más recientes de Meta.
Soporte Completo: FFT, todos los modelos (Mixtral, MOE, Cohere, Mamba) y todos los algoritmos de entrenamiento.
Modelos Visuales: Soporte para Llama 3.2 Vision, Qwen 2.5 VL, Pixtral, etc.
Optimización de la Inferencia: Velocidad de inferencia 2 veces más rápida.

Características Destacadas

Interfaz de Chat: Proporciona una interfaz de chat interactiva.
Corrección de Acumulación de Gradientes: Descubrió y corrigió un error en la acumulación de gradientes.
Cut Cross Entropy: Tecnología de optimización añadida en colaboración con Apple.
Pre-entrenamiento Continuo Multilingüe: Soporte para coreano y otros idiomas.

Comunidad y Ecosistema

Documentación y Soporte

Documentación Oficial: docs.unsloth.ai
Repositorio de GitHub: Comunidad de código abierto activa.
Redes Sociales: Cuenta oficial de Twitter/X.
Foro de la Comunidad: Intercambio en la página de Reddit.

Recursos de Aprendizaje

Notebooks de Colab amigables para principiantes.
Guías detalladas de instalación y uso.
Notebooks dedicados para competiciones de Kaggle.
Documentación completa de la API.

Resumen

Unsloth es una de las mejores herramientas de código abierto para el ajuste fino de LLM disponibles actualmente, que logra mejoras significativas en la velocidad de entrenamiento y la eficiencia de la memoria a través de tecnologías de optimización innovadoras. Tanto los investigadores como los desarrolladores de la industria pueden beneficiarse de la capacidad de entrenamiento eficiente de Unsloth. Las actualizaciones continuas del proyecto y el soporte activo de la comunidad lo convierten en una opción importante en el campo del ajuste fino de LLM.