Cuarta etapa: Aprendizaje profundo y redes neuronales

Un tutorial práctico de programación de modelos grandes desarrollado por la Universidad Jiao Tong de Shanghái, que cubre recursos de aprendizaje completos sobre 11 temas centrales, incluyendo ajuste fino e implementación, ingeniería de prompts, edición de modelos y tecnologías de seguridad.

LLMDeepLearningMLGitHubTextFree中文

Descripción detallada del curso "Aprende Modelos Grandes de Forma Práctica"

Resumen del curso

"Aprende Modelos Grandes de Forma Práctica" es un conjunto de tutoriales prácticos de programación de modelos grandes desarrollado por la Universidad Jiao Tong de Shanghái, originado en el curso de primavera de 2024 "Tecnologías de Seguridad de la Inteligencia Artificial" (NIS3353). Dirigido por el profesor Zhang Zhuosheng, este tutorial tiene como objetivo proporcionar a los estudiantes una referencia de programación introductoria relacionada con modelos grandes. Es un recurso educativo de código abierto, de naturaleza pública y completamente gratuito.

Características del tutorial

  • Orientado a la práctica: Ayuda a los estudiantes a iniciarse rápidamente en los modelos grandes a través de prácticas sencillas.
  • Completamente gratuito: De naturaleza pública, sin coste alguno.
  • Integración academia-industria: Extensión de los materiales del curso de una universidad de primer nivel.
  • Actualización continua: En junio de 2025 se realizó una actualización importante, añadiendo nuevos temas y contenido localizado.

Contenido didáctico principal

Estructura de los capítulos principales

Capítulo 1: Ajuste fino y despliegue

  • Enfoque del contenido: Guía de ajuste fino y despliegue de modelos preentrenados.
  • Objetivos de aprendizaje: Dominar cómo seleccionar un modelo preentrenado adecuado, ajustarlo para tareas específicas y desplegar el modelo ajustado como una demo funcional.
  • Recursos proporcionados:
    • Material del curso (formato PDF)
    • Documentación detallada del tutorial
    • Scripts de práctica (Jupyter Notebook)

Capítulo 2: Ingeniería de prompts

  • Recursos de aprendizaje:
    • Material del curso dive-into-prompting.pdf
    • Documentación del tutorial README.md
    • Script de práctica dive-prompting.ipynb

Capítulo 3: Edición de modelos

  • Recursos de aprendizaje:
    • Material del curso dive_edit_0410.pdf
    • Documentación completa del tutorial
    • Script de práctica dive_edit.ipynb

Capítulo 4: Razonamiento matemático

  • Recursos de aprendizaje:
    • Material del curso math.pdf
    • Documentación del tutorial
    • Script de práctica de razonamiento matemático sft_math.ipynb

Capítulo 5: Técnicas de marca de agua

  • Recursos de aprendizaje:
    • Material del curso watermark.pdf
    • Documentación del tutorial
    • Script de práctica watermark.ipynb

Capítulo 6: Ataques de "jailbreak"

  • Recursos de aprendizaje:
    • Material del curso dive-Jailbreak.pdf
    • Documentación del tutorial
    • Script de práctica dive-jailbreak.ipynb

Capítulo 7: Esteganografía

  • Recursos de aprendizaje:
    • Material del curso stega.pdf
    • Documentación del tutorial
    • Script de práctica llm_stega.ipynb

Capítulo 8: Modelos grandes multimodales

  • Recursos de aprendizaje:
    • Material del curso mllms.pdf
    • Documentación del tutorial
    • Script de práctica mllms.ipynb

Capítulo 9: Agente GUI

  • Recursos de aprendizaje:
    • Material del curso GUIagent.pdf
    • Documentación del tutorial
    • Script de práctica GUIagent.ipynb

Capítulo 10: Seguridad de la IA

  • Recursos de aprendizaje:
    • Material del curso dive-into-safety.pdf
    • Documentación del tutorial
    • Script de práctica agent.ipynb

Capítulo 11: Alineación de modelos grandes (RLHF)

  • Recursos de aprendizaje:
    • Material del curso RLHF.pdf
    • Documentación del tutorial
    • Script de práctica RLHF.ipynb

Puntos destacados especiales

Serie "Proceso completo de desarrollo de modelos grandes" localizada

En la actualización de junio de 2025, el tutorial, en colaboración con la comunidad Huawei Ascend, lanzó una versión localizada:

  • Soporte técnico: Desarrollado sobre el hardware y software base de Huawei Ascend.
  • Formato del tutorial: Incluye PPTs, manuales de laboratorio, videos y otras formas.
  • Niveles de dificultad: Dividido en series para principiantes, intermedios y avanzados.
  • Rutas de aprendizaje: Dirigido a diferentes necesidades de práctica con modelos grandes.
  • Orientado a la práctica: Presenta tecnologías de vanguardia a través de la práctica de código.

Estructura de los recursos de aprendizaje

Cada capítulo ofrece tres tipos de recursos principales:

  1. Material del curso (PDF): Explicación de conocimientos teóricos y conceptos.
  2. Documentación del tutorial (README.md): Guía detallada paso a paso.
  3. Scripts de práctica (Jupyter Notebook): Ejemplos de código ejecutables.

Público objetivo

  • Principiantes que deseen iniciarse en los modelos grandes.
  • Estudiantes que necesiten realizar diseños de cursos.
  • Investigadores dedicados a la investigación académica.
  • Desarrolladores interesados en la práctica de modelos grandes.
  • Profesionales que deseen comprender las tecnologías de seguridad de la IA.

Características técnicas

  • Altamente práctico: Cada capítulo tiene su código ejecutable correspondiente.
  • Bien estructurado: Progresa desde conceptos básicos hasta aplicaciones avanzadas.
  • Vanguardista: Cubre las últimas tecnologías de modelos grandes y problemas de seguridad.
  • Fácil de entender: Proviene de un curso universitario, con un sistema de enseñanza completo.

Acceso y uso

  • Código abierto y gratuito: El proyecto es completamente de código abierto y cualquier persona puede acceder a él de forma gratuita.
  • Actualización continua: El equipo del proyecto mantiene y actualiza el contenido de forma constante.
  • Soporte comunitario: Se aceptan Issues y Pull Requests.
  • Antecedentes académicos: Desarrollado a partir de un curso oficial de la Universidad Jiao Tong de Shanghái.

Historial de actualizaciones

  • Junio de 2025: Actualización importante, añadiendo contenido localizado y nuevos temas.
  • Mantenimiento continuo: El equipo del proyecto actualiza y mejora el contenido regularmente.

Nota: Todo el contenido de este tutorial se basa en la experiencia personal de los colaboradores, datos de internet y la acumulación de trabajo de investigación científica, y se proporciona únicamente para fines de referencia y estudio.