Quarta Etapa: Aprendizado Profundo e Redes Neurais

Um tutorial prático de programação de grandes modelos desenvolvido pela Shanghai Jiao Tong University, abrangendo recursos de aprendizado completos para 11 tópicos principais, incluindo ajuste fino, implantação, engenharia de prompts, edição de modelos e tecnologias de segurança.

LLMDeepLearningMLGitHubTextFree中文

Descrição Detalhada do Curso "Mão na Massa com Modelos Grandes"

Visão Geral do Curso

O curso "Mão na Massa com Modelos Grandes" é um tutorial prático de programação de Modelos Grandes (LLMs) desenvolvido pela Universidade Jiao Tong de Xangai, originado do curso de primavera de 2024 "Tecnologias de Segurança em Inteligência Artificial" (NIS3353). Liderado pelo professor Zhang Zhuosheng, este tutorial visa fornecer aos alunos uma referência de programação introdutória relacionada a LLMs, sendo um recurso educacional de código aberto, de natureza pública e totalmente gratuito.

Características do Tutorial

  • Orientado à Prática: Ajuda os alunos a iniciar rapidamente com Modelos Grandes através de práticas simples.
  • Totalmente Gratuito: De natureza pública, sem custos.
  • Integração Academia-Indústria: Expansão de materiais de curso de uma universidade de ponta.
  • Atualizações Contínuas: Recebeu uma grande atualização em junho de 2025, adicionando novos tópicos e conteúdo nacionalizado.

Conteúdo Central de Ensino

Estrutura dos Principais Capítulos

Capítulo 1: Fine-tuning e Implantação

  • Foco do Conteúdo: Guia de fine-tuning e implantação de modelos pré-treinados.
  • Objetivos de Aprendizagem: Dominar como selecionar modelos pré-treinados apropriados, realizar fine-tuning para tarefas específicas e implantar o modelo ajustado como uma demonstração utilizável.
  • Recursos Fornecidos:
    • Material didático (formato PDF)
    • Documentação detalhada do tutorial
    • Scripts práticos (Jupyter Notebook)

Capítulo 2: Engenharia de Prompts

  • Recursos de Aprendizagem:
    • Material didático dive-into-prompting.pdf
    • Documentação do tutorial README.md
    • Script prático dive-prompting.ipynb

Capítulo 3: Edição de Modelos

  • Recursos de Aprendizagem:
    • Material didático dive_edit_0410.pdf
    • Documentação completa do tutorial
    • Script prático dive_edit.ipynb

Capítulo 4: Raciocínio Matemático

  • Recursos de Aprendizagem:
    • Material didático math.pdf
    • Documentação do tutorial
    • Script prático de raciocínio matemático sft_math.ipynb

Capítulo 5: Tecnologia de Marca d'água

  • Recursos de Aprendizagem:
    • Material didático watermark.pdf
    • Documentação do tutorial
    • Script prático watermark.ipynb

Capítulo 6: Ataques de Jailbreak

  • Recursos de Aprendizagem:
    • Material didático dive-Jailbreak.pdf
    • Documentação do tutorial
    • Script prático dive-jailbreak.ipynb

Capítulo 7: Esteganografia

  • Recursos de Aprendizagem:
    • Material didático stega.pdf
    • Documentação do tutorial
    • Script prático llm_stega.ipynb

Capítulo 8: Modelos Grandes Multimodais

  • Recursos de Aprendizagem:
    • Material didático mllms.pdf
    • Documentação do tutorial
    • Script prático mllms.ipynb

Capítulo 9: Agente GUI

  • Recursos de Aprendizagem:
    • Material didático GUIagent.pdf
    • Documentação do tutorial
    • Script prático GUIagent.ipynb

Capítulo 10: Segurança de IA

  • Recursos de Aprendizagem:
    • Material didático dive-into-safety.pdf
    • Documentação do tutorial
    • Script prático agent.ipynb

Capítulo 11: Alinhamento de Modelos Grandes (RLHF)

  • Recursos de Aprendizagem:
    • Material didático RLHF.pdf
    • Documentação do tutorial
    • Script prático RLHF.ipynb

Destaques Especiais

Série Nacionalizada "Processo Completo de Desenvolvimento de Modelos Grandes"

Na atualização de junho de 2025, o tutorial, em colaboração com a comunidade Huawei Ascend, lançou uma versão nacionalizada:

  • Suporte Técnico: Desenvolvido com base no hardware e software fundamental Huawei Ascend.
  • Formato do Tutorial: Inclui várias formas, como PPTs, manuais de laboratório e vídeos.
  • Níveis de Dificuldade: Dividido em séries iniciante, intermediária e avançada.
  • Caminho de Aprendizagem: Atende a diferentes necessidades de prática com Modelos Grandes.
  • Orientado à Prática: Apresenta tecnologias de ponta através de práticas de codificação.

Estrutura dos Recursos de Aprendizagem

Cada capítulo oferece três tipos de recursos essenciais:

  1. Material Didático (PDF): Explicação de conhecimentos teóricos e conceitos.
  2. Documentação do Tutorial (README.md): Guia passo a passo detalhado.
  3. Scripts Práticos (Jupyter Notebook): Exemplos de código executáveis.

Público-Alvo

  • Iniciantes que desejam começar com Modelos Grandes.
  • Estudantes que precisam desenvolver projetos de curso.
  • Pesquisadores envolvidos em pesquisa acadêmica.
  • Desenvolvedores interessados na prática de Modelos Grandes.
  • Profissionais que desejam entender as tecnologias de segurança de IA.

Características Técnicas

  • Altamente Prático: Cada capítulo possui código executável correspondente.
  • Boa Sistematicidade: Progressão gradual desde conceitos básicos até aplicações avançadas.
  • Alta Vanguarda: Abrange as mais recentes tecnologias de Modelos Grandes e questões de segurança.
  • Fácil de Entender: Derivado de um curso universitário, com um sistema de ensino completo.

Acesso e Uso

  • Código Aberto e Gratuito: O projeto é totalmente de código aberto, acessível gratuitamente por qualquer pessoa.
  • Atualizações Contínuas: A equipe do projeto mantém e atualiza o conteúdo continuamente.
  • Suporte da Comunidade: Contribuições via Issues e Pull Requests são bem-vindas.
  • Contexto Acadêmico: Desenvolvido com base em um curso oficial da Universidade Jiao Tong de Xangai.

Histórico de Atualizações

  • Junho de 2025: Grande atualização, adicionando conteúdo nacionalizado e novos tópicos.
  • Manutenção Contínua: A equipe do projeto atualiza e aprimora o conteúdo regularmente.

Nota: Todo o conteúdo deste tutorial é baseado na experiência pessoal dos colaboradores, dados da internet e acúmulo de trabalho de pesquisa, e destina-se apenas para referência e estudo.