Phase 4: Deep Learning und neuronale Netze

Ein von der Shanghai Jiao Tong Universität entwickelter Programmierkurs für große Modelle, der umfassende Lernressourcen zu 11 Kernthemen wie Feinabstimmung, Bereitstellung, Prompt-Engineering, Modellbearbeitung und Sicherheitstechnologien umfasst.

LLMDeepLearningMLGitHubTextFree中文

Detaillierte Kursbeschreibung: "Hands-on Learning for Large Models"

Kursübersicht

"Hands-on Learning for Large Models" ist ein von der Shanghai Jiao Tong Universität entwickeltes praktisches Programmier-Tutorial für große Modelle. Es entstand aus dem Kurs "Sicherheitstechnologien der Künstlichen Intelligenz" (NIS3353) im Frühjahr 2024. Unter der Leitung von Dozent Zhang Zhuosheng zielt dieses Tutorial darauf ab, Lernenden eine Einführung in die Programmierung großer Modelle zu bieten. Es handelt sich um eine gemeinnützige, völlig kostenlose Open-Source-Bildungsressource.

Besonderheiten des Tutorials

  • Praxisorientiert: Hilft Lernenden durch einfache Übungen, schnell in die Welt der großen Modelle einzusteigen.
  • Völlig kostenlos: Gemeinnützig und ohne jegliche Gebühren.
  • Verbindung von Wissenschaft und Praxis: Erweiterung von Kursmaterialien einer Top-Universität.
  • Kontinuierliche Aktualisierung: Im Juni 2025 wurde eine umfassende Aktualisierung vorgenommen, die neue Themen und lokalisierte Inhalte hinzufügte.

Kerninhalte des Unterrichts

Hauptkapitelstruktur

Kapitel 1: Fine-Tuning und Bereitstellung

  • Inhaltlicher Schwerpunkt: Leitfaden für das Fine-Tuning und die Bereitstellung vortrainierter Modelle.
  • Lernziele: Beherrschen der Auswahl geeigneter vortrainierter Modelle, deren Fine-Tuning für spezifische Aufgaben und die Bereitstellung der feinabgestimmten Modelle als funktionierende Demos.
  • Bereitgestellte Ressourcen:
    • Kursmaterialien (PDF-Format)
    • Detaillierte Tutorial-Dokumentation
    • Übungsskripte (Jupyter Notebook)

Kapitel 2: Prompt Engineering

  • Lernressourcen:
    • dive-into-prompting.pdf Kursmaterialien
    • README.md Tutorial-Dokumentation
    • dive-prompting.ipynb Übungsskripte

Kapitel 3: Modellbearbeitung

  • Lernressourcen:
    • dive_edit_0410.pdf Kursmaterialien
    • Vollständige Tutorial-Dokumentation
    • dive_edit.ipynb Übungsskripte

Kapitel 4: Mathematisches Schlussfolgern

  • Lernressourcen:
    • math.pdf Kursmaterialien
    • Tutorial-Dokumentation
    • sft_math.ipynb Übungsskripte zum mathematischen Schlussfolgern

Kapitel 5: Wasserzeichen-Technologie

  • Lernressourcen:
    • watermark.pdf Kursmaterialien
    • Tutorial-Dokumentation
    • watermark.ipynb Übungsskripte

Kapitel 6: Jailbreak-Angriffe

  • Lernressourcen:
    • dive-Jailbreak.pdf Kursmaterialien
    • Tutorial-Dokumentation
    • dive-jailbreak.ipynb Übungsskripte

Kapitel 7: Steganografie

  • Lernressourcen:
    • stega.pdf Kursmaterialien
    • Tutorial-Dokumentation
    • llm_stega.ipynb Übungsskripte

Kapitel 8: Multimodale große Modelle

  • Lernressourcen:
    • mllms.pdf Kursmaterialien
    • Tutorial-Dokumentation
    • mllms.ipynb Übungsskripte

Kapitel 9: GUI-Agent

  • Lernressourcen:
    • GUIagent.pdf Kursmaterialien
    • Tutorial-Dokumentation
    • GUIagent.ipynb Übungsskripte

Kapitel 10: KI-Sicherheit

  • Lernressourcen:
    • dive-into-safety.pdf Kursmaterialien
    • Tutorial-Dokumentation
    • agent.ipynb Übungsskripte

Kapitel 11: Ausrichtung großer Modelle (RLHF)

  • Lernressourcen:
    • RLHF.pdf Kursmaterialien
    • Tutorial-Dokumentation
    • RLHF.ipynb Übungsskripte

Besondere Highlights

Lokalisierte Serie "Gesamter Entwicklungsprozess großer Modelle"

Im Rahmen der Aktualisierung im Juni 2025 wurde das Tutorial in Zusammenarbeit mit der Huawei Ascend Community um eine lokalisierte Version erweitert:

  • Technischer Support: Entwicklung basierend auf der grundlegenden Hard- und Software von Huawei Ascend.
  • Tutorial-Formate: Umfasst PPTs, Experimentierhandbücher, Videos und weitere Formate.
  • Schwierigkeitsgrade: Unterteilt in Anfänger-, Mittelstufe- und Fortgeschrittenen-Serien.
  • Lernpfade: Zugeschnitten auf unterschiedliche praktische Anforderungen an große Modelle.
  • Praxisorientierung: Präsentation modernster Technologien durch Code-Übungen.

Struktur der Lernressourcen

Jedes Kapitel bietet drei Arten von Kernressourcen:

  1. Kursmaterialien (PDF): Erklärungen von theoretischem Wissen und Konzepten.
  2. Tutorial-Dokumentation (README.md): Detaillierte Schritt-für-Schritt-Anleitungen.
  3. Übungsskripte (Jupyter Notebook): Ausführbare Codebeispiele.

Zielgruppe

  • Anfänger, die in große Modelle einsteigen möchten.
  • Studierende, die Kursarbeiten oder Projekte erstellen müssen.
  • Forschende, die akademische Studien betreiben.
  • Entwickler, die an der praktischen Anwendung großer Modelle interessiert sind.
  • Praktiker, die sich über KI-Sicherheitstechnologien informieren möchten.

Technische Merkmale

  • Stark praxisbezogen: Jedes Kapitel enthält entsprechende ausführbare Codes.
  • Gut strukturiert: Von grundlegenden Konzepten bis zu fortgeschrittenen Anwendungen schrittweise aufgebaut.
  • Hochaktuell: Umfasst die neuesten Technologien für große Modelle und Sicherheitsprobleme.
  • Leicht verständlich: Basierend auf Universitätskursen, mit einem vollständigen Lehrsystem.

Zugang und Nutzung

  • Open Source und kostenlos: Das Projekt ist vollständig Open Source und für jedermann kostenlos zugänglich.
  • Kontinuierliche Aktualisierung: Das Projektteam pflegt und aktualisiert die Inhalte kontinuierlich.
  • Community-Unterstützung: Issues und Pull Requests sind willkommen.
  • Akademischer Hintergrund: Entwickelt auf Basis eines offiziellen Kurses der Shanghai Jiao Tong Universität.

Update-Verlauf

  • Juni 2025: Umfassende Aktualisierung, Hinzufügung lokalisierter Inhalte und neuer Themen.
  • Kontinuierliche Pflege: Das Projektteam aktualisiert und verbessert die Inhalte regelmäßig.

Hinweis: Alle Inhalte dieses Tutorials basieren auf den persönlichen Erfahrungen der Mitwirkenden, Internetdaten und gesammelter Forschungsarbeit und dienen ausschließlich zu Referenz- und Lernzwecken.