Phase 4: Deep Learning und neuronale Netze

Ein von der Shanghai Jiao Tong Universität entwickelter Programmierkurs für große Modelle, der umfassende Lernressourcen zu 11 Kernthemen wie Feinabstimmung, Bereitstellung, Prompt-Engineering, Modellbearbeitung und Sicherheitstechnologien umfasst.

LLMDeepLearningMLGitHubTextFree中文

Detaillierte Kursbeschreibung: "Hands-on Learning for Large Models"

Kursübersicht

"Hands-on Learning for Large Models" ist ein von der Shanghai Jiao Tong Universität entwickeltes praktisches Programmier-Tutorial für große Modelle. Es entstand aus dem Kurs "Sicherheitstechnologien der Künstlichen Intelligenz" (NIS3353) im Frühjahr 2024. Unter der Leitung von Dozent Zhang Zhuosheng zielt dieses Tutorial darauf ab, Lernenden eine Einführung in die Programmierung großer Modelle zu bieten. Es handelt sich um eine gemeinnützige, völlig kostenlose Open-Source-Bildungsressource.

Besonderheiten des Tutorials

Praxisorientiert: Hilft Lernenden durch einfache Übungen, schnell in die Welt der großen Modelle einzusteigen.
Völlig kostenlos: Gemeinnützig und ohne jegliche Gebühren.
Verbindung von Wissenschaft und Praxis: Erweiterung von Kursmaterialien einer Top-Universität.
Kontinuierliche Aktualisierung: Im Juni 2025 wurde eine umfassende Aktualisierung vorgenommen, die neue Themen und lokalisierte Inhalte hinzufügte.

Kerninhalte des Unterrichts

Hauptkapitelstruktur

Kapitel 1: Fine-Tuning und Bereitstellung

Inhaltlicher Schwerpunkt: Leitfaden für das Fine-Tuning und die Bereitstellung vortrainierter Modelle.
Lernziele: Beherrschen der Auswahl geeigneter vortrainierter Modelle, deren Fine-Tuning für spezifische Aufgaben und die Bereitstellung der feinabgestimmten Modelle als funktionierende Demos.
Bereitgestellte Ressourcen:
- Kursmaterialien (PDF-Format)
- Detaillierte Tutorial-Dokumentation
- Übungsskripte (Jupyter Notebook)

Kapitel 2: Prompt Engineering

Lernressourcen:
- dive-into-prompting.pdf Kursmaterialien
- README.md Tutorial-Dokumentation
- dive-prompting.ipynb Übungsskripte

Kapitel 3: Modellbearbeitung

Lernressourcen:
- dive_edit_0410.pdf Kursmaterialien
- Vollständige Tutorial-Dokumentation
- dive_edit.ipynb Übungsskripte

Kapitel 4: Mathematisches Schlussfolgern

Lernressourcen:
- math.pdf Kursmaterialien
- Tutorial-Dokumentation
- sft_math.ipynb Übungsskripte zum mathematischen Schlussfolgern

Kapitel 5: Wasserzeichen-Technologie

Lernressourcen:
- watermark.pdf Kursmaterialien
- Tutorial-Dokumentation
- watermark.ipynb Übungsskripte

Kapitel 6: Jailbreak-Angriffe

Lernressourcen:
- dive-Jailbreak.pdf Kursmaterialien
- Tutorial-Dokumentation
- dive-jailbreak.ipynb Übungsskripte

Kapitel 7: Steganografie

Lernressourcen:
- stega.pdf Kursmaterialien
- Tutorial-Dokumentation
- llm_stega.ipynb Übungsskripte

Kapitel 8: Multimodale große Modelle

Lernressourcen:
- mllms.pdf Kursmaterialien
- Tutorial-Dokumentation
- mllms.ipynb Übungsskripte

Kapitel 9: GUI-Agent

Lernressourcen:
- GUIagent.pdf Kursmaterialien
- Tutorial-Dokumentation
- GUIagent.ipynb Übungsskripte

Kapitel 10: KI-Sicherheit

Lernressourcen:
- dive-into-safety.pdf Kursmaterialien
- Tutorial-Dokumentation
- agent.ipynb Übungsskripte

Kapitel 11: Ausrichtung großer Modelle (RLHF)

Lernressourcen:
- RLHF.pdf Kursmaterialien
- Tutorial-Dokumentation
- RLHF.ipynb Übungsskripte

Besondere Highlights

Lokalisierte Serie "Gesamter Entwicklungsprozess großer Modelle"

Im Rahmen der Aktualisierung im Juni 2025 wurde das Tutorial in Zusammenarbeit mit der Huawei Ascend Community um eine lokalisierte Version erweitert:

Technischer Support: Entwicklung basierend auf der grundlegenden Hard- und Software von Huawei Ascend.
Tutorial-Formate: Umfasst PPTs, Experimentierhandbücher, Videos und weitere Formate.
Schwierigkeitsgrade: Unterteilt in Anfänger-, Mittelstufe- und Fortgeschrittenen-Serien.
Lernpfade: Zugeschnitten auf unterschiedliche praktische Anforderungen an große Modelle.
Praxisorientierung: Präsentation modernster Technologien durch Code-Übungen.

Struktur der Lernressourcen

Jedes Kapitel bietet drei Arten von Kernressourcen:

Kursmaterialien (PDF): Erklärungen von theoretischem Wissen und Konzepten.
Tutorial-Dokumentation (README.md): Detaillierte Schritt-für-Schritt-Anleitungen.
Übungsskripte (Jupyter Notebook): Ausführbare Codebeispiele.

Zielgruppe

Anfänger, die in große Modelle einsteigen möchten.
Studierende, die Kursarbeiten oder Projekte erstellen müssen.
Forschende, die akademische Studien betreiben.
Entwickler, die an der praktischen Anwendung großer Modelle interessiert sind.
Praktiker, die sich über KI-Sicherheitstechnologien informieren möchten.

Technische Merkmale

Stark praxisbezogen: Jedes Kapitel enthält entsprechende ausführbare Codes.
Gut strukturiert: Von grundlegenden Konzepten bis zu fortgeschrittenen Anwendungen schrittweise aufgebaut.
Hochaktuell: Umfasst die neuesten Technologien für große Modelle und Sicherheitsprobleme.
Leicht verständlich: Basierend auf Universitätskursen, mit einem vollständigen Lehrsystem.

Zugang und Nutzung

Open Source und kostenlos: Das Projekt ist vollständig Open Source und für jedermann kostenlos zugänglich.
Kontinuierliche Aktualisierung: Das Projektteam pflegt und aktualisiert die Inhalte kontinuierlich.
Community-Unterstützung: Issues und Pull Requests sind willkommen.
Akademischer Hintergrund: Entwickelt auf Basis eines offiziellen Kurses der Shanghai Jiao Tong Universität.

Update-Verlauf

Juni 2025: Umfassende Aktualisierung, Hinzufügung lokalisierter Inhalte und neuer Themen.
Kontinuierliche Pflege: Das Projektteam aktualisiert und verbessert die Inhalte regelmäßig.

Hinweis: Alle Inhalte dieses Tutorials basieren auf den persönlichen Erfahrungen der Mitwirkenden, Internetdaten und gesammelter Forschungsarbeit und dienen ausschließlich zu Referenz- und Lernzwecken.