Phase 4: Deep Learning und neuronale Netze
Ein von der Shanghai Jiao Tong Universität entwickelter Programmierkurs für große Modelle, der umfassende Lernressourcen zu 11 Kernthemen wie Feinabstimmung, Bereitstellung, Prompt-Engineering, Modellbearbeitung und Sicherheitstechnologien umfasst.
Detaillierte Kursbeschreibung: "Hands-on Learning for Large Models"
Kursübersicht
"Hands-on Learning for Large Models" ist ein von der Shanghai Jiao Tong Universität entwickeltes praktisches Programmier-Tutorial für große Modelle. Es entstand aus dem Kurs "Sicherheitstechnologien der Künstlichen Intelligenz" (NIS3353) im Frühjahr 2024. Unter der Leitung von Dozent Zhang Zhuosheng zielt dieses Tutorial darauf ab, Lernenden eine Einführung in die Programmierung großer Modelle zu bieten. Es handelt sich um eine gemeinnützige, völlig kostenlose Open-Source-Bildungsressource.
Besonderheiten des Tutorials
- Praxisorientiert: Hilft Lernenden durch einfache Übungen, schnell in die Welt der großen Modelle einzusteigen.
- Völlig kostenlos: Gemeinnützig und ohne jegliche Gebühren.
- Verbindung von Wissenschaft und Praxis: Erweiterung von Kursmaterialien einer Top-Universität.
- Kontinuierliche Aktualisierung: Im Juni 2025 wurde eine umfassende Aktualisierung vorgenommen, die neue Themen und lokalisierte Inhalte hinzufügte.
Kerninhalte des Unterrichts
Hauptkapitelstruktur
Kapitel 1: Fine-Tuning und Bereitstellung
- Inhaltlicher Schwerpunkt: Leitfaden für das Fine-Tuning und die Bereitstellung vortrainierter Modelle.
- Lernziele: Beherrschen der Auswahl geeigneter vortrainierter Modelle, deren Fine-Tuning für spezifische Aufgaben und die Bereitstellung der feinabgestimmten Modelle als funktionierende Demos.
- Bereitgestellte Ressourcen:
- Kursmaterialien (PDF-Format)
- Detaillierte Tutorial-Dokumentation
- Übungsskripte (Jupyter Notebook)
Kapitel 2: Prompt Engineering
- Lernressourcen:
dive-into-prompting.pdf
Kursmaterialien- README.md Tutorial-Dokumentation
dive-prompting.ipynb
Übungsskripte
Kapitel 3: Modellbearbeitung
- Lernressourcen:
dive_edit_0410.pdf
Kursmaterialien- Vollständige Tutorial-Dokumentation
dive_edit.ipynb
Übungsskripte
Kapitel 4: Mathematisches Schlussfolgern
- Lernressourcen:
math.pdf
Kursmaterialien- Tutorial-Dokumentation
sft_math.ipynb
Übungsskripte zum mathematischen Schlussfolgern
Kapitel 5: Wasserzeichen-Technologie
- Lernressourcen:
watermark.pdf
Kursmaterialien- Tutorial-Dokumentation
watermark.ipynb
Übungsskripte
Kapitel 6: Jailbreak-Angriffe
- Lernressourcen:
dive-Jailbreak.pdf
Kursmaterialien- Tutorial-Dokumentation
dive-jailbreak.ipynb
Übungsskripte
Kapitel 7: Steganografie
- Lernressourcen:
stega.pdf
Kursmaterialien- Tutorial-Dokumentation
llm_stega.ipynb
Übungsskripte
Kapitel 8: Multimodale große Modelle
- Lernressourcen:
mllms.pdf
Kursmaterialien- Tutorial-Dokumentation
mllms.ipynb
Übungsskripte
Kapitel 9: GUI-Agent
- Lernressourcen:
GUIagent.pdf
Kursmaterialien- Tutorial-Dokumentation
GUIagent.ipynb
Übungsskripte
Kapitel 10: KI-Sicherheit
- Lernressourcen:
dive-into-safety.pdf
Kursmaterialien- Tutorial-Dokumentation
agent.ipynb
Übungsskripte
Kapitel 11: Ausrichtung großer Modelle (RLHF)
- Lernressourcen:
RLHF.pdf
Kursmaterialien- Tutorial-Dokumentation
RLHF.ipynb
Übungsskripte
Besondere Highlights
Lokalisierte Serie "Gesamter Entwicklungsprozess großer Modelle"
Im Rahmen der Aktualisierung im Juni 2025 wurde das Tutorial in Zusammenarbeit mit der Huawei Ascend Community um eine lokalisierte Version erweitert:
- Technischer Support: Entwicklung basierend auf der grundlegenden Hard- und Software von Huawei Ascend.
- Tutorial-Formate: Umfasst PPTs, Experimentierhandbücher, Videos und weitere Formate.
- Schwierigkeitsgrade: Unterteilt in Anfänger-, Mittelstufe- und Fortgeschrittenen-Serien.
- Lernpfade: Zugeschnitten auf unterschiedliche praktische Anforderungen an große Modelle.
- Praxisorientierung: Präsentation modernster Technologien durch Code-Übungen.
Struktur der Lernressourcen
Jedes Kapitel bietet drei Arten von Kernressourcen:
- Kursmaterialien (PDF): Erklärungen von theoretischem Wissen und Konzepten.
- Tutorial-Dokumentation (README.md): Detaillierte Schritt-für-Schritt-Anleitungen.
- Übungsskripte (Jupyter Notebook): Ausführbare Codebeispiele.
Zielgruppe
- Anfänger, die in große Modelle einsteigen möchten.
- Studierende, die Kursarbeiten oder Projekte erstellen müssen.
- Forschende, die akademische Studien betreiben.
- Entwickler, die an der praktischen Anwendung großer Modelle interessiert sind.
- Praktiker, die sich über KI-Sicherheitstechnologien informieren möchten.
Technische Merkmale
- Stark praxisbezogen: Jedes Kapitel enthält entsprechende ausführbare Codes.
- Gut strukturiert: Von grundlegenden Konzepten bis zu fortgeschrittenen Anwendungen schrittweise aufgebaut.
- Hochaktuell: Umfasst die neuesten Technologien für große Modelle und Sicherheitsprobleme.
- Leicht verständlich: Basierend auf Universitätskursen, mit einem vollständigen Lehrsystem.
Zugang und Nutzung
- Open Source und kostenlos: Das Projekt ist vollständig Open Source und für jedermann kostenlos zugänglich.
- Kontinuierliche Aktualisierung: Das Projektteam pflegt und aktualisiert die Inhalte kontinuierlich.
- Community-Unterstützung: Issues und Pull Requests sind willkommen.
- Akademischer Hintergrund: Entwickelt auf Basis eines offiziellen Kurses der Shanghai Jiao Tong Universität.
Update-Verlauf
- Juni 2025: Umfassende Aktualisierung, Hinzufügung lokalisierter Inhalte und neuer Themen.
- Kontinuierliche Pflege: Das Projektteam aktualisiert und verbessert die Inhalte regelmäßig.
Hinweis: Alle Inhalte dieses Tutorials basieren auf den persönlichen Erfahrungen der Mitwirkenden, Internetdaten und gesammelter Forschungsarbeit und dienen ausschließlich zu Referenz- und Lernzwecken.