Phase 4: Deep Learning und neuronale Netze
Ein von der Shanghai Jiao Tong Universität entwickelter Programmierkurs für große Modelle, der umfassende Lernressourcen zu 11 Kernthemen wie Feinabstimmung, Bereitstellung, Prompt-Engineering, Modellbearbeitung und Sicherheitstechnologien umfasst.
Detaillierte Kursbeschreibung: "Hands-on Learning for Large Models"
Kursübersicht
"Hands-on Learning for Large Models" ist ein von der Shanghai Jiao Tong Universität entwickeltes praktisches Programmier-Tutorial für große Modelle. Es entstand aus dem Kurs "Sicherheitstechnologien der Künstlichen Intelligenz" (NIS3353) im Frühjahr 2024. Unter der Leitung von Dozent Zhang Zhuosheng zielt dieses Tutorial darauf ab, Lernenden eine Einführung in die Programmierung großer Modelle zu bieten. Es handelt sich um eine gemeinnützige, völlig kostenlose Open-Source-Bildungsressource.
Besonderheiten des Tutorials
- Praxisorientiert: Hilft Lernenden durch einfache Übungen, schnell in die Welt der großen Modelle einzusteigen.
- Völlig kostenlos: Gemeinnützig und ohne jegliche Gebühren.
- Verbindung von Wissenschaft und Praxis: Erweiterung von Kursmaterialien einer Top-Universität.
- Kontinuierliche Aktualisierung: Im Juni 2025 wurde eine umfassende Aktualisierung vorgenommen, die neue Themen und lokalisierte Inhalte hinzufügte.
Kerninhalte des Unterrichts
Hauptkapitelstruktur
Kapitel 1: Fine-Tuning und Bereitstellung
- Inhaltlicher Schwerpunkt: Leitfaden für das Fine-Tuning und die Bereitstellung vortrainierter Modelle.
- Lernziele: Beherrschen der Auswahl geeigneter vortrainierter Modelle, deren Fine-Tuning für spezifische Aufgaben und die Bereitstellung der feinabgestimmten Modelle als funktionierende Demos.
- Bereitgestellte Ressourcen:
- Kursmaterialien (PDF-Format)
- Detaillierte Tutorial-Dokumentation
- Übungsskripte (Jupyter Notebook)
Kapitel 2: Prompt Engineering
- Lernressourcen:
dive-into-prompting.pdfKursmaterialien- README.md Tutorial-Dokumentation
dive-prompting.ipynbÜbungsskripte
Kapitel 3: Modellbearbeitung
- Lernressourcen:
dive_edit_0410.pdfKursmaterialien- Vollständige Tutorial-Dokumentation
dive_edit.ipynbÜbungsskripte
Kapitel 4: Mathematisches Schlussfolgern
- Lernressourcen:
math.pdfKursmaterialien- Tutorial-Dokumentation
sft_math.ipynbÜbungsskripte zum mathematischen Schlussfolgern
Kapitel 5: Wasserzeichen-Technologie
- Lernressourcen:
watermark.pdfKursmaterialien- Tutorial-Dokumentation
watermark.ipynbÜbungsskripte
Kapitel 6: Jailbreak-Angriffe
- Lernressourcen:
dive-Jailbreak.pdfKursmaterialien- Tutorial-Dokumentation
dive-jailbreak.ipynbÜbungsskripte
Kapitel 7: Steganografie
- Lernressourcen:
stega.pdfKursmaterialien- Tutorial-Dokumentation
llm_stega.ipynbÜbungsskripte
Kapitel 8: Multimodale große Modelle
- Lernressourcen:
mllms.pdfKursmaterialien- Tutorial-Dokumentation
mllms.ipynbÜbungsskripte
Kapitel 9: GUI-Agent
- Lernressourcen:
GUIagent.pdfKursmaterialien- Tutorial-Dokumentation
GUIagent.ipynbÜbungsskripte
Kapitel 10: KI-Sicherheit
- Lernressourcen:
dive-into-safety.pdfKursmaterialien- Tutorial-Dokumentation
agent.ipynbÜbungsskripte
Kapitel 11: Ausrichtung großer Modelle (RLHF)
- Lernressourcen:
RLHF.pdfKursmaterialien- Tutorial-Dokumentation
RLHF.ipynbÜbungsskripte
Besondere Highlights
Lokalisierte Serie "Gesamter Entwicklungsprozess großer Modelle"
Im Rahmen der Aktualisierung im Juni 2025 wurde das Tutorial in Zusammenarbeit mit der Huawei Ascend Community um eine lokalisierte Version erweitert:
- Technischer Support: Entwicklung basierend auf der grundlegenden Hard- und Software von Huawei Ascend.
- Tutorial-Formate: Umfasst PPTs, Experimentierhandbücher, Videos und weitere Formate.
- Schwierigkeitsgrade: Unterteilt in Anfänger-, Mittelstufe- und Fortgeschrittenen-Serien.
- Lernpfade: Zugeschnitten auf unterschiedliche praktische Anforderungen an große Modelle.
- Praxisorientierung: Präsentation modernster Technologien durch Code-Übungen.
Struktur der Lernressourcen
Jedes Kapitel bietet drei Arten von Kernressourcen:
- Kursmaterialien (PDF): Erklärungen von theoretischem Wissen und Konzepten.
- Tutorial-Dokumentation (README.md): Detaillierte Schritt-für-Schritt-Anleitungen.
- Übungsskripte (Jupyter Notebook): Ausführbare Codebeispiele.
Zielgruppe
- Anfänger, die in große Modelle einsteigen möchten.
- Studierende, die Kursarbeiten oder Projekte erstellen müssen.
- Forschende, die akademische Studien betreiben.
- Entwickler, die an der praktischen Anwendung großer Modelle interessiert sind.
- Praktiker, die sich über KI-Sicherheitstechnologien informieren möchten.
Technische Merkmale
- Stark praxisbezogen: Jedes Kapitel enthält entsprechende ausführbare Codes.
- Gut strukturiert: Von grundlegenden Konzepten bis zu fortgeschrittenen Anwendungen schrittweise aufgebaut.
- Hochaktuell: Umfasst die neuesten Technologien für große Modelle und Sicherheitsprobleme.
- Leicht verständlich: Basierend auf Universitätskursen, mit einem vollständigen Lehrsystem.
Zugang und Nutzung
- Open Source und kostenlos: Das Projekt ist vollständig Open Source und für jedermann kostenlos zugänglich.
- Kontinuierliche Aktualisierung: Das Projektteam pflegt und aktualisiert die Inhalte kontinuierlich.
- Community-Unterstützung: Issues und Pull Requests sind willkommen.
- Akademischer Hintergrund: Entwickelt auf Basis eines offiziellen Kurses der Shanghai Jiao Tong Universität.
Update-Verlauf
- Juni 2025: Umfassende Aktualisierung, Hinzufügung lokalisierter Inhalte und neuer Themen.
- Kontinuierliche Pflege: Das Projektteam aktualisiert und verbessert die Inhalte regelmäßig.
Hinweis: Alle Inhalte dieses Tutorials basieren auf den persönlichen Erfahrungen der Mitwirkenden, Internetdaten und gesammelter Forschungsarbeit und dienen ausschließlich zu Referenz- und Lernzwecken.