第四階段:深度學習與神經網路

由上海交通大學開發的大模型程式設計實踐教程,涵蓋微調部署、提示工程、模型編輯、安全技術等11個核心主題的完整學習資源

LLMDeepLearningMLGitHubTextFree中文

《動手學大模型》課程詳細介紹

課程概覽

**《動手學大模型》**是一套由上海交通大學開發的大模型程式設計實踐教程,源自2024年春季《人工智慧安全技術》課程(NIS3353)。該教程由張倬勝教師主導,旨在為學習者提供大模型相關的入門程式設計參考,屬於公益性質、完全免費的開源教育資源。

教程特色

  • 實戰導向:透過簡單實踐幫助學習者快速入門大模型
  • 完全免費:公益性質,無任何費用
  • 產學結合:來自頂級大學的課程講義拓展
  • 持續更新:2025年6月進行了重大更新,增加了新主題和國產化內容

核心教學內容

主要章節構成

第1章:微調與部署

  • 內容重點:預訓練模型微調與部署指南
  • 學習目標:掌握如何選擇合適的預訓練模型,在特定任務上進行微調,並將微調後的模型部署成可用的Demo
  • 資源提供
    • 課件(PDF格式)
    • 詳細教程文件
    • 實踐腳本(Jupyter Notebook)

第2章:提示工程

  • 學習資源
    • dive-into-prompting.pdf 課件
    • README.md 教程文件
    • dive-prompting.ipynb 實踐腳本

第3章:模型編輯

  • 學習資源
    • dive_edit_0410.pdf 課件
    • 完整教程文件
    • dive_edit.ipynb 實踐腳本

第4章:數學推理

  • 學習資源
    • math.pdf 課件
    • 教程文件
    • sft_math.ipynb 數學推理實踐腳本

第5章:浮水印技術

  • 學習資源
    • watermark.pdf 課件
    • 教程文件
    • watermark.ipynb 實踐腳本

第6章:越獄攻擊

  • 學習資源
    • dive-Jailbreak.pdf 課件
    • 教程文件
    • dive-jailbreak.ipynb 實踐腳本

第7章:隱寫術

  • 學習資源
    • stega.pdf 課件
    • 教程文件
    • llm_stega.ipynb 實踐腳本

第8章:多模態大模型

  • 學習資源
    • mllms.pdf 課件
    • 教程文件
    • mllms.ipynb 實踐腳本

第9章:GUI Agent

  • 學習資源
    • GUIagent.pdf 課件
    • 教程文件
    • GUIagent.ipynb 實踐腳本

第10章:AI安全

  • 學習資源
    • dive-into-safety.pdf 課件
    • 教程文件
    • agent.ipynb 實踐腳本

第11章:大模型對齊(RLHF)

  • 學習資源
    • RLHF.pdf 課件
    • 教程文件
    • RLHF.ipynb 實踐腳本

特別亮點

國產化《大模型開發全流程》系列

2025年6月更新中,教程聯合華為昇騰社區推出了國產化版本:

  • 技術支援:基於華為昇騰基礎軟硬體開發
  • 教程形式:包含PPT、實驗手冊、影片等多種形式
  • 難度層次:分為初級、中級、高級系列
  • 學習路徑:面向不同的大模型實踐需求
  • 實踐導向:將前沿技術透過程式碼實踐方式呈現

學習資源結構

每個章節都提供三類核心資源:

  1. 課件(PDF):理論知識和概念講解
  2. 教程文件(README.md):詳細的步驟指導
  3. 實踐腳本(Jupyter Notebook):可執行的程式碼範例

適用對象

  • 希望入門大模型的初學者
  • 需要進行課程設計的學生
  • 從事學術研究的研究人員
  • 對大模型實踐感興趣的開發者
  • 希望了解AI安全技術的從業者

技術特點

  • 實踐性強:每個章節都有對應的可執行程式碼
  • 系統性好:從基礎概念到高級應用層層遞進
  • 前沿性高:涵蓋最新的大模型技術和安全問題
  • 易於理解:來自大學課程,教學體系完整

獲取與使用

  • 開源免費:專案完全開源,任何人都可以免費存取
  • 持續更新:專案團隊持續維護和更新內容
  • 社群支援:歡迎提交Issue和Pull Request
  • 學術背景:基於上海交通大學正式課程開發

更新歷史

  • 2025年6月:重大更新,增加國產化內容和新主題
  • 持續維護:專案團隊定期更新和完善內容

註:本教程所有內容基於貢獻者的個人經驗、網際網路數據和科研工作累積,僅供參考學習使用。