第四段階:深層学習とニューラルネットワーク
上海交通大学が開発した大規模言語モデルのプログラミング実践チュートリアル。ファインチューニング、デプロイメント、プロンプトエンジニアリング、モデル編集、セキュリティ技術など、11の主要テーマを網羅した完全な学習リソース。
「大規模モデルを実践的に学ぶ」コース詳細紹介
コース概要
**「大規模モデルを実践的に学ぶ」**は、上海交通大学が開発した大規模モデルプログラミング実践チュートリアルです。2024年春季の「人工知能安全技術」コース(NIS3353)から派生しました。張倬勝(Zhang Zhuosheng)講師が主導し、学習者に大規模モデル関連の入門プログラミングリファレンスを提供することを目的としています。公益目的の完全無料のオープンソース教育リソースです。
チュートリアルの特徴
- 実践志向:簡単な実践を通じて、学習者が大規模モデルに迅速に入門できるよう支援します。
- 完全無料:公益目的であり、一切費用はかかりません。
- 産学連携:トップ大学の講義資料を基に拡張されています。
- 継続的な更新:2025年6月に大幅な更新が行われ、新しいテーマと国産化されたコンテンツが追加されました。
主要な学習内容
主要な章の構成
第1章:ファインチューニングとデプロイ
- 内容の重点:事前学習済みモデルのファインチューニングとデプロイガイド
- 学習目標:適切な事前学習済みモデルの選択方法、特定のタスクでのファインチューニング、およびファインチューニング後のモデルを実用的なデモとしてデプロイする方法を習得します。
- 提供リソース:
- 講義資料(PDF形式)
- 詳細チュートリアルドキュメント
- 実践スクリプト(Jupyter Notebook)
第2章:プロンプトエンジニアリング
- 学習リソース:
dive-into-prompting.pdf
講義資料- README.md チュートリアルドキュメント
dive-prompting.ipynb
実践スクリプト
第3章:モデル編集
- 学習リソース:
dive_edit_0410.pdf
講義資料- 完全チュートリアルドキュメント
dive_edit.ipynb
実践スクリプト
第4章:数学的推論
- 学習リソース:
math.pdf
講義資料- チュートリアルドキュメント
sft_math.ipynb
数学的推論実践スクリプト
第5章:透かし技術
- 学習リソース:
watermark.pdf
講義資料- チュートリアルドキュメント
watermark.ipynb
実践スクリプト
第6章:ジェイルブレイク攻撃
- 学習リソース:
dive-Jailbreak.pdf
講義資料- チュートリアルドキュメント
dive-jailbreak.ipynb
実践スクリプト
第7章:ステガノグラフィー
- 学習リソース:
stega.pdf
講義資料- チュートリアルドキュメント
llm_stega.ipynb
実践スクリプト
第8章:マルチモーダル大規模モデル
- 学習リソース:
mllms.pdf
講義資料- チュートリアルドキュメント
mllms.ipynb
実践スクリプト
第9章:GUIエージェント
- 学習リソース:
GUIagent.pdf
講義資料- チュートリアルドキュメント
GUIagent.ipynb
実践スクリプト
第10章:AIセキュリティ
- 学習リソース:
dive-into-safety.pdf
講義資料- チュートリアルドキュメント
agent.ipynb
実践スクリプト
第11章:大規模モデルアライメント(RLHF)
- 学習リソース:
RLHF.pdf
講義資料- チュートリアルドキュメント
RLHF.ipynb
実践スクリプト
特徴的なハイライト
国産化「大規模モデル開発の全プロセス」シリーズ
2025年6月の更新で、本チュートリアルはHuawei Ascendコミュニティと共同で国産化バージョンをリリースしました。
- 技術サポート:Huawei Ascendの基盤となるソフトウェアとハードウェアに基づいて開発されています。
- チュートリアル形式:PPT、実験マニュアル、ビデオなど、多様な形式が含まれます。
- 難易度レベル:初級、中級、上級のシリーズに分かれています。
- 学習パス:さまざまな大規模モデルの実践ニーズに対応しています。
- 実践志向:最先端技術をコード実践の形で提示します。
学習リソースの構成
各章では、3種類の主要なリソースが提供されます。
- 講義資料(PDF):理論知識と概念の説明
- チュートリアルドキュメント(README.md):詳細な手順ガイド
- 実践スクリプト(Jupyter Notebook):実行可能なコード例
対象者
- 大規模モデルの入門を希望する初心者
- 授業課題に取り組む学生
- 学術研究を行う研究者
- 大規模モデルの実践に興味のある開発者
- AIセキュリティ技術について学びたい実務家
技術的特徴
- 実践的:各章には対応する実行可能なコードがあります。
- 体系的:基礎概念から高度な応用まで段階的に学習できます。
- 最先端:最新の大規模モデル技術とセキュリティ問題を網羅しています。
- 理解しやすい:大学のコースから派生しており、教育体系が完備されています。
入手と利用
- オープンソースで無料:プロジェクトは完全にオープンソースであり、誰でも無料でアクセスできます。
- 継続的な更新:プロジェクトチームはコンテンツを継続的に保守・更新しています。
- コミュニティサポート:IssueやPull Requestの提出を歓迎します。
- 学術的背景:上海交通大学の正式なコースに基づいて開発されています。
更新履歴
- 2025年6月:大幅な更新、国産化コンテンツと新しいテーマを追加
- 継続的な保守:プロジェクトチームは定期的にコンテンツを更新・改善しています。
注:本チュートリアルの全内容は、貢献者の個人的経験、インターネットデータ、および研究開発活動の蓄積に基づいており、学習参考のみを目的としています。