第四段階:深層学習とニューラルネットワーク
浙江大学発のオープンソースLLM教科書。アーキテクチャ、プロンプトエンジニアリング、ファインチューニング、モデル編集、RAGを網羅。
大規模言語モデルの基礎 (ZJU-LLMs)
概要
LLMの基礎 は、浙江大学のデータベース・ビッグデータ分析研究所 (DAILY Lab) によって作成された、包括的な教育用教科書および学習リソースです。このオープンソースプロジェクトは、急速に進化するこの分野に関心のある読者のために、大規模言語モデル (LLM) に関連する基礎知識を体系的に説明し、最先端の技術を紹介します。
リポジトリ: https://github.com/ZJU-LLMs/Foundations-of-LLMs スター数: GitHubで11.4k+ 形式: 章ごとの資料と論文リストを含むPDF教科書
プロジェクトの理念
著者チームは以下に尽力しています。
- オープンソースコミュニティと専門家からの提案に耳を傾ける
- コンテンツを最新の状態に保つために毎月更新する
- 大規模モデルに関するアクセスしやすく、厳密で、詳細な教科書を作成する
- 各章の厳選された論文リストを通じて、最新の技術開発を追跡する
コンテンツ構成
初版は6つの主要な章で構成されており、各章は特定の技術を説明するために、異なる動物をテーマの背景として使用しています。
第1章: 従来の言語モデル
- 言語モデリングの基礎概念
- 言語モデルの歴史的背景と進化
第2章: 大規模言語モデルのアーキテクチャ
- LLMアーキテクチャの進化
- 主要なアーキテクチャの革新と設計原則
- さまざまなモデル構造の比較分析
第3章: プロンプトエンジニアリング
- 効果的なプロンプト設計のテクニック
- プロンプト最適化戦略
- アプリケーションとベストプラクティス
第4章: パラメータ効率的なファインチューニング (PEFT)
- 効率的なモデル適応のための手法
- 低リソースのファインチューニング技術
- LoRA、Prefix-tuning、その他のPEFTアプローチ
第5章: モデル編集
- モデルの知識を修正するためのテクニック
- 知識の更新と修正方法
- 編集中のモデルの整合性の維持
第6章: 検索拡張生成 (RAG)
- 生成モデルと検索システムの統合
- 外部知識によるLLM出力の強化
- RAGアーキテクチャと実装戦略
利用可能なリソース
1. 完全な教科書
- 中国語のフルPDF版が利用可能
- 英語版も利用可能
- 6つの章すべてを包括的に網羅
2. 章ごとのコンテンツ
- 各章の個別のPDFファイル
- 特定のトピックに焦点を当てた学習が可能
- 簡単なナビゲーションと参照
3. 論文リスト
- 各章に関連する研究論文の厳選されたコレクション
- 最新の研究で継続的に更新
- 各分野の最先端の開発を追跡
今後の方向性
著者チームは、以下の章を追加して教科書を拡張する予定です。
- LLM推論の高速化: より高速なモデル推論のためのテクニック
- LLMエージェント: 大規模言語モデルによって駆動される自律エージェント
- LLMの状況におけるその他の新たなトピック
対象読者
この学習リソースは、以下の方々を対象としています。
- AIおよびNLPの学生および研究者
- LLMを扱う実務家
- 大規模言語モデルの基礎を理解することに関心のあるすべての人
- LLMベースのアプリケーションを構築する開発者
ユニークな特徴
- 視覚的な学習: 各章は、概念をより記憶に残る魅力的なものにするために、ユニークな動物のテーマを特徴としています。
- コミュニティ主導: コミュニティからの問題提起やフィードバックを受け付けています。
- 定期的な更新: 毎月の更新により、コンテンツが最新の状態に保たれます。
- 包括的な論文リスト: 各章には、厳選された研究論文が含まれています。
- 無料およびオープン: 完全にオープンソースで、自由にアクセスできます。
- バイリンガルサポート: 中国語と英語の両方で利用できます。
学術的な厳密さ
コンテンツは、著者チームの関連する研究方向の探求と理解に基づいています。チームは、GitHubの問題を通じて修正や提案を積極的に歓迎し、継続的な改善と正確性を保証します。
連絡先情報
教科書に関する質問や提案については、以下までご連絡ください。
- メール: xuwenyi@zju.edu.cn
- GitHub Issues: リポジトリに直接フィードバックや提案を送信してください。
このリソースが重要な理由
大規模言語モデルは、人工知能における最も革新的な技術的進歩の1つになりました。この教科書は以下を提供します。
- 体系的な基礎: 従来のモデルから最新のLLMまで理解を深めます。
- 実践的なテクニック: LLMを扱うための実用的な方法を学びます。
- 研究とのつながり: 論文リストを通じて最新の研究とのつながりを維持します。
- 段階的な学習: 基本概念から高度なテクニックへと進みます。
コミュニティの認識
GitHubで11,400以上のスターを獲得しているこのプロジェクトは、大規模言語モデルを理解するための貴重な教育リソースとして、AI/MLコミュニティで大きな認識を得ています。