Lightning-AI/litgptPlease refer to the latest official releases for information GitHub Homepage

高性能な大規模言語モデルツールボックス。20以上のモデルの事前学習、ファインチューニング、デプロイメントをサポート。

Apache-2.0Python 12.3kLightning-AI Last Updated: 2025-06-18

LitGPT - 高性能大規模言語モデルツールボックス

プロジェクト概要

LitGPTは、Lightning AIによって開発されたオープンソースの大規模言語モデルツールボックスであり、20以上の高性能大規模言語モデルの事前学習、微調整、およびスケーラブルなデプロイメントソリューションを提供します。このプロジェクトはLightning Fabricに基づいて構築され、Lit-LLaMAとnanoGPTを拡張し、エンタープライズレベルのLLMトレーニングとデプロイメント機能の提供に焦点を当てています。

コア機能

✅ エンタープライズレベルの機能

Apache 2.0ライセンス - 無制限のエンタープライズレベルでの使用をサポート
開発者フレンドリー - 抽象化レイヤーのない単一ファイル実装で、デバッグが容易
パフォーマンス最適化 - 最大限のパフォーマンス、コスト削減、およびトレーニングの高速化のために設計
検証済みのレシピ - エンタープライズ規模でテストされた高度に最適化されたトレーニング/微調整レシピ

✅ 先進的な技術的特徴

ゼロからの実装 - すべてのモデルはゼロから記述され、抽象化レイヤーがなく、完全に制御可能
Flash Attention v2 - 最新の注意メカニズムの最適化
マルチGPUサポート - 完全なシャーディングデータ並列処理（FSDP）による実現
メモリ最適化 - オプションのCPUオフロードとTPU/XLAサポート
量子化技術 - 4ビット浮動小数点、8ビット整数、および二重量子化をサポート
パラメータ効率的な微調整 - LoRA、QLoRA、Adapter、およびAdapter v2をサポート

サポートされるモデル

LitGPTは、20以上の主要な大規模言語モデルをサポートしています。

主要なモデルシリーズ

Llamaシリーズ - Llama 3, 3.1, 3.2, 3.3 (1B-405Bパラメータ)
CodeGemma - コード生成専用の7Bモデル
Gemmaシリーズ - Googleのオープンソースモデル
Mistralシリーズ - Mistral 7BやMixtralなどを含む
Phiシリーズ - Microsoftの小型で効率的なモデル
Qwenシリーズ - アリババの多言語モデル
DeepSeek R1 - 最新の推論モデル

特徴的なモデル

Falconシリーズ - TIIによって開発された高性能モデル
StableLM - Stability AIの安定した言語モデル
TinyLlama - 軽量のLlamaバリアント
SmolLM - Hugging Faceの小型モデル

コア機能

1. クイックスタート

from litgpt import LLM
llm = LLM.load("microsoft/phi-2")
text = llm.generate("Fix the spelling: Every fall, the family goes to the mountains.")
print(text)

2. モデルの微調整

さまざまな微調整方法をサポート：

完全な微調整 - すべてのパラメータをトレーニング
LoRA微調整 - 低ランク適応微調整
QLoRA - 量子化LoRA微調整
Adapter微調整 - アダプター層微調整

サンプルコマンド：

litgpt finetune microsoft/phi-2 \
  --data JSON \
  --data.json_path my_custom_dataset.json \
  --data.val_split_fraction 0.1 \
  --out_dir out/custom-model

3. モデルの事前学習

ゼロからのトレーニングと継続的な事前学習をサポート：

litgpt pretrain EleutherAI/pythia-160m \
  --tokenizer_dir EleutherAI/pythia-160m \
  --data TextFiles \
  --data.train_data_path "custom_texts/" \
  --train.max_tokens 10_000_000 \
  --out_dir out/custom-model

4. モデルのデプロイメント

ワンクリックでWebサービスとしてデプロイメントをサポート：

# 事前学習済みモデルのデプロイメント
litgpt serve microsoft/phi-2

# カスタムモデルのデプロイメント
litgpt serve out/custom-model/final

5. モデルの評価

さまざまな評価基準をサポート：

litgpt evaluate microsoft/phi-2 --tasks 'truthfulqa_mc2,mmlu'

6. インタラクティブチャット

litgpt chat microsoft/phi-2

技術的優位性

パフォーマンス最適化

最適化された推論速度 - 高速推論専用に最適化
量子化サポート - メモリ使用量の削減
低メモリGPUでの実行 - リソース制約のある環境をサポート
本番環境レベルの拡張 - 1〜1000以上のGPU/TPUをサポート

メモリと計算の最適化

混合精度トレーニング - FP16、BF16、FP32混合をサポート
勾配チェックポイント - メモリ使用量の削減
CPUオフロード - 超大規模モデルの処理
分散トレーニング - マルチノードマルチGPUサポート

設定可能なトレーニング

LitGPTは、さまざまなトレーニングシナリオを網羅した検証済みのYAML構成ファイルを提供します。

litgpt finetune \
  --config https://raw.githubusercontent.com/Lightning-AI/litgpt/main/config_hub/finetune/llama-2-7b/lora.yaml

アプリケーションシナリオ

研究開発

モデル研究 - 可読性が高く、修正が容易なコードを提供
アルゴリズム実験 - 最新の研究アイデアの迅速な実装をサポート
ベンチマークテスト - 標準化されたモデル評価プロセス

エンタープライズアプリケーション

カスタマイズされたモデル - 特定のビジネスシナリオに合わせたモデルの微調整
本番環境へのデプロイメント - エンタープライズレベルのモデルサービスデプロイメント
コスト最適化 - 量子化と最適化による計算コストの削減

教育と学習

初心者向け - 明確なコード構造と詳細なドキュメント
実践的な教育 - トレーニングからデプロイメントまでの完全なプロセス
研究トレーニング - 研究者向けに信頼性の高い基盤ツールを提供

コミュニティエコシステム

著名なプロジェクトのサポート

SAMBAプロジェクト - MicrosoftがLitGPTに基づいて開発したハイブリッド状態空間モデル
TinyLlama - LitGPTを使用してトレーニングされた300Mパラメータの小型モデル
NeurIPS 2023チャレンジ - 公式に指定されたLLM効率チャレンジツールキット

活発なオープンソースコミュニティ

継続的な更新 - 新しいモデルと機能の定期的な追加
コミュニティ貢献 - あらゆるレベルの開発者の参加を歓迎
詳細なドキュメント - 充実したチュートリアルとAPIドキュメント

インストールと使用

基本的なインストール

pip install 'litgpt[all]'

ソースコードからのインストール

git clone https://github.com/Lightning-AI/litgpt
cd litgpt
pip install -e '.[all]'

基本的な使用フロー

モデルの選択 - 20以上のサポートされているモデルから選択
データの準備 - 組み込みのデータセットまたはカスタムデータを使用
トレーニングの構成 - プリセット構成またはカスタムパラメータを使用
トレーニングの実行 - モデルの事前学習または微調整
モデルのデプロイメント - 本番環境サービスとしてデプロイ
モデルの評価 - 標準ベンチマークテストを使用

技術ドキュメント

LitGPTは、以下の内容を含む完全な技術ドキュメントを提供します。

クイックスタートガイド - 0からLitGPTまでの完全なチュートリアル
微調整チュートリアル - LoRA、QLoRA、およびAdapterの詳細な説明を含む
事前学習ガイド - ゼロからモデルをトレーニングするための完全なプロセス
デプロイメントドキュメント - 本番環境へのデプロイメントのベストプラクティス
パフォーマンス最適化 - OOMエラー処理とメモリ最適化のヒント
クラウドデプロイメント - TPUとクラウドプラットフォームの使用ガイド

まとめ

LitGPTは、研究から本番環境まで、さまざまなアプリケーションシナリオに適した、機能が充実し、パフォーマンスに優れた大規模言語モデルツールボックスです。ゼロからの実装、抽象化レイヤーのない設計理念により、ユーザーに最大限の柔軟性と制御を提供すると同時に、豊富な最適化技術と構成オプションにより、さまざまなハードウェア条件下での効率的な動作を保証します。AI研究者、エンタープライズ開発者、学習者のいずれであっても、LitGPTから自分のニーズに合ったソリューションを見つけることができます。