第四段階:深層学習とニューラルネットワーク
アンドレイ・カルパシーが大規模言語モデル(LLM)技術を深く解説。基礎的なニューラルネットワークからGPTやLlamaモデルに至るまで、RLHF(人間のフィードバックに基づく強化学習)などの最先端技術を含む完全なトレーニングスタックをカバーしています。
ChatGPTのような大規模言語モデル(LLM)の深層解説 - コース紹介
コース概要
本講義は一般向けの大規模言語モデル(Large Language Model, LLM)AI技術に関するディープダイブ講座であり、ChatGPTおよび関連製品を支える技術原理を主に解説します。コースではモデル開発のトレーニングスタック全体を網羅し、「心理学的」な思考モデルの理解方法や、実際の応用においてこれらのモデルを最適に活用する方法についても詳しく説明します。
公開日: 2025年2月6日
視聴回数: 3,899,830回
講師紹介
Andrej Karpathy 氏はAI分野で豊富な経験を持つ専門家です:
- OpenAI創業メンバー(2015年)
- テスラ AI上級ディレクター(2017–2022年)
- 現在はEureka Labsを創業し、AIネイティブな学校の構築を進めています
講師の目的: 最新AI技術に対する一般の認知と理解を高め、人々が仕事で最新かつ最高のAI技術を効果的に活用できるように支援すること。
詳細情報:
- 個人ウェブサイト: https://karpathy.ai/
- Twitter: https://x.com/karpathy
コース章立て
基礎概念パート
00:00:00 イントロダクション
コース紹介
00:01:00 事前学習データ(インターネット)
Pretraining data (internet)
00:07:47 トークン化
Tokenization
00:14:27 ニューラルネットワークの入出力
Neural network I/O
00:20:11 ニューラルネットワークの内部構造
Neural network internals
00:26:01 推論
Inference
モデル学習パート
00:31:09 GPT-2:学習と推論
GPT-2: training and inference
00:42:52 Llama 3.1 ベースモデルの推論
Llama 3.1 base model inference
00:59:23 事前学習から事後学習へ
Pretraining to post-training
01:01:06 事後学習データ(会話データ)
Post-training data (conversations)
高度な機能パート
01:20:32 幻覚、ツール利用、知識/作業記憶
Hallucinations, tool use, knowledge/working memory
01:41:46 自己認識
Knowledge of self
01:46:56 モデルは考えるためにトークンを必要とする
Models need tokens to think
02:01:11 トークン化再考:モデルはスペルに苦労する
Tokenization revisited: models struggle with spelling
02:04:53 凹凸のある知能
Jagged intelligence
強化学習パート
02:07:28 教師ありファインチューニングから強化学習へ
Supervised finetuning to reinforcement learning
02:14:42 強化学習
Reinforcement learning
02:27:47 DeepSeek-R1
DeepSeek-R1
02:42:07 AlphaGo
AlphaGo
02:48:26 人間からのフィードバックに基づく強化学習(RLHF)
Reinforcement learning from human feedback (RLHF)
まとめパート
03:09:39 今後の展望
Preview of things to come
03:15:15 LLMの動向を追う方法
Keeping track of LLMs
03:18:34 LLMの入手先
Where to find LLMs
03:21:46 総まとめ
Grand summary
コースの特徴
- 包括的かつ体系的: データ前処理から高度な強化学習まで、LLMの完全な技術スタックをカバー
- 実践志向: 理論だけでなく、モデルの実際の活用方法も解説
- わかりやすく深い内容: 一般向けでありながら、技術的な深さを失わない
- 最新トピックを網羅: Llama 3.1やDeepSeek-R1など最新モデルを含む
対象者
- LLM技術を体系的に理解したいAI/機械学習初心者
- ChatGPTなどの製品の基盤技術を深く理解したい開発者
- AI技術に興味を持つ一般の方
- 仕事でLLMを活用したいプロフェッショナル
学習成果
本コースを修了することで、以下のことができるようになります:
- 大規模言語モデルの動作原理を理解する
- データ前処理からモデルデプロイまでのフルプロセスを把握する
- 実問題解決にLLMを効果的に活用する方法を習得する
- LLMの能力と限界を正しく認識する
- 最新のLLMの動向を追跡・評価できるようになる