第四段階:深層学習とニューラルネットワーク

アンドレイ・カルパシーが大規模言語モデル(LLM)技術を深く解説。基礎的なニューラルネットワークからGPTやLlamaモデルに至るまで、RLHF(人間のフィードバックに基づく強化学習)などの最先端技術を含む完全なトレーニングスタックをカバーしています。

LLMDeepLearningNeuralNetworkYouTubeVideoFreeEnglish

ChatGPTのような大規模言語モデル(LLM)の深層解説 - コース紹介

コース概要

本講義は一般向けの大規模言語モデル(Large Language Model, LLM)AI技術に関するディープダイブ講座であり、ChatGPTおよび関連製品を支える技術原理を主に解説します。コースではモデル開発のトレーニングスタック全体を網羅し、「心理学的」な思考モデルの理解方法や、実際の応用においてこれらのモデルを最適に活用する方法についても詳しく説明します。

公開日: 2025年2月6日
視聴回数: 3,899,830回

講師紹介

Andrej Karpathy 氏はAI分野で豊富な経験を持つ専門家です:

  • OpenAI創業メンバー(2015年)
  • テスラ AI上級ディレクター(2017–2022年)
  • 現在はEureka Labsを創業し、AIネイティブな学校の構築を進めています

講師の目的: 最新AI技術に対する一般の認知と理解を高め、人々が仕事で最新かつ最高のAI技術を効果的に活用できるように支援すること。

詳細情報:

コース章立て

基礎概念パート

00:00:00 イントロダクション

コース紹介

00:01:00 事前学習データ(インターネット)

Pretraining data (internet)

00:07:47 トークン化

Tokenization

00:14:27 ニューラルネットワークの入出力

Neural network I/O

00:20:11 ニューラルネットワークの内部構造

Neural network internals

00:26:01 推論

Inference

モデル学習パート

00:31:09 GPT-2:学習と推論

GPT-2: training and inference

00:42:52 Llama 3.1 ベースモデルの推論

Llama 3.1 base model inference

00:59:23 事前学習から事後学習へ

Pretraining to post-training

01:01:06 事後学習データ(会話データ)

Post-training data (conversations)

高度な機能パート

01:20:32 幻覚、ツール利用、知識/作業記憶

Hallucinations, tool use, knowledge/working memory

01:41:46 自己認識

Knowledge of self

01:46:56 モデルは考えるためにトークンを必要とする

Models need tokens to think

02:01:11 トークン化再考:モデルはスペルに苦労する

Tokenization revisited: models struggle with spelling

02:04:53 凹凸のある知能

Jagged intelligence

強化学習パート

02:07:28 教師ありファインチューニングから強化学習へ

Supervised finetuning to reinforcement learning

02:14:42 強化学習

Reinforcement learning

02:27:47 DeepSeek-R1

DeepSeek-R1

02:42:07 AlphaGo

AlphaGo

02:48:26 人間からのフィードバックに基づく強化学習(RLHF)

Reinforcement learning from human feedback (RLHF)

まとめパート

03:09:39 今後の展望

Preview of things to come

03:15:15 LLMの動向を追う方法

Keeping track of LLMs

03:18:34 LLMの入手先

Where to find LLMs

03:21:46 総まとめ

Grand summary

コースの特徴

  1. 包括的かつ体系的: データ前処理から高度な強化学習まで、LLMの完全な技術スタックをカバー
  2. 実践志向: 理論だけでなく、モデルの実際の活用方法も解説
  3. わかりやすく深い内容: 一般向けでありながら、技術的な深さを失わない
  4. 最新トピックを網羅: Llama 3.1やDeepSeek-R1など最新モデルを含む

対象者

  • LLM技術を体系的に理解したいAI/機械学習初心者
  • ChatGPTなどの製品の基盤技術を深く理解したい開発者
  • AI技術に興味を持つ一般の方
  • 仕事でLLMを活用したいプロフェッショナル

学習成果

本コースを修了することで、以下のことができるようになります:

  • 大規模言語モデルの動作原理を理解する
  • データ前処理からモデルデプロイまでのフルプロセスを把握する
  • 実問題解決にLLMを効果的に活用する方法を習得する
  • LLMの能力と限界を正しく認識する
  • 最新のLLMの動向を追跡・評価できるようになる