第二段階:古典的機械学習
アンドリュー・ウンのスタンフォード機械学習コースの完全な中国語ノート。基礎から応用まで網羅した18章構成で、様々な形式の学習資料を提供。
アンドリュー・ン機械学習コースノートプロジェクト紹介
プロジェクト概要
これは(fengdu78)によって作成されたGitHubプロジェクトで、スタンフォード大学2014年アンドリュー・ン先生の機械学習コースの中国語ノートを専門に収集・整理したものです。本プロジェクトは、中国語学習者が機械学習の基礎知識をより良く理解し、習得できるよう支援することを目的としています。
プロジェクト背景
- コース元: スタンフォード大学2014年アンドリュー・ン機械学習コース
- コースURL: https://www.coursera.org/course/ml
- 作成時期: 2014年下半期に翻訳開始、2018年3月26日に完成
- プロジェクト目標: 中国語学習者向けに高品質な機械学習学習資料を提供する
プロジェクト内容構成
フォルダ説明
docx
: ノートのWord版markdown
: ノートのMarkdown版html
: ノートのHTML版images
: ノートの画像素材ppt
: コースのオリジナルPPTスライドsrt
: コースの中国語・英語字幕code
: コースのPythonコード実装
コース内容概要
パート1:基礎概念
はじめに(Introduction)
- 機械学習とは?
- 教師あり学習
- 教師なし学習
単一変数線形回帰(Linear Regression with One Variable)
- モデル表現
- コスト関数
- 勾配降下法
線形代数の復習(Linear Algebra Review)
- 行列とベクトル
- 行列演算
- 逆行列、転置
パート2:古典的アルゴリズム
多変数線形回帰(Linear Regression with Multiple Variables)
- 多次元特徴量
- 多変数勾配降下法
- 正規方程式
Octaveチュートリアル(Octave Tutorial)
- 基本操作
- データ処理
- ベクトル化
ロジスティック回帰(Logistic Regression)
- 分類問題
- 仮説表現
- 高度な最適化
パート3:高度な技術
正則化(Regularization)
- 過学習問題
- 正則化線形回帰
- 正則化ロジスティック回帰
ニューラルネットワーク:表現(Neural Networks: Representation)
- 非線形仮説
- ニューロンモデル
- 多クラス分類
ニューラルネットワークの学習(Neural Networks: Learning)
- 誤差逆伝播法(バックプロパゲーション)
- 勾配チェック
- ランダム初期化
パート4:応用実践
機械学習を適用する上でのアドバイス(Advice for Applying Machine Learning)
- モデル評価
- 交差検定
- バイアスとバリアンス
機械学習システム設計(Machine Learning System Design)
- 誤差分析
- 適合率と再現率
- 機械学習のデータ
サポートベクターマシン(Support Vector Machines)
- 最適化目標
- カーネル関数
- サポートベクターマシンの使用
パート5:教師なし学習
クラスタリング(Clustering)
- K平均法(K-meansアルゴリズム)
- 最適化目標
- クラスタ数の選択
次元削減(Dimensionality Reduction)
- 主成分分析(PCA)
- データ圧縮
- データ可視化
異常検知(Anomaly Detection)
- ガウス分布
- 異常検知アルゴリズム
- 多変量ガウス分布
パート6:実用応用
レコメンダーシステム(Recommender Systems)
- コンテンツベース推薦
- 協調フィルタリング
- 行列分解
大規模機械学習(Large Scale Machine Learning)
- 確率的勾配降下法
- オンライン学習
- MapReduce
応用例:画像文字認識(Application Example: Photo OCR)
- スライディングウィンドウ
- 大量のデータ取得
- 上限分析(Cap Analysis)
プロジェクト特徴
1. 網羅性
- 機械学習の基礎理論から実用応用までをカバー
- 入門から上級まで18章を収録
- 完全なコースビデオ、PPT、コードを提供
2. 複数フォーマット対応
- Word、Markdown、HTMLの複数フォーマットを提供
- オンライン閲覧とオフライン学習に対応
- 数式は画像化処理されており、オンライン表示に便利
3. 中国語ローカライズ
- 中国語学習者向けに専門的に翻訳・整理
- 中国語の学習習慣と思考様式に合わせた内容
- 中国語・英語字幕の対照を提供
学習リソース
オンラインリソース
- GitHubリポジトリ: https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes
- コースビデオ: https://www.bilibili.com/video/BV1W34y1i7xK
- 百度網盤リソース: コースビデオと資料のダウンロードを提供
対象者
- 機械学習初心者
- コンピュータサイエンス専攻の学生
- データサイエンス実務者
- AI愛好家
- 中国語の学習資料を必要とする学習者
プロジェクト価値
- 教育的価値: 中国語学習者向けに高品質な機械学習入門資料を提供
- 実用的価値: 完全な理論知識と実践コードを収録
- 社会的価値: 機械学習の学習障壁を下げ、知識の普及を促進
- オープンソース的価値: オープンソース精神を体現し、知識共有と協力を奨励
まとめ
このプロジェクトは、中国語の機械学習教育分野における重要なリソースであり、体系的な翻訳と整理を通じて、広範な中国語学習者に機械学習を学ぶための質の高い教材を提供しています。内容は網羅的でフォーマットも多様であるだけでなく、学習コミュニティも構築されており、「人にバラを贈れば、手に香りが残る」というオープンソース精神を体現しています。