Segunda etapa: Aprendizaje automático clásico
Notas completas en chino del curso de aprendizaje automático de Stanford de Andrew Ng, que cubren 18 capítulos desde los fundamentos hasta las aplicaciones, proporcionando materiales de aprendizaje en múltiples formatos.
Introducción al Proyecto de Notas del Curso de Machine Learning de Andrew Ng
Resumen del Proyecto
Este es un proyecto de GitHub creado por (fengdu78) dedicado a recopilar y organizar notas en chino del curso de Machine Learning del profesor Andrew Ng de la Universidad de Stanford de 2014. El proyecto tiene como objetivo ayudar a los estudiantes de habla china a comprender y dominar mejor los fundamentos del aprendizaje automático.
Antecedentes del Proyecto
- Fuente del Curso: Curso de Machine Learning de Andrew Ng, Universidad de Stanford, 2014
- Dirección del Curso: https://www.coursera.org/course/ml
- Fecha de Creación: La traducción comenzó en la segunda mitad de 2014, completado el 26 de marzo de 2018
- Objetivo del Proyecto: Proporcionar materiales de estudio de aprendizaje automático de alta calidad para estudiantes de habla china
Estructura del Contenido del Proyecto
Descripción de Carpetas
docx
: Versión Word de las notasmarkdown
: Versión Markdown de las notashtml
: Versión HTML de las notasimages
: Material de imagen de las notasppt
: Diapositivas PPT originales del cursosrt
: Subtítulos en chino e inglés del cursocode
: Implementación de código Python del curso
Esquema del Contenido del Curso
Parte Uno: Conceptos Fundamentales
Introducción
- ¿Qué es el Machine Learning?
- Aprendizaje Supervisado
- Aprendizaje No Supervisado
Regresión Lineal con una Variable
- Representación del Modelo
- Función de Costo
- Descenso de Gradiente
Repaso de Álgebra Lineal
- Matrices y Vectores
- Operaciones con Matrices
- Inversa, Transpuesta
Parte Dos: Algoritmos Clásicos
Regresión Lineal con Múltiples Variables
- Características Multidimensionales
- Descenso de Gradiente Multivariable
- Ecuación Normal
Tutorial de Octave
- Operaciones Básicas
- Procesamiento de Datos
- Vectorización
Regresión Logística
- Problemas de Clasificación
- Representación de la Hipótesis
- Optimización Avanzada
Parte Tres: Técnicas Avanzadas
Regularización
- Problema de Sobreajuste
- Regresión Lineal Regularizada
- Regresión Logística Regularizada
Redes Neuronales: Representación
- Hipótesis No Lineales
- Modelo de Neurona
- Clasificación Multiclase
Aprendizaje de Redes Neuronales
- Algoritmo de Retropropagación
- Verificación de Gradiente
- Inicialización Aleatoria
Parte Cuatro: Aplicación Práctica
Consejos para Aplicar Machine Learning
- Evaluación del Modelo
- Validación Cruzada
- Sesgo y Varianza
Diseño de Sistemas de Machine Learning
- Análisis de Errores
- Precisión y Recuperación
- Datos para Machine Learning
Máquinas de Vectores de Soporte (SVM)
- Objetivo de Optimización
- Funciones Kernel
- Uso de Máquinas de Vectores de Soporte
Parte Cinco: Aprendizaje No Supervisado
Agrupamiento (Clustering)
- Algoritmo K-Means
- Objetivo de Optimización
- Selección del Número de Clusters
Reducción de Dimensionalidad
- Análisis de Componentes Principales (PCA)
- Compresión de Datos
- Visualización de Datos
Detección de Anomalías
- Distribución Gaussiana
- Algoritmo de Detección de Anomalías
- Distribución Gaussiana Multivariada
Parte Seis: Aplicaciones Reales
Sistemas de Recomendación
- Recomendación Basada en Contenido
- Filtrado Colaborativo
- Factorización de Matrices
Machine Learning a Gran Escala
- Descenso de Gradiente Estocástico
- Aprendizaje en Línea
- MapReduce
Ejemplo de Aplicación: Reconocimiento Óptico de Caracteres (OCR) de Imágenes
- Ventana Deslizante
- Obtención de Grandes Cantidades de Datos
- Análisis de Límite Superior
Características del Proyecto
1. Exhaustividad
- Cubre desde la teoría fundamental del aprendizaje automático hasta aplicaciones prácticas.
- Incluye 18 capítulos, desde el nivel de principiante hasta el avanzado.
- Proporciona videos completos del curso, PPTs y código.
2. Soporte Multiformato
- Ofrece múltiples formatos: Word, Markdown, HTML.
- Soporta visualización en línea y estudio sin conexión.
- Fórmulas matemáticas procesadas como imágenes para una fácil visualización en línea.
3. Localización al Chino
- Traducido y organizado específicamente para estudiantes de habla china.
- Combina hábitos de estudio y formas de pensamiento chinos.
- Proporciona subtítulos en chino e inglés para comparación.
Recursos de Aprendizaje
Recursos en Línea
- Repositorio de GitHub: https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes
- Videos del Curso: https://www.bilibili.com/video/BV1W34y1i7xK
- Recursos de Baidu Cloud: Proporciona descarga de videos y materiales del curso.
Público Objetivo
- Principiantes en Machine Learning
- Estudiantes de Ciencias de la Computación
- Profesionales de Ciencia de Datos
- Entusiastas de la Inteligencia Artificial
- Estudiantes que necesitan materiales de estudio en chino
Valor del Proyecto
- Valor Educativo: Proporciona materiales de introducción al Machine Learning de alta calidad para estudiantes de habla china.
- Valor Práctico: Incluye conocimientos teóricos completos y código práctico.
- Valor Social: Reduce la barrera de entrada al aprendizaje automático y promueve la difusión del conocimiento.
- Valor de Código Abierto: Encarna el espíritu de código abierto, fomentando el intercambio de conocimientos y la colaboración.
Conclusión
Este proyecto es un recurso importante en el campo de la educación de Machine Learning en chino. A través de una traducción y organización sistemáticas, proporciona materiales de alta calidad para que un gran número de estudiantes de habla china aprendan Machine Learning. El proyecto no solo es completo en contenido y diverso en formato, sino que también ha establecido una comunidad de aprendizaje, encarnando el espíritu de código abierto de "dar una rosa y que el aroma permanezca en tu mano".