4단계: 딥러닝 및 신경망

저장대학교에서 제공하는 오픈 소스 LLM 교과서로, 아키텍처, 프롬프트 엔지니어링, 미세 조정, 모델 편집 및 RAG를 다룹니다.

대규모언어모델프롬프트엔지니어링PEFTGitHubTextFree多语言

대규모 언어 모델 기초 (ZJU-LLMs)

개요

LLM 기초는 절강대학교 데이터베이스 및 빅데이터 분석 연구소(DAILY Lab)에서 제작한 종합적인 교육 교재 및 학습 자료입니다. 이 오픈 소스 프로젝트는 빠르게 진화하는 이 분야에 관심 있는 독자를 위해 대규모 언어 모델(LLM)과 관련된 기초 지식을 체계적으로 설명하고 최첨단 기술을 소개합니다.

리포지토리: https://github.com/ZJU-LLMs/Foundations-of-LLMs GitHub 스타 수: 11.4k+ 형식: 챕터별 자료 및 논문 목록이 포함된 PDF 교재

프로젝트 철학

저자 팀은 다음 사항을 약속합니다.

오픈 소스 커뮤니티 및 전문가의 제안 경청
최신 콘텐츠 유지를 위한 월별 업데이트 제공
대규모 모델에 대한 접근 가능하고 엄격하며 심층적인 교재 제작
각 챕터별 선별된 논문 목록을 통해 최신 기술 개발 추적

콘텐츠 구조

초판은 6개의 주요 챕터로 구성되며, 각 챕터는 특정 기술을 설명하기 위해 다양한 동물을 주제 배경으로 사용합니다.

챕터 1: 전통적인 언어 모델

언어 모델링의 기초 개념
언어 모델의 역사적 맥락 및 진화

챕터 2: 대규모 언어 모델 아키텍처

LLM 아키텍처의 진화
주요 아키텍처 혁신 및 설계 원칙
다양한 모델 구조의 비교 분석

챕터 3: 프롬프트 엔지니어링

효과적인 프롬프트 설계를 위한 기술
프롬프트 최적화 전략
응용 분야 및 모범 사례

챕터 4: 파라미터 효율적인 미세 조정 (PEFT)

효율적인 모델 적응을 위한 방법
저자원 미세 조정 기술
LoRA, Prefix-tuning 및 기타 PEFT 접근 방식

챕터 5: 모델 편집

모델 지식 수정 기술
지식 업데이트 및 수정 방법
편집 중 모델 무결성 유지

챕터 6: 검색 증강 생성 (RAG)

생성 모델과 검색 시스템의 통합
외부 지식을 활용한 LLM 출력 향상
RAG 아키텍처 및 구현 전략

사용 가능한 자료

1. 전체 교재

중국어 전체 PDF 버전 제공
영어 버전도 제공
6개 챕터 전체에 대한 포괄적인 내용

2. 챕터별 콘텐츠

각 챕터별 개별 PDF 파일
특정 주제에 대한 집중 학습 가능
쉬운 탐색 및 참조

3. 논문 목록

각 챕터별 관련 연구 논문 선별 컬렉션
최신 연구로 지속적으로 업데이트
각 분야의 최첨단 개발 추적

향후 방향

저자 팀은 다음 내용을 다루는 추가 챕터를 통해 교재를 확장할 계획입니다.

LLM 추론 가속: 더 빠른 모델 추론을 위한 기술
LLM 에이전트: 대규모 언어 모델로 구동되는 자율 에이전트
LLM 환경의 추가적인 새로운 주제

대상 독자

이 학습 자료는 다음을 위해 설계되었습니다.

AI 및 NLP 분야의 학생 및 연구원
LLM을 사용하는 실무자
대규모 언어 모델의 기초를 이해하는 데 관심 있는 모든 사람
LLM 기반 애플리케이션을 구축하는 개발자

고유한 특징

시각적 학습: 각 챕터는 고유한 동물 테마를 사용하여 개념을 더 기억에 남고 매력적으로 만듭니다.
커뮤니티 중심: 커뮤니티의 문제 제기 및 피드백에 개방적입니다.
정기적인 업데이트: 월별 업데이트를 통해 콘텐츠가 최신 상태로 유지됩니다.
포괄적인 논문 목록: 각 챕터에는 선별된 연구 논문이 포함되어 있습니다.
무료 및 개방: 완전한 오픈 소스이며 자유롭게 액세스할 수 있습니다.
이중 언어 지원: 중국어와 영어로 제공됩니다.

학문적 엄격성

콘텐츠는 저자 팀의 관련 연구 방향에 대한 탐구 및 이해를 기반으로 합니다. 팀은 GitHub 이슈를 통해 수정 및 제안을 적극적으로 환영하여 지속적인 개선과 정확성을 보장합니다.

연락처 정보

교재 관련 질문이나 제안 사항은 다음으로 문의하십시오.

이메일: xuwenyi@zju.edu.cn
GitHub 이슈: 리포지토리에서 직접 피드백 및 제안 제출

이 자료가 중요한 이유

대규모 언어 모델은 인공 지능 분야에서 가장 혁신적인 기술 발전 중 하나가 되었습니다. 이 교재는 다음을 제공합니다.

체계적인 기초: 전통적인 모델에서 최신 LLM까지 이해 구축
실용적인 기술: LLM 작업을 위한 실행 가능한 방법 학습
연구 연결: 논문 목록을 통해 최신 연구와 연결 유지
점진적인 학습: 기본 개념에서 고급 기술로 이동

커뮤니티 인정

GitHub에서 11,400개 이상의 스타를 획득한 이 프로젝트는 대규모 언어 모델을 이해하기 위한 귀중한 교육 자료로서 AI/ML 커뮤니티에서 상당한 인정을 받았습니다.