lm-sys/FastChatPlease refer to the latest official releases for information GitHub Homepage

FastChat é uma plataforma aberta para treinar, servir e avaliar grandes modelos de linguagem.

Apache-2.0Python 38.7klm-sys Last Updated: 2025-06-02

FastChat

FastChat é um projeto de código aberto projetado para fornecer uma plataforma fácil de usar, distribuída e escalável para treinar, servir e avaliar grandes modelos de linguagem (LLM), especialmente modelos de conversação. Desenvolvido pela organização LM-SYS da Universidade da Califórnia, Berkeley.

Principais Funções e Características

Treinamento (Training):
- Suporta o uso de várias estruturas (como PyTorch, Hugging Face Transformers) para ajuste fino e treinamento de LLMs.
- Fornece scripts de treinamento e exemplos de configuração para facilitar o início rápido para os usuários.
- Suporta treinamento distribuído, permitindo o uso de vários GPUs ou clusters de vários nós para acelerar o processo de treinamento.
Serviço (Serving):
- Fornece um servidor API baseado em FastAPI para implantar e fornecer serviços de inferência de LLM.
- Suporta vários métodos de implantação de modelo, incluindo GPU única, GPUs múltiplas, paralelismo de modelo, etc.
- Fornece balanceamento de carga e mecanismos de fila de solicitações para garantir a estabilidade do serviço e o alto rendimento.
- Suporta saída de streaming, permitindo o retorno de resultados gerados em tempo real.
Avaliação (Evaluation):
- Fornece um conjunto de ferramentas de avaliação para avaliar o desempenho de LLMs, incluindo métricas como precisão, fluidez e consistência.
- Suporta vários conjuntos de dados de avaliação e testes de benchmark.
- Fornece uma interface de visualização para facilitar a análise dos resultados da avaliação pelos usuários.
Interface do Usuário (User Interface):
- Fornece uma interface Web baseada em Gradio para facilitar a interação e o teste de LLMs pelos usuários.
- Suporta conversas de várias rodadas, troca de modelos, ajuste de parâmetros, etc.
Suporte a Vários Modelos:
- Suporta vários LLMs de código aberto e proprietários, como Llama, Vicuna, modelos OpenAI (GPT-3.5, GPT-4), etc.
- Fácil de expandir, permitindo a adição conveniente de novos modelos.
Arquitetura Distribuída:
- Adota uma arquitetura distribuída, permitindo fácil expansão para implantações em larga escala.
- Suporta plataformas de orquestração de contêineres como Kubernetes.
Fácil de Usar:
- Fornece documentação e exemplos detalhados para facilitar o início rápido para os usuários.
- Fornece imagens Docker para facilitar a implantação e o uso.

Principais Componentes

Controller: Gerenciador, responsável por gerenciar e agendar vários Workers.
Worker: Nó de trabalho, responsável por carregar o modelo e fornecer serviços de inferência.
API Server: Servidor API, recebe solicitações do usuário e as encaminha para o Worker.
Web UI: Interface de usuário Web, facilita a interação do usuário com o modelo.

Casos de Uso

Pesquisa: Usado para pesquisa e desenvolvimento de LLMs, como ajuste fino de modelo, avaliação, comparação, etc.
Aplicações: Usado para construir aplicações baseadas em LLMs, como chatbots, sistemas de perguntas e respostas, geração de texto, etc.
Educação: Usado para o ensino e aprendizado de LLMs, como demonstração de princípios do modelo, prática de aplicações do modelo, etc.

Vantagens

Código Aberto: Permite que os usuários usem, modifiquem e distribuam o código livremente.
Fácil de Usar: Fornece documentação e exemplos detalhados para facilitar o início rápido para os usuários.
Escalável: Adota uma arquitetura distribuída, permitindo fácil expansão para implantações em larga escala.
Suporte a Vários Modelos: Suporta vários LLMs de código aberto e proprietários.
Comunidade Ativa: Possui uma comunidade ativa, permitindo obter suporte e ajuda oportunos.

Como Começar

Clone o Código: git clone https://github.com/lm-sys/FastChat.git
Instale as Dependências: pip install -r requirements.txt
Configure o Modelo: Configure os parâmetros e caminhos do modelo conforme necessário.
Inicie o Serviço: Siga as instruções da documentação para iniciar o Controller, Worker e API Server.
Acesse a Web UI: Acesse a Web UI no navegador para interagir com o modelo.

Resumo

lm-sys/FastChat é uma plataforma LLM poderosa e fácil de usar que pode ajudar os usuários a treinar, servir e avaliar LLMs rapidamente. Possui vantagens como código aberto, escalabilidade, suporte a vários modelos e é adequado para vários cenários. Espero que esta introdução seja útil!