LMFlow是由OptimalScale团队开发的一个开源项目,是一个可扩展、便捷、高效的大型机器学习模型微调工具包。该项目专为用户友好、快速可靠而设计,旨在让大型语言模型技术面向整个社区开放,实现"让大模型为所有人服务"的愿景。
项目地址: https://github.com/OptimalScale/LMFlow
支持多种主流大语言模型,包括:
LMFlow Benchmark是一个专门为开源大语言模型设计的自动评估框架,使用负对数似然(NLL)作为指标评估模型在以下方面的能力:
项目提出了一种新的对齐算法:Reward rAnked FineTuning (RAFT),这种方法比传统的基于PPO的RLHF更加高效。
支持多种自定义优化器训练,包括:
LMFlow训练的模型在医疗领域表现出色,其任务调优模型在医疗领域的表现超越了ChatGPT,展现了在垂直领域应用的巨大潜力。
项目发布了多个高性能的Robin模型:
git clone -b v0.0.9 https://github.com/OptimalScale/LMFlow.git
cd LMFlow
conda create -n lmflow python=3.9 -y
conda activate lmflow
conda install mpi4py
pip install -e .
pip install lmflow-finetune
LMFlow项目已经在学术界和工业界产生了重要影响:
LMFlow作为一个综合性的大语言模型工具包,不仅提供了完整的模型训练和推理解决方案,还在内存优化、性能加速、模型评估等多个方面进行了创新。它降低了大语言模型的使用门槛,让更多的研究者和开发者能够便捷地构建和部署自己的语言模型,真正实现了"让大模型为所有人服务"的目标。