LMFlow是由OptimalScale團隊開發的一個開源項目,是一個可擴展、便捷、高效的大型機器學習模型微調工具包。該項目專為用戶友好、快速可靠而設計,旨在讓大型語言模型技術面向整個社區開放,實現"讓大模型為所有人服務"的願景。
項目地址: https://github.com/OptimalScale/LMFlow
支持多種主流大語言模型,包括:
LMFlow Benchmark是一個專門為開源大語言模型設計的自動評估框架,使用負對數似然(NLL)作為指標評估模型在以下方面的能力:
項目提出了一種新的對齊算法:Reward rAnked FineTuning (RAFT),這種方法比傳統的基於PPO的RLHF更加高效。
支持多種自定義優化器訓練,包括:
LMFlow訓練的模型在醫療領域表現出色,其任務調優模型在醫療領域的表現超越了ChatGPT,展現了在垂直領域應用的巨大潛力。
項目發布了多個高性能的Robin模型:
git clone -b v0.0.9 https://github.com/OptimalScale/LMFlow.git
cd LMFlow
conda create -n lmflow python=3.9 -y
conda activate lmflow
conda install mpi4py
pip install -e .
pip install lmflow-finetune
LMFlow項目已經在學術界和工業界產生了重要影響:
LMFlow作為一個綜合性的大語言模型工具包,不僅提供了完整的模型訓練和推理解決方案,還在內存優化、性能加速、模型評估等多個方面進行了創新。它降低了大語言模型的使用門檻,讓更多的研究者和開發者能夠便捷地構建和部署自己的語言模型,真正實現了"讓大模型為所有人服務"的目標。