MNN是一个高效轻量级的深度学习框架,支持深度学习模型的推理和训练,在设备端推理和训练方面具有业界领先的性能。目前,MNN已经集成到阿里巴巴30多个应用中,如淘宝、天猫、优酷、钉钉、闲鱼等,覆盖直播、短视频拍摄、搜索推荐、拍立淘、互动营销、权益发放、安全风控等70多个使用场景。
GitHub地址: https://github.com/alibaba/MNN
架构/精度 | Normal | FP16 | BF16 | Int8 |
---|---|---|---|---|
CPU | ||||
Native | B | C | B | B |
x86/x64-SSE4.1 | A | B | B | A |
x86/x64-AVX2 | S | B | B | A |
x86/x64-AVX512 | S | B | B | S |
ARMv7a | S | S(ARMv8.2) | S | S |
ARMv8 | S | S(ARMv8.2) | S(ARMv8.6) | S |
GPU | ||||
OpenCL | A | S | C | S |
Vulkan | A | A | C | A |
Metal | A | S | C | S |
CUDA | A | S | C | A |
NPU | ||||
CoreML | A | C | C | C |
HIAI | A | C | C | C |
NNAPI | B | B | C | B |
说明: S-强烈推荐 | A-支持良好 | B-支持但有问题 | C-不支持
模型转换工具,支持将其他框架模型转换为MNN模型:
模型压缩工具,减少模型大小并提高性能
支持控制流的模型执行,使用MNN算子进行通用计算
轻量级图像处理库,类似OpenCV但基于MNN实现
支持MNN模型训练
基于MNN引擎开发的大语言模型运行时解决方案,目标是在每个人的平台(手机/PC/IoT)上本地部署LLM模型。支持:
基于MNN引擎的稳定扩散模型运行时解决方案,支持在各平台本地部署稳定扩散模型。
MNN相关研究成果已发表在顶级系统会议OSDI'22和MLSys 2020上,证明了其在学术界和工业界的影响力。
可从MNN官网下载,提供:
为机器学习工程师提供易用的Python接口,无需编写C++代码即可进行推理、训练和图像处理。
MNN作为阿里巴巴开源的深度学习框架,凭借其轻量化、高性能、跨平台的特点,已成为移动端和嵌入式AI部署的优秀选择。无论是传统的CNN模型推理,还是最新的大语言模型部署,MNN都提供了完整的解决方案,是AI开发者不可多得的工具集。