MNN é uma estrutura de aprendizado profundo eficiente e leve que suporta inferência e treinamento de modelos de aprendizado profundo, com desempenho líder do setor em inferência e treinamento no dispositivo. Atualmente, o MNN foi integrado a mais de 30 aplicativos do Alibaba, como Taobao, Tmall, Youku, DingTalk, Xianyu, etc., cobrindo mais de 70 cenários de uso, como transmissão ao vivo, gravação de vídeos curtos, recomendação de pesquisa, "拍立淘" (Paipitao - pesquisa visual), marketing interativo, distribuição de direitos e controle de risco de segurança.
Endereço do GitHub: https://github.com/alibaba/MNN
Arquitetura/Precisão | Normal | FP16 | BF16 | Int8 |
---|---|---|---|---|
CPU | ||||
Native | B | C | B | B |
x86/x64-SSE4.1 | A | B | B | A |
x86/x64-AVX2 | S | B | B | A |
x86/x64-AVX512 | S | B | B | S |
ARMv7a | S | S(ARMv8.2) | S | S |
ARMv8 | S | S(ARMv8.2) | S(ARMv8.6) | S |
GPU | ||||
OpenCL | A | S | C | S |
Vulkan | A | A | C | A |
Metal | A | S | C | S |
CUDA | A | S | C | A |
NPU | ||||
CoreML | A | C | C | C |
HIAI | A | C | C | C |
NNAPI | B | B | C | B |
Legenda: S - Fortemente Recomendado | A - Bem Suportado | B - Suportado, mas com Problemas | C - Não Suportado
Ferramenta de conversão de modelos, suporta a conversão de modelos de outras estruturas para modelos MNN:
Ferramenta de compressão de modelos, reduz o tamanho do modelo e melhora o desempenho
Suporta a execução de modelos de fluxo de controle, usando operadores MNN para computação de propósito geral
Biblioteca leve de processamento de imagem, semelhante ao OpenCV, mas implementada com base no MNN
Suporta o treinamento de modelos MNN
Solução de tempo de execução de modelo de linguagem grande desenvolvida com base no mecanismo MNN, com o objetivo de implantar modelos LLM localmente na plataforma de todos (telefone celular/PC/IoT). Suporta:
Solução de tempo de execução de modelo de difusão estável baseada no mecanismo MNN, que suporta a implantação local de modelos de difusão estável em várias plataformas.
Os resultados de pesquisa relacionados ao MNN foram publicados nas principais conferências de sistemas OSDI'22 e MLSys 2020, demonstrando seu impacto na academia e na indústria.
Pode ser baixado do site oficial do MNN, fornecendo:
Fornece uma interface Python fácil de usar para engenheiros de aprendizado de máquina, permitindo inferência, treinamento e processamento de imagem sem escrever código C++.
Como uma estrutura de aprendizado profundo de código aberto do Alibaba, o MNN se tornou uma excelente escolha para implantação de IA móvel e embarcada devido às suas características de leveza, alto desempenho e multiplataforma. Seja a inferência de modelos CNN tradicionais ou a implantação dos mais recentes modelos de linguagem grandes, o MNN fornece uma solução completa e é um conjunto de ferramentas indispensável para desenvolvedores de IA.