MNN은 효율적인 경량 딥러닝 프레임워크로, 딥러닝 모델의 추론 및 훈련을 지원하며, 장치 측 추론 및 훈련 분야에서 업계 선도적인 성능을 자랑합니다. 현재 MNN은 타오바오, 티몰, 유쿠, 딩딩, 시엔위 등 알리바바의 30개 이상의 애플리케이션에 통합되어 라이브 스트리밍, 짧은 동영상 촬영, 검색 추천, 즉석 사진 검색, 인터랙티브 마케팅, 권익 제공, 보안 리스크 관리 등 70개 이상의 사용 시나리오를 커버합니다.
GitHub 주소: https://github.com/alibaba/MNN
아키텍처/정밀도 | Normal | FP16 | BF16 | Int8 |
---|---|---|---|---|
CPU | ||||
Native | B | C | B | B |
x86/x64-SSE4.1 | A | B | B | A |
x86/x64-AVX2 | S | B | B | A |
x86/x64-AVX512 | S | B | B | S |
ARMv7a | S | S(ARMv8.2) | S | S |
ARMv8 | S | S(ARMv8.2) | S(ARMv8.6) | S |
GPU | ||||
OpenCL | A | S | C | S |
Vulkan | A | A | C | A |
Metal | A | S | C | S |
CUDA | A | S | C | A |
NPU | ||||
CoreML | A | C | C | C |
HIAI | A | C | C | C |
NNAPI | B | B | C | B |
설명: S-강력 추천 | A-양호한 지원 | B-지원하지만 문제 있음 | C-지원하지 않음
모델 변환 도구, 다른 프레임워크 모델을 MNN 모델로 변환 지원:
모델 압축 도구, 모델 크기를 줄이고 성능 향상
제어 흐름을 지원하는 모델 실행, MNN 연산자를 사용하여 일반적인 계산 수행
경량 이미지 처리 라이브러리, OpenCV와 유사하지만 MNN 기반으로 구현
MNN 모델 훈련 지원
MNN 엔진을 기반으로 개발된 대규모 언어 모델 런타임 솔루션으로, 모든 사람의 플랫폼(휴대폰/PC/IoT)에 LLM 모델을 로컬로 배포하는 것을 목표로 합니다. 지원:
MNN 엔진 기반의 안정적인 확산 모델 런타임 솔루션으로, 각 플랫폼에 안정적인 확산 모델을 로컬로 배포하는 것을 지원합니다.
MNN 관련 연구 성과는 최고 시스템 회의 OSDI'22 및 MLSys 2020에 발표되어 학계와 산업계에서의 영향력을 입증했습니다.
MNN 공식 웹사이트에서 다운로드할 수 있으며, 다음을 제공합니다.
머신러닝 엔지니어에게 사용하기 쉬운 Python 인터페이스를 제공하여 C++ 코드를 작성하지 않고도 추론, 훈련 및 이미지 처리를 수행할 수 있습니다.
MNN은 알리바바에서 오픈 소스로 제공하는 딥러닝 프레임워크로서, 경량화, 고성능, 크로스 플랫폼의 특징을 바탕으로 모바일 및 임베디드 AI 배포에 탁월한 선택이 되었습니다. 기존의 CNN 모델 추론이든 최신 대규모 언어 모델 배포이든 MNN은 완벽한 솔루션을 제공하며, AI 개발자에게 없어서는 안 될 도구 세트입니다.