Hunyuan3D-2.0 est un système avancé de synthèse 3D à grande échelle développé par Tencent, spécialement conçu pour générer des actifs 3D texturés en haute résolution. Ce système représente l'état de l'art actuel en matière de technologie de génération 3D, capable de créer des modèles 3D de haute qualité à partir de descriptions textuelles ou d'entrées d'images.
Adresse du projet : https://github.com/Tencent-Hunyuan/Hunyuan3D-2
Hunyuan3D-2.0 adopte un pipeline de génération en deux étapes :
Par rapport à d'autres méthodes de génération 3D open source et propriétaires, Hunyuan3D-2.0 excelle dans plusieurs indicateurs d'évaluation :
Modèle | CMMD(⬇) | FID_CLIP(⬇) | FID(⬇) | CLIP-score(⬆) |
---|---|---|---|---|
Modèle open source de premier plan 1 | 3.591 | 54.639 | 289.287 | 0.787 |
Modèle propriétaire de premier plan 1 | 3.600 | 55.866 | 305.922 | 0.779 |
Modèle propriétaire de premier plan 2 | 3.368 | 49.744 | 294.628 | 0.806 |
Modèle propriétaire de premier plan 3 | 3.218 | 51.574 | 295.691 | 0.799 |
Hunyuan3D 2.0 | 3.193 | 49.165 | 282.429 | 0.809 |
Le projet propose plusieurs variantes de modèles pré-entraînés :
Hunyuan3D-2mini
: Version légèreHunyuan3D-2mv
: Version multi-vuesHunyuan3D-2
: Version complète# Hunyuan3D-2mini
python3 gradio_app.py --model_path tencent/Hunyuan3D-2mini --subfolder hunyuan3d-dit-v2-mini --texgen_model_path tencent/Hunyuan3D-2 --low_vram_mode
# Hunyuan3D-2mv
python3 gradio_app.py --model_path tencent/Hunyuan3D-2mv --subfolder hunyuan3d-dit-v2-mv --texgen_model_path tencent/Hunyuan3D-2 --low_vram_mode
# Hunyuan3D-2
python3 gradio_app.py --model_path tencent/Hunyuan3D-2 --subfolder hunyuan3d-dit-v2-0 --texgen_model_path tencent/Hunyuan3D-2 --low_vram_mode
Hunyuan3D-2.0 représente une avancée majeure dans la technologie de génération 3D. Grâce à une architecture innovante en deux étapes et à des modèles de diffusion à grande échelle, il permet une conversion efficace des concepts en actifs 3D finis. Que ce soit pour les développeurs professionnels ou les utilisateurs ordinaires, ce système permet de créer facilement du contenu 3D de haute qualité.