Home
Login

Outil de deepfake de remplacement de visage en un clic, remplacez les visages dans les vidéos avec une seule image.

GPL-3.0Python 30.0ks0md3vroop Last Updated: 2024-08-19

Roop - Outil de remplacement de visage en un clic

Aperçu du projet

Roop est un outil open source de deepfake, développé par l'utilisateur GitHub s0md3v. La fonction principale de ce projet est de remplacer le visage dans une vidéo avec une seule image, sans ensemble de données ni entraînement. Le projet n'est plus mis à jour, mais il est toujours utilisable.

Adresse GitHub: https://github.com/s0md3v/roop

Principales caractéristiques

Fonctionnalités principales

  • Opération en un clic: Fonction de remplacement de visage simple et facile à utiliser
  • Entrée d'une seule image: Nécessite uniquement une image du visage cible
  • Traitement vidéo: Prend en charge le remplacement de visage sur une vidéo entière
  • Pas d'entraînement nécessaire: Ne nécessite pas de pré-entraînement du modèle ni de préparation d'un grand ensemble de données

Caractéristiques techniques

  • Basé sur la technologie d'apprentissage profond
  • Prend en charge l'accélération CPU et GPU
  • Utilise des modèles pré-entraînés
  • Prend en charge plusieurs formats de sortie

Exigences d'installation

L'installation du projet nécessite certaines compétences techniques et ne convient pas aux débutants. Il existe principalement deux méthodes d'installation :

Installation de base

  • Meilleure compatibilité, mais vitesse de traitement plus lente
  • Convient aux environnements avec des ressources de calcul limitées

Installation accélérée

  • Utilise pleinement les performances du CPU et du GPU
  • Vitesse de traitement plus rapide, convient aux utilisateurs disposant d'une carte graphique dédiée

Méthode d'utilisation

Paramètres de ligne de commande

Le programme s'exécute via la ligne de commande, avec la syntaxe de base suivante :

python run.py [options]

Description des principaux paramètres

Paramètres de base

  • -h, --help: Afficher l'aide
  • -s SOURCE_PATH, --source SOURCE_PATH: Sélectionner l'image source
  • -t TARGET_PATH, --target TARGET_PATH: Sélectionner l'image ou la vidéo cible
  • -o OUTPUT_PATH, --output OUTPUT_PATH: Sélectionner le fichier ou le répertoire de sortie

Paramètres de traitement

  • --frame-processor: Sélection du processeur de trame (face_swapper, face_enhancer, etc.)
  • --keep-fps: Conserver la fréquence d'images cible
  • --keep-frames: Conserver les trames temporaires
  • --skip-audio: Ignorer l'audio cible
  • --many-faces: Traiter chaque visage

Paramètres de reconnaissance faciale

  • --reference-face-position: Position du visage de référence
  • --reference-frame-number: Numéro de trame de référence
  • --similar-face-distance: Distance du visage utilisée pour la reconnaissance

Paramètres de sortie

  • --temp-frame-format {jpg,png}: Format d'image de l'extraction de trame
  • --temp-frame-quality [0-100]: Qualité d'image de l'extraction de trame
  • --output-video-encoder: Sélection de l'encodeur vidéo de sortie
    • libx264, libx265, libvpx-vp9, h264_nvenc, hevc_nvenc
  • --output-video-quality [0-100]: Qualité vidéo de sortie

Paramètres de performance

  • --max-memory MAX_MEMORY: Utilisation maximale de la RAM (GB)
  • --execution-provider {cpu}: Fournisseur d'exécution disponible
  • --execution-threads: Nombre de threads d'exécution

Exécution en mode headless

L'utilisation des paramètres -s/--source, -t/--target et -o/--output permet d'exécuter le programme en mode headless, ce qui est adapté au traitement automatisé.

Architecture technique

Dépendances principales

  • InsightFace: Le projet utilise la bibliothèque insightface développée par l'équipe deepinsight
  • Bibliothèques tierces: Utilisation intensive de modèles pré-entraînés et de bibliothèques tierces
  • Framework d'apprentissage profond: Basé sur les technologies modernes d'apprentissage profond

Processus de traitement

  1. Entrée de l'image du visage source et de la vidéo cible
  2. Détection et analyse des caractéristiques du visage
  3. Traitement du remplacement de visage
  4. Sortie du fichier vidéo traité

Scénarios d'utilisation

Utilisations légitimes

  • Création artistique: Aide les artistes à créer des animations de personnages
  • Modélisation de vêtements: Fournit différents visages aux mannequins
  • Contenu de divertissement: Création de contenu vidéo amusant
  • Démonstration éducative: Utilisé pour les démonstrations techniques et l'enseignement

Considérations éthiques et déclaration de responsabilité

Code de conduite éthique

Ce logiciel est conçu pour contribuer positivement à l'industrie des médias générés par l'IA, en aidant les artistes à réaliser des animations de personnages et des mannequins, entre autres tâches.

Mesures de sécurité

  • Des mesures ont été mises en place pour empêcher l'utilisation du logiciel pour des contenus inappropriés (tels que la nudité).
  • Les utilisateurs sont tenus de respecter les lois locales et d'utiliser le logiciel de manière responsable.

Responsabilité de l'utilisateur

  • Si des visages réels sont utilisés, le consentement doit être obtenu et le contenu doit être clairement étiqueté comme un deepfake lors du partage.
  • Le développeur n'est pas responsable du comportement des utilisateurs.
  • Les utilisateurs doivent respecter les lois et réglementations locales en vigueur.

État du projet

Rappel important: Ce projet est toujours utilisable, mais il ne reçoit plus de mises à jour. Le développeur a déclaré ne pas avoir l'intérêt ou le temps de superviser le développement ultérieur de ce logiciel.

Le développeur remercie toutes les personnes qui ont contribué au projet, lui permettant d'atteindre sa forme finale.

Documentation et support

  • Documentation détaillée : https://github.com/s0md3v/roop/wiki
  • Les questions relatives à la plateforme et à l'installation ne sont plus acceptées sur GitHub.
  • Les utilisateurs qui rencontrent des erreurs doivent rechercher eux-mêmes des solutions.

Résumé

Roop est un outil d'IA puissant mais qui doit être utilisé avec prudence. Il démontre le potentiel des technologies modernes d'apprentissage profond dans le domaine du traitement vidéo, tout en nous rappelant la nécessité d'assumer les responsabilités éthiques et juridiques correspondantes lors de l'utilisation de telles technologies. Les utilisateurs doivent bien comprendre les risques associés avant de l'utiliser et s'assurer que leur utilisation est conforme aux lois et aux normes éthiques.

Star History Chart