TP3 : Métamorphose de visages (English version) Posez une question sur ce TP!

Date de remise: 26 février 2025 à 23h59

Survol

Pour ce TP, vous produirez une animation qui affichera votre visage, et la métamorphosera vers le visage d'un autre étudiant du cours, sous la forme d'une séquence vidéo. Lorsque le TP sera terminé, nous (les responsables du cours) allons raccorder vos vidéos afin de créer une séquence vidéo finale qui présentera une métamorphose de chacun d'entre nous. Vous devrez aussi produire des animations avec d'autres images.

Prérequis (5%)

Cette section doit être complétée avant dimanche le 16 février 23h59 ! Cela ne devrait vous prendre que quelques minutes.

Avant même de commencer à implémenter l'algorithme de métamorphose, il nous faut votre photo, ainsi qu'une façon d'établir des correspondances entre les images. Pour ce faire, effectuez les étapes suivantes dans l'ordre :

Prenez une photo de vous (un bon vieux selfie fait l'affaire, ou demandez de l'aide), de façon à ce que votre visage occupe à peu près la même taille dans l'image que l'exemple ci-bas. Les résultats seront plus beaux si l'arrière-plan est uniforme (un beau mur blanc, par exemple), mais ça n'est pas obligatoire.
Rognez et redimensionnez la photo de sorte que ses dimensions soient 720x720 pixels.
Grâce au code Python suivant, sélectionnez les points d'intérêt sur une image de votre propre visage de façon identique à celle de l'image suivante :

Par exemple, notez comment le premier point d'intérêt (1) correspond au menton, et les points subséquents (jusqu'à 13) contournent le visage à intervalles réguliers. Il est très important d'effectuer cette tâche attentivement: vous aurez besoin des points d'intérêts de vos collègues, et ils auront besoin des vôtres!

Consultez la liste de photos disponibles sur ce Google Drive.
Nommez le fichier de votre photo (N+1)_NomDeFamille_Prenom.jpg et le fichier de points (N+1)_NomDeFamille_Prenom.txt. Ici, N est le nombre de photos déjà présentes dans le répertoire, donc (N+1) représente le prochain nombre. Téléversez ces deux fichiers dans le Drive mentionné ci-haut.

Algorithme de métamorphose (95% pour 4105, 75% pour 7105)

Les étapes de l'algorithme de métamorphose sont:

Définir les correspondances
Calculer une triangulation
Créer la métamorphose:
1. Calculer la transformation affine des triangles
2. Calculer le fondu des couleurs

Chacune des étapes de l'algorithme sont décrites plus bas.

1. Définir les correspondances

Tout d'abord, vous devrez définir manuellement des paires de points correspondants sur les deux images. En général, plus il y a de points, mieux c'est. Pour ce faire, vous pouvez utiliser le même code python.

2. Calculer une triangulation

Ensuite, vous devez séparer l'image en plusieurs triangles en utilisant les points sélectionnés à l'étape précédente. Une bonne façon de faire est d'utiliser un algorithme de triangulation. Une triangulation de Delaunay (voir scipy.spatial.Delaunay en python) est un bon choix puisque cet algorithme ne produit pas des triangles trop minces. Pour ce faire, calculez la triangulation sur la moyenne des deux ensembles de points. Ceci diminuera la déformation potentielle des triangles, et réduira les déformations.

Attention : votre code ne devrait calculer la triangulation (la variable tri ci-bas) qu'une seule fois ! Cette dernière doit demeurer constante tout le long du métamorphose, sinon des triangles changeront abruptement.

Then you will need to divide the image into several parts using your previously selected points. A good way is to use a triangulation algorithm. The Delaunay triangulation (see scipy.spatial.Delaunay in python) is a good choice since this algorithm does not produce triangles that are too thin. Compute the triangulation on the average of the two sets of points, to decrease visual deformations.

: your code should compute the triangulation (the variable below) ! The triangulation must be the same throughout the morph, otherwise triangles will abruptly change.

3. Créer la métamorphose

Vous devez écrire la fonction suivante:

morphed_img = morph(img1, img2, img1_pts, img2_pts, tri, warp_frac, dissolve_frac)

qui produit une distorsion entre img1 et img2 en utilisant la correspondance des points img1_pts et img2_pts et la structure de triangulation tri. Les paramètres warp_frac et dissolve_frac contrôlent respectivement la distorsion de forme ainsi que le niveau de fondu. Plus particulièrement, les images img1 et img2 sont d'abord transformées en une forme intermédiaire contrôlée par warp_frac et le fondu est ensuite fait en fonction de dissolve_frac. Ces paramètres varient de 0 à 1. Ce sont les seuls paramètres qui varieront entre chaque trame de l'animation. Pour la trame de départ, ils devraient être chacun égal à 0 et, pour la trame finale, ils devraient être chacun à 1. La variable tri représente la triangulation, et stocke, pour chaque triangle, les indices des 3 points le composant.

which produces a distortion between img1 and img2 using the correspondence points img1_pts and img2_pts and tri the triangulation structure. The warp_frac and dissolve_frac parameters respectively control the distortion of the shape and the level of dissolution. Specifically, images img1 and img2 are first transformed into an intermediate shape which is a weighted mean of both points (where the weight is warp_frac). The level of dissolution is made according to dissolve_frac. These parameters vary from 0 to 1. These are the only parameters that should vary between each frame of the animation. At the start, they should each be equal to 0 and, for the final frame, they should each be equal to 1. The tri variable represents the triangulation and stores, for each triangle, the indices of the 3 points forming the triangle.

3.1 Transformation affine des triangles

Cela consiste à calculer la déformation de chaque triangle de la triangulation à partir des images originales jusqu'à un point intermédiaire entre ces deux images. Cela se fait en calculant simplement une matrice de transformation affine entre deux triangles. Ces transformations doivent être calculées indépendamment pour chaque paire de triangles.

Notez que vous ne pouvez pas utiliser les fonctions calculant les transformations pour vous (par exemple, les fonctions disponibles dans skimage.transform).

Note that you cannot use functions to calculate the transformation for you (eg. functions available in skimage.transform).

3.2 Fondu des couleurs

Après avoir calculé les transformations affines, il vous faut maintenant obtenir la couleur de chacun des pixels. Pour chaque triangle, calculez la transformation affine inverse qui vous permettra d'aller lire la couleur associée à chaque pixel dans les deux images, et d'en calculer une moyenne pondérée. La poids de chaque image correspond à dissolve_frac et 1-dissolve_frac.

After the affine transforms are computed, you must now compute the color for each pixel. For each triangle, compute the inverse affine transform, use it to look up the color associated to each pixel in both images, and compute their weighted average. The weight for each image corresponds to (1 - dissolve_frac) and dissolve_frac.

En python, vous pouvez utiliser matplotlib.path.Path.contains_points et l'adapter à vos besoins. La fonction scipy.interpolate.RectBivariateSpline effectue l'interpolation en 2D. Nous vous conseillons fortement d'utiliser ces fonctions.

In python, you can use and adapt it to your needs, however. The function performs 2D interpolation. We recommend you use these functions.

Arrière-plan

Finalement, il vous reste à déterminer quoi faire avec les pixels à l'extérieur de l'objet. Pour ce faire, rajoutez des points d'intérêts en bordure de l'image (aux quatre coins, ou de façon plus dense), et traitez-les comme les autres dans votre algorithme. De cette façon, l'image entière est transformée.

Conseils

Sélectionnez une grande quantité de points d'intérêt dans les deux images.
Select a lot of points to create your video.
Lors de la création de la séquence, augmentez warp_frac avant d'augmenter dissolve_frac. Autrement, les caractéristiques pourraient ne pas être correctement alignées lors du fondu. Cela est plus important/utile lorsque vous effectuez du métamorphose entre des visages.
When creating the sequence, increase warp_frac a lot before even increasing dissolve_frac. Otherwise, the features may not be properly aligned when dissolved. This is more important/useful when you perform morphing with faces.
Il est important d'utiliser la transformation inverse pour remplir votre image intermédiaire. Donc, pour chaque triangle dans l'image intermédiaire, vous regardez la position $(x,y)$ des pixels à l'intérieur de ceux-ci (en utilisant matplotlib.path.Path.contains_points) et vous appliquez les transformations inverses pour trouver les valeurs dans les images originales. Cela est illustré dans l'image plus haut.
It is important that you use the inverse transformation to complete your morphed picture. So, for each triangle in the morphed image, you look at the position (x, y) of the pixels inside them (using matplotlib.path.Path.contains_points) and you apply the inverse transformations to find the values in the original images. This is illustrated in the images above.
Faites attention à bien différencier les lignes-colonnes (r,c) des coordonnées (x,y)! Par exemple, dans python: img(r,c) = img(y,x).
Pay attention to the difference between row-column (r,c) and coordinates (x,y)! For example, in python: img(r,c) = img(y,x).

Attention: vous ne pouvez pas utiliser les fonctions disponibles dans skimage.transform, car ces dernières fournissent plusieurs aspect du TP que vous devez implémenter vous-mêmes !

: you cannot use functions available in , since they implement several parts of the TP that you must code yourself!

Sauvegarde vidéo

Pour créer une séquence vidéo, vous pouvez utiliser, par exemple, la librairie ffmpeg. Avec ffmpeg, la commande suivante générera le fichier test.mp4 à partir d'images individuelles nommées file_00001.png, file_00002.png, ...:

ffmpeg -i file_%05d.png -c:v libx264 -vf "fps=25,format=yuv420p" test.mp4

Crédits supplémentaires

Essayez ces idées pour approfondir vos connaissances (et augmenter votre note):

(10%) Essayez de métamorphoser une image filtrée avec un filtre passe-bas et une image filtrée avec un filtre passe-haut dans le but de créer une image métamorphosée hybride. Ceci est similaire à ce que vous avez effectué au travail 2, mais avec une meilleure correspondance spatiale entre les deux images. Quelle est la différence visible entre une image hybride normale et une image hybride métamorphosée?
(10%) Try to morph a low-pass filtered image with a high-pass filtered image to create a morphed hybrid image. This is similar to what you have implement in your second homework, but with now a higher spatial correspondance between both images. What is the visual difference between an normal hybrid image and a morphed hybrid image?
(10%) Essayez de faire votre métamorphose dans un autre système de coordonnées (ex.: polaire). Est-ce que vos résultats diffèrent?
(10%) Try to morph in another coordinate system (ex.: polar). Are the results any different?
(20%) Implémentez un algorithme de métamorphose n'utilisant pas des triangles. Plusieurs options sont possibles. Par exemple, vous pouvez calculer une transformation pour chaque pixel en faisant une estimation du moindre carrée pondérée où les poids sur les points de contrôle sont déterminés par la distance de ces points au pixel en question. Vous pouvez également implémenter la technique utilisée pour générer la vidéo de Michael Jackson « Black and White », qui est décrite dans l'article de Beier et Neely 1992.
(20%) Implement a non-triangle based morphing algorithm. There are a lot of possibilities out there. For example, you could try to compute a weighted least-squares estimate of the transform at each pixel, where the weights on the control points are determined by the distance from the pixel in question. You could also try the technique that was used in Michael Jackson's "Black and White" clip which was published in a 1992 paper by Beier and Neely.
(20%) Générez une séquence métamorphosant une vidéo vers une autre vidéo. Pour que les résultats soient convaincants, les deux vidéos doivent concorder. Par exemple, deux personnes effectuant les mêmes mouvements de façon synchronisée. Afin de réduire la quantité de travail manuel, vous pouvez identifier les points d'intérêts dans quelques images seulement, et interpoler leurs positions pour les autres images de la séquence.
Pour 10% : générez l'animation avec ces 19 images de deux vidéos synchronisées et alignées de Michael Jackson et John Travolta effectuant le moonwalk (merci à Gaël Letartre) (voir exemple ci-bas). Le 20% sera obtenu si vous trouvez vos propres vidéos.
(20%) Generate a sequence morphing a video towards another video. For the results to be convincing, both videos need to correspond to synchronized motions. For example, two persons could be performing the same actions synchronously. In order to reduce manual labor, you can identify interest points in a few images only, and interpolate their positions in the other images.
For 10%: generate the animation with these (see example below). You'll get 20% if you find your own videos.

Livrables

Incluez les informations et résultats suivants dans votre rapport:

(45% pour 4105, 35% pour 7105) Une séquence vidéo transformant le visage de la personne précédente (N-1) dans la liste en votre visage (N).
- Par exemple, si vous êtes la personne 05 dans la liste, générez une animation du visage de la personne 04 vers la vôtre.
- Cette séquence doit durer 4 secondes et être enregistrée à 25 images par secondes. Le nombre total d'images à générer est donc de 100. Le nombre d'images par secondes peut être géré par ffmpeg avec l'option fps=25 (voir ci-haut).
- Pour ce résultat, décrivez brièvement votre algorithme, présentez la vidéo, et également une brève discussion sur votre résultat.
- Truc : pour inclure une vidéo dans un rapport, vous pouvez utiliser le tag HTML video.
Trois (3) animations supplémentaires. Pour chacune d'elles, présentez vos résultats et incluez une brève discussion.
- (40% pour 4105, 30% pour 7105) Un minimum d'une animation de métamorphose effectuée sur des objets, des animaux ou autres. Amusez-vous !
- (10%) Un minimum de deux animations de métamorphose effectuées sur vos propres photos.
- Pour ces animations, à vous de choisir le nombre d'images et la durée pour obtenir une transition progressive.
(N%) Pour vos crédits supplémentaires, décrivez tout d'abord votre approche, présentez vos résultats et commentez. Lorsque c'est applicable, comparez vos résultats avec une autre technique.

section « prérequis »

Idées pour les discussions

L'objectif des discussions dans vos rapports est que vous nous fassiez part de vos réflexions sur vos résultats. Tentez d'être précis(es) dans vos descriptions. Voici quelques idées :

Commentez sur la qualité des résultats. Sont-ils à la hauteur de vos attentes? Y a-t-il des régions de l'image où les problèmes sont plus visibles?
Quand ça marche, commentez tout de même sur ce qui fait que ça marche.
Si vous avez rencontré des problèmes sur certaines images (ou paires d'images), décrivez ces problèmes et expliquez comment vous avez tenté de les résoudre. Tentez d'expliquer pourquoi ça fonctionne mieux sur certaines images plutôt que d'autres.
Si vos algorithmes échouent sur certaines images, décrivez les problèmes et expliquez pourquoi ils surviennent selon vous.
Si vous avez apporté des améliorations, faites une comparaison côte à côte des résultats avant et après votre amélioration.
Décrivez, le cas échéant, les ajustements que vous avez apportés à l'approche proposée.

Ideas for discussions

The main objective is that you share your thoughts on your results with us. No need to write a novel, just try to be precise. Here are some ideas:

Comment on the quality of the results. Do they live up to your expectations? Are there any regions of the image where the problems are more visible?
If you have encountered problems on some images, describe describe these problems and explain how you tried to solve them. Try to explain why it works better on some images than others.
If your algorithms fail on some images, describe the problems and explain why they occur in your opinion.
If you have tried implementing improvements to a method, show a side by side comparison of your results before and after your improvement.
Describe, if applicable, the adjustments you have made to the proposed approach.

Remise

Pour la remise de votre travail, créez un fichier tp3.zip qui contient:

Votre rapport en format HTML dans un dossier tp3b/web. Vos images doivent être dans un dossier tp3/web/images.
Votre séquence vidéo (visage) dans un dossier tp3/video.
Vos autres séquences vidéo dans un dossier tp3/resultats.
Votre code dans un dossier tp3/code.

Finalement, veuillez téléverser votre fichier tp3.zip sur le portail des cours avant la date limite. La politique des retards mentionnée dans le plan de cours sera appliquée.

Attention! La taille limite permise sur le portail des cours est de 250MB.

Remerciements

Merci à Alyosha Efros d'avoir créé le TP original qui a servi d'inspiration pour celui-ci!

Retour à la page web du cours.

TP3 : Métamorphose de visages (English version) Posez une question sur ce TP!

HW3 : Faces morphing (Version française) Ask us a question!

Survol

Overview

Prérequis (5%)

Prerequisites (5% for everyone)

Algorithme de métamorphose (95% pour 4105, 75% pour 7105)

Morphing algorithm (95% for 4105, 75% for 7105)

1. Définir les correspondances

1. Defining correspondences

2. Calculer une triangulation

2. Computing a triangulation

3. Créer la métamorphose

3. Create the morph

3.1 Transformation affine des triangles

3.1 Triangles affine transformation

3.2 Fondu des couleurs

3.2 Dissolving

Arrière-plan

Background

Conseils

Tips

Sauvegarde vidéo

Saving a video

Crédits supplémentaires

Extra credit

Livrables

Idées pour les discussions

Deliverables

Ideas for discussions

Remise

Handing in procedure

Remerciements

Thanks