FRONTS

Intelligence artificielle et photographie
Jouer avec le feu ?

L’expression « Jouer avec le feu » telle que vue par MidJourney © Gilles Courtinat

Gilles Courtinat poursuit son enquête. Cette semaine, il s’est intéressé aux points de vue controversés de Michael Christopher, Boris Eldagsen, Jos Avery et Eric Tabuchi… C’est riche d’enseignement ; et, pour ceux qui auront la chance d’être à Perpignan pour le festival Visa pour l’image, il animera les 7/8 septembre 2023 une conférence qui promet d’intéressant débats !

C’est arrivé comme un coup de tonnerre dans le monde de la photographie, un coup à l’estomac d’une profession déjà bien mal en point. Depuis la fin de l’année dernière, la génération d’image grâce à l’intelligence artificielle se développe à un rythme très soutenu et soulève bien des interrogations et des craintes. Pillage du droit d’auteur, remplacement par la machine de professionnels confirmés, risque élevé de désinformation, les sujets d’inquiétude ne manquent pas. Si une grande majorité des photographes oscillent entre effroi et attentisme, certains se sont emparés de la question soit pour en révéler les aspects problématiques, soit pour en explorer le potentiel créatif.

Michael Christopher Brown, photographe du National Geographic depuis 2004, ancien associé de Magnum Photos et connu pour son travail sur la guerre civile en Libye, a réalisé la série « 90 miles » qu’il présente comme…

« une expérience d’illustration de reportage par l’IA post-photographique explorant les événements historiques et les réalités de la vie cubaine qui ont motivé les Cubains à traverser les 90 miles d’océan séparant La Havane de la Floride. » (…) La qualité photoréaliste désormais possible grâce à l’IA, et la facilité avec laquelle on peut créer cette qualité, élargissent les possibilités de narration visuelle. Les médias utilisent depuis longtemps des photos d’illustration pour raconter les histoires d’une manière originale. Même si une illustration ne reflète pas la réalité, elle peut donner l’impression d’être vraie. Avec l’IA, cela peut aller plus loin, car une image créée à partir de centaines de millions de photographies peut sembler non seulement vraie, mais réelle. 90 Miles pourrait refléter une nouvelle façon de traduire des récits en images pertinents permettant de relier les gens aux histoires importantes de notre époque. N’importe qui peut désormais créer des illustrations de reportage photoréalistes sans objectif sur n’importe quel sujet, n’importe où, n’importe quand, en participant à l’histoire collective de la photographie pour illustrer le monde et créer une vision de ce qui a été, est ou peut être. Il s’agit bien sûr d’une démarche délicate, car nous devons préserver l’intégrité de la photographie et créer des barrières autour de certains résultats de l’IA. Mais nous devons aussi l’utiliser à notre avantage. »

Cette position en a fait bondir plus d’un et l’auteur a été sous le feu de sévères critiques lui reprochant de contrevenir aux règles éthiques du photojournalisme en simulant le réel, d’autant que ces images sont vendues sous forme de NFT, ce qui n’a fait qu’accentuer la colère de ses détracteurs. Brown a répondu en se revendiquant autant artiste que photographe et déclarant :

« Je partage bon nombre des pensées, des préoccupations et des opinions communes sur l’IA, mais il n’y a pas moyen de contourner le fait que la technologie existe? Alors, comment l’utiliser pour relater des faits, en particulier des faits impossibles à photographier, afin de générer de l’empathie et une prise de conscience des problèmes graves ?»

Un autre qui a bien mis le feu aux poudres c’est l’allemand Boris Eldagsen quand il a présenté, en l’indiquant explicitement, une image réalisée par une IA, au grand concours photographique de la société Sony pour laquelle il a obtenu un 1er prix dans la catégorie portrait. Voici ce que le photographe déclarait lors d’une intervention au récent congrès du CEPIC :

« Voici comment je suis devenu un activiste. Je voulais faire un test. Je voulais savoir si les concours photo étaient prêts pour l’arrivée soudaine d’images générées par l’IA. Et dans un deuxième temps, je voulais savoir si les concours photo avaient une position claire sur la relation entre l’IA et la photographie. En ce qui concerne les Sony World Photography Awards, la réponse est non. J’ai donc refusé le prix, ce qui a permis de faire prendre conscience du problème. Et cela a accéléré le débat plus rapidement et plus efficacement que je n’aurais pu l’espérer. Mon image était partout et les gens m’envoyaient des parutions dans les magazines. C’est devenu mondial. Ce que j’aimerais faire avec cette opportunité, cette chance que j’ai maintenant, c’est nettoyer la terminologie désordonnée et dire que les images générées par l’IA ne sont pas de la photographie. Le meilleur terme que j’ai trouvé jusqu’à présent est « promptographie », parce qu’il est suffisamment large pour englober le fait qu’une image générée peut ressembler à une photographie, mais aussi à un dessin, à une peinture. (…) Je pense donc que nous devons trouver un nouveau terme qui définisse ce processus de travail. Une fois que nous aurons ces deux termes, nous pourrons parler de la relation entre la photographie et la promptographie parce qu’elles se ressembleront de plus en plus. Et je pense que d’ici la fin de l’année, même moi, je ne pourrai pas les distinguer. Avant de devenir activiste, j’ai étudié l’art et la philosophie, je suis un artiste photographe depuis 23 ans. Je travaille également en tant que expert indépendant dans le domaine du marketing numérique. J’aimerais profiter de mon intérêt pour la photographie, mais j’adore travailler avec l’IA. L’IA me libère des contraintes matérielles et me permet de créer uniquement à partir de mon imagination. Et la connaissance devient mon matériau. Et cela suppose de l’expérience. J’ai accumulé de l’expérience en 30 ans de photographie, en 30 ans d’art. Par exemple, si vous regardez les prompts, ils peuvent être très simples, par exemple, « Trump se fait arrêter ». Mais il peut y avoir beaucoup d’éléments qui font partie d’un prompt, directement liés à mon expérience, à mes connaissances. Et la façon dont je travaille avec les générateurs d’IA sera différente de celle d’un enfant de 15 ans. Ma compréhension des générateurs d’images d’IA est donc que l’expérience fait la différence. Les plus âgés ont un avantage parce qu’ils ont plus d’expérience, et l’IA est un amplificateur de connaissances. Ou comme l’appelle un de mes collègues en Allemagne, ce n’est pas de l’intelligence artificielle, c’est de l’intelligence augmentée. Voici un aperçu de ce qui est possible aujourd’hui. Vous pouvez créer des images avec le langage, vous pouvez créer des images en utilisant d’autres images, et il y a une partie de ça qui se mélange.

La question principale est de savoir si l’IA remplace les artistes. Je dirais que non. Mais si nous regardons ce qui se passait avant l’IA, il y avait, disons, des personnes sans talent qui n’avaient pas d’éducation, d’expérience dans la création d’images. La qualité des images qu’ils pouvaient produire se situait quelque part en bas de l’échelle. Et puis il y avait au niveau au dessus les professionnels. L’IA est donc en train de faire grimper le seuil minimal à un niveau très proche de celui des professionnels.

Les professionnels, bien sûr, ont peur que l’écart soit devenu beaucoup plus petit. Mais si ils utilisent l’IA, ils peuvent également atteindre un niveau plus élevé.

Ce que j’entends aussi souvent, c’est que l’IA n’est pas créative. Je pense que c’est parce que le simple fait d’appuyer sur un bouton est quelque chose que l’on peut aussi faire en photographie. C’est pourquoi nous examinons de plus près ce que pourrait être la relation. C’est ainsi que je conçois la relation entre l’homme et la machine. Si vous avez l’habitude de travailler avec des générateurs d’IA, que vous connaissez les plateformes, que vous passez de l’une à l’autre, que le flux de travail comporte de nombreuses étapes et que vous prenez des décisions sur de nombreuses questions créatives, alors c’est vous qui menez la danse et la machine est votre copilote. (…) Si je suis débutant, c’est la machine qui va décider de ces questions créatives et qui remplira tous les éléments que je maitrise pas. Mais dans ces solutions, il s’agit d’une co-création, d’une maîtrise à plusieurs niveaux. Pour moi, la connaissance est un pouvoir. Mais la grande question est de savoir si l’on peut me remplacer complètement. Est-ce qu’il peut y avoir une machine qui est autonome et qui va prendre toutes les décisions créatives par elle-même sans avoir besoin de moi ? Je n’en sais rien. C’est quelque chose que l’avenir va décider. »

Celui qui s’est moins embarrassé de précaution dans la mise en ligne de ce genre d’images, c’est l’américain Jos Avery qui, de ce fait, a vu le nombre initialement raisonnable d’abonnés à son compte Instagram grimper en flèche atteignant aujourd’hui les 54 000 followers. Il y publie des portraits noir et blanc, accompagné parfois de textes comme …

« Natasha se tient au cœur de la capitale nationale, le Washington Monument s’élevant au-dessus d’elle. Elle se souvient du jour où elle est arrivée à Washington en tant que réfugiée d’Ukraine, il y a huit mois. Elle se souvient de ce jour où elle faisait la queue avec sa valise à l’aéroport de Dulles. Elle n’avait rien d’autre que les vêtements qu’elle portait sur le dos, quelques objets précieux rangés dans son sac. Le voyage avait été terrifiant et épuisant, mais elle était déterminée à se construire une vie meilleure ici. Les habitants de Washington l’ont accueillie à bras ouverts et leur hospitalité a été un véritable baume pour son âme. Elle a travaillé dur, acceptant tous les emplois qu’elle pouvait trouver et économisant chaque centime qu’elle gagnait. Finalement, Natasha a pu emménager dans son propre appartement, trouvant du réconfort dans les images et les sons familiers de la ville. » Ce récit et le rendu très réaliste de ses images, malgré la discrète mention #ai perdu dans des dizaines de hashtags, a entrainé de nombreux commentaires élogieux d’admirateurs persuadés d’être devant de fraies photos. Devant l’ampleur du phénomène, l’auteur s’est senti obligé un moment de dévoiler le pot au roses, déclenchant quelques grincements de dents chez son auditoire et malgré ses justifications : « Les gens veulent souvent une réponse simple, oui ou non, mais lorsqu’il s’agit de mon travail, la vérité est plus complexe. Bien que nombre de mes images soient basées sur des images générées par l’IA, ce n’est pas là que commence le processus créatif. Il commence par mon désir de créer quelque chose que j’aimerai. Ensuite, j’ai une idée et j’utilise des requêtes pour essayer de traduire cette idée. Au début, l’IA a du mal à comprendre, alors je continue à peaufiner et à générer. Finalement, je vois poindre le potentiel de réalisation de l’idée. Les images produites par l’IA sont imparfaites, je dois donc rechercher le meilleur potentiel. Une fois que j’ai obtenu des centaines d’images, je les choisis, en les agrandissant et en les examinant soigneusement pour vérifier qu’elles ne présentent pas de défauts et qu’elles sont de bonne qualité esthétique. Je n’en sélectionne qu’une infime partie. (…) Je retouche certaines parties à l’aide de Photoshop et de Lightroom. Le produit final est le résultat de plusieurs heures de travail. Est-ce l’IA ? L’IA joue un rôle dans le processus, mais la vérité est plus complexe. »

Eric Tabuchi est l’initiateur et auteur, en collaboration avec Nelly Monnier, du formidable projet encyclopédique L’Atlas des régions naturelles, portrait photographique du bâti et des paysages de la France découpée en territoires de petites tailles aux caractéristiques naturelles et culturelles marquées. Tout en poursuivant ce travail de titan, l’artiste, en bon esprit curieux qu’il est, s’est intéressé à la génération d’image qui lui apparaît comme un mode de travail complémentaire de sa pratique habituelle, rapprochant cette production d’un précédent projet L’Atlas of form. Cela ne l’empêche pas pour autant de porter un regard critique sur l’outil :

« Contrairement à ce qu’on entend dire partout, travailler avec Midjourney demande pas mal d’effort et de persévérance. Sauf à se contenter de ce qu’il propose, il faudra batailler avec pour obtenir des résultats probants, c’est à dire qui correspondent à ceux que vous désirez. Du reste, ceux-ci ne seront jamais – c’est un des grands intérêts de l’IA que de suggérer des pistes inattendues – conformes à l’idée que vous aviez en tête mais, a force de d’obstination, il est possible de parvenir à des choses qui, plutôt que paraitre étonnantes, le sont véritablement.  Cela peut se révéler difficile car MidJourney a été programmé pour satisfaire le plus grand nombre. Pour cela il surdose systématiquement tous les ingrédients constitutifs des images qu’il produit. Probablement inspiré du modèle fast-food, l’excès est sa règle. Tout y est non pas exagéré mais carrément hypertrophié car pensé par des gamins biberonnés aux jeux vidéo et aux films de supers héros. Chaque image consiste donc en une accumulation d’effets (brumes, halos, contre-jours etc…) en une surenchère de détails, de motifs et d’ornements dont la fonction est de dissimuler les lacunes du programme en matière de piqué, de contraste ou de nuances chromatique. Midjourney s’applique à faire le spectacle mais avec des fichiers très légers d’où une esthétique qui s’apparente souvent à un ballon de baudruche, bien tendu, brillant et coloré mais vide et prêt à éclater. On m’objectera que c’est justement sa qualité première de produire cette imagerie pop et baroque à la fois où tout est exagération et fantaisie, mais c’est un autre débat.  Quoiqu’il en soit, pour obtenir des saveurs plus délicates, des images qui ne serons pas une surenchère de crème pâtissière ou de sel ou de ketchup, il va falloir à force de persuasion le contraindre à plus de frugalité. Pour cela, ce sont parfois des dizaines de prompts qui seront nécessaire dont il faudra mémoriser les variables pour les recombiner dans l’espoir qu’enfin, après le temps de calcul nécessaire, apparaisse l’image non pas attendue mais, dans cet étrange mélange d’aléatoire et de dirigé, souhaitée.  Bien entendu, il ne s’agit pas en disant cela de mettre en avant le savoir-faire de l’opérateur par rapport à celui de la machine mais de dire qu’aussi puissant que soit MidJourney, il faut, comme avec tout outil, passer du temps pour en comprendre les limites et éventuellement les dépasser. »

Face au risque de déferlement d’images fabriquées qui remettent en question notre perception de la réalité, certains s’inquiètent à juste titre et réfléchissent aux pare-feux qui doivent être dressés, les médias n’étant certainement pas les derniers à avoir intérêt et responsabilité dans l’affaire. C’est l’opinion du Genevois Niels Ackermann, cofondateur de l’agence Lundi13, auteur de plusieurs photoreportages primés qui déclarait récemment dans Libération: «Avec les IA, on va partir du postulat que toute photo est fausse et là, on entre dans l’apocalypse. Est-ce qu’un jour, on ne croira plus à mon reportage sur les statues de Lénine à terre en Ukraine ? Le point positif, c’est que les IA lancent le débat sur le rapport philosophique au vrai. Ma porte de sortie est que je raconte des histoires vraies. Au milieu de la jungle du faux, les médias ont une carte à jouer. »

Quelle que soit la position de chacun, que l’on soit pour ou contre, il est grand temps de pousser plus avant la réflexion, d’autant que nos smartphones et boitiers sont déjà bourrés d’IA, sans parler des logiciels de la chaine graphique utilisés depuis longtemps par des millions de photographes. Alors, qu’elle est la voie qui permettrait d’exploiter au mieux le potentiel créatif de la technologie sans en être l’esclave et comment se prémunir efficacement des dérives indésirables ?

Affaire à suivre…

Gilles Courtinat

J’animerai le 7/8 septembre 2023, une table ronde sur ce sujet au festival Visa pour l’Image de Perpignan, avec des intervenants professionnels venant de la photographie, de la technologie et des médias.

Tous les articles de Gilles Courtinat sur IA et photographie

Pour aller plus loin

Dernière révision le 12 mars 2024 à 12;15 par

Gilles Courtinat


Si cet article vous a intéressés...Faites un don !