Visa pour l’image au risque de l’IA

Pour ses 35 ans, Visa pour l’image, qui s’est tenu à Perpignan du 2 au 17 septembre, s’est arrêté sur un sujet délicat pour le monde le photographie : l’IA. A partir d’exemples précis, les professionnels ont ausculté le phénomène et réfléchi aux diverses positions possibles face à cette technologie. Francesca Caruana était dans le public. Son texte rend compte de l’événement. Une analyse passionnante.

Tout le monde a entendu parler du festival international de photojournalisme Visa pour l’image. Il a fêté sa longévité cette année, soit 35 ans d’existence ! Loin de lasser le public, l’événement, en plus d’exposer les facettes du monde au travers une actualité de plus en plus cruelle, a étendu ses expositions aux nouvelles questions que pose le changement de climat. A cela s’est ajouté des reportages animaliers qui alertent sur la disparition des milieux naturels ou leur réduction en impliquant le déplacement d’espèces. Faut-il encore le préciser, le photojournalisme reste engagé dans le faire-savoir des grandes problématiques de notre monde.
Bien sûr certains thèmes sont revenus sans surprise, témoignant de nos propres troubles sociaux, de nos manquements et agressivités, des questions plus ou moins mal traitées par les régimes politiques et les morales sociales, les guerres récentes, la pollution de l’eau, l’homosexualité, les enfermements psychiatriques, etc. Dans cette nouvelle mouture, on constate, est-ce du courage, de l’adaptation au milieu de l’image ou une marque de réalisme, que Visa a développé une particularité concernant l’IA.
Ce festival ouvre chaque année par une semaine de soirées de projections, riches en actualité et rappels d’événements de l’année, suivie par une semaine professionnelle puis par celle des scolaires. Il faut insister sur la capacité de ce festival, qui doit beaucoup à la forte personnalité de son directeur Jean-François Leroy, à ne pas hésiter à s’interroger sur les profonds bouleversements que provoquent les avancées technologiques. Cela a toujours été une préoccupation du festival mais cette année, les conférences ont porté sur le cas très complexe de l’intelligence artificielle.
On s’intéressera donc ici non pas aux photoreportages, mais plus spécifiquement à ces problématiques embrassées par les professionnels eux-mêmes, qui ont tenté de cerner les risques, les contraintes et les enjeux de ce nouveau procédé de fabrication de l’image qu’est l’IA. Ainsi, une table ronde conduite par Gilles Courtinat (journaliste à L’œil de l’info) réunissait Laura Morton (photojournaliste, lauréate de la Bourse Canon de la Femme Photojournaliste 2018 et du Prix Pierre & Alexandra Boulat 2022), Niels Ackerman (photojournaliste), Benoît Tabaka (secrétaire général de Google France), Alexandre Lavallée (cofondateur de la start-up Glossia spécialisée dans l’événementiel/média, Chief Prompt Engineer à Passeport IA, organisme de formation spécialisé dans l’IA générative), Grégoire Lemarchand (rédacteur en chef investigation numérique, adjoint à la rédaction en chef centrale de l’AFP) et Thierry Meneau (chef du service photo aux Échos). Les interrogations n’étaient pas sans risque, puisque soulevant la question annoncée par certains comme la fin du photojournalisme.
En commençant par demander ce qu’est l’IA, les débatteurs nous invitent à faire une différence appréciable entre IA et IA générative. Après être restés en touche par tant de savoir technologique, il nous est expliqué que l’IA, que nous connaissons ou sollicitons pour répondre aux urgences qui nous assaillent, est analytique et qu’elle se différencie de l’IA générative en ce sens que cette dernière dépend d’algorithmes constituant un véritable entraînement de la machine à s’adapter aux données. On peut supposer que les images générées s’accordent parfaitement, ou de plus en plus, à l’information soumise qui elle-même est modifiée et devient une néo-donnée dans la machine. C’est le cas du logiciel d’images Midjourney. Explication donnée par Alexandre Lavallée, suivi d’un document qualifié de Fiction documentée.
Réalisé par M. C. Brown, ce travail parle du passage des Cubains vers l’Amérique, période qui n’avait pas été documentée et que le photographe a « reconstituée », non pas avec des archives visuelles, filmiques ou autres mais avec les récits rapportés par les migrants eux-mêmes. Le document produit par Midjourney est perçu comme une photo sortie d’un portfolio sans que le moindre doute n’émerge. Cela fait dire aux professionnels présents que les photos ne sont plus des preuves et dire à Brown qu’on ne peut opposer l’IA et le photojournalisme (1).

Michael Christopher Brown, série 90 Miles, 2022-2023, image générée par IA.

Si tant est que la photo constitue une preuve, on ne doit pas oublier qu’elle est avant tout une représentation. Bien que la photographie constitue en elle-même une version contestable de la réalité, on est confronté à ce qu’un des photojournalistes, Grégoire Lemarchand a nommé « l’économie fantastique du vrai ». Deux points sont à souligner : est-ce une manière de se passer du vrai ? de l’économiser ? ou bien est-ce une façon de désigner un système, celui de la vérité dont il faudrait déterminer l’impossible enjeu des tenants et aboutissants ?
Puis notre attention est attirée sur le cas de l’image d’Arthur Rimbaud réalisé par Vincent Dugré et Midjourney (2). Ce reportage a fait grand bruit sur le net particulièrement soutenu par une crédibilité que l’auteur a décidé toutefois de dénoncer en fin de course, à destination des spectateurs attentifs qui pouvaient voir une mention relative à la réalisation en IA. A noter, et ce n’est pas négligeable, la difficulté constatée dans le rendu des images produites par IA à représenter les mains avec précision, les personnages ont parfois un doigt de trop ou bien un raidissement inhabituel des gestes. Les grands maîtres comme Michel-Ange, Rubens et autres peintre talentueux faisaient exécuter les extrémités des personnages par des « petites mains », pour « finir » la peinture et se mettaient à distance de la complétude de leur sujet réalisé en fin de compte en pièces détachées. On peut donc ici relativiser la légère incompétence de l’IA !
De ce type d’incidents ou d’indices, l’interprétation des images tire deux versions dont l’une est dite deepfake (le faux profond) et le lowingfake (le faux moins grave) (3). A savoir de fausses vérités difficiles à décrypter et d’autres comme les mains plus facilement identifiables. Le débat est nourri car il n’y a pour l’instant aucune possibilité humaine de contrôle sur ce type d’écart hormis l’algorithme lui-même capable à certaines conditions de stopper la fake génération. A cet égard ce brillant cénacle a cité le cas de complotistes américains sur le fait que des hommes soient réellement allés sur la lune ou non, déclarés par eux comme une mise en scène produite par Hollywood. S’il y avait ce « grand pas de fait pour l’humanité », on peut a contrario se résigner avec une certaine désolation à ce que la réalité ne touche pas l’ensemble de la communauté des hommes ! Cela laisse supposer que la représentation est la proie de croyances et que ce à quoi nous avons affaire à l’heure actuelle relève d’une reconstitution permanente de la réalité. Lorsque la réalité frappe, il semble pourtant qu’elle incarne le moment privilégié de son existence, mais pour une grande majorité des humains, il se peut que la réalité soit fréquemment confondue avec le réel. Rappelons-nous que le rêve est réel et que tous ceux qui nous poursuivent et attaquent dans les rêves s’évaporent avec le réveil qui lui est la réalité active de notre vie. Mais…
Un politique et auteur tel que Ron Desantis et son programme DeSantis War room établit un réel mélange des genres dans sa campagne anti Trump jusqu’à créer un doute, là encore sur la véracité des images, tout comme une problématique soulevée par les images de la guerre en Ukraine. La propagande ukrainienne a créé un spot où l’IA dévoile un certain niveau de cruauté alors que la réalité est pire, elle invite à dépasser la capacité de conviction que peuvent avoir les Ukrainiens. Si le moyen est risqué, il fixe les bases d’une communication jusque-là hors normes.
De ce point de vue, la logique de l’IA générative entraînée par les événements qu’elle digère doit être abondamment différenciée de l’IA analytique. Ce que fait Google avec assiduité et néanmoins prudence, en choisissant d’être une plate-forme d’observation des différentes technologies, c’est-à-dire en adoptant une approche progressive qui modère la dangereuse consommation déferlante de l’IA.

Vincent Dugré, Arthur Rimbaud, image générée par Midjourney .

Faudrait-il donc se prémunir contre l’IA ? Deux piliers sont mis en évidence : comment déceler un contenu d’IA ? et une fois chose faite comment en attester ? Une voie est ébauchée par ce que les spécialistes nomment un marker making sur le spot lui-même tel que « ce contenu inclut des infos générées par IA », soit en ayant une obligation de labellisation via un logo ou un post-it sur les images. C’est ce qui aurait pu ou dû se produire à propos d’un reportage réalisé par le JDD sur Michel Houellebecq dont les photos ont été générées par Midjourney, montrant l’écrivain courant dans un champ de fleurs ou dans des situations totalement insolites pour qui connaît les habitudes du personnage, tout cela sans le consentement de l’écrivain ! Contre ces pratiques un peu trop libres de droit, Google propose la solution du logiciel « Imagine » sachant que de l’avis général, seuls les iconographes sont à même d’arbitrer un tel problème.
L’image devient manipulatrice, mais la question est celle qui interroge la « passion de vérité » à laquelle en toute modestie, nous pourrions opposer pour sortir de ce manichéisme la vérité des possibles. Car en réalité que peut-il arriver de pire, de préjudiciable, de définitif à une image que de dire autre chose que sa vérité, si relative ? Faut-il être accroc à outrance à la « pureté » fantasmatique d’une représentation investie de vérité par des censeurs autorisés ? Cela conduit à faire un étonnant parallèle avec la tauromachie. En effet, quelle importance pour le taureau d’avoir été bien toréé, selon l’élégance des règles plutôt qu’avec l’approximation d’un novillero ? Il finira de toutes façons, noblement ou pas, au croc. Soyons donc attentifs à la question de la vérité en soi, qui n’a que peu d’intérêt mais à la compétence avec laquelle nous faisons apparaître une situation. Faux ou vrai, cet aspect de l’image ne peut intéresser que le légal voire la police ! Nous ne devons pas oublier que nous sommes dans l’univers de la représentation et à ce même titre irions-nous vérifier que Cézanne a bien peint une pomme Golden alors qu’il s’agissait d’une Pink lady ? Evidemment que non mais cela révèle la confiance démesurée et inopportune dans un document photographique. Ce type d’espièglerie mais aussi de mise au pied du mur incarnées par l’IA devient fréquent et si le monde s’en émeut c’est que l’IA peut donner lieu à d’infinies constructions de propagande toxique, se multiplier et toucher un public prompt à se laisser embarquer par une quelconque nouveauté, un scoop de bazar ou encore un événement superlatif, inédit, au summum de la curiosité des détenteurs de portables.
La question subséquente que cette rencontre a soulevée par la bouche de Niels Ackerman est celle du « marché du vrai ». Vaste problématique d’ordre psychologique, éthique et sociale. En cela nous avons fondé depuis des décennies, l’idée que le mensonge partait du langage, nous sommes confrontés actuellement au mensonge de l’image et si l’œil ment alors… Alors cela ne signifie-t-il pas que nous avons oublié les anamorphoses du XVII^e siècle, les trompe-l’œil du XVIII^e siècle ? Les montages photographiques ? Ces images avançant masquées pour ne révéler leur secret que d’un certain point de vue, laissant apparaître a priori un document anodin ? L’IA est impressionnante d’être plus vraie que nature, elle est une sorte d’hyperréalisme au sein même de l’outil technologique comme l’hyperréalisme l’a été au sein de la peinture du XX^e siècle. L’exemple patent en a été donné à propos des images de campagne autour de Donald Trump, générées par ses opposants à l’aide de l’IA, le montrant avec tous les tyrans et despotes possibles, images que les photojournalistes aimeraient voir qualifiées à juste titre de nouveaux spams. Mais la démarche est peut-être un peu faible car le spam permet des repentirs.
Devant cette somme de manipulations, on peut se demander pourquoi tant de défiance, tant de doutes pour en arriver à un contrôle humain ? Le commentaire du photojournaliste reste essentiel, ainsi que le hors cadre. Le hors cadre viendrait arbitrer la vérité possible d’une image, ou garantir qu’il s’agit d’une actualité et non d’un imaginaire. Le reportage réalisé par IA à partir des récits des migrants eux-mêmes montre ce qui n’a pas été documenté au moment des faits. Cela démontre une aporie selon laquelle l’intelligence artificielle ne peut montrer une intention d’image, c’est une intention de réalité et celle-ci appartient à un auteur humain. Le hors cadre parfois nécessaire est du même ordre plastique que celui pratiqué par les dessinateurs de presse. En cela on sort forcément de la croyance en l’image. Il n’y a donc pas que méfiance et prudence à avoir devant l’IA, on peut concevoir que l’IA serait performante en termes de restauration d’images ou être utilisée à des fins d’indexation ou investigation d’open source pour retrouver des datas.
En cette fin de rencontre, la conclusion qu’en ont tiré les participants est que le photojournalisme est fondé sur une éthique, sur une méthode et que l’IA ne peut être là qu’à des fins d’infos génératives complémentaires. Il en sort qu’une classification d’images vers le texte qui existait dans les années 2015 est « remplacée » aujourd’hui par ce que le photojournalisme rend visible, il met en exergue ce qui est invisible et de ce point de vue, il serait utile de créer une Sacem de la photographie. Les acteurs du numérique ont leur responsabilité, la traçabilité, la technologie ne peuvent pas tout remplacer. Le spam est semble-t-il la meilleure analogie, la technologie sera capable de traiter le spam image mais l’humain le sera encore plus.
S’il restait à faire un commentaire, il serait que l’IA s’avère un outil performant tirant davantage du côté de l’art, que les utilisateurs, qu’ils soient spectateurs ou acteurs pourraient s’efforcer d’exorciser l’obsédante question de la vérité sans cesse convoquée en identifiant l’objet donné à voir. Cette précaution permettrait dès maintenant au photojournalisme d’exercer sa spécificité qui est toute autre qu’une fabrique d’images. L’argument discriminant à ne pas négliger étant que l’IA ne peut être le témoin direct d’un événement.
La fin de cette rencontre proposait un tour de table au cours duquel l’IA montrait que les réactions professionnelles oscillaient entre un travail augmenté de l’intention d’un photojournaliste comme peut l’être celui d’un « fixeur », brillamment expliqué par l’intervenant suisse Niels Ackermann, ou bien un gain de temps comme l’a affirmé Laura Morton, ou encore être considéré comme un outil positif par Alexandre Lavallée. Face à ce nouveau chantier de réflexion de Visa pour l’image tous concluent avec sagesse et non sans humour, que nous nous trouvions peut-être perplexes devant la machine comme nos prédécesseurs au XIX^e siècle !

(1) www.polkamagazine.com
(2) twitter.com
(3) Que les photojournalistes pardonnent une éventuelle erreur de ma part car le terme n’a pas pu être vérifié mais seulement saisi lors de la conférence.

Site de Visa pour l’image.

Image d’ouverture> Capture d’écran de la captation vidéo de la table ronde animée par Gilles Courtinat. ©Visa pour l’image