Entre neurosciences cognitives et intelligence artificielle, cet article explore comment notre perception visuelle n’ jamais neutre : elle est façonnée par la mémoire, l’émotion, la culture et désormais, par les machines. À l’heure où les images générées par IA brouillent les frontières entre souvenir, fiction et preuve, il devient urgent de comprendre ce que signifie vraiment voir. Car nous ne voyons pas le monde tel qu’il est, mais tel que nous avons appris à le regarder.
La perception, comme les nuages, est façonnée davantage par l’observateur que par l’objet. L’un y voit un cheval galopant dans le ciel ; un autre y devine un visage, un dragon , ou rien du tout. Le ciel ne change pas , c’est le regard qui évolue. Et il en va de même pour les images. Nous ne voyons pas le monde tel qu’il est, mais tel que nous avons appris à le voir.
Ce n’est pas une métaphore. C’est de la biologie.
Les recherches récentes en neurosciences cognitives, notamment celles de Sylvie Chokron et Christian Marendaz, confirment que la vision est un processus actif de reconstruction, influencé autant par ce que nous percevons que par ce que nous anticipons. Chokron a montré que notre cerveau sélectionne l’information visuelle en fonction de nos attentes, de nos émotions et de notre histoire sensorielle, allant jusqu’à ignorer une partie du champ visuel si elle ne correspond pas à nos schémas mentaux, comme dans les cas de négligence spatiale. Marendaz, quant à lui, a étudié comment l’apprentissage et l’attention modulent notre perception en orientant la façon dont nous interprétons les stimuli. Le cerveau ne voit donc pas objectivement : il reconstruit. Les hémisphères gauche et droit traitent des informations visuelles différentes , l’un se focalisant sur les détails, l’autre sur les formes globales, et tous deux s’appuient sur notre vécu. Le cortex visuel n’est pas un miroir. C’est un narrateur, qui compose le monde à partir de ce que nous sommes.
La perception comme reconstruction
Nous aimons croire que ce que nous voyons est ce qui est. Mais ce que nous voyons n’est, au mieux, que ce qui subsiste après avoir filtré la réalité à travers ce que nous sommes, d’où nous venons, et ce que nous avons déjà vu. Notre compréhension visuelle du monde est une construction, modelée par la répétition, l’exposition, l’émotion et l’éducation.
Comment nous voyons les photographies
Dans la publicité, cette malléabilité est un atout. L’objectif n’est pas de représenter le réel, mais de le manipuler, d’activer des associations, de cadrer le désir. La photographie de stock obéit à la même logique : elle injecte dans la culture visuelle des motifs prévisibles que le spectateur reconnaît instantanément comme une idée, une sensation, une intention.
Le photojournalisme, en revanche, se fonde sur une prétention de neutralité. Il se veut preuve, non suggestion. Pourtant, lui aussi est soumis à la nature sélective de la vision. Lui aussi est cadré, composé, choisi. Une photographie peut témoigner de ce qui s’est passé, mais le sens qu’elle transmet est toujours reconstruit dans l’esprit de celui qui la regarde. Et ce sens est façonné par ce que l’on a appris à voir.
L’arrivée de l’IA générative
C’est ici que les choses se compliquent.
Les modèles d’IA générative, à l’instar de notre perception, produisent des images à partir de ce qu’ils ont appris. Leur base d’apprentissage est immense : des millions de photographies, d’œuvres d’art, de légendes, de textes. Lorsqu’ils créent une image, ils n’inventent pas tant qu’ils réassemblent. À la manière de la mémoire.
Et c’est là que les frontières commencent à se brouiller.
Si notre perception visuelle est déjà une reconstruction, une synthèse cognitive entre souvenirs et attentes, alors qu’est-ce qui distingue réellement une image produite par un appareil photo humain d’une image générée par une machine ? Surtout lorsque la “vision” de cette machine est façonnée par notre mémoire visuelle collective ?
Certaines images générées vont plus loin : elles reconstituent des scènes décrites par des témoins. Entraînées non à partir de pixels, mais de souvenirs. Elles donnent une forme visuelle à ce que les gens se rappellent, non à ce qui a été enregistré. Ce ne sont pas des photographies. Ce sont des souvenirs synthétiques. Et pourtant, elles paraissent souvent tout aussi réelles.
Nous avons déjà vu cela à l’œuvre. Dans Le jour où j’ai tué mon frère, le psychanalyste Serge Tisseron raconte une expérience troublante : il se souvient d’une photographie de son enfance avec une telle vivacité qu’il peut la décrire et la dessiner. Mais lorsqu’il retrouve enfin la photo réelle, ce n’est pas la même. Les détails dont il était certain n’y figurent pas. L’image dans sa tête avait été remodelée par l’émotion, le temps, l’interprétation.
Il utilise alors une IA générative pour recréer ce qu’il pensait avoir vu. Et cette version, bien qu’artificielle, lui semble plus juste sur le plan émotionnel que l’originale.
L’IA n’a pas halluciné. Elle a collaboré avec la mémoire. Le résultat n’est pas une documentation. C’est une intimité stylisée. Et pourtant, cela reste détaché de ce qui s’est réellement passé.
Une différence qui compte encore
Alors, est-ce que cela a encore de l’importance ?
Oui. Parce que la réalité a des conséquences.
Une photographie basée sur la lumière capture un moment ancré dans le temps et l’espace. Aussi subjectif que soit son cadrage, elle conserve un lien indexical avec le réel. Elle peut être interprétée, mal lue, instrumentalisée, mais elle reste un document de quelque chose qui a eu lieu. Une trace.
Une image générée par IA, même fondée sur la mémoire collective, est détachée. Elle reflète un sentiment, non un fait. Elle contient de l’émotion, pas de preuve. Elle peut sembler plus “vraie” qu’un cliché mal pris, mais elle ne peut le remplacer.
Et cette distinction n’est pas philosophique. Elle est éthique. Politique. Épistémologique.
Le danger, ce n’est pas que les images générées par IA nous trompent. Le danger, c’est que nous cessions de nous soucier du fait que quelque chose ait réellement eu lieu.
Un avenir du regard
Dans un monde où humains et machines reconstruisent le visible à partir de ce qu’ils ont appris, la valeur de la photographie capturée par la lumière ne s’estompe pas, elle se précise. Car elle porte la responsabilité de nous ancrer dans ce qui a eu lieu, même lorsque nos interprétations divergent.
Nous voyons ce que nous avons appris à voir. Les machines aussi, désormais.
Mais un seul d’entre nous y était.
Et cela fait encore toute la différence.
Et pour ne rien louper, abonnez vous à 'DREDI notre lettre du vendredi