IA génératives : Et maintenant ?

Julien Laureau
7 min readFeb 15, 2023

--

Penser l’impact de la révolution générative sur les métiers de la création.

Il est peu probable que vous ayez échappé au retentissement médiatique suscité par les récents progrès de l’intelligence artificielle générative. Pour une fois, il faut bien l’admettre, la hype est à la mesure du phénomène. Après avoir supplanté l’humanité dans à peu près tous les domaines, les machines investissent notre dernier pré carré : la créativité.

Chat GPT crée et débugue des programmes informatiques, compose de la musique et rédige chaque jour des milliers de dissertations. Midjourney ou DALL·E permettent à n’importe qui de se rêver illustrateur, designer, peintre ou photographe. L’IA générative est un abîme qui vient de s’ouvrir et dont nous ignorons encore la profondeur.

Est-ce le moment pour les designers d’envisager sérieusement une reconversion ? L’IA générative est-elle une calamité ou une opportunité ? Est-il souhaitable et encore possible d’inverser la tendance ?

Comme beaucoup de designers, ça fait des semaines que ces questions résonnent en moi. Il est trop tôt pour leur apporter une réponse définitive, mais ça ne doit pas nous empêcher d’y réfléchir. C’est ce que je me propose de faire dans cet article : essayer de penser les implications de cette révolution sur mon métier et plus largement sur les professions dites “créatives”.

Inéluctable

Chat GPT a atteint cent millions d’utilisateurs deux mois après son lancement. Les illustrations créées par Midjourney et DALL·E sont utilisées par la presse quotidiennement. De nouveaux outils génératifs apparaissent chaque jour pour composer de la musique libre de droits, rédiger des emails marketing ou créer des comptes rendus de réunions. Que l’on accueille ces changements à bras ouverts ou avec plus de réserves, il est de toute façon trop tard pour résister. La révolution générative n’est pas à venir, elle a lieu en ce moment et nous n’avons pas vraiment d’autre choix que de nous y adapter.

Ce qui va changer

L’IA générative va profondément bouleverser le processus créatif. Avec Midjourney ou DALL·E, en quelques secondes et gratuitement n’importe qui peut produire des images inédites, extrêmement précises, souvent belles, toujours surprenantes. Cette accélération du processus créatif est une opportunité incroyable pour tous les professionnels de l’image.

Mais cette compression temporelle n’est pas le plus grand apport de l’IA aux concepteurs. Ces dernières années, les outils d’édition graphique, vidéo, photo et audio nous ont donné toujours plus de contrôle sur la production. Dans Figma, Photoshop ou Indesign, les accidents et les surprises sont rares. À l’inverse, les outils génératifs réintroduisent l’inattendu dans le processus créatif. Aucun prompt n’est assez précis ni directif pour que l’imprévu ne parvienne à s’immiscer dans la réponse de la machine. Le génie de l’IA générative n’est pas dans son aptitude à retranscrire ce qu’elle comprend, mais dans sa capacité à inventer ce qu’on ne lui demande pas. Cette faculté de dépasser nos attentes, de briser nos automatismes et nos intuitions peut décupler notre créativité.

Il y a d’ores et déjà des dizaines d’applications concrètes de ces outils pour les concepteurs de tous bords. J’ai intégré Midjourney aux phases exploratoires de mon processus illustratif. J’utilise Chat GPT pour synthétiser mes notes, faire des recherches préparatoires ou reformuler des textes rapidement. Je peine à imaginer la place que prendra l’IA dans ma pratique dans les dix ans qui viennent, mais il est évident qu’elle sera considérable.

Pour que rien ne change

Le moment est venu de tempérer un tout petit peu cette entrée en matière enthousiaste. Les progrès récents de l’IA générative sont tellement bluffants qu’on a tendance à surestimer la façon dont elle va impacter nos métiers. Il est indéniable que l’IA nous bouscule, mais contrairement à une idée largement rebattue, je ne crois pas qu’elle soit en mesure de mettre tous les créateurs au chômage dans un avenir proche.

Ceux qui pensent cela possible considèrent que la valeur ajoutée d’un illustrateur, d’un photographe ou d’un designer réside uniquement dans leur capacité d’exécution. La vélocité des modèles, leur puissance de calcul, l’immensité de leur référentiel culturel les placent effectivement loin devant n’importe quel être humain sur le strict plan de la rapidité d’exécution. Mais si Midjourney et DALL·E peuvent satisfaire un besoin d’image, ils ne sont pas capables de définir ce besoin. Or c’est justement là que réside le talent des créateurs : identifier précisément la problématique à résoudre. Cela requiert des capacités d’empathie, d’analyse et une compréhension du monde dont les machines sont encore loin d’être capables.

À chaque grand moment de bascule, on se focalise sur ce qui évolue et on prête moins attention à ce qui reste inchangé. Avec ou sans Midjourney, 50% à 80% de la mission d’un graphiste, d’un designer d’interface ou d’un illustrateur se situe avant la phase d’exécution et ça n’est pas prêt de changer. La majorité des concepteurs et professionnels de l’image devrait donc résister au tsunami génératif. Les créateurs de visuels à faible valeur ajoutée, les banques d’images libres de droits, les concepteurs de logos à 5 euros et les producteurs de templates UI interchangeables ont probablement plus de soucis à se faire.

La révolution générative sera brutale pour tous ceux qui concentrent leur savoir-faire sur l’exécution et qui ne témoignent pas dans ce domaine d’un talent particulier ou d’une grande originalité. J’ai l’optimisme de croire qu’ils sont minoritaires. Pour les autres, la meilleure façon de restister aux coups de bouttoirs des algorythmes, c’est de développer les compétences qui leur font défaut. Celles particulièrement utiles dans la phase amont du processu créatif : la communication, l’empathie, l’esprit critique, et une autre essentielle au moment d’élaborer des solutions concrêtes : le style.

La question du style

Aucun humain n’est capable de rivaliser avec les systèmes génératifs sur le plan de la rapidité d’exécution. Leur usage devrait donc naturellement s’imposer dans les industries où la vitesse de frappe compte particulièrement : la presse, la publicité, la communication, les réseaux sociaux… En revanche dans d’autres domaines où l’originalité et l’authenticité priment, ils partent avec un léger handicap : leur penchant prononcé pour la convention et le déjà-vu.

Prenons l’exemple des algorithmes de diffusion comme Midjourney ou Stable Diffusion. Ces modèles s’entraînent sur des paires textes-images en provenance d’internet. Ils comprennent ce que représente une image grâce à sa description et sont donc capables de synthétiser ces informations en sens inverse. En d’autres termes, ils échangent des pixels contre du texte. C’est une opération d’ordre probabiliste, par nature plus proche de l’imitation (même si les humains trouvent celà très naturel) que de la création ex nihilo. Outre tous les biais évidents, et déjà documentés, que cela suppose (préjugés, stéréotypes), cela signifie que ces systèmes sont bien plus efficaces à généraliser sur le monde d’hier qu’à inventer celui de demain. Il suffit d’ailleurs de faire un tour sur les forums Discord de Midjourney, pour être envahi par un étrange sentiment de familiarité. Comme si nous connaissions la plupart de ces visuels avant même de les avoir vus, comme si l’IA avait un léger temps de retard sur notre univers esthétique et pictural.

Ces petites madeleines qui sentent fort les années 2010 ont pour autre particularité de beaucoup se ressembler. D’abord parce que les gens tendent à utiliser des requêtes similaires, et ensuite parce que certaines esthétiques dominent les bases de données qui alimentent les modèles : l’heroic fantasy, le manga, le style Marvel, Pixar ou Ghibli. Les poses, les cadrages, l’éclairage, les gammes chromatiques confinent à une forme de standardisation très visible.

Les meilleurs promptistes parviennent à s’extraire un peu de ces ornières stylistiques, en pratiquant l’oxymore, mais au prix d’efforts importants et avec des résultats plus ou moins heureux. Au fond l’IA générative n’est jamais aussi efficace que dans l’hommage, l’évocation, l’imitation et le pastiche. Par ailleurs, si elle excelle particulièrement dans les univers tapageurs et flamboyants, elle peine à convaincre dans des registres plus subtils ou minimalistes. Étienne Mineur a eu l’occasion de raconter l’incapacité de Midjourney à s’approprier la griffe épurée du designer Dieter Rams et à l’inverse sa facilité à singer le style plus clinquant de Philippe Stark.

L’avenir appartient à ceux qui creuseront leur sillon dans les lacunes des machines. Mieux vaut éviter de les concurrencer sur leur terrain de prédilection. Les modèles identifieront plus tôt et synthétiseront mieux que nous les dernières tendances, les poncifs et les lieux communs. C’est dans leur nature. À l’inverse, il leur sera plus difficile de reproduire un style unique et en constante évolution. Le salut des professionnels de l’image réside donc dans leur capacité à développer une griffe originale et versatile. J’ai hâte de découvrir les talents extraordinaires (au sens littéral), dont accouchera cette grande émulation générative.

Et maintenant ?

La révolution générative est une formidable opportunité pour les métiers de la conception. D’abord parce qu’on a beaucoup à gagner à utiliser ces outils comme des partenaires créatifs. Ensuite parce que leur concurrence nous oblige à élever notre niveau de jeu dans les domaines où l’on fait encore la différence.

Mais si les modèles génératifs sont bluffants par bien des aspects, il faut rester lucide sur leurs limites intrinsèques. Cet effort de discernement incombe aussi et surtout aux commanditaires et aux employeurs qui doivent intégrer que le processus créatif ne se limite pas au résultat final, et que la qualité de ce dernier découle essentiellement du travail effectué en amont. Sommes-nous prêts à sacrifier un peu de cette qualité sur l’autel de la performance et des coûts ?

Les systèmes informatiques n’ont ni conscience, ni intention. Ils font ce qu’on leur commande de faire. Je ne sais pas si un énième avatar de Midjourney finira un jour par effectuer mon travail, mais je sais que c’est nous et non l’IA qui écrirons collectivement la réponse à cette question.

--

--