Pourquoi personne ne lit vraiment votre interface (et comment y remédier)
Il y a quelques semaines, nous discutions d’un nouveau parcours avec un product manager et une designer de mon équipe. Ils venaient d’effectuer des tests utilisateurs et avaient constaté que la plupart des gens avaient rencontré des difficultés sur un écran, faute d’avoir lu les consignes qui y figuraient pourtant en toutes lettres. Le product manager s’est alors tourné vers moi et m’a demandé : “Mais pourquoi les gens ne lisent pas ?”. Les questions les plus simples échappent souvent à notre curiosité et j’ai réalisé que je n’avais jamais véritablement creusé ce sujet.
Bien sûr, j’avais comme beaucoup de designers, une connaissance empirique de cette réalité. Je savais que les gens ne lisent pour ainsi dire jamais le contenu d’un écran de façon exhaustive. Néanmoins, je ne connaissais pas bien les raisons de ce comportement. Je me suis donc renseigné et pensant que cela pouvait intéresser d’autres personnes, je partage ici ce que j’ai pu comprendre et quelques clés pour essayer de palier à ce problème.
Attention et effort
L’écriture serait apparue au cours du quatrième millénaire avant J-C. À l’échelle de l’histoire humaine, qui s’étend sur plusieurs millions d’années, c’est une invention extrêmement récente. L’alphabétisation massive est quant à elle un phénomène moderne, puisqu’en 1950, 44% de la population mondiale était encore illettrée.
De ce fait, si le cerveau a évolué sur plusieurs centaines de milliers d’années pour s’ajuster au langage parlé, il n’a tout simplement pas eu le temps de s’adapter à la lecture sur le plan génétique. Lire nécessite donc de recycler une architecture cérébrale existante en mettant en liaison la vision et certaines zones du langage parlé. Sur le plan cognitif, c’est donc une activité complexe qui engage de multiples zones du cerveau. Disons-le clairement : déchiffrer et comprendre un texte constitue un effort non négligeable !
Cet effort est variable selon les individus, leur pratique de la lecture, et la nature des textes à déchiffrer, mais il est loin d’être anodin, y compris pour les grands lecteurs. Un des moyens de s’en rendre compte est de penser au degré d’attention requis par la lecture. Comme l’a expliqué Daniel Kahneman, l’attention est un indice direct de l’effort cognitif nécessaire à une activité. Si l’on peut difficilement mener une autre tâche complexe en parallèle de la lecture, c’est que lire monopolise une bonne partie de nos ressources cognitives. Quiconque a essayé d’ouvrir un livre en présence d’un enfant de 3 ans un peu agité a une bonne idée de ce que j’essaie d’expliquer.
Si les gens ne lisent généralement pas l’intégralité des textes présents dans les interfaces, c’est donc d’abord et avant tout, parce qu’ils ne disposent pas de l’attention nécessaire à cet effort.
Mille et une raisons d’être inattentif
Les raisons de ne pas prêter attention aux textes présents dans les interfaces ne manquent pas. Pour commencer, il est important de rappeler que notre attention est l’objet d’une compétition constante.
Cette lutte se joue d’abord dans le monde physique où les sollicitations ne manquent pas, mais de plus en plus aussi sur nos écrans. Du reste, nous partageons souvent notre attention entre deux ou trois écrans à la fois. À titre d’exemple, selon une étude de 2021, 53% des téléspectateurs utilisent leur smartphone en regardant la TV. Dans ces conditions, on peut légitimement douter de leur qualité d‘attention et de leur faculté à bien comprendre tout ce qui s’affiche sur leur mobile.
Les facteurs externes ne sont d’ailleurs pas les seuls à perturber nos efforts de concentration. Il nous est tous arrivé de perdre le fil d’une lecture après qu’une pensée impromptue ait fait irruption dans notre esprit. Pour résumer, notre attention est versatile, difficilement contrôlable et partagée entre une multitude de signaux concurrents.
Par ailleurs, nous abordons généralement les interfaces avec d’autres objectifs que celui de lire scrupuleusement l’ensemble des textes qui y figurent. Sur un site e-commerce, nous venons pour nous renseigner ou effectuer un achat. Sur une application bancaire, nous cherchons en général à effectuer une opération ou à consulter notre solde. Sur un site d’hôtellerie, nous essayons de réserver un logement, etc. Toutes les formalités, les consignes, les messages qui ponctuent nos parcours sont autant de freins qui nous ralentissent dans l’atteinte de nos objectifs. Par conséquent, nous cherchons généralement à distinguer rapidement les informations utiles des contenus que nous pouvons ignorer, avec une marge d’erreur proportionnelle à notre empressement.
Nous ignorons aussi certains textes parce que nous nous considérons suffisamment familiers de l’interface ou d’interfaces comparables, pour ne pas avoir à lire attentivement et de façon exhaustive l’ensemble des contenus disposés à notre attention le long de notre parcours.
La fatigue est un autre puissant perturbateur de l’attention. Lorsqu’on ouvre un site web ou une application, nous sommes généralement soumis à un grand nombre de messages qui ne concernent pas notre besoin initial. Il nous faut donc fournir un effort cognitif important pour identifier ce qui nous intéresse et le chemin le plus court pour l’atteindre. La somme de ces efforts constitue ce que l’on appelle le “coût de l’interaction”. Lorsque celui-ci est trop élevé, nous avons tendance à chercher à le diminuer en ignorant de plus en plus d’informations. Dit autrement, plus un parcours est long et complexe et moins il y a de chances que nous lisions scrupuleusement tous les textes qui y figurent.
Ne nous y trompons pas. Nous savons tous qu’il est préférable de prêter attention aux informations qui ponctuent nos parcours sur le web. Nous savons aussi qu’en ne le faisant pas, nous nous exposons à nous tromper ou à être trompés. Néanmoins nous prenons très souvent ce risque quand même. Ce paradoxe typiquement humain, d’avoir conscience de ce qu’il faudrait faire et de pas le mettre en œuvre porte un nom : l’acrasie. Vous saurez maintenant mettre un mot sur ce sentiment qui vous envahit chaque année mi-janvier, au moment où vous mettez un terme à votre Dry January. Notre vie quotidienne est ponctuée de ces petits renoncements de la volonté qui vont à l’encontre de notre propre intérêt, comme lorsque les gens cliquent sur un bouton avant d’avoir lu la moindre consigne. En tant que concepteur, on peut être tenté d’ignorer cette réalité. Il est commode de renvoyer la faute aux utilisateurs : “Ça n’est quand même pas de ma faute si les gens ne lisent pas !”. On peut aussi se conformer aux agissements réels des gens et essayer de structurer le contenu pour en faciliter la lecture.
Structurer le contenu pour être lu
Une étude du Nielsen Norman Group a permis de recenser les grands modes de lecture sur écran. Un des plus communs est le “F-shaped pattern”. Il consiste à commencer à lire quelques lignes, puis à scanner le contenu verticalement en concentrant son attention d’abord sur les premières lignes, puis finalement uniquement sur les premiers mots à gauche. Cette façon de balayer rapidement le contenu d’une page en accordant moins d’attention aux textes situés en bas et à droite de l’écran augmente considérablement les chances pour les utilisateurs de passer à côté d’une information importante.
Un second mode de lecture très courant est le “Layer cake pattern”. Il consiste à parcourir les titres à la recherche d’informations clés et à ignorer délibérément le reste du texte. Là encore, les chances pour l’utilisateur de passer à côté d’une information essentielle sont élevées.
Un dernier type de lecture répandu est le “Z-shaped pattern”. Il consiste à laisser courir son regard de gauche à droite, puis de haut en bas en suivant la forme d’un Z. Les gens ont tendance à suivre ce schéma de lecture lorsqu’ils sont confrontés à des interfaces riches, dont la structure est complexe. Ce mode de lecture pose à nouveau un problème de découvrabilité de l’information.
La constante de ces trois modes d’accès au texte, c’est la propension des gens à scanner le contenu des pages plutôt qu’à s’engager dans une lecture exhaustive. Nous serions 79% à adopter ce comportement. Par ailleurs, dans deux de ces trois modes de lecture courants, les gens ont tendance à accorder plus d’attention aux débuts des textes qu’aux titres. Il est donc nécessaire de structurer le contenu des écrans en conséquence. Pour se faire, on peut respecter trois règles simples :
- D’abord, il faut être aussi concis que possible. Chaque phrase présente dans une interface doit rapprocher les utilisateurs de ce qu’ils souhaitent accomplir. Une phrase qui ne remplit pas cette mission doit être reformulée ou supprimée. De la même façon, l’utilité de chaque mot doit être questionnée afin de limiter la quantité de texte au stricte nécessaire.
- Ensuite, il faut que le formatage du texte facilite le balayage visuel rapide. Pour se faire on peut utiliser des styles de textes (titres, sous-titres, paragraphes) bien hiérarchisés ainsi que des retours à la ligne et des listes à chaque fois que c’est possible. Par ailleurs, pour être véritablement efficace, une liste ne devrait pas excéder 5 à 6 items.
- Enfin, les informations cruciales doivent figurer dans les titres ou dans le premier paragraphe, selon un principe de rédaction appelé la “pyramide inversée”. Ce format permet aux personnes qui auraient rapidement interrompu leur lecture d’avoir tout de même connaissance des éléments essentiels.
Le respect de ces quelques règles simples améliore sensiblement l’utilisabilité des interfaces, mais il ne constitue pas une garantie absolue contre l’inattention. En définitive, la motivation des utilisateurs a davantage d’influence sur leur comportement de lecture que tous les ajustements que nous pourrions mettre en place. La meilleure façon d’engager les gens à lire sur un écran reste donc de leur proposer un service, un produit ou une expérience qui vaille cet effort.
Si le sujet de la motivation vous intéresse, j’y ai consacré un article récemment.