Articles

Lentille connecté

On parlait il y a deux semaines de la curiosité et du temps nécessaire à celle-ci [1]. Le monde digital actuel, et la façon dont il est conçu, vise à consommer notre temps. Et nombreux sont les acteurs de la Silicon Valley et les analystes à avoir pointé ces travers. Mais deux des révolutions technologiques en cour vont avoir un impact bien plus grand sur notre temps et sur la place du monde digital dans notre vie. Un impact sur notre perception même du monde réel.

La fin des écrans

Jusqu’ici, quand on pensait au monde digital, on pensait avant tout aux écrans. Nous avons commencé à expérimenter le Web grâce aux écrans des ordinateurs. Nous avons prolongé cette expérience via tablettes et smartphones. En conséquence, notre conception actuelle des interactions digitales est basée sur un ensemble de ruptures. Des ruptures de plus en plus fines et transparentes, mais des ruptures tout de même.

Il y a 15 ans, pour chercher quelque chose sur Internet, il fallait utiliser un ordinateur et prendre le temps de la connexion et de la recherche, éplucher plusieurs résultats avant de trouver l’information ou le produit que nous voulions. Et souvent, avant d’acheter quelque chose en ligne, nous devions par exemple vérifier la fiabilité du site sur lequel nous souhaitions effectuer un achat.

Il y a 15 ans, le temps digital était un temps dédié, un « Attends, je vais regarder sur Internet ».

Avec les tablettes et les smartphones, mais aussi avec l’habitude d’utilisation et la confiance en l’univers digital, ces ruptures se sont réduites. Aujourd’hui, nous avons gardé le réflexe du « Je vais regarder sur Internet. », mais ce réflexe est devenu à la fois plus rapide et nomade. Plus rapide, parce que le smartphone est dans notre poche en permanence et qu’il est facile de le sortir, le déverrouiller et de taper une requête. Nomade, parce que nous avons désormais accès à une connexion permanente, continue, qui nous permet d’accéder à l’univers digital dans la rue, le métro ou en voiture.

Les seules ruptures qui subsistent encore dans notre expérience digitale, ce sont les ruptures de l’attention et de la manipulation. Le smartphone sollicite à la fois nos mains et nos yeux et nous oblige à nous concentrer sur la manipulation qu’il impose. Le regard se pose sur le smartphone, captant notre attention et interrompant la conversation en cours. Les mains sont nécessaires pour activer les interfaces tactiles de notre téléphone, stoppant les autres actions en cours. Attention et manipulation sont aujourd’hui les frontières du monde digital – tant il est devenu naturel d’y recourir ou d’anticiper son usage dans notre cerveau. Et ces frontières sont sur le point d’être abolies.

La fin de la déconnexion

La fin de la séparation « physique » entre le monde réel et le monde digital – effet de vocabulaire, le monde digital est aussi « réel » qu’un autre – a débuté en 2011 avec l’intégration de l’assistant Siri aux iPhones. En proposant un programme permettant d’interagir par la voix, de formuler ses questions vocalement et d’entendre les réponses, Apple a réduit une des ruptures évoquées plus tôt, celle de l’attention : plus besoin de détourner le regard vers un écran pour interroger le Net et commander un taxi ou savoir qui était roi de France en 1463. La formulation de la réponse à l’oral contribue de la même façon à la continuité de l’expérience réelle. Siri se glisse dans la conversation assez naturellement.

La seule rupture reste celle de la manipulation : déverrouiller le téléphone, lancer le programme de l’assistant. Et cette seconde rupture est en train de disparaître grâce aux assistants vocaux qui vont rapidement peupler nos maisons. Les bornes Google Home ou Amazon Alexa, en restant en permanence aux aguets et en se dispensant d’écran, se glissent naturellement dans les interactions quotidiennes. Au bureau, il devient « normal » au cours d’une conversation entre collègue d’interpeller Google pour lui demander une précision. Il y a peut-être encore un peu de dérision, de digression, dans cette demande… principalement du fait que toute nouveauté technologique semble un gadget pour geeks aux premiers utilisateurs, mais les usages s’installent doucement.

L’interaction vocale devient naturelle, et porte en elle l’avènement du web ambiant.

Le web ambiant : c’est justement la fin de la déconnexion et du monde digital tel qu’on le connaît depuis 25 ans.
Avec l’avènement des assistants vocaux domestiques, le Web n’est plus un outil supplémentaire accessible le temps d’une demande, il est une couche d’information supplémentaire de la réalité, qui ajoute un degré de connaissance ou de service aux interactions quotidiennes.

Les audioguides des musées (ici au Louvre), une expérience concrète de réalité augmentée

Les audioguides des musées (ici au Louvre), une expérience concrète de réalité augmentée

Pour certains, l’audio est même la première expérience de réalité augmentée vraiment réussie et populaire. Les audio-guides des musées, en commentant œuvres et salles, répondent à cette définition d’une surcouche informative sur la l’expérience concrète, physique.

Reste, pour que la frontière monde concret / monde digital ne disparaisse concrètement à imaginer des interfaces et expériences qui iront plus loin que la voix.

Les expériences visuelles de réalité augmentée – de réalité modifiée, diminuée, altérée… quelque soit le terme employé – ne sont pour l’instant que des expériences. En cause ? Principalement les défauts d’interface des terminaux qui ne permettent pas aujourd’hui de gommer les ruptures de manipulation entre le monde physique et digital.

Il faut toujours enfiler un casque, dépendre d’une connexion, lever son téléphone ou sa tablette… Autant de gestes qui rompent l’expérience concrète et rendent l’expérience augmentée / alternative plus technologique que pratique.

Second Life, ou le fantasme de l'univers virtuel indépendant, est toujours actif depuis 2007

Second Life, ou le fantasme de l’univers virtuel indépendant, est toujours actif depuis 2007

Soyons honnêtes, les univers virtuels imaginés dans la science-fiction (Neuromancer, Snow Crash ou Ready Player One) ont peu de chance d’aboutir réellement. Les expériences réelles similaires, si elles sont restées très ludiques et geeks (Le deuxième monde ou Second Life) n’ont pas abouties principalement du fait de freins matériels : la rupture de manipulation, d’usage et d’interface nécessaire pour se projeter dans ces univers.

Et pourtant, les prototypes pratiques d’application ne manquent pas (affichage des avis des lecteurs en librairie, localisation des hôtels proches…). Mais ils se popularisent difficilement aujourd’hui, faute d’interface naturelle. L’aspect ludique domine, principalement grâce à SnapChat et à ses lens et à Pokemon Go… sans pour autant créer une véritable usage quotidien sorti de celui de la messagerie.

Si la popularité du jeu est indéniable, Pokemon Go! n'a pas pour autant démocratisé la Réalité Augmentée

Si la popularité du jeu est indéniable, Pokemon Go! n’a pas pour autant démocratisé la Réalité Augmentée

Les Google Glass sont, à date, la tentative la plus aboutie de créer une interface pratique de réalité augmentée visuelle. Leur arrêt en 2015 a signé une fin temporaire des développements liés à un web ambiant visuel, laissant la réalité alternative visuelle dans le champ de la science-fiction (The Circle, Black Mirror), de la publicité (Coca Cola) ou du jeu vidéo (Sony)… Quand les prototypes de lunettes proposés par Facebook ou de lentilles connectés imaginés par Google verront le jour et seront adoptées, alors le Web ambiant sera une réalité et on pourra parler de la fin du monde digital. Ce n’est qu’une question de temps.

La fin de la réalité ?

Mais si l’on anticipe un monde sans rupture entre digital et concret – oublions le terme de réel – il va falloir également anticiper les dérives possibles de cette imbrication. Pas tant celles de la connexion permanente, car si cette connexion devient transparente et « augmentée », elle posera moins de question sur l’isolement du concret qu’elle ne le pose actuellement, mais les dérives liées aux contenus mis à disposition dans ce digital ambiant.

Yantra, le premier robot journaliste indien se charge de trouver les sources d'information, de les recouper et de fournir une première analyse aux rédacteurs humains

Yantra, le premier robot journaliste indien se charge de trouver les sources d’information, de les recouper et de fournir une première analyse aux rédacteurs humains

L’avalanche de contenus produits dans les espaces digitaux a déjà été pointée du doigt de nombreuses fois. Au bruit humain – la répétition des informations, les contenus créés uniquement à objectif marketing – s’ajoutent désormais les contenus créés artificiellement, par des programmes informatiques et des intelligences artificielles. Les robots journalistes ne sont pas une nouveauté, ils ont été testés par de nombreux portails Web, dont Yahoo!, au cours des dix dernières années. Ils étaient destinés, avant tout, à faciliter une création de contenu à moindre coût pour les grands sites d’information.

Actuellement, ce seraient plutôt les programmes de manipulations d’images et de vidéos qui feraient les choux gras des experts.

Les intelligences artificielles de Microsoft ou de Google sont capables de mixer des photos pour recréer des ambiances (adapter un coucher de soleil sur une vue de la campagne par exemple…) ou de créer de toute pièce une photo à partir d’une description textuelle. Plus effrayant, les dernières manipulations d’images permettent de coller un discours sur un visage ou de greffer le visage en particulier sur un film porno – les fameux DeepFakes – le tout en vidéo.

DeepFake, l'algorithme capable de copier n'importe quel visage dans n'importe quelle vidéo... est également utilisé pour manipuler les films pornographiques

DeepFake, l’algorithme capable de copier n’importe quel visage dans n’importe quelle vidéo… est également utilisé pour manipuler les films pornographiques

Ces possibilités de manipulation massive des images vont créer deux travers : tout d’abord la multiplication des « versions » de la réalité – un même contenu pourra exister de plusieurs façons, avec plusieurs ambiances ou plusieurs acteurs – mais surtout un doute permanent dans notre esprit sur les images que nous voyons.

Prenez ces possibilités de création et d’altération massive des contenus – rendues possibles par la croissance exponentiellement de la puissance de calcul – et mêlez-les aux possibilités du Web ambiant – la superposition sonore ou visuelle – et à la puissance des algorithmes que nous évoquions dans l’article précédent – un contenu ciblé par utilisateur. Effrayant ?

Terra Incognita

Oui. Ce qui se dessine en superposant les innovations technologiques les plus récentes ressemble naturellement une dystopie. Les derniers développements de l’omniprésence numérique n’incitent pas à l’optimisme – que l’on parle de la diffusion massive de fausses actualités pendant la campagne présidentielle américaine, ou de l’exploitation des données personnelles des utilisateurs de Facebook par Cambridge Analytica.

Un futur où la déconnexion n’existe plus nous expose de fait à des manipulations permanentes, voire à un travestissement du monde concret.

Pour autant, les initiatives pour créer de la richesse, à défaut d’honnêteté, à l’aide d’outils digitaux existent. Qu’ils s’agissent d’interfaces à la Tinder créées pour favoriser l’exposition au hasard – l’interface, pas forcément l’algorithme qui est derrière – que ce soit des initiatives éditoriales comme Artips ou des mécaniques audios proches de la radio – les Podcasts – ou encore l’économie des Box qui surfent sur l’inconnu que peut contenir un coffret chaque mois. Ces mécaniques favorisant la découverte de nouveaux produits, de nouvelles informations ou de nouvelles cultures sont nombreuses.

Il nous reste à imaginer une exploitation concrète de ces mécaniques, toutes plus ou moins issues de la philosophie de l’hypertexte, dans le monde hybride qui s’annonce. Une mécanique permettant non seulement d’enrichir, mais surtout d’agrandir le monde concret en y ajoutant des occasions d’être curieux. Loin de l’image d’un Ready Player One qui met en scène un monde virtuel fermé, et qui enferme ses visiteurs, on construirait au contrairement un univers où les interactions entre concret et virtuel servent à l’enrichissement « culturel ».

Une sorte de dystopie positive.

Le meilleur des deux mondes.

Fais le bon choix Neo !

10mn de lectureLa question du « Choix » va être cruciale dans le développement des interfaces digitales dans les années à venir. La plateformisation des outils, le développement grandissant de l’intelligence artificielle et l’émergence des interfaces vocales posent très clairement la question de la marge de choix laissée aux internautes, voire aux consommateurs dans le futur Web ambiant.

Algorithmes et intelligences robotiques

On se souviendra qu’il y a moins d’un an, en pleine campagne électorale américaine, le rôle des algorithmes dans la diffusion de l’information avait été largement évoqué. Le monde des médias découvrait avec un mélange d’effroi et de fascination les fameuses « bulles cognitives« .
En surfant sur les réseaux sociaux, nous ne serions exposés qu’à des contenus qui confortent nos opinions et réduisent rapidement notre sphère de connaissance et de curiosité. Facebook, qui avait tenté un temps d’automatiser sa politique de gestion éditoriale avait du faire marche arrière devant deux écueils : la capacité de son algorithme à favoriser des contenus outranciers [1], excessifs – on ne parlait pas encore de fake news – et les accusations de réduction de l’exposition de certains contenus [2].

La faute aux algorithmes bien entendu, mais surtout au fait que ceux-ci ne soient conçus et pilotés sur une base d’objectifs chiffrés. Si je cherche à provoquer un maximum de clics sur mon contenu, j’ai tout intérêt à cibler les audiences les plus affinitaires avec celui-ci, donc les audiences partageant les mêmes centres d’intérêts – Facebook est extrêmement fort à ce jeu – voire qui participent à la construction et à la propagation de mes opinions. Travers humain compréhensible, il est plus facile de parler à une cible séduite que de tenter le prosélytisme. Tout marketeur vous le dira.

Ce travers de conception des principales interfaces du Net – les pages de résultats de recherche de Google, le fil d’actualité de Facebook… – n’en serait pas un s’il était la simple résultante d’une volonté humaine. Malheureusement, ce n’est pas aussi simple. Si les bulles cognitives existent à ce point, c’est principalement qu’elles sont générées par des programmes informatiques dont l’objectif est de maximiser nos réactions… Donc de nous plaire et de nous exposer à des contenus qui confortent nos opinions…

Algorithmes aujourd’hui, Intelligences artificielles demain. La puissance des futurs robots et leur capacité à traiter nos informations personnelles – non plus seulement un historique de cliks, mais des données comportementales complexes comme la mesure de nos réactions physiques ou nos interactions avec l’environnement domestique – va augmenter sensiblement la pertinence de ces bulles. Le but de l’intelligence artificielle va être au final de faire mouche à chaque fois, et de non plus seulement proposer un contenu – produit, service, utilisez le mot qui vous semble juste – qui nous plaise, mais également qui corresponde exactement à nos contraintes – physiques, temporelles, domestiques – du moment.

L’intelligence artificielle, c’est la « satisfaction garantie » poussée à son paroxysme…

Les contenus idéaux pour qui ?

Tout va donc pour le mieux puisque le futur me propose la satisfaction assurée de mes désirs. Ce serait aussi simple que ça si ne se posait pas la question de l’émetteur.
Qui, concrètement, est à même de nous proposer ce contenu idéal ? À date, ce sont les GAFA.

  • Google peut nous proposer des sites et des « adresses » où trouver à coup sûr le service que nous recherchons. Le rôle clé de son moteur de recherche – et de ses extensions mobiles et vocales – n’est que cela : nous orienter vers le bon prestataire.
  • Amazon lui entend nous orienter rapidement vers le produit idéal en exploitant notre historique d’achat. Amazon Dash [3] par exemple se veut une simplification extrême du choix et jouant sur la fidélité à une marque…
  • Facebook, on l’a vu, joue la même partition pour les contenus. Le réseau social entend nous pousser le média le plus en adéquation avec notre habitude de consultation des contenus.

À ces trois géants, qui semblent aujourd’hui indétrônables, s’ajouteront sans doute un ou deux autres acteurs dans les années à venir. Notamment celui qui, entre Uber, Tesla et Apple, maîtrisera une voiture autonome transformée en simple canal de diffusion de contenus [4].

Sans entrer dans la paranoïa anticapitaliste, il est bon de garder en tête le rôle de ces GAFA dans l’économie mondiale, et surtout leurs objectifs propres de rentabilité. Si Google doit garder en tête sa « ligne » de pertinence pour être utilisée – c’est à dire toujours proposer un contenu en cohérence avec la requête de l’internaute – il doit le faire dans un dispositif qui favorise la création de revenus publicitaires propres. La mainmise d’Adwords sur la publicité digitale à objectif commercial, la mainmise de Facebook sur la publicité à visée éditoriale [5], montrent bien les torsions possibles du système. Me propose-t-on les contenus les plus pertinents parmi lesquels certains sont publicitaires, ou les contenus les plus pertinents parmi des choix publicitaires ? La limite est ténue…

L’interface, clé de l’interaction.

Intelligences artificielles et GAFA semblent donc dessiner notre environnement direct de demain… Mais si le paysage n’était pas assez complexe à anticiper, un changement drastique d’usage guette le digital : l’omniprésence des assistants. Les assistants, quelle que soit leur forme, changent complètement la notion d’interaction dans l’univers digital, basculant d’un monde de requêtes – une demande / plusieurs reponses – à un monde de conversation – une demande / une réponse.

Premier avatar de ce tsunami conversationnel : les chatbots. Héritiers directs du smartphone et des interfaces de SMS, le chatbots réduit par défaut toute interface à un écran de mobile, et toute interaction à un échange de message textuel. Si des démonstrations d’intégration laissent envisager des possibilités d’interfaces autrement plus riches, à l’image de l’essayage et de l’achat de lunettes de soleil chez Ray Ban [6], il reste pertinent de penser que le chatbots tend vers la simplicité : échange de quelques mots, boutons de sélection mais guère plus d’options ouvertes. Si les arbres de décision peuvent s’avérer complexes, les espaces de liberté laissés au mobinaute sont réduits.

Le second avatar de la révolution de la conversation, l’assistant vocal, n’est pas mieux logé. L’interface vocale est prometteuse en termes d’interactivité, elle permet au consommateur de formuler à peu près n’importe quelle question [7]. Les taux de reconnaissance vocale et linguistique des Intelligences artificielles laissent en effet présager d’une compréhension fine d’à peu près n’importe quelle formulation [8]. Mais l’interface vocale pêche aujourd’hui par la pauvreté de ses réponses. Un canal vocal peut en effet être un vecteur d’information, mais difficilement devenir un canal de navigation. Les personnes s’étant déjà heurtées au serveur téléphonique de n’importe quelle administration – ou il y a vingt ans aux horaires vocaux des cinémas – pourront en témoigner.

D’ailleurs, ce n’est pas un hasard si, après avoir testé et formalisé les codes de l’interaction vocale, Amazon travaille désormais à son complément visuel : d’abord via smartphone interposé (Echo Look [9]), puis via un assistant domestique mixant les usages de la borne vocale et de la tablette (Echo Show [10])

La réduction du champ des possibles ?

Résumons ?

  1. Une intelligence artificielle qui pense à notre place.
  2. Des GAFA qui régissent les flux, et donc décident de l’information à laquelle nous sommes exposée.
  3. Des interfaces, conversationnelles et vocales, qui limitent les possibilités de sélection et de choix.

Tout est pensé dans l’univers ergonomique qui se dessine pour limiter la charge cognitive du choix… Pour limiter notre exposition à un champ de possibles soit par le filtrage, soit par la non exposition aux options possibles.
Tout est fait pour que, ergonomiquement, le choix n’existe plus, ou en tout cas ne soit plus un écueil de navigation.

Prototype de réfrigérateur connecté par Samsung et Google

Prototype de réfrigérateur connecté par Samsung et Google

Le philosophe Eric Sadin se posait la question d’une révolution numérique qui au final nie l’impact que l’humain peut avoir sur elle. Dans son interprétation de la « Silicolonisation du monde » [11], il part des trois principes de la révolution numérique que nous sommes en train de vivre – tout d’abord l’ère de l’accessibilité aux données, plus l’ère de la captation des données et enfin, bientôt, l’ère de l’intelligence artificielle – pour démontrer à quel point robots et algorithmes pourront se passer de nous.
Pour exemple ? Le frigo connecté qui a la capacité de connaître en temps réel son propre contenu, et donc de commander « seul » le pack de yaourt qui viendrait à manquer. L’exemple est caricatural ? Pas tant que ça si l’on pense aux nombres de systèmes automatisées qui sont en train d’être conçus par la Silicon Valley, de l’affichage publicitaire à la voiture autonome en passant par les thermostats ou les balances connectées.

Sans aller jusqu’à cette perte totale de contrôle de l’être humain sur sa vie, il faut bien reconnaître que dans la sphère digitale, les moyens d’interaction de l’être humain sur sa propre vie vont dans le sens d’une grande simplification, ou a minima d’un conseil extrêmement guidé… Le bouton Amazon Dash en étant le modèle plus poussé actuellement : en permettant l’achat d’un produit identifié d’un seul « clic », on ne se pose plus la question du produit lui-même et du jeu de la concurrence. Hors l’activation du bouton, le périmètre de l’intervention humaine est bien faible.

Sans revenir sur les fondements de la psychologie humaine, on gardera en tête que le choix reste en grande partie ce qui donne de la valeur à un acte ou à un produit. Comment valoriser une expérience si le choix de la suivre ou non n’existe plus ? Comment gérer une relation client, dans un cadre purement commercial – voire dans un cadre juridique de service après-vente – si le consommateur n’a pas eu la sensation d’opérer un choix réel lorsqu’il a commandé un produit ou fait appel à un service ? L’équilibre entre « Proposition », « Suggestion » et « Obligation » est précaire. Et toutes les conditions générales de vente du monde ne changeront rien à la perception de ne pas avoir de prise réelle sur un système informatique ou commercial.

Du rôle de l’expérience utilisateur

On a eu tendance à définir, dans le monde digital de ces vingt dernières années, les métiers de l’User eXperience comme étant ceux de la simplification. L’expérience utilisateur devait apporter clarté et pédagogie aux interfaces pour que chaque internaute puisse rapidement trouver une information, ne s’égare pas sur un site et accède rapidement aux produits dont il avait réellement besoin. On a bien souvent détourné ces métiers de base, au service de l’internaute, pour en faire des chausse-trappes commerciaux et « tenter » l’internaute, l’inciter à commander et dépenser plus [12].

À l’aube de la révolution de l’intelligence artificielle et des interfaces dialogantes, le rôle des UX va peut-être encore changer. Dans les années qui viennent, les designers digitaux et les spécialistes de l’interactivité vont peut-être avoir pour mission de valoriser l’interaction humaine pour ne pas donner aux humains l’impression d’être soumis au contrôle des machines. Rétablir l’équilibre en quelques sortes.