Un peu de recul sur les sciences du numérique
Le Théorème d’Hypocrite
Thierry Maugenest et Antoine Houlou-Garcia (Albin Michel, 2020)
Ce livre discute de l’application des mathématiques à la politique.
Le rôle d’une politicienne est de prendre des décisions arbitrant entre les inévitables aléas et conflits internes à une société. À l’échelle d’un pays il est impossible à la politicienne de l’observer en totalité à chaque instant. Les mathématiques, via la statistique d’État, peuvent l’aider à visualiser le pays en y collectant des chiffres bien choisis fournissant des indicateurs. La politicienne peut alors interpréter ces chiffres pour se construire un modèle théorique qui lui semble pertinent représentant l’État ou l’évolution de l’ensemble de la société. Cette recension prend la liberté de chosifier les multiples points de vue statistiques, de les traduire sous la forme de lunettes chaussées pour éclairer la décision politique voire en évaluer les conséquences.
Ces lunettes sont bien plus discutables que de nombreux modèles scientifiques car elles traitent du système particulièrement complexe qu’est une société. L’usage de lunettes n’est pas limité à la politicienne car elle a aussi souvent besoin de l’adhésion des citoyennes. Pour cela elle peut présenter la société via un modèle encore plus simplifié, des lunettes bon marché, car la citoyenne n’a pas autant de temps ni de conseillères que la politicienne. Dans une perspective historique s’appuyant sur des exemples à de multiples époques, ce livre discute des atouts, défauts, ajustements sincères et déformations malintentionnées des lunettes mathématiques présentées dans ce paragraphe.
Je continue de filer l’analogie des lunettes dans cette présentation, mais rassurez-vous elles n’existent pas dans ce livre. J’ai apprécié cet ouvrage notamment pour la sélection variée des exemples illustrant le propos et que je ne veux pas trop dévoiler ici. Cohérents avec leur appel à mélanger modélisations, nombres et opinions, les auteurs expriment certaines de leurs positions sur des évènements très récents comme la pandémie actuelle. Il n’est pas nécessaire d’adhérer à toutes leurs opinions pour reconnaître que leur façon de les étayer est un pas vers un débat où l’utilisation et la place des chiffres seraient plus adaptées. Voici quelques impressions issues de ma lecture et les leçons avec lesquelles je me suis revacciné.
Ne pas nécessairement accepter l’argument d’autorité de calculs complexes probablement justes surtout quand personne ne prend la peine de les vérifier, calculs qui peuvent d’ailleurs n’être qu’un paravent indiscutable à des modèles eux bien discutables.
Ne pas oublier que ces chiffres ne montrent pas tout de la société, comme par exemple les trajectoires individuelles de ses citoyens, sans nier non plus que parfois, bien choisis, ils en montrent quelque chose.
Pour identifier les cas d’utilisation pertinents, continuer à voir ces chiffres comme le résultat de mesures sur une expérience souvent subtile qu’il est tout aussi important de comprendre d’autant que la citoyenne en est capable et que cela peut être passionnant.
Reprenons un survol plus factuel d’éléments présentés dans ce livre.
Les succès indubitables des applications des mathématiques à la physique donnent à voir la puissance possible du couplage de la modélisation/description mathématique et des calculs pour comprendre et dompter le fonctionnement de certains aspects de la Nature. Fort de l’aura produite par ces succès, il est alors tentant d’appliquer cette démarche scientifique à d’autres domaines sans nécessairement s’assurer que tous les ingrédients de la recette soient d’aussi bonne qualité.
Dans le domaine politique, les caprices de l’âme humaine et l’ensemble des évènements d’une société semblent encore difficiles à décrire, pour ne pas dire que c’est illusoire, et trouver des lunettes qui fassent consensus chez toutes les citoyennes — ces fameuses valeurs communes — est délicat. Les auteurs commencent par rappeler les possibles paradoxes des multiples procédures de votes agrégeant des avis divergents en de multiples consensus. Ils s’appuient sur ces paradoxes pour exposer la limite d’une procédure nécessairement discutable de conciliation chez l’opticienne. Le choix des lunettes est pourtant important car, une fois chaussées durant la Grèce antique, elles ont pu par exemple aussi bien justifier par \(A+B\) l’égalité des citoyens sans prendre en compte leur mérite déclaré impossible à quantifier ou au contraire justifier toujours par \(A+B\) les inégalités pour les rendre proportionnelles à l’indiscutable et incitatif indicateur du mérite à la mode.
En discutant des exemples jouets de décision en théorie des jeux, les auteurs rappellent la joie d’avoir identifié LA meilleure décision prouvée par \(A+B\), résultant d’un calcul logique, donnant une solution confortablement incontestable et même parfois inattendue que nous pouvons qualifier de futée. Ils n’oublient pas de mentionner que les lunettes que nous avions chaussées peuvent s’avérer être des œillères qui masquent trop d’aspects essentiels de la réalité pour que le résultat s’applique sur le terrain.
Un grand classique: le raisonnement logique peut être inattaquable et la solution correctement déduite mais à partir d’hypothèses et prémices gravées dans les lunettes plus que douteuses !
Les auteurs racontent les façonnages des premières lunettes d’État, rudimentaires, avec leurs gros défauts encore bien visibles, qui n’ont pas empêché les plus enthousiastes de célébrer leurs naissances. Toutefois une fois les premiers gros défauts corrigés, les lunettes mathématiques plus matures sans être parfaites ont progressivement étendu leur influence. Nous ne sommes pas dans un roman avec Harry Potter, mais ces simples outils d’observation plongés dans la société peuvent passer à l’action ! En effet, lorsqu’elles donnent le pouvoir de justifier une action, elles deviennent elles-mêmes observées par les citoyennes et politiciennes quitte à devenir parfois une finalité : on veut un joli tableau vu par ces lunettes, quitte à progressivement se détacher de la réalité pour leur obéir. Ce risque a été rapidement identifié par une partie des statisticiennes et les auteurs mentionnent le débat entre le suivi de trajectoires individuelles, même parfois sous la forme romanesque, et les agrégats comptables d’indicateurs sur l’ensemble de la population. Puisque ces lunettes peuvent agir dans une société, toutes les intervenantes peuvent défendre leurs intérêts en proposant leurs lunettes. Les inévitables erreurs sincères sur un sujet aussi complexe peuvent alors glisser vers des manipulations, chacune voulant faire parler ses chiffres et les auteurs donnent quelques exemples probants.
Ce livre évite tout formalisme mathématique, épargnant par exemple à la lectrice une discussion précise sur la variance en lien avec la loi normale ou bien comme ici le distinguo entre chiffres et nombres. Cela ne l’empêche pas de discuter précisément par exemple des notions de risques absolu et relatif, des confusions entre causalité et corrélation, du paradoxe Simpson, du biais de sélection volontaire… mais aussi de citer Spirou, les débats aux procès de l’affaire Dreyfus, celui entre Hyppias et Socrate, du suivi de couples sur Facebook, de se demander pourquoi Charles Ponzi est passé à la postérité plutôt qu’Adele Spitzeder, Sarah Howe et Marthe Hanau…
Il y a quelques références à d’autres livres parfois universitaires tout aussi intéressants, par exemple « La gouvernance par les nombres » d’Alain Supiot. Mais c’est bien un livre de vulgarisation car il n’y a pas une bibliographie académique comme celles que j’ai peut-être trop pris l’habitude d’aller fouiller sur les détails qui m’intéressent le plus. Ce n’est donc pas un défaut, juste une envie de creuser transmise par les auteurs et donc finalement un symptôme de qualité.
- La référence précise de l’ouvrage d’Alain Supiot est « La gouvernance par les nombres » d’Alain Supiot.
- Le livre « Algorithmes: la bombe à retardement » de Cathy O’Neil fait également partie des références mentionnées dans le livre.
En ouverture qui me semblent en lien avec ce livre, je citerai un article du Journal du CNRS pour les 100 ans d’Edgar Morin pour une discussion sur les approches d’une société nécessairement complexe, ainsi que des réflexions sur les outils numériques de suivi de contacts de François Pellegrini, vice-président de la CNIL dans un article de la revue 1024 pour un dialogue entre scientifiques et politiques durant la pandémie.
Un échauffement citoyen pour la campagne présidentielle ?
Au cœur des réseaux – Des sciences aux citoyens
Fabien Tarissan (Éditions Le Pommier, collection Essais, mars 2019)
Qu’est-ce qu’un réseau ? On connaît les réseaux de transport, de communication, etc. Le monde numérique est basé sur le réseau Internet et le Web. Tandis que le premier achemine les données, le second les organise en pages et en liens hypertextes. Mais alors, qu’est-ce qu’un réseau ? C’est le sujet du livre « Au cœur des réseaux » de Fabian Tarissan.
Un réseau est tout simplement un graphe, nous explique l’auteur, avec des nœuds (les pages pour le Web) et des liens entre eux (l’hypertexte). En étudiant les graphes, on peut définir la notion de plus court chemin entre deux nœuds, puis de distance moyenne, etc. On peut aussi résoudre le casse-tête des ponts de Königsberg, ou plutôt montrer qu’il n’a pas de solution !
D’après l’auteur, deux articles fondateurs contribuent à l’essor de l’analyse scientifique des réseaux. Ils vont introduire les structures de réseau petit monde d’une part, et de réseau sans échelle d’autre part. Bien que ces notions abstraites semblent difficiles à appréhender, la virtuosité de l’auteur permet de les rendre très digestes. De plus, il illustre l’intérêt de ces notions qui apportent un éclairage nouveau dans divers champs disciplinaires. Par exemple, une étude sur les malades atteints d’Alzheimer a montré que les réseaux cognitifs de ces patients ont perdu la structure de petit monde observée chez les personnes saines.
Au fil des pages, on apprend que les réseaux petits mondes se caractérisent par une courte distance moyenne (il suffit en général de moins de 6 liens pour trouver un chemin entre deux nœuds) et une forte densité locale (beaucoup de triangles dans le réseau), avec une faible densité globale (peu de liens par rapport au nombre possible). La science des réseaux a montré que cette structure s’explique par un modèle où une régularité des connexions s’accompagne de quelques liens aléatoires. De plus, la structure petit monde permet l’émergence d’une forte viralité, autrement dit d’une diffusion rapide d’information entre les nœuds. Le deuxième article fondateur concerne les réseaux sans échelle, caractérisés par quelques nœuds avec un grand nombre de voisins (des hubs). Cette propriété, là encore commune à de nombreux réseaux d’origine diverse, permet de résister à des pannes, sauf si des attaques visent les hubs.
En informatique, le Web et les réseaux sociaux sont emblématiques des réseaux sans échelle et petits mondes. Leur taille est devenue gigantesque et il a fallu organiser l’information, une des missions et devises de Google. L’auteur nous expose son point de vue sur quelques algorithmes du Web et des réseaux sociaux. Les moteurs de recherche proposent une liste de pages web pour répondre à une requête. Or ce choix n’est pas anodin et peut introduire des biais dans la collecte d’informations, voire la prise de décision. L’auteur détaille ainsi l’algorithme « PageRank », à l’origine du moteur de recherche de Google, basé sur la notion de pertinence d’une page. Les pages qui contiennent les mots-clés indiqués dans la requête sont ainsi classées par pertinence décroissante. Celle-ci est mesurée à l’aide du nombre de liens hypertextes qui pointent sur la page, en tenant compte de la pertinence des pages contenant ces liens. On comprend alors pourquoi la mesure de pertinence impacte directement le classement.
Quant aux réseaux sociaux, ils organisent les relations entre les utilisateurs et gèrent le fil d’actualité. Fabien Tarissan décortique aussi l’algorithme EdgeRank (maintenant NewsFeed) de FaceBook, qui choisit l’affichage en fonction d’un critère d’affinité et qui introduit donc un biais dans les échanges sur le réseau social. Ces bulles filtrantes, communes aux algorithmes sur le Web, entrent en résonance avec les chambres d’écho où les utilisateurs ont tendance à communiquer par affinités. L’auteur nous invite donc à garder un esprit critique et à bien mesurer l’objectivité de l’information acquise sur le Web.
Le livre pointe également plusieurs dérives sur la toile, liées notamment à l’utilisation des données personnelles collectées sur le réseau. Les traces que laissent les usagers sont exploitées à des fins commerciales ou politiques. De plus, la structure des réseaux favorise la viralité et aussi la propagation de fausses rumeurs, qui s’amplifient presque instantanément. Pour se protéger de ces dangers, l’auteur préconise d’en prendre conscience. Ce livre joue ainsi un rôle essentiel, grâce à des explications très pédagogiques et de nombreux exemples. C’est un outil indispensable pour approfondir les notions de sciences du numérique qui sont désormais enseignées au lycée.
L’Homme ou la machine ? Comment Internet tue la démocratie (et comment la sauver)
Jamie Bartlett (Éditions De Boeck Supérieur, juin 2019)
« […] nous imaginons que les démocraties meurent sous les coups d’hommes armés, mais elles peuvent également s’effondrer doucement par le biais de gouvernements élus qui suppriment lentement les garde-fous institutionnels avec le soutien de citoyens divisés et en colère. »
Quoi de plus actuel que cette pensée extraite du livre L’Homme ou la machine ? Jamie Bartlett propose ici d’explorer cette question au travers des bouleversements apportés, voire imposés par les nouvelles technologies, aujourd’hui omniprésentes dans la sphère publique et politique.
Ainsi il apporte au fil des pages une analyse clairement documentée et en profondeur des impacts des technologies du numérique sur nos vies quotidiennes et sur l’organisation globale de la société démocratique. Le livre décrit comment le monde du travail a été transformé ces dernières années par l’automatisation et la numérisation des tâches. Jamie Bartlett y aborde de nombreuses questions et dessine les trajectoires envisagées, les écueils qui nous attendent et les moyens de s’en prémunir. Plus globalement, il pose la question de l’émergence de la toute-puissance des géants du numérique, au détriment de celle des gouvernements. Il revient ainsi sur l’essor des cryptomonnaies et du mouvement global de la cryptoanarchie, sur le cas des élections américaines de 2016, sur le référendum britannique sur le Brexit, et également sur la naissance et l’essor du mouvement des Gilets Jaunes en France, propulsés entre autres par quelques modifications des algorithmes d’ordonnancement des fils d’actualité de Facebook.
En résumé, l’auteur nous livre ici un ouvrage accessible, à la fois terriblement inquiétant mais aussi empreint d’optimisme, proposant un ensemble de garde-fous et de solutions à mettre en œuvre pour réinventer la démocratie et la place de l’humain à l’ère numérique. Sa lecture est agréable et nécessaire, elle nous ouvre les yeux et nous incite à revoir notre rapport tant personnel que global aux nouvelles technologies pour éviter que l’humain n’en devienne la marchandise passive et malléable.
Algorithmes : la bombe à retardement
Cathy O’Neil, préface de Cédric Villani (Éditions Les Arènes, novembre 2018)
Cathy O’Neil se présente comme une amoureuse des mathématiques, qui enfant, en voiture, jouait avec les chiffres des plaques d’immatriculation… Une anecdote dans laquelle beaucoup se reconnaîtront ! Après des études en mathématiques et une brève carrière académique, elle bifurque et devient analyste au sein d’un fonds spéculatif. Elle est aux premières loges lorsqu’éclate la crise financière de 2008. En 2011, elle quitte la finance pour devenir data scientist dans une startup élaborant des modèles prédictifs d’achats. Peu à peu, elle réalise le potentiel destructeur de l’économie du Big Data. Riche de ses expériences, elle s’attache depuis à dénoncer ce scandale global et invisible : les méfaits de certains algorithmes. En 2016, elle publie le livre « Weapons of Math Destruction » (jeu de mot intraduisible), qui sort en France fin 2018 avec un certain retentissement dans les médias dits « intellectuels » (Le Monde, Libération, France Culture, etc.). La préface est écrite par le mathématicien et homme politique français Cédric Villani qui dit avoir incorporé les enseignements de ce livre dans son rapport sur l’Intelligence Artificielle (IA).
Ce livre très pédagogique et bien documenté fourmille d’exemples concrets et illustratifs. L’auteur y démystifie les algorithmes, elle montre qu’ils ne sont aucunement neutres, mais qu’ils servent une intention, souvent cachée, et qu’ils reposent sur des modèles empreints de nos préjugés. Elle dénonce la tendance de ceux qu’elle qualifie d’« Armes de Destruction Mathématiques » (ADM) à « punir les pauvres et à accroître les inégalités » et le danger qu’ils représentent pour la démocratie.
D’un exemple à l’autre, Cathy O’Neil pointe les « mécanismes d’une bombe » : les ADM s’appliquent à une grande échelle de la population et induisent des boucles de rétroaction néfastes qui ont tendance à amplifier les biais de l’algorithme. De plus, « elles se nourrissent les unes des autres ».
À la lecture de ce livre, la série britannique Black Mirror ne paraît plus si futuriste… Dans sa préface, Cédric Villani se veut rassurant : « Car une chose est certaine : pour mettre fin aux mauvais usages de l’IA, il ne faut pas les cacher ou se bercer de l’illusion qu’ils seraient réservés aux autres : il faut, au contraire en tirer parti et en parler. En parler aussi pour convaincre nos concitoyens que tous ces problèmes ont bien été identifiés et que les pouvoirs publics ne seront pas naïfs, mais vigilants ». Mais sommes-nous rassurés pour autant ?
Que pouvons-nous faire ? En conclusion, Cathy O’Neil nous livre quelques pistes. Elle suggère par exemple que les experts en données signent une sorte de serment d’Hippocrate, tout en admettant que « les nobles valeurs et l’autorégulation ne refrènent que les gens scrupuleux ». Il faut donc mettre en place un système de régulation qui prenne en compte les coûts cachés, qui soit basé sur une mesure d’impact et sur un audit des algorithmes. « Si l’on envisage les modèles mathématiques comme les moteurs de l’économie numérique, ce qu’ils sont à maints égards, le travail des auditeurs consiste alors à soulever le capot et à nous montrer comment ils fonctionnent. C’est une étape vitale, pour nous permettre d’équiper ces puissants moteurs d’un volant et de bons freins. » Elle clame qu’il faut remettre de la science dans la science des données. Les chercheurs se sont déjà emparés de ces questions, mais ils se heurtent souvent aux politiques de confidentialité des grands groupes. Si l’on voit bien comment faire en pratique, décider de le faire est une question politique. Même si les lois progressent — la loi Européenne de protection des données RGPD est un bon début par exemple, nombreux sont les scientifiques à penser que les politiques ne s’attaquent pas assez fort, pas assez vite au problème, et à ne pas savoir comment les y contraindre.
Il nous reste à partager nos inquiétudes, nos analyses, nos remèdes avec un public aussi large que possible. Dans cet objectif, le livre de Cathy O’Neil est un outil précieux qui donne matière à réfléchir, telle cette recommandation pour conclure : « Il convient en premier lieu de tempérer notre utopie technologique, cet espoir sans borne et injustifié dans ce que les algorithmes et la technologie pourraient accomplir. Avant d’en exiger mieux, nous devons d’abord admettre qu’ils ne peuvent pas tout. »
Newsletter
Le responsable de ce traitement est Inria. En saisissant votre adresse mail, vous consentez à recevoir chaque mois une sélection d'articles et à ce que vos données soient collectées et stockées comme décrit dans notre politique de confidentialité
Niveau de lecture
Aidez-nous à évaluer le niveau de lecture de ce document.
Votre choix a été pris en compte. Merci d'avoir estimé le niveau de ce document !