La donnée encadrée

Depuis la mise en place du RGPD, le Règlement général de la protection des données, les internautes et consommateurs disposent de droits pour mieux protéger leur identité en ligne. En France, la CNIL guide les entreprises vers une meilleure conformité au règlement, elle encadre la collecte de données en plusieurs points :

  • Les entreprises ne collectent que les données nécessaires,
  • La collecte se fait de manière transparente,
  • Le traitement des données se fait dans leurs conditions d’utilisation,
  • Les utilisateurs retiennent le droit de modifier ou de supprimer leurs données
  • L’entreprise doit les stocker de manière sécurisée.

Mieux comprendre les biais cognitifs pour s’en défaire

L’autre enjeu fort est celui de la propagation des biais cognitifs. On identifie trois facteurs principaux : les humains, la data et l’algorithme. Nous le savons, les humains sont bourrés de biais, qui à leur tour sont représentés dans la data. Puisque les algorithmes se nourrissent de la donnée générée par des humains, ils reproduisent à leur tour ces biais, sur une plus grande échelle et à plus haute vitesse. C’est comme cela qu’un poste se retrouve proposé à une majorité d’hommes ou que la reconnaissance faciale peut poser problème si elle n’a été testée que sur des profils occidentaux.

En somme, l’intelligence artificielle tire ses propres conclusions des données desquelles elle se nourrit. L’avenir d’un monde plus inclusif et mixte repose donc sur une intelligence artificielle capable de repérer les biais et d’elle-même les corriger. Cela avec l’inclusion de plus de femmes et de personnes issues de la diversité dans les métiers de la tech. Où je veux en venir? Si nous aspirons à l’égalité, les données elles aussi doivent être collectées de manière équitable, exhaustive et représentative du monde par-delà nos écrans.

Pour que l’utilisation de l’intelligence artificielle se fasse plus éthique et respectueuse de chacun, l’éducation se doit d’intégrer une meilleure connaissance des principes qui gouvernent l’essor du machine learning et de l’algorithmie. Jérôme Pesenti, Vice-President of AI at Facebook le dit lui-même : «une bonne IA est une IA que tout le monde peut améliorer et de laquelle chacun peut bénéficier.» Mais cela reste impossible sans une connaissance généralisée et une population qui serait équipée pour user des innovations technologiques avec plus de discernement.

De Goliath au Penseur

Certains géants du numérique, grands brasseurs de données, ont décidé de prendre le taureau par les cornes. Au moment où les entreprises tendent vers la collecte de larges volumes de data, le chef de l’intelligence artificielle chez Google, Jeff Dean, affirme qu’il est possible de faire demi-tour. «Nous voulons construire des systèmes qui peuvent généraliser une nouvelle tâche. Être capable d’accomplir des choses avec moins de data et moins de calculs sera intéressant et très important,» affirmait-il le mois dernier dans Wired.

Autre mastodonte du web, Facebook est comme nous le savons tous un énorme consommateur de data. Sur Facebook, cela se fait sans achat de données puisqu’elles sont là sous le clavier des analystes. En 2018, Jérôme Présenti lors d’une conférence évoquait l’analyse des données pour optimiser l’expérience sur la plateforme. Selon lui, il serait question de nourrir différemment la technologie, avec des groupements spécifiques de données déjà disponibles sur les plateformes publiques. L’idée serait d’utiliser la data à l’état sauvage pour que le système s’améliore de lui-même, une approche qui pourrait bien nous débarrasser de certains biais cognitifs. Une intelligence artificielle sophistiquée pourrait notamment améliorer la modération du discours sur les réseaux sociaux.

Cette question implique également de revoir le but ultime de l’usage de l’IA. Car pris la main dans le sac, les géants du web, ont montré à quel point ils sont capables de la monétiser ou ont peu de scrupules. Suite à des polémiques comme celle de 2018 causée par une collaboration avec l’armée américaine, Google déclare avoir revu leurs principes moraux au cas par cas. Par exemple, ils accepteraient tout de même de collaborer avec l’armée, si c’est pour améliorer la sécurité des garde-côtes. Ces déclarations restent tout de même à prendre avec beaucoup de discernement.

La data for good

Dans son discours Keynote au titre ambitieux, «Comment le machine learning peut résoudre le changement climatique», le chef de l’IA chez Google, John Platt, dessine une image partagée du pouvoir salvateur de la data. Se concentrant sur les sources d’énergies, il a identifié la fusion comme une solution inépuisable à l’avenir, dans l’immédiat il s’attaque à la réduction de carbone. Puisqu’il est peu réaliste d’arrêter l’infrastructure d’énergie d’un réseau du jour au lendemain, il est plus judicieux de viser la réduction progressive d’émissions de gaz carbone. Que vient faire la data tout dans tout cela?

Aujourd’hui il existe des réseaux basés sur l’énergie renouvelable. Mais saviez-vous que pour assurer la totalité de la couverture énergétique, de très larges quantités doivent être produites? Ce qui se révèle extrêmement coûteux et difficile à reproduire à grande échelle. Platt explique que plutôt que de viser le stock en cas de demande, il serait plus malin d’arriver à identifier le moment de besoin d’énergie et y répondre. L’analyse de données et le machine learning peuvent rendre cela possible en prédisant le moment même où le réseau tombera à 0, ainsi l’énergie ne sera provisionnée que lorsqu’il est nécessaire. D’autres cas possibles sont la détection de fuites de méthane ou la prédiction plus exacte d’un risque d’inondation, un problème qui touche 250 millions de personnes par an. En termes d’émissions carbone, on peut aussi penser à réduire le besoin de se déplacer, notamment dans le cadre du travail, l’essor de la réalité virtuelle et de la téléprésence peut contribuer à cela.

Circonspect, Platt rappelle que même si la technologie propose des solutions, elle seule ne peut résoudre cet enjeu, c’est par l’accumulation de solutions que nous arriverons à la résolution d’un problème. La récolte de data peut donc avoir des bienfaits, à condition qu’elle respecte un nombre de principes éthiques. Les systèmes pouvant appendre de manière plus naturelle, se libérant ainsi de la nécessité d’avoir des sets de data volumineux.

Si le machine learning peut prédire les évènements liés au changement climatique, à rapidement apporter plus de diversité dans les métiers à grande échelle ou encore débarrasser les plateformes des discours haineux pourquoi s’y opposer? Le traitement de la data pose la nécessité d’un changement de paradigme, pour contrer la diabolisation de ce formidable outil, la transparence est de mise. Enfin, devrions envisager différemment la donnée? Comme nos organes, pourrions-nous un jour en faire don à la science? Après tout, sans nous, la donnée n’aurait jamais existé.

Maï Trébuil
Maï Trébuil
Digital Nomade
Fascinée par la relation entre l'humain et la tech, je décrypte les tendances innovantes qui tentent de répondre aux enjeux sociétaux d'aujourd'hui et de demain. Éternelle curieuse, je m'inspire de mes déambulations de digital nomade, avec ou sans connexion.