Big data : dangers, enjeux et impact
Vous avez déjà probablement entendu le terme « Big Data ». Ce terme est souvent comparé à “Big Brother” car toutes nos données sont enregistrées quelque part ce qui créée un sentiment de crainte. Est ce qu’on est en train de basculer dans une société hyper surveillée ? Et bien avant de s’alarmer, n’oublions pas quand même les possibilités qu’offre cette collecte de donnée.
Jusqu’ici, on n’utilisait que de petites quantités de données, on cherchait à les interpréter afin de comprendre le monde. On a à présent infiniment plus de données, plus que jamais auparavant. Et quand on a une telle quantité d’informations, on peut accomplir des choses inimaginables. Le seul moyen qu’on aura pour faire face aux enjeux mondiaux : nourrir l’humanité, l’approvisionner en médicaments, en énergie, en électricité, et éviter d’être rôti par le réchauffement climatique, ce sera probablement grâce à une utilisation efficace des données.
Il faut se rappeler à quoi ressemblait physiquement une information dans le passé. Gravures, hiéroglyphes, papyrus, livres … c’est ainsi que les sociétés stockaient et transmettaient l’information. On stocke toujours l’information, mais en quantité beaucoup plus grande. On peut dire que les données sont passées d’un stock à un flux, de statique à fluide et dynamique. Les informations sont plus faciles à chercher, plus faciles à copier, à partager, plus faciles à traiter. On peut aussi réutiliser ces informations à des fins auxquelles on n’avait pas du tout pensé au moment où on les a collectées.
Prenez l’exemple des données de localisation. Si on avait voulu savoir au 16e siècle où un type se trouvait, on aurait dû le suivre tout le temps, sans doute avec une plume et un encrier pour noter ses différentes positions. Regardez à quoi ça ressemble aujourd’hui ! Vous savez que quelque part, probablement dans la base de données de votre opérateur, les informations sur votre localisation sont enregistrées à chaque instant. Si vous avez un téléphone portable, que ce dernier soit muni d’un GPS ou non, il stocke vos informations. C’est ainsi que la localisation a été mise en “données”. Prenons maintenant l’exemple de votre posture, la manière dont vous êtes assis en ce moment, votre posture à vous, la vôtre. Elles sont toutes différentes. Si on posait, disons, 100 capteurs sur chacun de vos sièges, on pourrait créer un index unique qui vous serait propre, comme une empreinte unique. Mais à quoi ça pourrait bien servir ? Des chercheurs à Tokyo utilisent ça comme un possible système antivol dans les voitures. Si un voleur s’assied derrière le volant et tente de démarrer, la voiture reconnaît qu’un conducteur non approuvé est derrière le volant et stoppe simplement le moteur, sauf si vous entrez un mot de passe qui dit que vous avez l’autorisation de conduire la voiture.
Le Big Data serait même capable de prédire l’avenir ! Oui oui ! En rassemblant des données liées au comportement d’un conducteur, on pourrait peut-être identifier des signes révélateurs qui prédisent qu’un accident va se produire dans les 5 prochaines secondes. C’est ainsi qu’on sera parvenu à mettre en données la fatigue du conducteur. La voiture sent qu’une personne s’affale ou ferme les yeux, et réagit en faisant vibrer le volant, en klaxonnant à l’intérieur. C’est le genre de choses qui deviennent possibles quand on met en données certains aspects du quotidien.
Une des applications les plus impressionnantes des Big Data concerne le domaine de l’apprentissage automatique. L’idée générale c’est que plutôt que de dire à l’ordinateur ce qu’il a à faire, on va juste lui donner plein d’informations. Retournons aux origines de l’apprentissage automatique. En 1950, un informaticien de chez IBM, Arthur Samuel, était amateur du jeu de Dames. Il a donc créé un programme informatique afin de jouer contre l’ordinateur. Il gagnait toujours parce que l’ordinateur ne connaissait rien d’autre que les coups légaux. Arthur Samuel avait des notions de stratégie. Puis Arthur Samuel a laissé l’ordinateur jouer contre lui-même. Plus il joue contre lui-même, plus il collecte de données. Plus il collecte de données, plus il augmente la précision de ses prédictions. Et quand Samuel a rejoué contre l’ordinateur, il a perdu à chaque fois.
Comment croyez-vous que des voitures roulent toutes seules ? Avant, on essayait d’expliquer clairement et ouvertement à l’ordinateur comment il devait conduire. Aujourd’hui, on lui dit : « Voici tout plein de données sur le véhicule, débrouille toi à comprendre que le feu est rouge et non vert, que cela veut dire que tu dois t’arrêter, et non pas continuer. » L’apprentissage automatique est à la base de nombreux outils en ligne : les moteurs de recherche, l’algorithme de personnalisation d’Amazon, la traduction par ordinateur, ou encore la reconnaissance vocale.
Les chercheurs se sont récemment penchés sur la question des biopsies de cellules cancéreuses. Ils ont demandé à des ordinateurs d’analyser les données et le taux de survie pour déterminer quelles cellules sont réellement cancéreuses. Sans surprise, en fournissant assez de données à l’algorithme, l’ordinateur était capable d’identifier les 12 signes caractéristiques qui prédisaient au mieux que des cellules tumorales mammaires étaient en effet cancéreuses. Le truc, c’est que les médecins n’en connaissaient que 9. Trois des signes ont été identifiés par l’ordinateur sans que quelqu’un n’ait besoin de faire de recherche dessus. Mais il y a aussi une face sombre des Big Data.
Le premier, c’est l’idée que l’on puisse être puni à cause de prédictions, que la police utilise les Big Data un peu comme dans « Minority Report ». On appelle ça la prévision policière ou la criminologie algorithmique. L’idée est que, si on prend beaucoup de données par exemple la localisation des crimes commis, on sait où envoyer les patrouilles. C’est logique. Mais le problème, c’est qu’on ne s’arrêtera pas aux données de localisation, on va aller jusqu’au niveau de l’individu. Pourquoi ne pas utiliser les données fournies par vos bulletins scolaires ? Peut-être devrions-nous utiliser le fait que les gens ont un emploi ou non, leur comportement sur Internet, s’ils sont debout tard dans la nuit. On peut avoir des algorithmes qui pourraient prédire ce que nous sommes sur le point de faire. Avec les Big Data, le défi sera de préserver le libre arbitre, les choix moraux, le consentement et la capacité d’agir de l’homme. Et il y a un autre problème : les Big Data vont nous voler notre travail.
À l’aide des algorithmes, elles vont entrer en concurrence avec les chercheurs, avec les travailleurs intellectuels du 21e siècle. De la même manière que l’automatisation des lignes de montage a concurrencé le travail des ouvriers, au 20e siècle. Imaginez un technicien de laboratoire qui examine à l’aide d’un microscope la biopsie d’une tumeur pour déterminer si elle est cancéreuse. Cette personne a fait des études. Et pourtant cette personne, ainsi qu’un pan entier de professionnels similaires, va voir son travail radicalement transformé, voire carrément éliminé. On aime pourtant se dire que sur le long terme, la technologie crée des emplois, après une courte période temporaire de destruction d’emplois. C’est vrai pour la période de référence dans laquelle nous vivons, la Révolution industrielle, car c’est précisément ce qui s’est passé.
Mais on oublie un élément dans cette analyse. Il y a des catégories d’emplois qui sont simplement éliminés et ne sont pas remplacés. La Révolution industrielle n’a pas été bonne pour les chevaux. Il va donc falloir être prudent, prendre les Big Data et les ajuster à nos besoins, nos besoins humains fondamentaux. Nous devons maîtriser cette technologie et non devenir ses esclaves. L’ère des Big Data vient tout juste de commencer et nous ne sommes pas très bons pour manipuler toutes ces données. Ce n’est pas juste un problème pour la NSA. Les entreprises collectent aussi beaucoup de données, et elles en abusent aussi. Il va falloir faire mieux, et cela va prendre du temps. C’est un peu comme le défi de l’homme préhistorique quand il a inventé le feu. C’est un outil, mais c’est un outil qui, si nous ne sommes pas prudents, va nous brûler. Les Big Data vont transformer nos modes de vie, de travail et de pensée. Mais comme toujours, ce ne sera ni noir ni blanc.
[contenus_similaires]- Auteurs
Le problème qui est posé, aussi, concerne l’utilisation des données dans l’exploitation publicitaire, ce qui est le plus évident sur Internet. J’ai lu un livre il y a peu de temps, “A quoi rêvent les algorithmes”, de Dominique Cardon, qui explique très bien ce qui se passe dans toutes ces pages, ces scripts, ces cookies qu’on stockent et qu’on rempli de nos comportements, nos préférences, à notre insu… La manière qu’ont ces robots d’organiser l’information, de hiérarchiser le web, de tirer des conclusions pour rendre floue la frontière entre un sens et l’autre du transfert d’information… apprennent-ils de nous, ou bien organisons-nous notre vie internaute selon la façon dont elles nous le suggère ?
La publicité comportementale et les réseaux sociaux, voilà un côté bien sombre aussi de ces big data.
Les moteurs de recommandation sont évidemment au coeur du big data. Après, je ne suis pas étonné qu’ils existent. C’est plutôt logique de cibler des consommateurs en fonction de leurs préférences. C’est redoutablement efficace et si ça n’existait pas, je l’inventerais ^^. Maintenant, il est vrai qu’on peut se sentir espionner mais bon, croire qu’on peut surfer sur internet sans être “traqué”, c’est utopique ou alors faut s’intéresser au monde du Dark Web. Il faut juste réussir, je pense, à surfer en étant responsable et ne pas tomber dans tous les pièges. Internet est un endroit public, il faut donc ne pas y délivrer son jardin secret.