« Big Data » : un Janus du 21ème siècle ?
Mais pourquoi faire ?
On pourrait imaginer qu’il y ait derrière tout cela une vision philanthropique mais on y croit peu. En fait, les domaines d’application sont quasiment infinis, eux aussi. Evidemment, c’est principalement le secteur commercial qui est le plus demandeur : et là, on entre dans le monde du « data marketing ». Imaginez que vous soyez capable d’identifier précisément le bon client pour la bonne publicité, que vous soyez capable de lui délivrer l’information sur votre produit au moment opportun (le moment où il est prêt à acheter) sans polluer l’ensemble des clients qui n’ont pas besoin de votre produit (et qui de toute manière ne l’achèteront pas), et bien c’est exactement cela le « data marketing ». Il y a un exemple de société (française, pour une fois !) qui est un leader dans le domaine : 1000mercis. Vous ne la connaissez probablement pas mais c’est elle qui vous connaît et qui, historiquement, a développé le système du « mailing » (l’envoi de courrier électronique publicitaire) ciblé : en gros, vous avez des préférences sur internet (que vous pouvez formaliser dans des « listes d’envies », par exemple) qui sont associées à votre boite mail ; cette société a développé des algorithmes qui permettent de cibler mieux vos besoins, vos envies en fonction du temps. Mieux encore, le concept a évolué vers la possibilité d’afficher des informations ciblées vous concernant dans les bannières publicitaires (ces trucs qui clignotent sur les bords de votre écran lorsque vous naviguez sur la toile) des sites internet que vous fréquentez : l’information à laquelle vous allez être le plus réceptif sera affichée en temps réel, au moment où vous y êtes le plus sensible. Mieux encore, cet espace publicitaire est revendu en temps réel aux enchères au plus offrant (les commerciaux des fabricants) : c’est le principe du « real time bidding » ; c’est la recherche de la rentabilité maximale pour les annonceurs. Prenons autre exemple d’utilisation du « data marketing »… Vous êtes client fidèle de votre magasin local d’électroménager : c’est-à-dire que vous avez accepté de faire une commande une fois avec votre « 06 » (ndlr, votre numéro de téléphone portable) ou, pire, vous avez la carte fidélité. Vous n’y allez que ponctuellement mais il se trouve qu’en ce moment vous regardez des modèles de vidéoprojecteurs sur internet parce que vous envisagez dans un avenir (pas si proche) de vous équiper. Lorsque vous passerez à proximité (physique, dans la rue) de votre magasin fétiche, alors même que vous aurez oublié votre souhait d’achat, vous recevrez un SMS vous annonçant une promotion en cours…sur les vidéoprojecteurs ! Effrayant, sans doute, efficace, certainement…
Le « Big Data », ce n’est pas que du « data marketing ». C’est aussi la possibilité de générer des analyses pour nos décideurs politiques. Par exemple, les très classiques sondages d’opinion (réalisés dans le but d’avoir une estimation des votes à venir) appartiennent encore aux techniques d’analyses « simples », à ce qu’on faisait « avant » (bon, OK, on continue encore un peu mais parce qu’ils parlent plus au grand public que les algorithmes). A l’heure actuelle, déjà, les candidats comptent sur les « Big Data » pour leur stratégie : ils analysent ainsi la carte électorale, incluent des pondérations en fonction des précédents votes, etc… Hillary Clinton, pour la campagne présidentielle américaine, aurait même investi près des 2/3 de son budget dans l’analyse de ces données ; on voit où ça l’a menée, alors qu’il suffisait d’un Donald Trump sachant manier Twitter© à la perfection (vous savez, ce réseau social émettant à l’époque de courts messages de 140 caractères, 280 aujourd’hui, sur lequel le Président américain adore donner son avis sur tout et sur rien).
On touche ici, en fait, à une des « limites » des analyses du « Big Data » : ce que veulent ceux qui les utilisent, ce n’est pas simplement une analyse, mais c’est surtout savoir prédire un comportement (d’achat, de vote, etc…) : c’est le fameux « profilage » qui le leur permet. La très prestigieuse revue scientifique PNAS vient de publier une étude de la – aussi – très prestigieuse université de Stanford : les chercheurs ont montré qu’ils étaient capables, à partir de la voiture garée devant chez vous (reconnue à partir d’images de Google Street View® : vous savez, ce programme qui permet une visite virtuelle des rues lorsque vous cherchez une adresse sur Google©…), de connaître votre niveau de revenu, votre origine ethnique, votre niveau de diplôme et…pour qui vous voteriez…
La prédiction semble donc une motivation extrêmement importante dans l’univers des « Big Data ». C’est pour ça qu’un des champs dans lequel il est le plus utilisé est la météorologie : énormément de données sont générées au fur et à mesure du temps (c’est le cas de le dire…), elles permettent de prédire le temps qu’il fera à t+1 voire à t+2. Mieux encore, si la prédiction se confirme, le modèle se renforce, si elle s’infirme…il se renforce aussi : on est réellement dans le « machine learning ». Cela dit, si en météorologie, l’échec du modèle de prédiction est toléré, il devient moins acceptable pour un candidat à l’élection présidentielle de la première puissance économique mondiale. Tout dépend de l’enjeu et des données initiales que vous intégrez dans le modèle…