Écrit par Pierre-André Fortin et Thierry Vallaud le 5 octobre 2020
De la polysémie à la perte de sens…
Pierre-André Fortin (à droite) et Thierry Vallaud (à gauche)
En avril dernier, à travers une étude (3) sur les publicités postées sur LinkedIn répondant au terme Datascientist, nous avons constaté la forte diversité que recouvre cette terminologie. 
 ;

 ;
Pour la petite histoire, il s’agit d’une étude où nous avons utilisé le terme « data scientist » comme critère de recherche et l’Ile de France comme zone géographique – le moteur de recherche de LinkedIn nous a donné 674 références comme résultat…& #xD ;
A y regarder de plus près, le Statisticien côtoie le Data Engineer et le React Developer… quelle relation ? La donnée sous toutes ses formes, de l’infra à sa restitution en passant par l’analyse, … plus surprenant, la disparition du terme Datamining et la faible représentation des statistiques d’occurrence / statisticiens en seulement 4 annonces … et un ratio équivalent entre data analyst et data scientist … Nous ne parlons que des titres de poste ici.

 ;
Bref, une évolution très significative de la nomenclature…

 ;
Autant que nous puissions tirer de cette observation…

 ;
En définitive cette imprécision est génératrice… d’incompréhension et de chaos…
Qu’il n’y a pas un Datascientist mais des Datascientists, chacun avec une spécialité… après tout, parler de Data Scientist pour désigner un métier, c’est comme parler de Financier ou de Marketer : c’est plutôt une classification générique et un département dans l’entreprise. La direction financière selon les groupes sera composée d’un comptable, d’un contrôleur de gestion, d’un trésorier ou d’un responsable administratif… 4 métiers très différents comme la gestion de produit et le CRM…. Ou comme on l’observe dans certaines organisations, les plus matures, les départements data où : ingénieur data – analyste data, ingénieur ML et un autre architecte data…

 ;
Aussi, dans un univers qui excelle dans l’ultra-expertise, l’appellation générique de Datascientist est, d’une part, extrêmement déroutante et, parce qu’catégorielle, ne permet pas d’appréhender véritablement le périmètre d’un métier, tout comme celui d’informaticien. ne permet pas de faire la différence entre un administrateur réseau et un développeur…

 ;
Une Offre de formation toujours plus large… CF Liste en fin d’article.
Le plus à craindre est, in fine, une perte d’orientation… A chacun sa vérité et comprendre qui peut… Revenons au terme Commissaire aux Comptes ou Dataminer, ces deux titres désignent des fonctions bien précises, l’une dans la finance et l’autre d’autres dans le monde des données.
 ;

 ;
Cette hésitation sur le nom est perceptible lors du recrutement, où finalement une partie du résumé portera sur ce que recouvre la terminologie Datascientist : algorithme, programmation, analyse de données, visualisation de données et infrastructure informatique.
Cette terminologie Datascientist ne peut se suffire à elle-même… Certains y verront peut-être l’expression d’âmes tristes ou délicates, pourtant sous-jacentes à l’avenir d’une profession, de son industrie et de son impact sur l’organisation. 
 ;

 ;
« Quand j’utilise un mot, dit Humpty Dumpty […], il signifie exactement ce que j’aime lui faire signifier. Rien de moins, rien de plus. « La question », répondit Alice, « est de savoir s’il vous est possible de faire en sorte qu’un mot signifie différentes choses. « La question », répondit Humpty Dumpty, « est de savoir qui dominera. Et c’est tout. 🇧🇷
A chacun son métier, aux ingénieurs big data, data architect, pour construire les infrastructures, aux data managers pour gérer et définir ces données, aux data analysts pour les analyser et aux data visualizer pour les restituer…& #xD ;
On trouvera certainement ici et là des BI, qui prendront parfois en charge certains projets.
Un marché qui reste porteur… mais… !

 ;
Si jeunesse savait… vieillesse pourrait !
Même si parfois la différenciation est ténue sur les publicités, on voit émerger petit à petit de nouveaux titres et ça tombe bien…

 ;
• Chief Data Officer : le Chief Data Officer est responsable de la gestion de la gouvernance des données au sein de l’entreprise pour permettre une utilisation optimale. 
 ;
Si complexes et si simple…
• Big Data Architect : configure toute l’infrastructure technique nécessaire pour collecter et traiter un grand volume de données brutes
• Business Intelligence Manager : configure les outils et les technologies qui transforment les données en informations utilisables pour et par l’entreprise. 
 ;
• Master Data Manager : gère le référentiel de données critiques de l’entreprise. Il garantit sa qualité et son intégrité.
• Délégué à la protection des données : est responsable de la protection des données au sein d’une organisation. Sa mission est de conseiller votre organisation et de contrôler l’application des textes légaux et des règles internes en matière de données personnelles.
• Data Miner : le rôle du Data Miner est d’extraire les données à l’aide de techniques statistiques et algorithmiques afin d’identifier les données pertinentes pour l’entreprise.
 ;
• Data Analyst : spécialiste métier, le data analyst étudie les données disponibles pour en tirer des insights business utiles à la gestion des affaires et des activités. 
 ;
• Ingénieur Big Data : l’ingénieur Big Data développe et implémente les outils et l’infrastructure nécessaires aux équipes de Data Science pour analyser les données.
 ;
• Ingénieur Machine Learning : Développe et met en production (industrialisation) des modèles d’intelligence artificielle. 
 ;

 ;
Et le data scientist ? 
 ;
• Selon les organismes, on retrouvera dans ce terme tout ou partie des composantes des métiers ci-dessus…
Nous avions une trentaine de formations en 2012 dans notre dernier article sur le sujet, pour la plupart héritières des secteurs de la statistique et des mathématiques, aujourd’hui l’offre de formation est bien plus large ! Depuis on en compte un peu plus de 150 !!!

 ;
S’il y a eu beaucoup de nouvelles formations créées ces dernières années, nous avons aussi eu un important mouvement de convergence. 
 ;

 ;
En toute logique, les formations en informatique portant sur le traitement des données, l’intelligence artificielle, le HPC… se retrouvent désormais dans la grande famille de la science des données avec raison… D’ici là, nombre de vos formations ont ouvert leurs cours aux éléments statistiques et mathématiques.. .D’autres formations, comme certaines formations en Recherche Opérationnelle, ont également orienté votre formation vers ce métier…

 ;
Liste des formations “data” en 2020
A propos des auteurs
Plus surprenant peut-être, une formation en Datascience destinée aux non-scientifiques – Ces dernières années, ce type de cours est apparu dans les écoles de commerce… – si la Finance a déjà pris en compte la dimension data depuis longtemps, et pour de bonnes raisons raisons, c’est une véritable révolution pour d’autres métiers, dans la vente, le marketing, la Supply Chain… On assiste à la naissance de profils hybrides destinés à accompagner les entreprises dans l’exercice de leurs activités… héritiers d’une certaine maîtrise de la gestion commerciale.. L’entreprise hésite souvent dans votre désignation : analyste d’affaires, data analyst, data strategist parfois…

 ;
En formation initiale, l’offre de formation professionnelle a littéralement explosé… Il faut y voir la matérialisation d’un important besoin de main d’oeuvre mais aussi l’opportunité business que peut représenter ce nouvel Eldorado Data de la formation ! 
 ;