Le data scientist, un "mouton à 5 pattes" au coeur des données

02 avril 2014 à 15h36
0
Selon le référentiel de l'Apec, le data scientist a pour mission d'extraire de la connaissance à partir des données de l'entreprise. Rare et cher, ce profil reste encore flou. Mais il est toujours plus demandé par les organisations souhaitant tirer profit de leurs données. Eclairage lors du salon Big Data de Paris.

0118000007275430-photo-data-scientist.jpg
Vu de loin, le data scientist est la personne à qui une entreprise va confier ses données, variées et volumineuses (big data), et qui devra se débrouiller pour en tirer de la valeur, en ayant en tête les impératifs côté IT et côté business. Ce profil, encore en pleine définition, est né le jour où les organisations ont pris conscience qu'elles ne devaient plus simplement stocker leurs données pour des raisons légales, ayant tout intérêt à les exploiter de façon intelligente, et en quasi-temps réel.

Quand La Poste a démarré son projet big data en 2009, il n'y avait pas de profil disponible « sur l'étagère », se souvient Denis Weiss, DSI Industrie du groupe. « Nous sommes partis avec des profils ouverts et avons lancé notre projet en mode agile car nous apprenions tout en faisant », indique-t-il. L'enjeu de La Poste était de récolter et d'analyser toutes les informations des enveloppes et des colis lorsqu'ils sont scannés. Sur ces centaines de millions d'informations quotidiennes, celles relatives à un problème seulement sont étudiées.

Cela permet maintenant à La Poste de détecter les endroits où un acheminement s'est mal déroulé. Denis Weiss explique que « la transformation de l'essai technique en succès business a été possible grâce à l'appui des informaticiens qui ont permis une montée en compétence. Mais un projet big data n'est pas simple à mener car il faut d'abord convaincre les décideurs d'investir dessus. Ensuite il faut trouver les bons profils ».

Une variété de profils...

On dit qu'un tiers de data scientists sont, à l'origine, des statisticiens. Un autre tiers, sont des informaticiens. Et le dernier, issus des métiers. Jérémy Harroch, fondateur du cabinet de data scientists Quantmetry, voit trois profils-type aujourd'hui : le « super junior », issu d'un cursus prestigieux, passionné par ce qu'il fait mais assez rare, l'expérimenté, qui peut être un ancien trader algorithmique ou un statisticien, difficile à trouver, et le senior, qui a moins de maîtrise technique mais a une vision stratégique.

Pour cristalliser la profession et répondre à la pénurie, des formations émergent doucement. La première émane de l'école d'ingénieurs Télécom ParisTech qui a lancé un master en ce sens l'année dernière. Stéphan Clemençon, le directeur de ce cursus big data explique qu'il s'agit de former les étudiants via différents prismes, tels que l'économie, le marketing ou le social. « Ils n'ont pas qu'une formation technique, ils doivent être capables d'avoir le recul suffisant pour pouvoir évoluer, car ce secteur est en mutation », souligne-t-il.

... et autant de compétences

Les trois axes de la formation visent à développer des compétences dans le domaine de la gestion des données, enrichir les compétences dans l'analyse statistique des big data et acquérir la maîtrise des technologies et des algorithmes permettant d'exploiter ces données. En aval, ce qui est souvent demandé par les entreprises tourne de plus en plus autour de la maîtrise des briques NoSql et du machine learning.

01E0000007275464-photo-big-data.jpg
« La demande pour ces profils est flagrante mais pour autant, il y a une vraie réflexion des entreprises en amont avant de lancer le processus de recrutement », souligne Emmanuel Stanislas, fondateur du cabinet de recrutement Clémentine. D'ajouter que finalement, « elles ne recrutent pas non plus des couteaux suisses et préfèrent des équipes pluridisciplinaires ». Néanmoins, « il est demandé à ces data scientists, en plus d'être experts techniques, de comprendre leur contexte de travail et d'être câblés sur les enjeux business ».

Plus précisément, si le socle commun des data scientists reste la statistique, ils doivent être à l'aise avec le data mining (extraction de connaissances à partir d'une base de données), les bases de données et le métier d'application, principalement le marketing dans les faits. Une fois en poste, le data scientist exécute sa mission en trois grandes étapes récurrentes : comprendre la problématique métier et mettre en équation l'enjeu business, rapatrier les données pertinentes, internes et externes (qui sont réparties à 50/50 en moyenne), et enfin analyser puis restituer les résultats afin de les intégrer dans le système d'information.

Deux approches différentes

A l'échelle du projet big data, les opérations peuvent être conçues de deux façons, si elles sont confiées à l'IT ou aux métiers. Damien Cudel, responsable de plateforme applicative chez Microsoft France, observe que dans le premier cas, l'approche sera proche du reporting avec un tableau de bord, elle sera focalisée sur les moyens avec une aversion au risque car il en va de la pérennité du DSI. Dans le second cas, les métiers vont monter un « data lab », seront plus agiles et focalisés sur la production rapide de résultats. D'illustrer qu'« une banque cliente avait installé 200 machines pour tester un concept sans en avertir l'IT ».

Les deux approches restent compatibles avec le data scientist qui, on le rappelle, peut être lui aussi issu des métiers, ou bien ingénieur de formation. Pour Jérémy Harroch, le duo ingénieur mathématicien est le couple gagnant. Ces deux profils au « parcours réussi » et aux compétences adéquates seront de plus en plus reconnus et demandé. Pour Google, c'est le métier d'avenir. Et cela s'en ressent sur le niveau de salaire, 20% plus élevé que la moyenne d'après Emmanuel Stanislas, allant de 50 à 75 000 euros brut, de junior à senior.

Pour autant, Quantmetry considère que cet effet d'aubaine devrait se tasser d'ici trois à quatre ans. « Aujourd'hui il y a une vague big data avec de plus en plus de juniors mais pas assez de personnes pour les manager », note Jérémy Harroch. Il prévoit qu'« un affrontement pas très sain va se produire entre les profils premium et ceux moins qualifiés ce qui aura un effet négatif sur le niveau de rémunération ». En réalité, le métier de data scientist pourrait être éclaté en plusieurs spécialisations. Et gagner en lisibilité.


A lire également :





Modifié le 01/06/2018 à 15h36
Soyez toujours courtois dans vos commentaires.
Respectez le réglement de la communauté.
0
0
Haut de page