Le Data Scientist est en charge de la gestion et de l’analyse pointue de données massives « big data » d’une entreprise. Expert dans la maîtrise et l’interprétation des données, il détermine à partir de sources de données multiples et dispersées, des modèles de données permettant la mise en place d’analyses pour répondre à des besoins business et/ou métiers. Là où le Data Analyst est dans l’exploitation de ses analyses de données, le Data Scientist est beaucoup plus dans la conception de modèles de données, les algorithmes, et les mathématiques appliquées. Il travaille généralement dans l’équipe du Chief Data Officer.
Les principales missions du Data Scientist :
Identification des besoins et de la problématique des directions métiers avec les Data analyst
Participation à la modélisation statistique des données et aux tests
Définition des solutions de stockage et de structuration des données
Sourcer et rassembler l’ensemble des sources de données structurées ou non structurées nécessaires à l’analyse et pertinentes
Organiser, étudier et synthétiser ces sources de données sous forme de résultats exploitables
Responsabilité de l’assurance qualité du modèle analytique
Définition des critères de contrôle du modèle
Développement de bonnes pratiques analytiques (modèles, standards, outils)
Gestion du réservoir de projets analytiques et suivi de l’impact des analyses sur l’activité
Concevoir et entretenir des « entrepôts de données » (datawarehouse)
Suivi de la veille de marché
Quelles sont les compétences & les soft skills d’un Data Scientist ?
Forte appétence pour les technologies et les outils informatiques des bases de données
Maîtrise des techniques du data mining et des statistiques
Savoir-faire dans le secteur d’application des données analysées
Connaissances en maths, en statistiques, en modélisation, en analyse de données et en informatique
Maîtrise d’Hadoop, Java, MapReduce, Bigtable ou encore NoSQL
Quelles études pour devenir Data Scientist ?
Être diplômé d’une formation Bac +5 ou 6 en École spécialisée dans les statistiques telles que Ensae, Paris Tech, Ensai, Isup ou Polytech’Lille ou d’Ingénieurs telles que Centrale, Polytechnique, Normale Sup, Télécom Paristech ou Cnam. Il existe également des formations spécialisées en Big Data au niveau Bac +6.