CNAV Retraite & Action sociale

★★★★★

Data scientist H/F

New 08 novembre Paris, 108-112 Avenue de Flandre, 75019 Paris, France CDI

Dans le cadre du développement du Big Data au sein de la Cnav, un poste de data scientist est à pourvoir dans le pôle Production statistiques nationales.
Ce pôle, composé de 6 statisticiens, a pour principales missions de :
- collecter, produire puis publier les statistiques de la branche vieillesse du régime général et assurer le suivi de la montée en charge de dispositifs législatifs

- participer à la maintenance du système d'information statistique (SNSP : Système National Statistiques Prestataires)

- mener des études et opérations avec le réseau de statisticiens des caisses régionales

- participer, avec les autres unités à la valorisation des études et travaux de la DSPR ainsi qu'aux réponses aux demandes internes et externes.

Le pôle doit investir fortement à court et moyen termes pour assurer la continuité de ses productions et pour les adapter dans un contexte d'évolutions majeures des systèmes d'information.
Il doit mettre en place des accès efficaces et juridiquement sécurisés à des jeux de données individuelles rapprochant des sources différentes (prestations retraite, carrières, action sociale …) afin de mener des opérations de datamining.

Vos principales missions seront de :
- participer à des opérations de datamining avec d'autres chargés d'études de la DSPR

- développer des modèles prédictifs depuis des bases de données distribuées sur un système de stockage Hadoop (avec une éventuelle mise en production) (exemples : travaux sur le non recours aux droits, fraude)

- développer et mettre en production des modules de data visualisation (basés par exemple sur les packages dash/plotly de python)

- participer à l'administration du serveur de data science de la plateforme Big Data et dans ce cadre assurer le lien avec les informaticiens de la Cnav (Miad de Tours).

Ce poste requiert une forte autonomie, une capacité à travailler en équipe, de bonnes qualités relationnelles (liens avec les autres personnes de la direction, avec les équipes informatiques …), une bonne maîtrise des communications orales et écrites (conduite de réunion, animation de groupe, réalisation de présentation), une capacité à prendre des initiatives et être force de proposition.
Diplômé(e) d'une école d'ingénieur ou Master 2 en informatique et statistiques.

Vous justifiez d'une première expérience dans le Big Data et la Data Science et vous connaissez idéalement les langages et outils suivants :
- python (dont les packages pyspark, mllib, pandas, numpy, sklearn, plotly, dash…)

- R
- scala

- spark (nécessaire pour exploiter des données distribuées sur un cluster Hadoop)

- notebook Jupyter ou IDE de type RStudio

- invite de commande

- HDFS

- HIVE


- ecosystème Hadoop (une expérience sur une plateforme Cloudera serait un plus).

Notre Direction « Statistiques, Prospective et Recherche » a son propre site, n'hésitez pas à le consulter : http://www.statistiques-recherches.cnav.fr/