Data Scientist - Télétravail - Algorithmes révolutionnaires F/H chez MTE
L’équipe et le télétravail
Vous intégrerez une équipe composée de 25 professionnels, dont 10 experts techniques, travaillant selon les méthodologies agiles (Shape Up/Kanban). L’innovation est au cœur de leurs projets.
L’équipe est en télétravail et se retrouve toutes les deux semaines à Paris, ainsi qu’une fois par trimestre pour des sessions de teambuilding.
Le produit : classification algorithmique avancée
Notre client, éditeur de logiciels spécialisé en data science appliquée aux industries, recherche un Data Scientist Senior pour développer une solution de classification algorithmique. Le poste nécessite de l’autonomie pour créer de la valeur ajoutée, tout en collaborant étroitement avec l’équipe. L’entreprise travaille sur des données spécifiques, structurées et fiables fournies par des experts métiers, permettant de construire des modèles robustes et centrés sur la valorisation des actifs industriels, avec un objectif précis d’évaluation des risques assurantiels.
Les modèles de machine learning utilisés croisent diverses dimensions (par exemple, tailles et matériaux des produits) et intègrent de la reconnaissance d’images pour des applications industrielles comme la détection et la classification de bâtiments via des images satellites.
Le rôle inclut également une transition vers des bases de données orientées graphes, avec une gestion des systèmes existants (legacy) pour préparer l’industrialisation des modèles de classification.
Les missions
Le Data Scientist Senior jouera un rôle clé pour le Chief Product Officer et le Product Manager Data en traduisant les besoins métier en modèles de data science pertinents et déployables. Le poste implique de développer des modèles avec un fort ancrage métier, en adoptant une approche pragmatique et simplifiée.
Le pragmatisme est essentiel : l’équipe souhaite éviter les approches purement théoriques et privilégie les solutions opérationnelles qui tiennent compte des contraintes et des systèmes existants.
Stack
Cloud : Google Cloud Platform (GCP)
Stockage : Google Cloud Storage
Orchestration : Airflow
Gestion de versions : Lake FS
MLOps : Vertex AI pour production et développement, Jupyter Notebooks et MLflow pour le suivi de modèle
Data Viz : Apache Superset pour la visualisation des données