Data engineer appétence machine learning F/H chez AMILTONE
Intégré à nos équipes sur notre Factory ou chez nos clients, vous interviendrez sur un projet en tant que Data engineer.
Dans le cadre d’un projet de transformation Data ambitieux, nous recherchons un Ingénieur Data pour concevoir et structurer l’architecture d’un Data Warehouse et poser les bases des futurs projets d’intelligence artificielle.
Vous interviendrez sur l’ensemble de la chaîne de valeur de la donnée : collecte, structuration, gouvernance, qualité et préparation aux usages prédictifs.
Vos missions :
1. Architecture & Infrastructure Data
Définir et mettre en œuvre l’architecture du Data Warehouse (on-premise).
Concevoir et automatiser les pipelines ETL/ELT à partir des systèmes existants (ERP, TMS, WMS…).
Garantir la qualité, la traçabilité et la sécurité des données.
Participer à la mise en place d’un catalogue de données pour améliorer la gouvernance.
2. Préparation et Structuration pour l’IA
Concevoir des modèles de données adaptés aux futurs cas d’usage IA et prédictifs.
Structurer et enrichir les datasets nécessaires aux analyses (prévision ETA, détection d’anomalies…).
Collaborer avec les équipes de développement ERP pour intégrer les flux métiers.
3. Collaboration & Culture Data
Travailler en étroite collaboration avec les équipes IT, métiers, développement logiciel et direction.
Sensibiliser les équipes à la culture data-driven et à l’utilisation des outils analytiques.
Être un moteur dans la diffusion des bonnes pratiques Data au sein de l’entreprise.
4. Développement Machine Learning (à moyen terme)
Participer à la création de premiers modèles de Machine Learning en lien avec les métiers.
Contribuer à leur industrialisation (API, conteneurisation, intégration à l’ERP).
Compétences :
Excellente maîtrise de Python et SQL.
Solide expérience en construction de pipelines de données (ETL/ELT).
Connaissance d’un ou plusieurs outils d’orchestration : Airflow, dbt, Talend…
Bonnes bases en bases de données relationnelles et cloud : Snowflake, BigQuery, Synapse, PostgreSQL…
Compréhension des principes du Machine Learning (pandas, scikit-learn).
À l’aise dans un environnement DevOps (Git, CI/CD, Docker, APIs REST).