Profile Picture

Data Scientist & ML Engineer

Modeling, Architecture de solutions data et déploiement de modèles ML en production

Projets Data Science & ML

Vision par ordinateur en temps réel

Lead technique sur le développement d'un produit ML complet pour la détection d'objets et la segmentation sémantique en temps réel à la périphérie. Architecture de solution data avec DynamoDB et inférence à la périphérie dans une architecture hexagonale.

DINOV2 RT-DETR FASTER-RCNN Edge Computing

Détection de changements en streaming

Point focal produit sur le périmètre data. Architecture de solution avec Azure Functions durables, ingestion incrémentale et TimescaleDB. Création d'un modèle de correction de points de changement en streaming avec techniques avancées.

Azure ML Autoencoder Seasonal Decomposition Exponential Smoothing

Détection d'anomalies sur séries temporelles

Point focal produit sur le périmètre data pour le cycle 2. Architecture de solution utilisant Databricks pour l'inférence par lots, Azure Data Factory et base de données PostgreSQL. Création d'un modèle de détection d'anomalies sur séries temporelles.

Databricks Bayesian OCPD Kats Azure Data Factory

MLOps & Cycle de vie des modèles

Mise en place de pipelines d'entraînement versionnés et déployés en continu sur AWS Sagemaker et Azure ML. Intégration de multiples frameworks (TensorFlow, PyTorch) et optimisation avec ONNX pour le déploiement en production.

AWS Sagemaker Azure ML MLOps CI/CD

Compétences Techniques

Langages & Frameworks

  • Python (NumPy, Pandas, Scikit-learn)
  • TypeScript / JavaScript
  • SQL & NoSQL (DynamoDB, PostgreSQL)
  • Terraform, Infrastructure as Code

Machine Learning & Deep Learning

  • TensorFlow & PyTorch
  • ONNX (optimisation de modèles)
  • Computer Vision (FASTER-RCNN, RT-DETR, DINOV2)
  • Time Series Analysis (Sktime, Kats)
  • Anomaly Detection & Change Point Detection

Cloud & Architecture

  • AWS (Sagemaker, Lambda, DynamoDB)
  • Azure (Functions, ML, Data Factory, Databricks)
  • Architecture Hexagonale & Serverless
  • Batch & Streaming Inference
  • Edge Computing & Optimisation

Leadership & Gestion

  • Leadership technique & Product Focal Point
  • Gestion de projet & Product Scoping
  • Mentorat & Supervision d'équipe
  • Entretiens techniques & Recrutement
  • Organisation de séminaires (25-300 pers.)

Explorations Data & Analyses

Analyse des causes racines d'événements

DataStudio - Exploration Data

Conduite d'analyses pour identifier les causes racines d'événements en utilisant des techniques avancées comme la corrélation de Pearson, les transformations polynomiales et la classification multivariée supervisée.

Optimisation des émissions de CO2

DataStudio - Exploration Data

Développement d'une application Streamlit pour l'analyse exploratoire des données et l'optimisation des émissions de CO2, permettant d'identifier les leviers d'action les plus efficaces.

Problème de tournées avec fenêtres temporelles

DataStudio - Exploration Data

Résolution d'un problème de tournées de véhicules avec fenêtres temporelles (Time Window VRP) pour l'optimisation des livraisons, en utilisant OR-Tools pour la modélisation et la résolution.

Clustering de courbes de charge

DataStudio - Exploration Data

Application de techniques de clustering pour identifier des profils types dans les courbes de charge, permettant une meilleure compréhension des comportements de consommation et l'optimisation des ressources.

Community of Practice Data

TDF - Organisation

Mise en place d'une communauté de pratique Data au sein de TDF, incluant le recrutement, l'organisation de l'équipe Data et la définition des processus et méthodologies.

Publications Medium

Migrate your Poetry project to UV

In this article, we will help you to migrate your project based on poetry to uv. It is quite simple because both dependency managers are…

Python Tutorial Productivity
Lire sur Medium

ZoeDepth: 3D Visualization of Depth Estimation

Exploration des techniques de visualisation 3D pour l'estimation de profondeur avec ZoeDepth, un modèle état de l'art pour la perception de profondeur monoculaire.

Computer Vision 3D Depth Estimation
Lire sur Medium

Open AI: Multi images prompting, python API

Guide pratique pour l'utilisation de l'API Python d'OpenAI avec des prompts multi-images, permettant de combiner vision et langage dans les applications d'IA.

OpenAI API Multi-modal
Lire sur Medium

Cultural Mindset: A Thought About Collective Ownership

Réflexion sur l'importance de la propriété collective dans les équipes techniques et comment elle favorise l'innovation et la qualité des produits.

Culture Leadership Team Building
Lire sur Medium

Sktime — TimeSeriesForestClassifier Improving features comprehension

Analyse approfondie du TimeSeriesForestClassifier de Sktime et méthodes pour améliorer la compréhension des caractéristiques extraites des séries temporelles.

Time Series Sktime Classification
Lire sur Medium

Sktime — Feature Importance on TimeSeriesForestClassifier

Techniques pour calculer et interpréter l'importance des caractéristiques dans les modèles TimeSeriesForestClassifier, améliorant l'explicabilité des prédictions.

Feature Importance Explainable AI Time Series
Lire sur Medium

Create your own "Google" with Sphinx

Guide pratique pour créer un moteur de recherche personnalisé avec Sphinx, permettant d'indexer et de rechercher efficacement dans de grandes quantités de données.

Search Engine Sphinx Information Retrieval
Lire sur Medium

Time Series: The problem with resampling

Analyse des défis et pièges liés au rééchantillonnage des séries temporelles, avec des solutions pratiques pour éviter les erreurs courantes dans l'analyse de données temporelles.

Time Series Resampling Data Preprocessing
Lire sur Medium

End-to-End Anomalies Detection Models Evaluation Algorithms

Méthodologie complète pour l'évaluation de bout en bout des algorithmes de détection d'anomalies, avec comparaison des performances et recommandations pratiques.

Anomaly Detection Evaluation Algorithms
Lire sur Medium

Contact

Intéressé par la collaboration sur des projets d'architecture de solutions data, de ML en production ou d'analyse de séries temporelles ? N'hésitez pas à me contacter.