Le monitoring des modèles
Durant l'entraînement : MLFlow
En production : Prometheus & Grafana
Prometheus
Prometheus est un software permettant de recupérer de nombreuses méttriques et permet de les centraliser. On peut par exemple récupérer
- l'espace disque utilisé,
- la RAM,
- l'utilisation du CPU/GPU,
- etc.
Prometheus permet aussi de vous alerter sur certaines des ces métriques sont sur-utilisées et risquent de ne plus répondre.
- Collect Docker metrics with Prometheus
- How to Visualize Tensorflow Metrics in Kibana
- FastAPI Microservice Patterns: Application Monitoring
- How to monitor your FastAPI service
- Starlette Prometheus
- Prometheus FastAPI Instrumentator
- PrometheusRock
Accéder aux métriques docker
/etc/docker/daemon.json
Le client Python
Client Python officiel de Prometheus