Breakout Session
L’observabilité sans limites: comment nous avons maximisé nos métriques avec OTel et Datadog
Que se passe-t-il lorsque plusieurs équipes instrumentent leurs systèmes indépendamment ? Chez leboncoin, nous étions confrontés à un paysage de monitoring totalement fragmenté. Avec de multiples plateformes de ventes à travers l'Europe au sein d'Adevinta (maison mère du boncoin), des technologies variées et une multitude de conventions de nommage, répondre à des questions simples comme « Quel est le taux d'erreur de nos services par plateforme de vente ? » se transformait en une véritable chasse au trésor à travers des métriques et dashboards personnalisés, des implémentations redondantes et des connaissances cloisonnées.
Dans cette présentation, nous détaillerons comment nous avons mis de l'ordre dans ce chaos en adoptant les conventions sémantiques d'OpenTelemetry. Nous expliquerons comment nous avons aligné les équipes d'ingénierie autour d'une nomenclature de métriques commune, pourquoi OpenTelemetry s'est imposé comme notre solution de choix, et comment nous avons tout intégré à Datadog, notre plateforme unifiée. L'objectif : construire des tableaux de bord et des alertes fonctionnels pour tous, afin d'observer les services que nous fournissons à nos dizaines de millions d'utilisateurs uniques chaque mois.
Nous partagerons également les défis que nous avons relevés (faire accepter la migration, incidents imprévisibles etc.) et nous vous donnerons un aperçu de nos prochaines étapes pour étendre une culture d'observabilité en tant que code.