Workshop
SRE 실습: 0에서 SLO로 이동하기
이 워크숍에서는 모니터링이 미흡한 마이크로서비스 애플리케이션을 예시로 활용하며, SRE 팀이 서비스 성능을 측정하고 서비스 수준 목표(SLO)를 수립할 수 있는 필수 단계를 실습을 통해 알아봅니다. 이를 통해 서비스 신뢰도를 향상하는 방법을 배울 수 있습니다.
워크숍 목표:
- 로그 하나로 복잡한 애플리케이션에 관한 첫 인사이트 얻기
- Datadog APM으로 애플리케이션을 계측하고 수집 트레이스를 가시화해 인사이트 확장하기
- 실행 가능한 알림을 설정하고, 알림과 페이징의 주요한 차이를 이해하여 알림 피로도 줄이기
- 핵심 사용자 여정을 이해하고, 서비스 수준 지표(SLI)를 파악하며, SLO를 설정하여 개발 속도와 안정성 간의 균형을 찾기
- Datadog의 Case Management와 Incident Management 제품을 사용해 분산된 팀에서 원활하게 이슈 탐색하기