1) 모니터링 1-1. 네 가지 숫자Throughput : 들어오고/나가는 메시지 양 (bytes/sec, records/sec)Error : 프로듀서/컨슈머 에러율Lag/LatencySaturation : 브로커가 바쁨 (Idle% 낮은 경우), 디스크가 꽉 참 (사용량 높은 경우)지표 몇가지1. URP > 0 : 불완전 복제 파티션이 있으니 확인 필요2. RequestHandlerIdle %가 계속 0.3보다 작은 경우 : 브로커 과부화 가능성3. Consumer Lag이 업무 시간에 계속 증가 : 처리 병목 1-2. SLO란?SLI (무엇을 측정하는가) : 특정 메시지가 3초 안에 처리되는 비율SLO (목표) : 영업 시간에 99.9%는 3초 안에 끝낸다알람 : 3초 넘는 구간이 5분 이상 지속되..