AX Flow SDK 명세서 v2.0 · 통합 파트너 검토용 — 정식 스키마는 /docs Swagger UI를 단일 기준으로 사용합니다.
Operations
모니터링 · 알람

운영 단계에서 호스트와 AX Flow가 각자 측정해야 할 지표·임계·알람 액션을 한 번에 정의한다. 4개 핵심 지표는 응답 지연·인증 실패·인입 실패·과다 호출이며, 호스트 측 임계 도달 시 자동 백오프 또는 AX Flow 측 통보 액션으로 분기한다.

17.1 호스트 측 (도입사) 모니터링 권장 지표

지표임계알람 액션
retriever p50 지연smart >1.5s / deep >5sAX Flow 측 통보
401 / 403 분당 비율평균의 5배호스트 인증 점검
status=failed 인입 비율평균의 3배AX Flow 측 통보
사용자 단위 검색 빈도사용자별 분당 10회 초과자동 백오프

p50 지연 임계는 Smart 모드 1.5초 / Deep 모드 5초로 운영 SLA보다 50% 여유를 둔 사전 경보 수준이며, 분당 인증 실패 분량은 호스트 토큰 회전 누락·만료를 가장 먼저 잡아낸다. status=failed 인입 비율은 단일 문서 결함이 아니라 인입 파이프라인 자체의 장애 신호이므로 평균 대비 3배 도달 즉시 AX Flow 측 통보 라인을 가동한다.

17.2 AX Flow 측 모니터링 (참고)

  • 서비스 단 모니터링 / 1차 장애 대응 — AX Flow 측 책임 (5.3)
  • 호스트 통합 단 호출 모니터링 — 도입사 책임

운영 단계에서 두 측 모니터링은 동일 사고 1건당 두 측 알람이 동시 발화하도록 정렬한다. AX Flow 측이 서비스 단 1차 장애 대응을 시작한 시점에 호스트 측은 자체 통합 코드의 재시도·폴백 경로가 정상 동작하는지를 병행 점검하는 구조이며, 두 측이 서로의 알람 채널(이메일·웹훅·Slack 1개 이상)을 사전 공유한 상태로 PoC 진입을 권장한다.