요즘 모니터링이 참 어려운 것 같습니다. 개발 트렌드가 Microservices Architecture로 전환되면서 애플리케이션이 많이 쪼개지고, 비동기 프레임워크 사용으로 인해 구조가 더욱 복잡해졌죠. 그만큼 장애 발생 시 복잡한 애플리케이션을 모니터링하는 것도 어려워졌습니다.
전통적으로 APM은 개발자와 운영자가 주로 사용하는 시스템이었습니다. 트랜잭션 분석, 장애 분석, 리소스 추이 확인 등 일정 수준 이상의 전문 지식이 필요했기 때문입니다.
그래서 이번에 WhaTap에서는 비즈니스 관점의 VIEW, 즉 ‘비즈니스 대시보드'를 새롭게 선보였습니다. 이는 개발자나 운영자가 아니더라도, 업무에 대한 도메인 지식만 있다면 누구나 쉽게 볼 수 있도록 구성한 화면입니다.
자신이 맡고 있는 도메인 애플리케이션이 어떻게 동작하고 있는지, 초당 몇 건의 트랜잭션을 처리하고 있는지, 에러는 얼마나 발생하는지를 직관적으로 확인할 수 있습니다.
또한, 앞서 소개한 비즈니스 설계에 맞춘 API 설계 왜 중요할까?에서 보셨듯이 많은 기업들이 RESTful API를 체계적으로 설계하고 있기 때문에, WhaTap은 트랜잭션 URL을 일일이 수동으로 설정하지 않도록 기본적으로 URL의 1-depth를 기준으로 업무 단위로 자동 지정하도록 했습니다. (참고로, 최대 2-depth까지 표현 가능합니다.)
예를 들어, 주문 도메인(/orders
)에 장애가 발생하면 회사의 매출에 직접적인 영향을 미치게 됩니다. 시스템 전체가 정상 작동하더라도 결제 기능만 오류가 발생한다면, 고객 불만과 함께 실질적인 수익 손실이 발생할 수 있습니다.
또한 인증/인가 도메인(/auth
)에 문제가 생기면, 로그인조차 되지 않아 고객이 서비스를 이용하지 못하게 되고, 이는 곧 비즈니스 손실로 이어집니다.
🔎 단순한 시스템 지표보다는 "주문 실패율", "결제 응답 시간", "로그인 성공률" 같은 업무 중심 지표가 훨씬 중요한 경우가 많습니다.
하지만 기존 방식의 모니터링에서는 트랜잭션이 무작위로 섞여 있어, 실제 장애가 발생하더라도 진짜 중요한 장애를 빠르게 인지하지 못하는 경우가 종종 발생합니다.
이러한 문제를 해결하고자, WhaTap은 도메인별로 문제를 빠르게 식별하고, 고객의 신속한 대응을 지원하는 비즈니스 기반 데이터 체계를 구축했습니다.
도메인 단위로 모니터링을 하면 어떤 기능에서 문제가 발생했는지 즉시 확인할 수 있습니다.
예를 들어, “회원 로그인은 되는데, 상품 조회가 안 돼요”라는 상황이라면, 곧바로 상품 도메인에 문제가 있음을 인지할 수 있습니다.
기존 APM 솔루션을 사용 중인 경우:
이 과정에서 다양한 트랜잭션을 개별적으로 분석하느라 시간이 소요될 수밖에 없습니다.
하지만 최종적으로 “상품” 도메인에 장애가 발생했음을 인지하고, 확산 방지를 위한 조치를 취하는 데 시간이 걸리게 됩니다.
👉 WhaTap의 ‘비즈니스 대시보드’는 이 과정을 훨씬 빠르고 명확하게 도와줍니다. 도메인별로 미리 알림 조건을 설정해두면, 다음과 같은 이상 징후가 감지되었을 때 알림이 발생합니다:
예: "상품 도메인의 에러율이 5%를 초과했습니다. 확인 바랍니다."
이처럼 문제 도메인을 빠르게 식별하고, 장애 확산을 방지하며 즉각적인 대응이 가능해집니다.
마이크로서비스 아키텍처(MSA) 환경에서는 보통 하나의 도메인이 하나의 서비스이자 독립적인 배포 단위가 됩니다.
예: order-service
, payment-service
, auth-service
등
따라서 서비스별로 개별 모니터링이 되지 않으면, 장애 발생 시
“전체 시스템은 정상인데 뭐가 문제야?”
와 같은 혼란이 생기기 쉽습니다.
이러한 구조에서는 도메인별, 서비스별 모니터링이 반드시 필요합니다.
조직이 도메인별로 팀이 나뉘어 있다면, 각 팀은 자신이 담당하는 도메인의 모니터링만 집중적으로 수행하면 됩니다. 예를 들어, 결제팀은 payment 도메인만 모니터링하면 되겠죠.
하지만 일부는 다음과 같이 질문할 수 있습니다:
“결제 도메인만 본다고 다 되는 건가요? 결제 과정에서 외부 호출 에러는 어떻게 알 수 있죠?”
여기에 대해 WhaTap은 해답을 제공합니다. WhaTap은 ‘멀티 트랜잭션 검색’ 기능을 제공해, payment 도메인에서 실행된 트랜잭션을 기반으로 다음을 구분해서 파악할 수 있습니다:
이 과정을 통해 예를 들어,
“아, AAA 카드사 API 호출에서 문제가 발생했구나”
라는 식으로 장애 원인을 명확하게 파악할 수 있습니다.
🔎 기술 지표만 있으면 이런 분석은 어려울 것입니다. 관련하여 비즈니스 모니터링이 가능한 와탭 APM을 사용해 보십시오. 많은 리소스 절감이 가능할 것입니다.
비즈니스별 모니터링은 단순한 시스템 모니터링을 넘어, 매출과 직결된 이상 징후를 조기에 식별하고 신속하게 대응할 수 있도록 돕는 핵심 전략입니다. 지금 비즈니스 대시보드에 대해 자세히 확인해보세요.
👉 와탭 비즈니스 대시보드 더 알아보기