와탭랩스 블로그 오픈 이벤트 😃
자세히 보기
와탭 모니터링
2025-07-24
비즈니스 모니터링 어떻게 해야 할까?
business dashboard

요즘 모니터링이 참 어려운 것 같습니다. 개발 트렌드가 Microservices Architecture로 전환되면서 애플리케이션이 많이 쪼개지고, 비동기 프레임워크 사용으로 인해 구조가 더욱 복잡해졌죠. 그만큼 장애 발생 시 복잡한 애플리케이션을 모니터링하는 것도 어려워졌습니다.

전통적으로 APM은 개발자와 운영자가 주로 사용하는 시스템이었습니다. 트랜잭션 분석, 장애 분석, 리소스 추이 확인 등 일정 수준 이상의 전문 지식이 필요했기 때문입니다.

그래서 이번에 WhaTap에서는 비즈니스 관점의 VIEW, 즉 ‘비즈니스 대시보드'를 새롭게 선보였습니다. 이는 개발자나 운영자가 아니더라도, 업무에 대한 도메인 지식만 있다면 누구나 쉽게 볼 수 있도록 구성한 화면입니다.

자신이 맡고 있는 도메인 애플리케이션이 어떻게 동작하고 있는지, 초당 몇 건의 트랜잭션을 처리하고 있는지, 에러는 얼마나 발생하는지를 직관적으로 확인할 수 있습니다.

또한, 앞서 소개한 비즈니스 설계에 맞춘 API 설계 왜 중요할까?에서 보셨듯이 많은 기업들이 RESTful API를 체계적으로 설계하고 있기 때문에, WhaTap은 트랜잭션 URL을 일일이 수동으로 설정하지 않도록 기본적으로 URL의 1-depth를 기준으로 업무 단위로 자동 지정하도록 했습니다. (참고로, 최대 2-depth까지 표현 가능합니다.)

✅ 왜 비즈니스 모니터링이 중요한가?

1. 비즈니스 중심의 문제 인식

예를 들어, 주문 도메인(/orders)에 장애가 발생하면 회사의 매출에 직접적인 영향을 미치게 됩니다. 시스템 전체가 정상 작동하더라도 결제 기능만 오류가 발생한다면, 고객 불만과 함께 실질적인 수익 손실이 발생할 수 있습니다.

또한 인증/인가 도메인(/auth)에 문제가 생기면, 로그인조차 되지 않아 고객이 서비스를 이용하지 못하게 되고, 이는 곧 비즈니스 손실로 이어집니다.

🔎 단순한 시스템 지표보다는 "주문 실패율", "결제 응답 시간", "로그인 성공률" 같은 업무 중심 지표가 훨씬 중요한 경우가 많습니다.

하지만 기존 방식의 모니터링에서는 트랜잭션이 무작위로 섞여 있어, 실제 장애가 발생하더라도 진짜 중요한 장애를 빠르게 인지하지 못하는 경우가 종종 발생합니다.

이러한 문제를 해결하고자, WhaTap은 도메인별로 문제를 빠르게 식별하고, 고객의 신속한 대응을 지원하는 비즈니스 기반 데이터 체계를 구축했습니다.

2. 빠르고 정확한 장애 원인 추적

도메인 단위로 모니터링을 하면 어떤 기능에서 문제가 발생했는지 즉시 확인할 수 있습니다.
예를 들어, “회원 로그인은 되는데, 상품 조회가 안 돼요”라는 상황이라면, 곧바로 상품 도메인에 문제가 있음을 인지할 수 있습니다.

기존 APM 솔루션을 사용 중인 경우:

  • 트랜잭션 에러 발생 여부 확인
  • 트랜잭션 상세 정보 분석 (URL, 응답 시간, 에러 클래스, 에러 메시지 등)

이 과정에서 다양한 트랜잭션을 개별적으로 분석하느라 시간이 소요될 수밖에 없습니다.
하지만 최종적으로 “상품” 도메인에 장애가 발생했음을 인지하고, 확산 방지를 위한 조치를 취하는 데 시간이 걸리게 됩니다.

👉 WhaTap의 ‘비즈니스 대시보드’는 이 과정을 훨씬 빠르고 명확하게 도와줍니다. 도메인별로 미리 알림 조건을 설정해두면, 다음과 같은 이상 징후가 감지되었을 때 알림이 발생합니다:

  • 에러율 급증
  • 응답 시간 지연
  • 거래량 급등 혹은 급감

예: "상품 도메인의 에러율이 5%를 초과했습니다. 확인 바랍니다."

이처럼 문제 도메인을 빠르게 식별하고, 장애 확산을 방지하며 즉각적인 대응이 가능해집니다.

3. MSA 구조에서의 필수 요소

마이크로서비스 아키텍처(MSA) 환경에서는 보통 하나의 도메인이 하나의 서비스이자 독립적인 배포 단위가 됩니다.
예: order-service, payment-service, auth-service

따라서 서비스별로 개별 모니터링이 되지 않으면, 장애 발생 시

“전체 시스템은 정상인데 뭐가 문제야?”
와 같은 혼란이 생기기 쉽습니다.

이러한 구조에서는 도메인별, 서비스별 모니터링이 반드시 필요합니다.

4. 팀 책임 구분이 명확해짐

조직이 도메인별로 팀이 나뉘어 있다면, 각 팀은 자신이 담당하는 도메인의 모니터링만 집중적으로 수행하면 됩니다. 예를 들어, 결제팀은 payment 도메인만 모니터링하면 되겠죠.

하지만 일부는 다음과 같이 질문할 수 있습니다:

“결제 도메인만 본다고 다 되는 건가요? 결제 과정에서 외부 호출 에러는 어떻게 알 수 있죠?”

여기에 대해 WhaTap은 해답을 제공합니다. WhaTap은 ‘멀티 트랜잭션 검색’ 기능을 제공해, payment 도메인에서 실행된 트랜잭션을 기반으로 다음을 구분해서 파악할 수 있습니다:

  • 어떤 SQL 쿼리에 문제가 있었는지
  • 외부 HTTP Call이 실패했는지
  • 내부 시스템 간 호출에 문제가 있었는지

이 과정을 통해 예를 들어,

“아, AAA 카드사 API 호출에서 문제가 발생했구나”
라는 식으로 장애 원인을 명확하게 파악할 수 있습니다.

5. 지표 기반 개선 가능

  • “주문 성공률이 92%네? 왜 떨어졌지?” → payment 팀에서 원인 파악 → 디버깅 → 수정 → 개선
  • “로그인 실폐율이 5%네? 왜 실폐가 많지?” → auth 팀에서 원인 파악 → 디버깅 → 수정 → 개선

🔎 기술 지표만 있으면 이런 분석은 어려울 것입니다. 관련하여 비즈니스 모니터링이 가능한 와탭 APM을 사용해 보십시오. 많은 리소스 절감이 가능할 것입니다.

✅ 비즈니스 대시보드 활용법

1. 비즈니스별 / 트랜잭션별 알림 설정을 통한 비즈니스 확인 방법

  • 경고알림 > 이벤트 설정(new) > 트랜잭션 탭에서 설정
    • 비즈니스 알림 설정
      • 비즈니스 대시보드의 업무명은 트랜잭션의 서비스명을 기준으로 구성된 대그룹입니다.
      • 하위 트랜잭션 알림이 상위 비즈니스 알림으로 연결되면 실제 장애가 아님에도 장애처럼 보일 수 있음.
      • 이를 방지하기 위해 비즈니스 알림과 트랜잭션 알림을 분리하여 설정할 수 있도록 개발하였습니다.
  • 트랜잭션 알림 설정
    • 트랜잭션 URL(서비스)별로 알림을 설정할 수 있습니다.
    • 특정 트랜잭션별로 필터링이 가능합니다.

2. 비즈니스 대시보드를 통한 데이터 확인 방법

  • 대시보드를 통한 실시간 이상 탐지 기능
    • 업무별 액티브 트랜잭션을 통한 거래 지연 확인
    • 응답시간 추이 그래프를 통한 업무별 성능 확인
    • 에러 추이 그래프를 통한 장애 추이 확인
  • 과거 이상 탐지를 위한 히스토리 분석 기능
    • 비즈니스별 트랜잭션 전체 건수 확인
    • 응답시간 , 에러 추이 를 통한 장애 시점 유추
    • 상세 데이터를 통한 특정 비즈니스별 어떤 트랙젹션들이 에러가 많은지 , 응답이 느린지  , 메모리를 많이 사용하는지 등 확인 가능

3. 액티브 트랜잭션 확인을 통한 실시간 비즈니스 확인

  • 실시간으로 업무별 트랜잭션을 확인할 수 있습니다.
  • 종료되지 않은 트랜잭션을 식별할 수 있습니다.
  • 트랜잭션의 병목 구간을 확인할 수 있습니다.

결론

비즈니스별 모니터링은 단순한 시스템 모니터링을 넘어, 매출과 직결된 이상 징후를 조기에 식별하고 신속하게 대응할 수 있도록 돕는 핵심 전략입니다. 지금 비즈니스 대시보드에 대해 자세히 확인해보세요.
👉 와탭 비즈니스 대시보드 더 알아보기

와탭 모니터링을 무료로 체험해보세요!