WhaTap Monitoring
2025-07-24
ビジネスモニタリングはどのように行うべきか?

初めに

最近のITモニタリング環境はますます困難になっています。開発トレンドが**マイクロサービスアーキテクチャ(MSA)**に移行するにつれて、アプリケーションが細分化され、非同期フレームワークの使用が増加し、構造が複雑になりつつあるためです。その結果、障害が発生した際には複雑なアプリケーションの状況を把握することが容易ではありません。

従来、APM(アプリケーションパフォーマンスモニタリング)は、主に開発者と運用者が使用するツールでした。トランザクション分析、障害分析、リソース推移の確認などには、一定の専門知識が必要だったからです。

WhaTapは、開発者や運用者でなくても業務ドメインの知識さえあれば簡単に確認できる機能、つまり**「ビジネスダッシュボード」**を新たにリリースしました。

ビジネスダッシュボードを通じて、自分が担当しているドメイン(サービス)がどのように動作しているか、1秒あたりの処理トランザクション数やエラー発生状況を直感的に把握できます。

また、別のコンテンツの「ビジネス設計に合わせたAPI設計はなぜ重要なのか?」で触れたように、多くの企業がRESTful APIをポリシーに沿って設計しています。このため、WhaTapはサービス(URL)の1デプスを基準に業務単位を自動でまとめ、ユーザーがトランザクションURLを一々手作業で指定する必要がないようにしました。(最大2デプスまで指定)

✅ ビジネスモニタリングが重要な理由は?

ビジネス中心の問題認識

例えば、注文ドメイン(/orders)に障害が発生したら企業の売上に直結します。

システム全体が正常に動作していても、決済機能にのみエラーがあると、ユーザーの不満とともに実質的な収益損失が発生する恐れがあります。。

また、認証ドメイン(/auth)に問題が発生するとログインすらできなくなり、サービスの利用が不可能になります。これはすぐにビジネスの損失につながります。

重要ポイント:単純なシステム指標よりも、注文失敗率、決済応答時間、ログイン成功率のような業務中心の指標がより重要な場合が多いです。

しかし、既存のモニタリング方式では数多くのトランザクションが混在しているため、実際に障害が発生したら重要な障害を早急に切り分けることができない場合が多くありました。

WhaTapは、ドメイン別に障害を特定し、迅速に対応できるビジネスダッシュボードを提供します。

迅速かつ正確な障害原因の追跡

ドメイン単位のモニタリングにより、サービスのどの業務で問題が発生したかを即座に確認できます。

“会員ログインはできるが、商品の検索ができません。” → 商品ドメインでの問題であるのがすぐ分かる

ビジネスダッシュボードがない場合なら

  • トランザクションエラー発生の確認
  • トランザクション詳細情報の分析(URL、応答時間、エラークラス、メッセージ等)
  • 多数のトランザクションを個別に詳細分析

この過程を経て最終的に問題のドメインが特定できました。それだけ時間がかかります。

👉 WhaTapビジネスダッシュボードはドメインごとにアラート通知を設定し、次のような異常兆候が発生した際には即座に通知を行います。

  • エラー率の急増
  • 応答時間の遅延
  • トランザクション量の急増や急減

“商品ドメインのエラー率が5%を超えました。確認してください。”

MSA構造における必須要素

MSA環境では、1つのドメインが1つのサービスであり、独立したデプロイ単位となります。

例: order-service, payment-service, auth-service

ドメイン(サービス)ごとの個別モニタリングではない状況で障害が発生すると、

“システム全体は正常なのに、何が問題だろう?”

のような混乱が起こりやすいです。

そのため、MSA環境ではドメイン別/サービス別のモニタリングが必須です。

チームごとの責任の明確化

組織がドメイン別のチームで構成されている場合、各チームは担当ドメインの監視に集中できます。

例: 決済チーム → paymentドメインのみを監視

更には、WhaTapが提供するマルチトランザクション検索機能を活用して、特定ドメインのトランザクションに基づいて次のような分析が可能です。

  • 問題のSQLクエリ
  • 外部HTTPコール失敗
  • 内部システム呼出し問題

“AAAカード社API呼び出しで障害が発生しました。”

指標に基づいた改善が可能

  • 注文成功率が92%。なぜ下がっただろう? → paymentチームで原因を分析 → 修正及び改善
  • ログイン失敗率が5%。その原因は?→ authチームで原因を分析 → 修正及び改善

技術的な指標だけだとこのような対応は難しいです。ビジネスモニタリングができるWhaTap APMなら、リソースが大幅に削減できます。

ビジネスダッシュボードの活用方法

アラートの設定

  • アラート通知 → イベント設定 → 「TX」で設定
  • ビジネスアラートはトランザクションのサービス名を基準にした大グループ単位
  • 下位のトランザクションアラートが上位のビジネスアラートにマッピングされた場合、実際の障害ではないにもかかわらず障害のように見えることがあります。これを防ぐために、ビジネスアラートとトランザクションアラートを分離することができます。
  • トランザクションURL(サービス)別にアラート通知がフィルタリング可能

データの確認

  • リアルタイムな異常検知
  • 業務別アクティブTXによるトランザクション遅延の確認
  • 応答時間の推移グラフ → 性能分析
  • エラーの推移グラフ → 障害推移の把握
  • 過去の履歴分析 → 障害発生時点の推定と、詳細原因の確認

リアルタイムなビジネスの確認

  • 業務別トランザクションのリアルタイムなモニタリング
  • 遂行中(遅延)トランザクションの識別
  • ボトルネックの分析

終わりに

ビジネスダッシュボードで実現できるビジネス別のモニタリングは、単純なシステムモニタリングを超えて、売上に直結する異常兆候を早期に特定し、迅速に対応できる重要な戦略です。

WhaTap モニタリングを無料でお試しください!