韓国最大手のディスカウントストアであるemartで買い物をした後、駐車場を出る際には精算機を利用します。この駐車場システム「i PARKING」を開発・運営するPARKING CLOUDのCTO、Lee Sangmin氏に、国内最大規模を誇るi PARKINGをどのようにモニタリングしているのかについて伺いました。
PARKING CLOUDはどのような企業で、CTOのLeeさんはどんな業務に就いていますか?
PARKING CLOUDは韓国トップの駐車場運営企業で、ハードウェアからソフトウェアまで自社開発しています。私はCTOとして開発組織全体を統括しており、全国に点在するデバイスを中央集約的に管理しています。現在はAWSとNHN IDCを活用し、マルチクラウド構成でインフラを運用しています。
PARKING CLOUDのシステム開発と運用組織では、WhaTap Monitoringをどのように活用していますか?
Javaバックエンド開発者とインフラ運用エンジニアは、リソースからアプリケーションまでをすべてWhaTap Monitoringでモニタリングしています。バックエンド開発者の大半がWhaTapを見ながら開発を進めている状況です。オフィスにモニタリング向けの大型モニターが置いてあり、その画面には常にWhaTap Monitoringのダッシュボードが表示してあります。開発とインフラ運用は、行き来しながらもWhaTapのダッシュボード画面に目を配っています。注意すべきイベントが発生したら、その画面をキャプチャして全体の開発組織と共有します。そして、どの指標が問題なのか状況を確認したり、分析を行ったりするコミュニケーションの媒体として活用します。特に、シニアレベルの開発者には必須のモニタリングツールになっています。
PARKING CLOUDがWhaTap Monitoringを選択したきっかけは何ですか?
なにより、数千台規模のインフラを、しかもマイクロサービスアーキテクチャ(MSA)サービスを効果的に統合モニタリングできる点です。MSA構造では、無数の小さいサービスが複雑に絡み合い、サービスを呼び出したりしています。それらをモニタリングするためには、MSAサービス間の呼び出し関係や比率を把握する必要があります。さらにマルチトランザクションを追跡して、どこの相関トランザクションで遅延が発生しているのかをトレースしなくてはなりません。WhaTap Monitoringは10,000台を超えるサーバーシステムをひと目で確認でき、MSA構造でのサービス間呼び出し関係や比率を数字として見える化します。また、マルチトランザクションの処理フローを効果的にトレースできます。
そして、改善点や要求に対していつも前向きに対応してくれたのも、導入に至った大きな理由の一つです。
WhaTap Monitoringでよく使うメニューや機能は何でしょうか?
よく使うのはApplication、Server、Databaseの順です。常に大型モニターにWhaTap Monitoringのダッシュボード画面を表示してあるため、異常発生の検知がすばやくできます。現場レベルでのリソースは統合ダッシュボード、障害発生時には統合メトリックスボードでモニタリングします。
WhaTap Monitoringの導入効果は何でしょうか?
PARKING CLOUDでは、障害発生時には最優先でWhaTapの画面を表示させます。障害時には色々なルートから数多くのアラート通知がくるため、障害を正しく認知するのが何より重要です。アラートが無数に受信されがちなので、必要なアラートだけが通知されるよう気を使い設定する必要があります。PARKING CLOUDではApplication Monitoring向けに、必要不可欠で重要だろうと思われるアラートだけを設定しています。その結果、障害発生の認知が早くなりました。
WhaTap Monitoringは単に障害発生をアラートするだけのサービスではありません。それがなぜ発生したのか、その根本の原因は何なのかも分析できるサービスです。例えば、ネットワークに問題があるのか、アプリケーションに問題があるのか、あるいは連携したサービスに問題があるのか、データベースなのか等を簡単に把握できる構造になっています。そのおかげで、PARKING CLOUDでは何度も障害の原因を簡単に見つけ出し、解決しています。