なぜネットワーク監視は大変なのか
どんなに技術が進歩しても、通信事業者にとって安定したサービスの提供が重要なのは古今東西変わらず永遠の課題です。インターネットが当たり前の存在になったことに加え、トラフィックが急激な増加を見せる昨今は、安定だけでなく「安く」「快適な」サービスを実現するための投資も必要性を増しているのが実情です。しかし、そのどちらも安定の上に成り立っていることを忘れてはいけません。
そのような中、一体どれだけの予算が「安定」に割り当てられているのでしょうか。やはり、通信帯域やサービスの拡充が優先されるはずです。安定したサービスを提供するために、ギリギリの人員・設備・費用でネットワークを監視しているという通信事業者は少なくないと考えます。
リソースが限られている中で「安定」を実現・維持しなければならないことが、ネットワーク監視の現場が抱える最大の悩みではないでしょうか。
なぜ楽にならないのか
例えば、ネットワーク監視に従事している方であれば以下のような悩みを抱えていないでしょうか。
- 24時間いつ呼び出されても動けるよう、常にPCを持ち歩いている
- 緊急ではないアラートも容赦なく夜中に飛んでくる
- エスカレーション先がわからない/気が引けてしまって連絡できない
- ワークアラウンドを残そうと思ってもタスクがスタックしてしまい着手できない
監視の自動化や最適化を謳った製品やサービスは多く存在しており、これらの悩みは概ね解決することが可能ですが、当然ながら基本的にそのどれも費用と手間/時間が必要です。
ネットワーク監視が大変なことで明らかな損失(機会損失も含む)が生じていたり、楽にすることで利益が生まれることが確かであれば、改善に向けて動き出すことはそう難しくはないでしょう。
そうではないから悩んでいる。という方の方が多いと思います。
多くの場合、効果の有無を検討し、上司へ説明するシナリオを考え、根回しをして稟議を通し、予算化し、体制を構築する必要があります。この負担を考えると、ギリギリで回している状態を維持した方がマシだと考える方は多いように思います。実際、調整にはかなりの労力を伴うでしょう。
我々レンジャーも同じ悩みに直面
当社はこれまで、いくつもの企業に対して通信事業への参入を支援してきました。中にはエンジニア体制を持っていない企業もあり、その場合は当社がネットワーク監視や障害時の復旧、メンテナンスなど運用全般を請け負っています。開発・運用部門の業務を丸ごと当社に任せて頂いているイメージです。2024年現在も複数事業者の設備を運用しておりますが、前述した悩みを抱えていた時期もありました。
では、当社がどのようにしてこの悩みを乗り越えたのかご紹介します。まず前提は以下のように、決して意思決定のプロセスが少なかったり、マルチタスクで何でもこなせるスペシャルなエンジニアで体制を固めていたわけでもありません。
- 運用に直接携わっていたエンジニアは数人(全員共通で前述した悩みを抱えていた)
- 稟議プロセスは世間一般の企業と同様
主に重視した点は以下です。
改善のつもりが想定外の問題を起こしてしまった。という話を耳にしたことはないでしょうか。特にサービスの運用に関連する設備の変更は慎重に検討しなければならず、スピード感が失われるため一切手を加えないことを大前提としました。
少額であっても、減価償却の対象になる稟議は単純な費用と比べ、特に財務・経理や経営者に分かりやすく説明する必要がある場合が多いと思います。やはり担当者にとっては負担増になってしまうため、サブスクリプションサービスを探しました。
たどり着いた答え
そうして、たどり着いたのが「Squadcast」でした。導入に至った経緯や機能は過去記事で紹介しています。
これによって担当者の呼び出しにまつわる悩みは綺麗に解消しました。
チケットとして対応履歴を残すこともできるため、誰がどのアラートを対応したのか、どれほどの業務負荷が発生しているのか把握することができます。これにより適切なタスクの分担や人員配置を検討することができ、スタックしてしまうタスクが大幅に減少しました。
初の試みだったことから、Squadcastを見つけて実際に運用へ乗せるまでに時間は要しましたが、効果は絶大であったことから、現在は我々が構築した仕組みをパッケージにして広く共有しています。
導入までの流れ
どのようなパッケージなのか、3ステップでご紹介します。
- 監視の悩みや課題をヒアリング(無償)
- 当社で用意したSquadcastテストアカウント上にパラメータを設定して試験運用(1か月無償)
- 実運用のアカウントを立ち上げてパラメータを移行
ネットワーク監視の悩みをお聞かせください。解決方法を整理してご提案します。
Squadcastが有効と思われる場合、当社が構築した試験環境でお試しいただきます。実際に商用環境からアラートを送信いただくことも可能です。試験環境では主に以下の機能を提供いたします。
- Zabbix等、監視ツールからのアラートメッセージ受信
- アラート受信時の自動エスカレーション
- Slackとの連携
- インシデント管理ダッシュボード
お試しいただいた後、新たにアカウントを契約いただき試験環境からパラメータを移行します。その際、必要に応じて実運用に合わせたパラメータに調整いたします。
さいごに
Squadcastの活用を中心に説明しましたが、ネットワーク監視にまつわる課題は千差万別かと思います。様々な通信事業者を支援している当社だからこそ、多くのアイデアを提供できます。どのような悩みでもお気軽にご相談ください。