Meraki Cloud障害時の各機器の挙動について その1

先日(2023年1月25日)、Microsoft社のCloudサービスに大規模な障害が発生していることがニュースになりました。
企業においてMS365を使われているケースは日に日に多くなっている印象で障害発生時には業務が行えなかったという人もかなりいたのでは無いかと思っています。
Merakiに関してもCloud(Dashboard)による管理をおこなっており、Cloudにて障害が発生した場合の影響についてまとめておきたいと思います。

Meaki CloudのSLA

Meraki Cloudは99.99%のSLAであると書かれています。
この99.99%というのは月当たり約4分、年間では1時間弱までのダウンタイムはあり得るという計算になります。

年間1時間のダウンタイムが許容されるのか?

年間で1時間もダウンタイムが発生する可能性があるとなると急に不安になる方もいらっしゃると思います。
Meraki Cloudはユーザの実通信には直接関与をしておらず、Meraki Dashboardを介したユーザ情報の可視化や、各種機器への設定の投入にのみ影響することになるので、このSLAにおいて約1時間のダウン時に及ぼされる影響を理解しておく必要があります。
また、回線業社やサービスプロバイダの障害によりMerakiSLAとは関係のないMeraki Cloudへの通信断といったことも十分に考えられると思います。

Meraki Cloudとの接続性が失われた際の影響

Merakiの各機器がMerakiクラウドとの接続性が失われた場合、およびMeraki管理者がMeraki Dashboardへのアクセスができなくなった場合の影響をまとめておきたいと思います。

・管理者が新たな設定を行うことができなくなる。
・各機器からの利用状況がDashboard上で更新されなくなる。

この2点に関しては大きく影響することは無いと思います。
Meraki Cloudに障害が発生している期間のみ設定行為が出来ないだけど復旧さえ待てば元通りに設定が可能になるはずです。
機器のステータスの最新情報が得られなくもなりますが、Meraki各デバイスを通過するトラフィック自信には影響を及ぼさないので心配はありません。

・MRのAuto RF機能が動作しなくなる
Air Marshal機能が動作しなくなる

この機能はエンドユーザにとって少し影響のある内容かもしれません。
MRの電波設定を固定チャンネルにしている分には問題はないのですが、Auto RF機能を使って最適なチャネル設計をダイナミックにおこなっている場合にはMeraki Cloudに障害が発生している場合にはその間はチャネルの変更はされないということになります。
また、RogueAPの管理も出来なくなるので不正なAPが新たに発見された場合の対応は出来ないということになります。
しかしながら、これらの機能は早急に対応する必要も無いと思いますので復旧まで待つのでも問題はないと思います。

・スプラッシュ画面が表示されない

これはエンドユーザに大きく影響するでしょう。
例えばゲスト無線環境を提供している場合はスプラッシュ(Splash)画面を表示させるという場合がよくありますが、そのスプラッシュ画面はMeraki Cloud側で表示させているため、ログインができなくなります。
しかし、これは設定により回避が可能で、「ワイヤレス > 設定 > アクセス制御」からSplashを行っているSSIDを選択し、その中の「高度なSplash設定 > コントローラー切断時の挙動」からオープン(もしくは制限付き)を選択することによってMeraki Cloudに障害が発生している際にも引き続き無線NWを提供することが可能になります。

Merakiクラウド認証が動作しない

これが最もユーザに影響しうる事象かもしれません。
802.1x認証においてMerakiクラウド認証を利用している場合は、Cloudに障害が発生している場合は新規認証ができなくなってしまいます。
これが許容できない環境においてはオンプレでRADIUSサーバの設置を行うことの検討が必要となります。

Meraki Cloudの稼働状況の確認

MerakiではMeraki Cloudの稼働状況を確認するサイトが用意されています。

Meraki Cloudの稼働状況を確認したい場合はこのサイトをまずはチェックしてみることをお勧めします。

status.meraki.net

まとめ

Meraki Cloudにおいて障害が発生した場合に発生しうる影響をまとめてみました。
SplashやMeraki Cloudによる802.1x認証以外に関しては大きく影響することが無いと思われますのでSLA99.99% 年間1時間程度のダウンタイムと照らし合わせてそれを許容できるかどうかを判断していただければと思います。
また、次回はMeraki Cloud障害時の各Merakiバイスの動作についてもまとめたいと思います。

documentation.meraki.com

documentation.meraki.com