image 2

大規模障害が多いのはなぜ?な話

Gotoです。

image 2
全国銀行資金決済ネットワークプレスリリースより

https://www.zengin-net.jp/

全銀ネットウェブサイト

 ここ数日話題となっている大規模障害と言えば、全銀ネットワークの大規模障害ではないでしょうか?結果丸2日間の対応の末、システムとしては復旧し、残った処理を順次こなしていくというターンです。(この記事を書いている時点でですが)

 さて、このような大規模障害というものがここのところモバイル通信であったり、銀行システムであったりでよく聞かれるようになったように感じませんか?実際みずほ銀行の大規模障害はかなりの影響があったのは記憶に新しいところですし、本件の裏でゆうちょ銀行もトラブルを起こしています。

 全銀ネットも50年の運用で初の大規模障害ということですが、そもそも50年前と今ではネットワークが置かれている環境があまりにも違います。50年前は専用線が当たり前、インターネットもないので介入してくる対策はほぼ必要なく、調整する先も接続先だけというようなところから、なんでもかんでもネットワークに繋がり、さらにサイバー犯罪が横行してくると、もう自社システムと関係システムだけを見ていればいい状況ではなく、様々な対策を日単位で対応しなければならないという状況になっています。

 サーバー運用にしても、10年ひと昔前なら安定バージョンであえて止めて運用するというのは、安定稼働のために当たり前とされてきましたが、今はそんなことは言えられません。いつどんな脆弱性をつかれて事故が起こるかわからない疑心暗鬼な状況ですので、とにかくセキュリティパッチがリリースされれば早期に適用するのが基本中の基本となっているからです。

 このあたりの運用をクラウドサービス型にしてアプリケーションだけを管理するというような形も増えましたが、とはいえOS部分のアップデートが頻繁であることは変わらないので、結局アプリケーション側も対応が月ではなく、日、もっといえば時間での対応になってきているのです。

 こんな状況であれば、なにか一つ間違えば大規模障害に繋がるようなリスクは50年、いや15年前と比べれば格段に高いのですが、そのリスクよりもサイバー犯罪に餌食になるほうがもっと問題があるという状況で日々運用管理がされていることは、利用者もよく知っておくべきだと私は考えます。

 便利で早く、いつでもどこでもというのが当たり前になっている裏では、多くの人々の苦労があってこそということをこういう事案の際に今一度考えてみるよい機会とするのはいかがでしょうか?