ホンモノのエンジニアになりたい

ITやビジネス、テクノロジーの話を中心とした雑記ブログです。

楽天カード社のサービス停止について考える【愚考】(19/11/25)

Power cable


ITニュースのお時間です。

今宵は楽天カードなどのサービスが止まったというニュースをもとに愚考を進めてまいります。

 

 

 

どういうニュースか?

九州電力の子会社QTnet社が運営するデータセンターで障害が発生し、同社顧客のシステムが利用できなくなった。顧客には楽天カードや福岡県、九州電力など260社、自治体が含まれる。

電源設備の更新作業中にサーバへの電力供給が一時遮断されたことが原因。

QTnet社は老朽化した無停電電源装置を更新するため、切り替え作業をしていたところ、分電盤で何らかの障害が起き、電力の供給が一時遮断された。

 

本件のそれダメでしょ的なところ

まだ障害発生から2日ほどしか経っていないので、今後情報が出てくると思います。現在時点で発表されている内容から、「それダメでしょ」と思う所を挙げていきます。 

QTnet側の対応

センターの電源断はヤバすぎる

色々な意味でヤバいですね。自分がその現場にいたらと思うと、血の気が引いていく感じです。

まずデータセンターってのは客を集める時に大体こんな宣伝をします。「複数系統の電源があるから、たとえ電力会社の変電所が逝ってもウチは大丈夫」とか「無停電電源装置があるから広域停電しても〇〇時間は稼働させる」とか、こういう「絶対止まりません」的なことを言います。(もちろん「絶対止まりません」とは言わないですが)

 

北海道胆振地方で地震が発生したときのさくらインターネットの対応はまだ記憶に新しいですね。

約60時間を非常用電源設備で乗り切った石狩データセンターの奇跡 - 週刊アスキー

北海道は災害が少ないと踏んでデータセンターを開設したのでしょうけど、結局は地震被害に遭ってしまいました。しかし、これは私見ですが「地震が発生する場所にわざわざデータセンターを作った会社」というより「地震が起こっても何とかする会社」というイメージを、さくらインターネットは作れたと思います。結局国内にデータセンターを建てようとしたら地震やそれによる停電のリスクってのはどこにでもあるし、むしろそれを乗り越えられる力を持つ会社が良い会社なんだと思います。

 

今回は極短時間の電源断だったようですが、データセンターがそれをやっちゃいかんと思います。

 

 

障害発生データセンターの発表

今は情報が掲載されていないようですが、当初は事故が発生したデータセンターの名前を公表していたそうです。これよくないんじゃないかなぁ。よくないから公表情報から削除したんだと思いますけど。

 

今現在の最新障害情報はこんな感じで発表されています。 

【QTnetデータセンター】データセンターシステムの障害による停止について(障害お知らせ 第9報 11/25 7時現在)

影響範囲
データセンターご利用お客さまシステム
(楽天カード株式会社、福岡県庁、九州電力株式会社含む約260社)

 

影響範囲の会社名が出てるんですよね。これって情報をくっ付けると「楽天カードと福岡県庁と九州電力はウチの会社の〇〇データセンターを利用しています。」と公表してるのと同義となります。

 

通常、企業は自社のシステムがどこに存在するかを公表しません。公表すれば場合によってはテロの標的になったり、出入りしている業者が丸め込まれてなんかされるってことがありますから。

なぜ公表に至ったのか。どうも本件で楽天は激おこぷんぷん丸のようなので、ものすごい強い要請がきたりしたのでしょうか。なんかチグハグな対応のように見えるんですよね。 

 

楽天カード側の対応

なぜ副系に倒れなかったのか

今現在の楽天カード側の最大の謎はこれですよね。金融関係の事業のシステムが副系(バックアップセンター)を持っていなかったというのは考えられません。推測ですけど、副系に倒れなかったんだろうと思います。

システムのことを分からない人は簡単に考えるかもしれませんが、電気のスイッチをパチンと切り替えるような単純なものではありません。どういう条件のときに、どういう順番で、何をどうやって副系センターに切り替えるのか、ということを考えていくと複雑なものになっちゃうことが多いんですよね。

とはいえ、電源断ってのは想定し得ない事態ではありません。まさかデータセンター側のやらかしで落ちるとは思っていなかったでしょうけど、電源が落ちるという事態は想定していたはず。なのに対応できなかった。楽天側からしたら「データセンターが無停電電源装置を持っているから、いきなり電力供給が途切れることはない」という前提で設計していた可能性はあります。

この副系に倒れずサービスダウンとなってしまった原因は是非公表してほしいなと思います。

 

 

激おこプンプン丸ニュースリリース「QTnetの所為」と言わんばかり

楽天は↓のようなアナウンスを繰り返しています。(楽天カード社は公式ページへのリンクを許可制と謳っているためTwitterを掲載。本家も同じようなノリ) 

 

ムカついてんのは理解できますし、「俺らの所為じゃない」と言いたい気持ちもわかります。が、どうも責任逃れの方便のように見えてくるんですよ。「弊社が契約しているデータセンター事業者」とかって書けばいいと思うんですけど、QTnetという会社名を前に出し過ぎな印象があります。

電源設備の更新作業でやらかしてしまう会社を選んで契約しているのは楽天サイドなわけです。任命責任とかっていうとちょっと違うかもしれないですけど、100%QTnetが悪いという方向に持っていこうとしているように見えます。とりあえず障害発生直後はその事象と影響範囲に注目して、原因が他社であるという事実はオマケ程度に扱った方が誠実に見えると思うのですが。

 

あと、こういうときに公式Webサイト上に掲載しているお知らせを上書きしていくスタイルって、あんまりない事のように思えます。怒りのあまり忘れているのかもしれませんが、隠したい理由があるのではないかと思ってしまいます。

 

 

これから起こること

これから起こることを予言します。愚考セクションです。

「やっぱり現金が安心よね。キャッシュレス怖いよね。」派の躍動

「それ見たことか。こーゆーのがあるからやっぱり現金なんだよ。ニヤニヤ」このようにほくそ笑んでいる方々がいらっしゃるのが容易に想像できます。私は半現半レス(現金とキャッシュレスの併用マン)なので影響はありませんでした。というより楽天系のサービスは一切使っていないので全くもって影響はありません。

 

本件はそこそこなニュースになったので、「いざと言う時には現金なのだよ」という主張をする方にはとてもおいしい材料になるのではないかと思いました。これ単に現金派vsキャッシュレス派の飲み屋での議論に使われるだけに留まらない話です。現在は国を挙げて(というより国が)キャッシュレスの旗を振っていますので、このタイミングでこの障害は、キャッシュレス普及活動に水を差した形になったと思うのです。

 

せっかく政治屋さんまで巻き込んで税金ジャブジャブ使いながら「キャッシュレス♫キャッシュレス♫」と踊らせていたのに、「やっぱキャッシュレスってヤバくない?」と一般庶民の心に疑問の芽を植え付けてしまった罪は大きいと思います。

 

我々庶民サイドからしたら、現実的にキャッシュレス決済に頼ることのリスクが可視化されてきたので歓迎すべき側面もあると思います。先述の胆振地方の地震による北海道停電の際に、私たち庶民は「店舗が停電していたらキャッシュレスは使えない」ということを学びました。そして今回は「事業者のサーバが逝くとキャッシュレスは使えない」ということを身をもって学ぶことが出来ました。

 

キャッシュレス決済ってのは使ってみないとメリットが見えにくいものです。しかし使わなくてもこういう形でデメリットは見えてしまう。これはキチンと世論操作をするなどの創意工夫をしないとキャッシュレス決済普及の足枷になってしまうのではないかと思いました。

 

CCP流行のキッカケ

CCP、「Comsumption Continuity Plan(消費継続計画)」の略称です。有事の際にもモノを買えるようにしておきましょうという計画のことを指します。

 

たとえば有事の際に、現金をいくらか保有していても店舗側にお釣りが無ければ現実的に等価交換ができません。銀行預金もおろせないかもしれません。しかし電力と通信網が生きていればキャッシュレス決済が使えます。

反対にキャッシュレス決済に依存していると電力、通信網、サーバのいずれかが逝った場合にモノを買うことができません。事業者のサーバは各社それぞれ好きなところに置いているので〇〇社は使える、△△社は使えないという状況も発生し得ます。

 

こういったことから有事の際にも消費を継続するための計画をたてること、これをCCPと言います。なお、これはBCP(Buisiness Continuity Plan:事業継続計画)をもじった私の造語のため「CCP」と言っても相手に通じることはないでしょう。

 

日頃から災害などを想定して、現金(小額紙幣や硬貨を推奨)、クレジットカード、QRコードといった複数の決済方法を持っておきましょうということです。これ流行ると思うんだけどなぁ。どうでしょうか。

 

今度は金融庁に怒られるの巻。

楽天の話です。楽天は第4の通信事業者となるべく現在奮闘中。ですが、あまり状況は芳しくない模様。最近ちょこちょこ報道で見かけます。

ざっくり言うと、通信事業をやるための基地局をいっぱい作らないといけないんだけど、どうも進捗が悪いようで総務省閣下より三度の行政指導を頂戴しているという状態です。

 

そして今回の問題です。決済関連は金融庁です。たぶん楽天は金融庁への顛末報告が必要となるでしょう。で、まぁガミガミと、税金で遊んでるお役人様方から有難い御注意をいただくことになるでしょう。

上でも書いた通り、楽天側は「QTnetが悪い」という姿勢を最初から露骨に出しており、様々な批判をかわすためのクサビを打っているんだと思います。とは言っても「データセンターの短時間の停電」に耐えられなかったのは事実です。副系への切り替えが行われなかったのは楽天側の落ち度。

 

さらに加えて停電から丸2日経過した本日25日、再度「楽天ペイ」などが使えない状態になっているそうです。

 

 

11/23の朝方にデータセンターの電源断によるサービス停止があって、同日昼ごろには復旧してましたね。この件の原因はセンターの電源断です。でも一度サービスが復旧してから、本日また楽天ペイが使えないという事象が起こったのは、もはやQTnet側の所為ではないのではないでしょうか。楽天カード社は「株式会社QTnetの電源設備更新作業に伴う不具合」と繰り返し述べていますが。

一度復旧して、もう電力供給は安定している状態なのにもう一度サービス停止をしていると。これは他のサービスを復旧させる作業のなかでやっちまったことなんじゃないだろうか。そりゃ大元の原因はデータセンターにあるだろうけど、電力が安定してからは楽天サイドの話になると思うんですけどねぇ。

 

経産省にも突かれるかもしれない

クレジットカードのA型決済事業者一覧 | キャッシュレス消費者還元事業

キャッシュレスの還元事業ですね。これは経産省がやっているらしい。ここに楽天カード社も入り込んでいます。

 

感想

私は中の人じゃないので詳細は分かりませんが、外の人の立場で見た時に、本件の楽天側の対応はベストな行動をとれていたようには見えません。

 

システムが落ちてしまうというのは、これは究極的には仕方のないことだと思います。しかしながらサービスの復旧後にまた落ちるってのは、システムを完全にコントロールできていないことの現れだと思うんです。あらゆる場面を想定した復旧手順を作ることは難しいですが、アナウンス無く再度サービスを落としてしまうってのはよろしくない。本日朝時点では楽天ペイは復旧した状態だったはずで、その状態を維持しながら他のサービスを復旧させるってのがエンジニアサイドのタスクになっていたはずです。しかし落としてしまったと。正直この部分をQTnetの所為にするのはお門違いなんじゃないかと思います。

 

また、上にも書きましたが「悪いのはQTnet。俺たちは悪くない」という主張が強すぎるように感じます。私はこのニュースを見た時に少し嫌悪感を覚えました。何から身を守ろうとしているのかはわかりませんが、一般庶民に嫌悪感を覚えさせる対応は避けるべきだと思うのです。

 

むむむ、待てよ。これは逆に、我ら庶民に嫌悪感を覚えさせても、それでも守りたい何かがある、避けたい事態がある、ということなんじゃないだろうか。一般庶民に嫌われてでも守りたいもの、避けたい事態。何だろう?

お役所からの業務停止命令?いや金融サービスを止めるなんてありえない。流石にサービスがちょっと止まった程度で業務停止はない。楽天は国内でも数少ないIT系大企業だから、世界との戦いを見て背中を押すことはあっても足を止めることはしないはず。

関係各所からの訴訟対策か?「キカイソンシツガー!ソンガイバイショーガー」って群衆が現れたときのために保険をかけているのか?

一周回って、世間からのイメージを守ろうとしているのか?だとしたら、一庶民の私に限っては逆効果。ものすごく印象が悪い。

 

訴訟対策・イメージ維持戦略のような気がするんですが、どうでしょう。

 

おわりに

私はSIerに勤めていたころに数年間金融システムのSEをやっていました。そのとき「金融系システムはたとえ天地がひっくり返ろうと止めてはならないシステムだ」と教わりました。ホントかどうかは知らないですが、東日本大震災の発生時にデータセンターのラックが横倒しになっていても動作していた、なんて逸話も聞いたことがあります。

 

そんな止まったらとんでもないことになると言われる金融系システムが今回サクッと止まったということでエントリを書いてみました。

あまり期待はできないですが、本件の発生原因などのレポートが出ることを期待しながら待つことにします。