記録

東証システム障害の考察してみた。#東証システム障害考察

7時4分にアラートが上がっていた?が、現場がアラートに気が付かず、後続の処理が流れ相場、売上の前処理バッチ処理が走った時点なのかな。そこでようやく現場がアラートが出ていることに気づく、この時点でベンダーに現場が支持を仰いだのか、マニュアル通りフェイルオーバーさせて、これ自体問題かもしれないが、そうしたんだろう。フェイルオーバーさせたけど運良くフェイルオーバー失敗。メモリリークがおそらく原因でサーバーの切り替えが出来なかった。ここでベンダーに支持を仰いだ可能性もありそう。そしてベンダーがここらへんから介入して監視端末のログなどを調査したら、メモリリークのエラーログを確認したんだと思う。

※失敗したジョブがどこかに格納されるだろう。この時点でフェイルオーバーさせるより後続の処理をストップさせて、ベンダーに支持を仰いだ方が良かったのかもしれないなと。でも現場は混乱していただろう。

もう前処理バッチ処理をして失敗していたんだろう、きっと。なので遮断して本日の東証での取引は出来ないようにした。ここでログなどを回収して再起動したんじゃないのかな?(切り離しもここでの話だと)

メモリリークの原因は、メモリの物理的破損だったのでメモリが悪いと判断した。メモリエラーが監視端末のログにクリティカルなエラーとして表示されていたのかは不明。

7時時点で相場や売上の前処理を取り込むのなら、何だか整合性がつきそうです。おそらく手動で前処理が走るのではなく自動で前処理が走るシステムだったんだろう。従業員が端末の監視も7時からだったのかな?

資料が時系列で書かれていないので良く分からないけど、自分なりに東証システム障害を考察してみた。

現場のヒューマンエラーも疑われるけど、末端の従業員は下請け業者何だろうな?。ベンダーは常時、東証システムの現場にいたのか?とかいろいろな事が問われるかもしれないよな。

おそらく本日から正常に東証は取引できると思います。メモリを取っ替えだろうしメモリチェックもしているだろうし。

最後に頑張れ東証システムの現場!!
末端が解雇されないことを切に願う、これで直ぐに切られたら次の職には絶対につけなくなるよ。でも末端が悪いという事ならば数年後、数ヶ月後にはクビになる可能性は高いかもな。

ちなみに上記が昨日のツイートまとめになります。

3月のライオンを今頃、前半と後半を観る。前のページ

text形式に土日は変更。次のページ

関連記事

  1. 記録

    夜な夜なサーバー移行。

    夜な夜なサーバー移行。ほぼ徹夜してサーバー移行を行いました。ち…

  2. 記録

    映画:寄生獣、大ヒット上映中らしいですが!!

    映画:寄生獣、大ヒット上映中らしいですが観に行く予定はないです{今…

  3. 記録

    映画、イントゥ・ザ・ストームを観てきましたので感想なんか(´△`)

    イントゥ・ザ・ストームを観てきましたので感想を書いときますね。この…

  4. 記録

    20210102変革の年2日目。

    変革の年と勝手に思っているのですが、新年明けてもう2日になります、昨…

  5. 記録

    ガジェット好きな凄いITエンジニア、drikinさんのYOUTUBEが和む。

    ガジェット好きな凄いITエンジニア、 drikin (どりきん…

  6. 記録

    欲しい物リスト。

    マックブックプロ(MacBook Pro)です、アプリ開…

PAGE TOP