記録

東証システム障害の考察してみた。#東証システム障害考察

7時4分にアラートが上がっていた?が、現場がアラートに気が付かず、後続の処理が流れ売上の前処理バッチ処理が走った時点なのかな。そこでようやく現場がアラートが出ていることに気づく、この時点でベンダーに現場が支持を仰いだのか、マニュアル通りフェイルオーバーしたんだろう。フェイルオーバーさせたけど失敗。メモリリークがおそらく原因でサーバーの切り替えが出来なかった。ここでベンダーに支持を仰いだ可能性もありそう。そしてベンダーがここらへんから介入して監視端末のログなどを調査したら、メモリリークのエラーログを確認したんだと思う。

※失敗したジョブがどこかに格納されるだろう?。フェイルオーバーさせるより後続の処理をストップさせて、ベンダーに支持を仰いだ方が良かったのかもしれないなと。でも現場は混乱していただろう。

メモリーリークが起きていたと思うと実際は前処理バッチ処理をして失敗していたんだろう。遮断して本日の東証での取引は出来ないようにしたのは正解だと思う。

メモリリークの原因は、メモリの物理的破損だったのでメモリが悪いと判断した。メモリエラーが監視端末のログにクリティカルなエラーとして表示されていたのかは不明だけど、おそらく見落としだと思う。

7時時点で相場や売上の前処理を取り込むのなら、何だか整合性がつきそうです。おそらく手動で前処理が走るのではなく全自動で前処理が走るシステムだったんだろう。従業員が端末の監視も7時からだったのかな?

資料が時系列で書かれていないので良く分からないけど、自分なりに東証システム障害を考察してみた。

現場のヒューマンエラーも疑われるけど、末端の従業員は下請け業者何だろうな?。ベンダーは常時、東証システムの現場にいたのか?とかいろいろな事が問われるかもしれないよな。

おそらく本日から正常に東証は取引できると思います。メモリを取っ替えだろうしメモリチェックもしているだろうし。

最後に頑張れ東証システムの現場!!
末端が解雇されないことを切に願う、これで直ぐに切られたら次の職には絶対につけなくなるよ。でも末端が悪いという事ならば数年後、数ヶ月後にはクビになる可能性は高いかもな。

ちなみに上記が昨日のツイートまとめになります。

活動支援よろしくお願いします

3月のライオンを今頃、前半と後半を観る。前のページ

text形式に土日は変更。次のページ

関連記事

  1. 記録

    歩くことが楽しくなるピクミンブルームをスマホに?

    歩くことが楽しくなるピクミンブルームをスマホに入れていますか?、自分…

  2. 記録

    ひとつの納期が終わる頃・・・・。

    ひとつの納期が終わる頃、何故か新人教育をしろという命令が先輩方からく…

  3. 記録

    iPhone6のNFCは全然、アレなんだって(´・ω・`)

    iPhone6のNFCは全然、日本では使用できない感じらしい(未対応…

  4. 記録

    この街。

    高知駅を撮った一枚。iPhoneで撮った写真だけど・・・。トイウコト…

  5. 記録

    安倍首相にお願いしたいこと。LCC(格安航空会社)を全国的に!!

    安倍首相にお願いしたいこと。LCC(格安航空会社)を全国的に!!っ…

2020年10月
 1234
567891011
12131415161718
19202122232425
262728293031  

カテゴリー

PAGE TOP