記録

東証システム障害の考察してみた。#東証システム障害考察

7時4分にアラートが上がっていた?が、現場がアラートに気が付かず、後続の処理が流れ売上の前処理バッチ処理が走った時点なのかな。そこでようやく現場がアラートが出ていることに気づく、この時点でベンダーに現場が支持を仰いだのか、マニュアル通りフェイルオーバーしたんだろう。フェイルオーバーさせたけど失敗。メモリリークがおそらく原因でサーバーの切り替えが出来なかった。ここでベンダーに支持を仰いだ可能性もありそう。そしてベンダーがここらへんから介入して監視端末のログなどを調査したら、メモリリークのエラーログを確認したんだと思う。

※失敗したジョブがどこかに格納されるだろう?。フェイルオーバーさせるより後続の処理をストップさせて、ベンダーに支持を仰いだ方が良かったのかもしれないなと。でも現場は混乱していただろう。

メモリーリークが起きていたと思うと実際は前処理バッチ処理をして失敗していたんだろう。遮断して本日の東証での取引は出来ないようにしたのは正解だと思う。

メモリリークの原因は、メモリの物理的破損だったのでメモリが悪いと判断した。メモリエラーが監視端末のログにクリティカルなエラーとして表示されていたのかは不明だけど、おそらく見落としだと思う。

7時時点で相場や売上の前処理を取り込むのなら、何だか整合性がつきそうです。おそらく手動で前処理が走るのではなく全自動で前処理が走るシステムだったんだろう。従業員が端末の監視も7時からだったのかな?

資料が時系列で書かれていないので良く分からないけど、自分なりに東証システム障害を考察してみた。

現場のヒューマンエラーも疑われるけど、末端の従業員は下請け業者何だろうな?。ベンダーは常時、東証システムの現場にいたのか?とかいろいろな事が問われるかもしれないよな。

おそらく本日から正常に東証は取引できると思います。メモリを取っ替えだろうしメモリチェックもしているだろうし。

最後に頑張れ東証システムの現場!!
末端が解雇されないことを切に願う、これで直ぐに切られたら次の職には絶対につけなくなるよ。でも末端が悪いという事ならば数年後、数ヶ月後にはクビになる可能性は高いかもな。

ちなみに上記が昨日のツイートまとめになります。

活動支援よろしくお願いします

3月のライオンを今頃、前半と後半を観る。前のページ

text形式に土日は変更。次のページ

関連記事

  1. 記録

    映画、ダイバージェントNEOが面白そう?

    映画、ダイバージェントNEOが面白そうだと感じたので、1を昨日見てみ…

  2. 記録

    独り身で生きている方は15年で5000万貯めれば大丈夫。

    独り身で生きている方は15年で5000万貯めればその後、働かないで大…

  3. 記録

    PHPとVS2015をJSONで連携する。第二弾

    VB2015側Imports System.NetPublic …

  4. 記録

    9月度のアクセス数です。

    この所、アクセス数はRSSから訪問者数が多い事がアクセスカウンター…

  5. 記録

    Yesとか書いている人がいた。

    https://www.youtube.com/watch?v=_…

  6. 記録

    face-api.jsとElectronで顔認識をさらっと導入。

    face-api.jsとElectronで顔認識をさらっと導入してみ…

PAGE TOP