NTT東日本フレッツ障害の原因

| コメント(0) | トラックバック(0) このエントリーを含むはてなブックマーク

 NTTより15日に発生したネットワーク障害の最終報告がありました。多分今回のようなケースはNTTでも初めてなんじゃないかな。というか実際に再現するテスト環境なんてコスト的に無理だから机上のリスク計算しかできないと思う。

 私のような末端はVPNやプライベートLANのルーティング設定してそれ以外は精々数本のグローバル回線にルーティング情報を張るぐらいだから手作業で済みますが、主要回線はピアtoピアで沢山のルーターが相互に物理的な接続をしているし、常にルーティング情報は変わるから自動じゃないとやってられないと思います。

 DNSと違ってルーティング情報は直ぐに書き換えを行う仕様みたいなので、タイミング悪くトラフィックの多いときにやってしまったようですね。(DNSのキャッシュもサーバの増減時に強制的に消し去りたいと思うこともありますが…)

 NTTでは障害の連鎖に対しどのようなソフトウェア対策を行われていたか記事からは分かりませんが、実際に障害を起こしたのは古いソフトウェアで動作しているルータということでルーティング情報の書き換え連鎖を防ぐ処理が無かった為のようです。

 通信事業者としての現在の立場を考えると今回の障害は多くから非難も発生すると思いますが、ネットワーク障害について速やかに技術的な報告をする姿勢は評価したいです。

 このニュース記事見た一部ISPがルータ総点検するきっかけになれば、他社による同じ過ちの再発を未然に防止できるのではないかなっと思います。

3秒で2000ルータがダウン、NTT東フレッツ障害の原因は - @IT
http://www.atmarkit.co.jp/news/200705/16/ntt.html

BGPの仕組みと役割を理解する
http://www.atmarkit.co.jp/fnetwork/rensai/iprt02/iprt01.html

「フレッツサービス」および「ひかり電話」をご利用できない状況について(最終報)
http://www.ntt-east.co.jp/release/0705/070516b.html

別紙1 時系列
http://www.ntt-east.co.jp/release/0705/070516b_1.html

別紙2 発生のメカニズム
http://www.ntt-east.co.jp/release/0705/070516b_2.html

トラックバック(0)

トラックバックURL: http://blog.c-production.com/mt/mt-tb.cgi/407

コメントする

アーカイブ