先週6月14日に発生したAmazon Web Servicesの米国東部リージョンでのシステム障害は、HerokuやPinterestなど大手のサービスにも影響を与えたようです。その障害報告が、Service Health Dashboardで公開されています(現在はRSS内の記述として読めます)。 障害は米国東部リージョンでの特定のアベイラビリティゾーンで発生したもの。報告によると、プライマリの電源ケーブルのトラブルをきっかけにバックアップとしての発電機へ移行したものの、そこでもまたトラブルが発生し、二... > このページを見る
最終更新時間:
2012年06月21日15時17分
みんなのブックマーク 人気(10) 新着
- バックアップ電源のファンが不調だったってのは、普段から稼働しているシステムならば起こらなかったはず。「非常時だけ使う物」の保守ってすごく大変。こんなとこにも日経が言う「スマートデザイン」の思想が必要?
- イザという時のバックアップ装置は、イザという時に限って役に立たない。(普段使わない為、不具合の発覚も漏れ易い。 ≫ Amazonクラウド先週のシステム障害、原因は電源トラブル。二重三重の防護策が次々と倒れる -
- この話のキモって、実はリカバリ速度だよね。1時間22分後には副系統電源ファンの修理が終わって、その30分後に復旧。(Niftyクラウドは分岐盤交換に7時間、その2時間40分後に復旧) 実力は、やらかした後の復旧で出る。
- 電源周りはなあ。 / コールドバックアップ機材は寝起きがなあ。
- AmazonのDCにもコンセント抜く「掃除のおばさん」がいるのかとおもった(焦
- 現用系から待機系への切り替えのリスクは、待機系が果たして正常かが切り替わるまで分かりにくいこと。現用系を冗長化するシステムでは逆に寿命が同じ時期になるという問題が。
- なんか原発っぽいw
- どこぞの原発の話を思い出した。
- 原発じゃあるまいし、全電源喪失なんて事態対応できなくても仕方ないでしょ。そこまでやってたら価格競争力がなくなる
- 途中から福一の話に見えた
- これだけ冗長化されたシステムが障害を受けるとは。
- 3重に冗長化された電源が次々に死んだとのこと。事象・対応をオープンにしていることが好印象。 / Amazonクラウド先週のシステム障害、原因は電源トラブル。二重三重の防護策が次々と倒れる
- 待機系ってフェイルオーバー部分含めてどうやって動確テストやってくのがベストなんだろ。ファーストサーバはそこら辺まったくノータッチだったのか
- AWSが落ちてた件。電源がやられると全部イカれる。国内でも事例があったね。。
- 物理システムが関係する予備系は定期的に動作させておく必要があるよね。インフラ企業のように四半期ごとの単独運転・年1回の切り替え試験をやるのは難しいかもしれないけど。
- へー電源トラブルなのかー。今のところ、電源障害は体験したこと無いなー。空調のトラブルは何度か経験したけど。空調も二重化して欲しい…
- 案外電源トラブルは馬鹿にできない。
- こういうのって難しいよな。
- 予備電源が使えなかったって某原発みたいだなーと思ったらブコメでさんざん言われてた 1 RT
- amazonクラウドが死んだ件 めも:Amazonクラウド先週のシステム障害、原因は電源トラブル。二重三重の防護策が次々と倒れる - Publickey
- 現用系から待機系への切り替えのリスクは、待機系が果たして正常かが切り替わるまで分かりにくいこと。現用系を冗長化するシステムでは逆に寿命が同じ時期になるという問題が。
- AWSですらこれだから、最近参入してきたMSとかオラクルその他国内ベンダで今後大量に障害報告が上がってくることは想像に難くない
- 電源周りはなあ。 / コールドバックアップ機材は寝起きがなあ。
- 「マルチアベイラビリティゾーンの重要性」結果的にうまく宣伝に結びつけた感じ?/安価な他社をメインにする場合、従量制のAWSを予備でアイドルさせとくのとか便利かね?
- 電源喪失問題はどこも同じ破綻をするのね。電源喪失→バックアップ発電機に移行するもオーバーヒート→セカンダリバックアップ電源に移行するも設定がミスっていた、みたいな。ほぼ福一原発事故をなぞってる。
- この話のキモって、実はリカバリ速度だよね。1時間22分後には副系統電源ファンの修理が終わって、その30分後に復旧。(Niftyクラウドは分岐盤交換に7時間、その2時間40分後に復旧) 実力は、やらかした後の復旧で出る。
- 興味深いレビュー。AWS使いはマルチアベイラビリティゾーンを設定しておくことが最大の対策になるだろう。
- こわ~( ̄▽ ̄)
- 普段休んでる非常時用装置が急に起こされて異常発生ってのはよくある話だけど怖いな
- イザという時のバックアップ装置は、イザという時に限って役に立たない。(普段使わない為、不具合の発覚も漏れ易い。 ≫ Amazonクラウド先週のシステム障害、原因は電源トラブル。二重三重の防護策が次々と倒れる -