記事検索

PSPINC代表 内倉憲一の公式ブログ

https://jp.bloguru.com/uchikura

データセンターのアップデート

スレッド
データセンターのアップデート
2週間前の土曜日にデータセンターの UPS から発煙した事故ですが、今週末に壊れた UPS を2台バイパスして給電をする工事が行われました。この工事の結果、UPS 3台が冗長化した形で給電が行われています。

事故の前は4台で給電が行われていましたが、事故の後は2台に減った状態。現時点で4つの経路から3つの UPS で給電が行われています。電源の冗長化が行っていただめに事故の際のサービス停止は少なくて済みました。また、今回の工事によるサービス停止はありません。

テレビ局が所有するデータセンターで、今回の事故に関する発表や報道は一切ありません。報道管制とでも言うのでしょうか。でも新聞社からインタビューの申し込みがありました。すっぱ抜きでもするのでしょうか。インタービューは電話で行われましたが、気をつけて話をしました。PR 会社のアドバイスです。(こんなこと英語で書けないですよ。)
#ビジネス #マーケティング #営業

ワオ!と言っているユーザー

  • ブログルメンバーの方は下記のページからログインをお願いいたします。
    ログイン
  • まだブログルのメンバーでない方は下記のページから登録をお願いいたします。
    新規ユーザー登録へ
この投稿へのコメントはできません。
KUMA
KUMAさんからコメント
投稿日 2008-07-01 07:03

難しい話ですね・・・・

前の事故では発電機が起動しなかったと聞いていますが、試験などはどうやっているのでしょうか?

ワオ!と言っているユーザー

うちくら
内倉憲一さんからコメント
投稿日 2008-07-01 17:58

今のデータセンターには A, B, C, D の4つの 300KVM クラスの UPS がありました。それぞれ 150KVM を最大にするように使っていたのですが、A が 50% を越えたために、E と F UPS を増築しました。この結果  A, B, C, D, E, F の6つの UPS ができました。PSP では、A, B, C, D 全てから電気の供給を受けていました。


完成した時点で、A のロードの半分を E に移行しました。この時点で PSP は、E, B, C, D から電気の供給を受けることになったのです。この A から E への移転が行われた2時間後に事故は発生しました。

現時点でも原因は不明(発表していないだけかも)なのですが、A から E への移行のあと C, D UPS のスイッチが燃えて使えなくなりました。この時点で PSP への電気供給は E と B 回路だけになったのです。この事故はメインテナンス中に起こったので、消防によってデータセンターから追い出されてしまい、その結果数台のサーバーがメインテナンスから戻ることができなくなりサービス停止が発生しました。

1週間後行われた工事は、使っていない F UPS を D UPS の代行として電源共有を行う工事でした。これが完成した時点で PSP は、E, B, D の3つの UPS から給電を受けることになりました。この完成後に E UPS から C UPS への給電工事も行われ現在に至っています。

ワオ!と言っているユーザー

ファルコン
ファルコンさんからコメント
投稿日 2008-07-01 08:11

これだけのIT化の状況で事故発生となると、大問題になるのでしょうね。


日本では、銀行のATMのトラブルぐらいしかあまり報道はされませんが、隠れた事件も多々ありそうな気がいたしております。

ワオ!と言っているユーザー

うちくら
内倉憲一さんからコメント
投稿日 2008-07-01 17:30

こんな事を書く IT 会社の社長はいないのではないでしょうか。私は隠すようなことでは無いと考えています。データセンターの運営はサーバーを買えば終わりと思っている人も少なくは無いと思います。この事故のなかで 99.9% 以上のアップ率をキープするために努力をしていることを知ってもらわないと、動いていてあたりまでは24時間シフトで対応しているスタッフが可哀想です。

ワオ!と言っているユーザー

ハッピー
悲しい
びっくり