【カッパドキア】memories 2.0建造委員会2【過去ログ倉庫】
■ このスレッドは過去ログ倉庫に格納されています
2ちゃんねるの過去ログを一手に引き受けている
oyster902.peko.2ch.net+sumaもデビューから3年。
1.5TBのストレージはそろそろ満杯だし、フロントエンドも結構いっぱいいっぱい
そろそろ次の過去ログ倉庫を作らないとまずいなぁ・・・・
ってことで、RAID 6 8TBのbanana3000.maido3.comを作ってるんです
開発日記
http://www.maido3.com/server/zousan/
お姿
http://www.maido3.com/server/ebanana/
転送量グラフ
http://traffic.maido3.com/jfj1/McNh/nXAg/
■ ぞうさんからのお知らせ part1
http://qb5.2ch.net/test/read.cgi/operate/1197634004/l50
--------------------------------------------------------------
ここまでのお話
いよいよその姿を現した「ぞうさん(花子)banana3000.maido3.com」
しかし、過酷な試験に花子はくじけてしまいそうなのだった。
負けるな花子、がんばれ花子! 今悩むのはナンセンスかと、
両方できるようになってから悩むべし >>297モレは、管理のヒューマンエラーより現場のヒューマンエラーの方が単純で頻度が高いんで、現場での人間の作業はなるべく減らした方がいいという見解。
何せ現場だと常に時間が無いから、担当者が軽いパニックに陥り易い。順番間違えとか処理忘れとか確認忘れとかw
ミスが凡ミスのわりに事態が深刻になるからね。可能な限り機械にやらせるべきだと思ってる。
やることが赤ランプのディスクを抜いてゴミ箱(不良ボックス)に捨て、新規ディスクを持ってきて差すというだけなら、並や大抵の馬鹿ならミスは起こせないでそ
で、そのまま待機室に戻っても、チェック後にまた使えないディスクを交換汁メッセージが入ってきて同じことを繰り返すw
>>298でも自動化するなら、自動化に必要になりそうな実験のフルログを今のうちにチェックしておかなきゃならないわけで・・・ >298
んだすな(^_^;)
ここまでにできたこと
・1本抜いたときの振る舞いの確認
・2本目抜いたときの振る舞い確認
・3本目抜いた時の振る舞いの確認
・4本目抜いてしまった時の振る舞いの確認(^_^;)
・逆手順の振る舞いの確認
・ホットスペアの復旧手順の確認 腹回りと言われなかっただけ、マシなんじゃないかと。 マァヴだって昔はアレだったんだぞ!きっと、多分…もしかしたら…… http://www.maido3.com/server/zousan/nikki3.html
>(^_^;):「おおっ、1号機(manidame)よりも凄く安定しているぞっ!」
まにだめwwwwwwww まにだめワロタ
てか、誤字をよく見かけるwプレスリリースとかにもあったような なんか、mamonoと何度か入力してたせいで手が自然にmaと入力してしまっているきがする __ _
/ .\__ノ )
(_ノ フ__,ノ
ノ ( ´∀`)
/ 凵 |コ
(. l
∪、, _ ,,ノ
凵 凵 さしずめ、百式は桃か。名の通り魔物か。
この連休、花子の調教も無さそうだし、余興、余興。 VIPをyutoriへ移転させないのかな。
年末年始、とくに年越しのVIPに対応するためという意味も持たせて百式作ってたような気がするんだけど。 確か進捗状況は
抜き差しのテストも終わって、ホットスペア追加等の手順も分かった
しかしSumaのようにガチャポンだけで行けないけどどうするよ?
ってな感じだったかと
負荷がかかっている状態でのテストは済んでいますが
この先もテストをする必要があるかどうかは、情勢によって変わるでしょう。 このあとの予定(^_^;)
あと1つだけ実験やります。予定は明日午前中。
1 一本抜く
2 ホットスペア起動→リビルド開始
3 リビルド中にホットスペア追加(が成功したとして)
4 更に一本抜く
どうなる?(^_^;)
これが終わって、16本すべてが所定の状態に戻ったら実験終了です。 マァヴさん
2つほど質問させてください
・実験中、サーバーは停止しますか
・今回の勝算はいかほどでしょうか >337
・停止するかもしれないししないかもしれない(^_^;)それを確認するための実験だし
・勝算って、どうなったら勝ちなんだろう?(^_^;)動作を確認できればいいわけなんで、勝ち負けはないと思う 停止どんとこい
VIP931で他に行けない奴らが鯖落とされたらどうなるか
いとをかし >>338
回答ありがとうございます
実験の趣旨をよく理解してませんでした、ごめんなさい
実験が成功するよう願っています 本日の実験結果(^_^;)
やること>336
初期状態
UNIT0 0-2-3-4-5-6-7-8-9-10-11-12-13-14-15
UNIT1 1 (ホットスペア)
#2を抜いた
UNIT0 0-2X-3-4-5-6-7-8-9-10-11-12-13-14-15
UNIT1 1 (ホットスペア)
ホットスペアが起動し、#1のリビルドが始まった
UNIT0 0-1R-2X-3-4-5-6-7-8-9-10-11-12-13-14-15
抜いた#2に新品のHDDを入れ、ホットスペアに設定(#1のリビルドは進行中)
UNIT0 0-1R-3-4-5-6-7-8-9-10-11-12-13-14-15
UNIT1 2 (ホットスペア)
#3を抜いた(#1のリビルドは進行中)
UNIT0 0-1R-3X-4-5-6-7-8-9-10-11-12-13-14-15
UNIT1 2 (ホットスペア)
ホットスペアが起動し、#2のリビルドが始まった(#1と#2のリビルドは平行して進む)
UNIT0 0-1R-2R-3X-4-5-6-7-8-9-10-11-12-13-14-15
抜いた#3に新品のHDDを入れ、ホットスペアに設定(#1と#2のリビルドは進行中
UNIT0 0-1R-2R-4-5-6-7-8-9-10-11-12-13-14-15
UNIT1 3 (ホットスペア)
今ここ(^_^;)
毎回ホットスワップの場所変わるの?
エラーランプとか無いみたいだし交換要員が間違ったりしないのかな? わかったこと
1 障害が発生し、ホットスワップが起動したら、障害HDDを新品に交換し、ホットスワップに設置できる
2 リビルド中に新たな障害が発生しても、ホットスワップがあれば機能する
ということで
「実行されているリビルドが2つ以下ならば、故障したHDDをホットスワップ化する」
ことで、連続した障害に対する耐性を向上できることが判明(^_^;)
ただし、現状(つまりリビルド2つ+ホットスワップ)では冗長性は0です。 >343
毎回変わります(^_^;)
ランプは点灯しない(というかない)ので、デッキ番号とポート番号で管理します。
デッキ番号とポート番号は一致しています。 >346
実験はこれで終了ですー(^_^;)ってことでいよいよ本題の「memories 2.0建造」かな? 現在まだリビルド中(^_^;)ちょいと待ってね
RAIDアレイがすべて平常に戻って、予備HDDがすべて準備完了したら終了宣言の予定 お。お。お。お。( ^ω^)
いよいよ本編スタート お疲れ様です
実験は大成功だったようで、喜ばしいことです
花子のささやきも働いていて心強いですね
2.0いよいよ始動ですか 今回は予測通りの動きを示しました(^_^;)
予想外だったのは、リビルドが2つ平行して進む点。
よくできてます>花子 >>351
> 予想外だったのは、リビルドが2つ平行して進む点。
ふむー。RAID 6だからってことですかね。 >352
RAID5では二つてこと自体発生しないわけで(^_^;)その状況では破綻してるし
RAID6の実装として、一台づつ順次リビルドではなくて、両方同時にリビルドするようになっているようです。
どっちがいいのかっていうと、一台づつのほうが、冗長性+1に速く到達する気もするんですが(^_^;) 1TBのデータ転送、気が遠くなるくらい時間かかりそう。 なるほど、rebuild の間は wait するんじゃないか、って思っていたということですか。>>353
その動作はなんとなくですが、configurable な気がします。
設定を変えるかどうかは別にして、マニュアルをあたっておくといいかも。 >355
あいあい(^_^;)確認します
とはいえ、現状で満足な状態なので、あえて1台づつモードは目指しません
原則、デフォルト(つまりメーカー推奨)を使いこなします。 >>353原理的に0→+1→+2よりも0→+2の方が、ざっと40%程度早いです。
0→+1と0→+2の差はだいたい6%ぐらいしかないはずなので、気にするほどではないと思われます。 >>356
> とはいえ、現状で満足な状態なので、あえて1台づつモードは目指しません
はい、それで問題ないと思います。
>>357
ほほう。 さて、次のアクションは、、、。
memories2、本格スタート? 記憶では、
1) システムディスクどうしようか
2) 使ってないネットワークカードが入ってるみたいだけど・・・
3) 長く使い続けるものだから当初から 64bit化、4G mem化 したほうがいいんじゃね
ぐらいが課題として出ていたはず。 >>366
で、
1) は、あえてこのままいく、という手もあるかな、という話をしていたと思います。
もちろん他の T-banana 同様に RAID 1 にするのもありだと思います。
2) は、気にする必要はないでしょう。
3) は個人的には、やっておきたい気がしますね。 ドライバーとかがちゃんとあるんだろうか・・・64bit >>368
twa の amd64 用ドライバがあるのは確認済です。 HDD大量に積んでるから、エアフローとか考えても
不必要なカード類は外した方がいいんじゃね? 作業完了予定(^_^;)明日の正午
残り作業
・予備HDDのフォーマット
花子自身は完璧に動作しています(^_^;) >>371
ハードウェアの予備体制も含め、明日正午にて準備完了と。
ということは、このまま過去ログ倉庫として2chにリリースする、
ということでおkなのかしら。 仕様はこのままで行こう。
つまり再インストールとかはなし、当然32bitのまま
ん? 64bitじゃなかったっけ? >>372
その方向でここで話し合いをつつけたいなと、 >>373
今は32bit版ですね。
banana3000:~$ uname -m
i386 一回も落ちずにいい仕上がりだと思うな
堅牢そのものに見える。 現在のスペックは、
標準T-banana - (250G HDD x 2) + 80G HDD + Realtek Network IF x 2
+ (RAID card + 500G HDD x 16)
ということになりますね。
標準T-bananaと同じ、メモリは2Gで、32bit版ということになるです。 へへへ(^_^;)おいらもそう思います
で、システムディスクですが・・・・
1RAID 1にする
2RAID 6にユニークデータを置いて、システムディスクはいつでも入れ換え可能にする
3RAID 6にユニークデータのコピーを置いて、システムディスクが壊れたら、そこを読み出せるようにして復旧させる
4このままでいく
5もっと凄いアイデアを考える
3が一番手っ取り早い上に、確実な気がします(^_^;) >>377
システムディスクがふっとぶリスクは旧banana程度にはあると思いますが、
その時には単純に HDD 交換(その間は収容している過去ログが見られない)
ってことですね。
RAID 6 のほうは、
ちゃんと設定ができてからは、きちんと動いている様子。 >>380
2 と 3 の違いは、、、。
symbolic link する、ということかしら。
だとすると、あんまりおすすめできないですね。
RAIDカードに異常が発生すると、復旧作業がしにくいです。
直感的に、1 か 3 じゃないでしょうか。 >383
ですです(^_^;)方法論は色々あるかもだけど
ユニークデータをRAID 6上に配置して、そこから読み込んで動くってことです。
というかきっと、
A) 1 と 3 の組み合わせ
B) 3
のどっちかがいい気がしますね。
1 と 2,3 は互いに独立な手法ですから。 くらべてみると(^_^;)
1のメリット
既知の手法(T-bananaで経験済み)
1のデメリット
両方ふっ飛ぶことがある(T-bananaで経験済み)
3のメリット
RAID1より堅牢である
現状から改変が不要
3のデメリット
始めてやることである
1に比べて復旧手順がちょっと複雑 あと、思うんですが、
基本的には旧 banana サーバのシステムディスクだけがこわれた時の
リカバリーオペレーションと、
本質的には同じなんではないでしょうか。
単に、データディスクが堅牢になって、
容量がばかでかくなっただけではないかと。
そしてその際のリカバリー手法やノウハウはさすがに、
既に蓄積されているんじゃないですかね。 んじゃそれで(^_^;)
どっちにしても4から始まるわけだし
なにはともあれ4でスタートってことで >388
です(^_^;)
4の状態である間は、bananaと同じですー >>387
それでいきますか。
>>381 の第一段落の運用ポリシーでいくんであれば、
わたし的には特に異論ないです。 んじゃ >>387 でいこう。
始まりはあした。それまで特に反対意見が出なければ
memories2 は船出 !! 明日VIPがyutoriに戻る
でよろしいですか? >>393
「かもね」くらいです。
大掃除、大掃除。 今のバーチャルホストを banana3000 に移したら、
旧 tiger/cobra 達は OS から入れ直して、
いよいよバックヤード系の旧 banana の置き換えにかかろうかと。
年始あたりからぼちぼちと。 ■ このスレッドは過去ログ倉庫に格納されています