X



トップページ運用情報
1001コメント266KB

2ch特化型サーバ・ロケーション構築作戦 Part32

■ このスレッドは過去ログ倉庫に格納されています
0001 ◆4A8q3C5o8xCU
垢版 |
NGNG
2ch特化型サーバ・ロケーション構築作戦のスレッドです。

・2ちゃんねるのサーバロケーション、PIEに関する関連作業・調整事項
・DNS登録・変更関連の各種作業や調整事項
・2ちゃんねるのサーバで採用しているOS、FreeBSDに関する情報・調整事項
・各種作戦・プロジェクトとの連携、プロジェクト間の連携

等を取り扱います。

前スレ:
2ch特化型サーバ・ロケーション構築作戦 Part31
http://qb5.2ch.net/test/read.cgi/operate/1235553306/
0542動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 00:29:08ID:QO3so9+y0
connect() に対して connection aborted が返ってくるのは早かったので帯域じゃないと思います。

connection aborted はソケットの backlog(listernキュー)があふれて撥ね返されている状態
なので httpd がリクエストを捌けてないんだと思います。

StartServers が小さいので「どーん」に弱いというお話でしたが、一度 MaxSpareServers まで
上がってしまえば(MaxSpareSreversが適正ならば)徐々に回復するはずで、
今回はリブートするまで長時間ずっと回復しなかったので、StartServers のせいかどうか。

逆にサーバー性能に対して MaxSpareServers を大きくとりすぎたために、「どーん」と来たときに
Apacheが身動き取れなくなったんじゃないかという気がします。

一番疑わしいのはディスクの iowait ですが、もしかしたら Apache内の排他制御とかで詰まってたのかも。
いずれにしてもボトルネックがわかrないと対策しようがないですね。
0547root▲▲ ★
垢版 |
2009/08/07(金) 00:32:42ID:???0?DIA(102777)
tsushima httpd を強制的にリスタートしてみた。
0549動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 00:33:56ID:w198sjxz0
こういう見切り発進で知らずにやってきた利用者を
巻き込むあたりが実に2chらしいわなw
こういうのを楽しめないでマジ怒りする無粋な奴は
黙って寝てろってノリだしw
0551root▲▲ ★
垢版 |
2009/08/07(金) 00:35:58ID:???0?DIA(102777)
>>542
> connect() に対して connection aborted が返ってくるのは早かったので帯域じゃないと思います。

なるほど。

その他の分析もきわめて論理的ですね。

MaxSpareServers が大きすぎるのも確かにつらいです。
「どーん」の時に fork しまくりになるわけで。

因みに私は「どーん」が予想されるサーバでは基本的に、

・httpd は最初から最大数待たせる
・ひまでも数は減らさない、「どーん」はいつ何時起こるかわからないから

ようにしているです。
0554root▲▲ ★
垢版 |
2009/08/07(金) 00:37:50ID:???0?DIA(102777)
>>550
りょうかいです。私のほうでも確認しました。

今日は私のほうではもうこれ以上手の施しようがないかんじですね。(´・ω・`)
しばらくは涙流しながら放置ということで。
0556動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 00:38:14ID:ApBs87Hh0
>>546

Linuxのは、商用のディストリビューションをテストする時のやり方。
想定クライアント数を越える、Max Client数を割り出すときのやり方。
基本は、サービスをとめないというテスト法。

FreeBSDは、カーネルハッキングできるような人間がやることを前提にしている。
そのため、資料は乏しい。どっちかといえば、つっけんどん。
0557動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 00:42:19ID:Upa5FWXt0
落ちる→リブートの繰り返し何度もやるくらいなら
しばらく放置して熱冷めるの待った方が安全ですな。
0560root▲▲ ★
垢版 |
2009/08/07(金) 00:43:08ID:???0?DIA(102777)
PIEの中の人とICQして、tiger3547のグラフ見せてもらいました。

ここにはちと出せないですが(非公開URLにつき)、
100Mbps 天井までは行ってなかったです。70Mbpsぐらい。

しかもグラフがピンっと上がる*前に*、つぶれていました。
つまり一撃でKO負けした感じ。

ということで、
>>542
> connection aborted はソケットの backlog(listernキュー)があふれて撥ね返されている状態
> なので httpd がリクエストを捌けてないんだと思います。

というのが正解のようですね。

いきなり「どーん」と来て、httpd が起動というか fork() しきれなくて、

> 「どーん」と来たときに
> Apacheが身動き取れなくなったんじゃないかという気がします。

という状態になった、というのが農耕かな、という気がします。
0563root▲▲ ★
垢版 |
2009/08/07(金) 00:45:20ID:???0?DIA(102777)
寝る前にもう1回ずつリブート要請かな。< yutori7、tsushima

1:00 回れば人も減ってくるだろうから。
0564root▲▲ ★
垢版 |
2009/08/07(金) 00:45:44ID:???0?DIA(102777)
「今はあきらめてください」 >>561

これでよいかしら。
0565動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 00:46:45ID:eARRFZ6h0
>>556
なるほど。
にしても試してないけどUbuntu上だと
sudo aptitude install ltp
して
sudo ltpmenu
するだけでいいとか簡単すぎワロタ。

>>560
メモリ足りてるならforkも問題なくできるはずでは?
0567動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 00:47:57ID:77qd7CrP0?S★(600822)
rootさん乙です〜
0568root▲▲ ★
垢版 |
2009/08/07(金) 00:48:04ID:???0?DIA(102777)
>>565
> メモリ足りてるならforkも問題なくできるはずでは?

いやぁ、そうはイカのなんたらかと。
fork() のコストはものすごいから。
0573動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 00:49:59ID:eARRFZ6h0
>>568
cpuも余ってたんでしょ? 追いつかなくても適切な処理はなされるはずだし、なされてないなら原因はやっぱりデッドロックだし。
0574root▲▲ ★
垢版 |
2009/08/07(金) 00:50:51ID:???0?DIA(102777)
>>572
> forkが負荷高くて駄目ならしないようにすればいい

やばそうなサーバでははじめから最大数(>>551)

というかんじで。
0576動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 00:51:04ID:RlJDWc+Q0
今日はもう寝るから
明日も朝から仕事だし
帰宅する20:00までには復帰しておいてくれ
0579動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 00:51:25ID:nyTdzduj0
rootもおまいらも早く寝ろ
体壊さない程度にしとけ
0583root▲▲ ★
垢版 |
2009/08/07(金) 00:55:00ID:???0?DIA(102777)
>>573
上のほうでもありましたが、
> backlog(listernキュー)があふれて撥ね返されている

というかんじですね。

ちなみに httpd は普通に kill できるので、
わたし的にはデッドロックという印象は持っていないです。
0584root▲▲ ★
垢版 |
2009/08/07(金) 00:56:46ID:???0?DIA(102777)
>>578
> その後落ちたら、そのまま放置?

あとは適宜リブート要請(誰でも可能)というパターンかと。
ただすぐ落ちる状態でリブート要請しても、またすぐ落ちるだけかと。
0588root▲▲ ★
垢版 |
2009/08/07(金) 01:02:27ID:???0?DIA(102777)
人が減ったっぽいので、さっき 1:00 頃に httpd を kill してみた。< tsushima
0592root▲▲ ★
垢版 |
2009/08/07(金) 01:05:47ID:???0?DIA(102777)
>>591
数えるプログラムが謎のハングアップしてた。
リスタート完了。
0593 ◆NAO/2MXDEk
垢版 |
2009/08/07(金) 01:06:50ID:Ij6prAzR0
いつの間にか新生ゆとりが投入されたと思いきや、なんかありそうな感じで・・・
# あまり流れがよくわかってませんが
0595動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 01:08:49ID:ApBs87Hh0
>>592
お疲れさんでした。
0600root▲▲ ★
垢版 |
2009/08/07(金) 01:35:29ID:???0?DIA(102777)
1:30 になったので、
httpd を kill してみた。< yutori7
0603動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 01:37:06ID:bww1ftrL0
ツイッターにサイバー攻撃か 利用不可能に
2009年8月7日1時15分

【ワシントン=勝田敏彦】短い「つぶやき」を自由に書き込んだりできる人気の交流サービス
(SNS)のツイッターが米東部時間6日朝、トラブルのため、利用できなくなった。
7月に韓国や米国の政府機関などが受けたのと同様の、DoS(サービス拒絶)攻撃と
呼ばれるサイバー攻撃を受けている可能性があり、ツイッターの運営会社が原因を調べている。

AP通信によると、ツイッターは利用者が多すぎる場合や点検などのためにサービスを停止する場合があるが、
今回はそうではないという。

http://www.asahi.com/international/update/0807/TKY200908060372.html

これ今回のと関係ありそう?
0604動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 01:38:49ID:eARRFZ6h0
そういえばこれってもう修正されたんだっけ? まだだっけ?
Apacheに新たな脆弱性発見
http://slashdot.jp/security/article.pl?sid=09/06/23/0455215
>この脆弱性は、これを利用したHTTP DoSツール「Slowloris」がリリースされたことから明らかになったとのこと。
>この攻撃ツールはApacheに不完全なリクエストヘッダーを送り続けるもので、Apacheが最後のヘッダが送られてくるのを待つ間、偽のヘッダを送ることで接続をオープンにし続け、Apacheのプロセスを一杯にさせるものだという。
0607root▲▲ ★
垢版 |
2009/08/07(金) 01:44:13ID:???0?DIA(102777)
今回みたいな場合、あらかじめ
「1時になったらやります」「1時30分になったらやります」みたいなことは言えないですね。>>605
だって、そんなこと言ったらみんなその瞬間に(りゃ。

あとは朝に向けて人は減る一方だと思うので、
とりあえずお手柔らかにおながいします、というかんじで。
0611動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 01:49:34ID:Upa5FWXt0
>>607
こういうケースなら人が減ってきただろう頃合いにしれっとやらないと…
あとは、落ちないことを願うのみです。
お疲れさまでした。
0612動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 01:51:17ID:77qd7CrP0?S★(600822)
あらかじめ鯖を増強しておくのも必要かと。

本日はお疲れ様でした。
0615root▲▲ ★
垢版 |
2009/08/07(金) 02:00:45ID:???0?DIA(102777)
>>613
お酒飲めません。。。
下戸遺伝子ということで。
0620root▲▲ ★
垢版 |
2009/08/07(金) 07:40:15ID:???0?DIA(102777)
高木先生の日記。

高木浩光@自宅の日記 - やはり退化していた日本のWeb開発者「ニコニコ動画×iPhone OS」の場合
http://takagi-hiromitsu.jp/diary/20090802.html

「蛸壺化」というのはなかなか。
0622動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 09:33:03ID:FiR3aD+E0
>>431
いや、PIEも儲かるのわかってて、コストに見合うと判断すれば帯域を解放するでしょ。
そのへんはパケモンの技術担当兼PIE COOのJimさんの判断になるんだが。
0623動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 09:38:46ID:FiR3aD+E0
>>560
さあ、オレンジ畑で農耕してくるんだ(ぇ

>>564
Releaseになる時点で、今よりはややましにはなりますかね。
所詮観測的希望ってやつですが
0629動け動けウゴウゴ2ちゃんねる
垢版 |
2009/08/07(金) 11:29:08ID:v50wbJnn0
まあ、rootさんで設定できる箇所が限られてる鯖ですんで
全設定を触れる人が根本的に直さないことには
常時こんなことだらけと思ったほうがいいっすね
0631root▲▲ ★
垢版 |
2009/08/07(金) 11:35:41ID:???0?DIA(102777)
こっちに書いておくか。

top すると、

39597 ch2yutor7 1 44 0 79308K 13560K keglim 7 0:00 0.00% httpd
39531 ch2yutor7 1 44 0 80252K 13484K keglim 5 0:00 0.00% httpd
39506 ch2yutor7 1 44 0 78192K 13488K keglim 3 0:00 0.00% httpd
39557 ch2yutor7 1 44 0 79296K 13632K keglim 2 0:00 0.00% httpd

というのがいっぱい並んでいるですね。

状態欄が keglim というのはあまり見かけないけど、
この状態になると、もうだめぽな模様。
0632root▲▲ ★
垢版 |
2009/08/07(金) 11:36:35ID:???0?DIA(102777)
カーネルソース grep してみた。これかな。

%find . -name '*.[ch]' -print | xargs grep keglim
./vm/uma_core.c: msleep(keg, &keg->uk_lock, PVM, "keglimit", 0);
0636root▲▲ ★
垢版 |
2009/08/07(金) 11:44:58ID:???0?DIA(102777)
どうやら ./kern/kern_mbuf.c か。
keg とかこのへんに結構ある。

ということは、ネットワークの鍛えが足りないかんじかも。
mbuf が少ない、というより増やしてないとか。
0638root▲▲ ★
垢版 |
2009/08/07(金) 11:49:05ID:???0?DIA(102777)
これかな。

ソケットのバッファ最大値がデフォルト値のままなのね。< yutori7

・changi namidame anchorage 等

%sysctl kern.ipc.maxsockbuf
kern.ipc.maxsockbuf: 20480000 <= 増やしてある

・yutori7

%sysctl kern.ipc.maxsockbuf
kern.ipc.maxsockbuf: 262144 <= デフォルトのまま
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況