X



トップページ運用情報
1001コメント297KB

【Project peko】2ch特化型サーバ・ロケーション構築作戦 Part14

■ このスレッドは過去ログ倉庫に格納されています
0001root ★
垢版 |
04/06/20 02:40ID:???
peko作戦について語るスレです。
サーバの新ロケーション、PIEに関する話題もこちらで。

現在の主要なテーマは、
・新ロケーション、PIEの安定化
・pekoサーバ突然死の原因究明
となります。

レンタルサーバー maido3.com 2ちゃんねるの転送量: http://server.maido3.com/pie/
MRTGによる統計情報: http://mumumu.mu/mrtg/
2ちゃんねる/PINKちゃんねる 稼動中のサーバ一覧: http://mumumu.mu/serverlist.html

PINKちゃんねるで現在進行中のama作戦については、こちら。

【Project ama】PINKちゃんねる特化型サーバ構築作戦 Part2
http://qb3.2ch.net/test/read.cgi/operate/1082721809/l50

携帯電話特化型サーバ構築作戦については、こちら。

【Love Affair】携帯からのアクセスに対する考察・次の一手 Part1
http://qb5.2ch.net/test/read.cgi/operate/1075887465/

前スレ
【Project peko】2ch特化型サーバ構築作戦 Part13
http://qb5.2ch.net/test/read.cgi/operate/1085678587/
0442root ★
垢版 |
04/07/10 22:24ID:???
>>441
今のgame6/news11の状態ですね。
SMPなし状態。(i386ではないのでapicはもともとなし)

やってみる価値はあるけど、
read.cgiなしでしばらく(すくなくとも1日は)動かしてみてからか。
0443root ★
垢版 |
04/07/10 22:48ID:???
gdb /usr/bin/perl [暴走しているプロセスID] ってやったら、

(gdb) where
#0 0x2818648f in stat () from /lib/libc.so.5
#1 0x080d8925 in Perl_my_stat ()
#2 0x080cec5b in Perl_pp_ftis ()
#3 0x0809d028 in Perl_runops_standard ()
#4 0x0805bb46 in perl_run ()
#5 0x0805b82b in perl_run ()
#6 0x08058f59 in main ()
#7 0x08058e02 in _start ()

だそうで。
すくなくともこのPerlは、stat()の中で暴走していた模様。

ううむ。
0446動け動けウゴウゴ2ちゃんねる
垢版 |
04/07/11 01:00ID:unLv8kCs
スレ汚しすみません。上げておきます。
0447動け動けウゴウゴ2ちゃんねる
垢版 |
04/07/11 02:20ID:koTU8zn7
頼むから誰か
「bbs.cgi再開発プロジェクト 4」
を立ててくれ
0449▲ 某ソレ511
垢版 |
04/07/11 02:21ID:E2K/EaH4
うーん、立てるとしても必要になってからでいいんじゃないかなあ
0451root ★
垢版 |
04/07/11 07:22ID:???
寝ていた(倒れていた)間に、なんだかいろんなことがあったようで。

で、とりあえずbbs.cgiが更新されていたようなので、
pekoサーバのものをコンパイルして更新しておいた。
0454root ★
垢版 |
04/07/11 18:24ID:???
落ち着いているようなので、

・MaxRequestsPerChild 10000 => 100
・StartServers 128 => 64
・MaxSpareServers 128 => 64

にして、ex7のread.cgiを元に戻してみた。
0455root ★
垢版 |
04/07/11 18:28ID:???
で、あまりにしっちゅうbbs.cgi(Perl)の暴走を目撃するので、

RLimitCPU 120 => 60

に変更した。< ex7

これでしばらく実験かと。
0456名無しさん@そうだ選挙に行こう
垢版 |
04/07/11 20:11ID:+dVLTLkH
何か重いですよー>root氏
0457名無しさん@そうだ選挙に行こう
垢版 |
04/07/11 20:14ID:yjG3lYKc
ex7さらに負荷上がっているように見えるが・・・
0458名無しさん@そうだ選挙に行こう
垢版 |
04/07/11 20:15ID:+dVLTLkH
read.cgiがまた喧嘩しちゃってるのかな?
書き込み時にだいぶ時間かかりますた
0461root ★
垢版 |
04/07/11 20:24ID:???
重いすね。
bbs.cgi(perl)がたくさん暴走してました。
今は少しましかな。
0462root ★
垢版 |
04/07/11 20:26ID:???
>>455 のやつ、ex7だけ30(秒)にしてもいいかもしんないなぁ。
0463root ★
垢版 |
04/07/11 20:29ID:???
ex7だけ30secにした。
しかしlive系でもたまにしか起こらないのに、どうしてこうもbbs.cgiが暴走するんだろう。< ex7
0465動け動けウゴウゴ2ちゃんねる
垢版 |
04/07/11 20:33ID:yjG3lYKc
ex7少しマシになった
0466root ★
垢版 |
04/07/11 20:33ID:???
>>464
5.6.1ですねぇ。すくなくとも私がおもりしてるやつは全部そうです。
ex7は実験のため、あえてperlccはしてませぬ。
0467root ★
垢版 |
04/07/11 20:35ID:???
>>463 が効果出してるですね。
でも、しょっちゅう暴走する状況にかわりはない模様。
0469root ★
垢版 |
04/07/11 20:40ID:???
軽い状態でいきなり反応がなくなった、、、。
やはり同じ病をかかえているのか。

リブート要請しました。
0470root ★
垢版 |
04/07/11 20:40ID:???
リブート要請しました。
上がったら、read.cgiを止めます。
0471root ★
垢版 |
04/07/11 20:45ID:???
read.cgiを停止。< ex7
0475未承諾広告※ ◆TWARamEjuA
垢版 |
04/07/11 21:27ID:gaaNaJCm
>>474
確認してみましたが、退役した鯖の httpd レスポンス Server: にだけ、Perl/v5.8.0 の文字列が入っていました。
ということで現状すべて 5.6 系かと思われるですm(_ _)m
0477root ★
垢版 |
04/07/11 21:42ID:???
>>476
・1CPUにした(SMP, apicをコメントアウト)game6がその後5日間落ちていない(amd64だけど)
・1CPUなbananaサーバは問題が起こっていない

ところをみると、FreeBSD 5.2.1のSMP/apicまわりに何か問題があるのかも。
0478まぐろ ◆Ctm6ZKuo5w
垢版 |
04/07/11 21:48ID:+i+jN1A5
qb5.2ch.netサーバのuptime情報(?)みたいなのが今日の0:30で止っているようです

http://qb5.2ch.net/_service/20040711.txt
2004/07/11 00:30:00 LA=12:30AM up 31 days, 11:53, 0 users, load averages: 5.58, 10.41, 16.00
で止ってます

qb6.2ch.netは動いているみたいです
0479動け動けウゴウゴ2ちゃんねる
垢版 |
04/07/11 21:53ID:2KcG2Fi6
>>477
1CPUでは問題が発生せず、2CPU(機能)にのみ問題が発生している、
ということを考慮すると、
現行のFreeBSDと2CPUの問題としか、考え難いですねぇ・・・

FreeBSDの4.xのほうがいいのかなぁ・・・
0480root ★
垢版 |
04/07/11 21:53ID:???
>>478
たぶん昨日の騒ぎで、F22を切ったままなんではないかなと。
0485root ★
垢版 |
04/07/11 23:24ID:???
ドキッとして調べてみたけど、そうではなさそうですね。
本当にLAが上がっている模様。

このグラフはApacheのserver-statusからとるようにしました。
(今まではアクセスログを正直にカウントしていた)

で、見ているとrunnable processが多いです。< c-docomo2
0487 ◆BFzK/mtqM2
垢版 |
04/07/11 23:33ID:Bf0yN6d9
うーん、選挙でもないんか。。。
0489root ★
垢版 |
04/07/11 23:35ID:???
選挙 < 新庄

らしい。(もちろん選挙も無視できないけど)
0490root ★
垢版 |
04/07/12 00:12ID:???
I updated bbs.cgi on all peko servers.
0492root ★
垢版 |
04/07/12 01:29ID:???
問題切り分けのため、近々シングルCPU設定を試してみる予定。< ex7
それでうまく動くようなら、やむを得ないけどしばらくシングルCPU設定で。< tigerサーバ

携帯サーバへのアクセスも峠越えたみたいなので、今日はこれで。
0493root ★
垢版 |
04/07/12 12:12ID:???
acpiを止めてみたらどう?という天の声を聞いた。

/boot/device.hintsに

hint.acpi.0.disabled="1"

か。
0495動け動けウゴウゴ2ちゃんねる
垢版 |
04/07/12 12:20ID:plJfsqrl
あーacpiが悪さするってのは結構ありえますね。
Linux系でもたまに聞くので。

ぐぐったらこんな話もありました。
ttp://pc5.2ch.net/test/read.cgi/unix/1039789225/485
0496▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
垢版 |
04/07/12 12:26ID:plJfsqrl
>>495
すいません、またコテハン入れ忘れた・・・ orz

これを読む限り、(OS問わず)SMPとACPIは相性がよろしくありませんな。
たぶんhaltさせるときは同時でないといけないから
何かの理由でそのタイミングが狂うと(その段階で)出してはいけない命令が
かちあってそのままお亡くなりになるという・・・・
0497root ★
垢版 |
04/07/12 14:49ID:???
ex7で試してみることにした。
0498動け動けウゴウゴ2ちゃんねる
垢版 |
04/07/12 15:02ID:IR7/72H+
また実験台か!
0499root ★
垢版 |
04/07/12 15:09ID:???
設定変更・リブート完了。
read.cgiを復活させました。< ex7
0500root ★
垢版 |
04/07/12 15:30ID:???
これで明日まで無事だったら、デュアルCPUを復活させてgame6とかにも入れてみよう。
で、順次他のサーバにも。
0502動け動けウゴウゴ2ちゃんねる
垢版 |
04/07/12 18:44ID:qAlI75Jj
まっ実験しなきゃ先には進めん。
いい結果を期待したいが・・・

これでもダメなら・・・
どうなるんでそ?>root ★ さん
やっぱりシングルCPUでしばらくの間は置いとくのかな。
0503root ★
垢版 |
04/07/12 18:48ID:???
>>502
まずはex7でのテスト結果をマターリと見ようかと。
これまでの様子から、1日動けば効果ありとしてよいと思われ。
0510ミラー名無しさん
垢版 |
04/07/12 20:41ID:SkpVRt+W
peko姐の新しいお仕事・・・

【oyster争奪戦】新サーバ情報スレッド 14
http://qb5.2ch.net/test/read.cgi/operate/1086435290/552
552 名前:留守番 ★ 投稿日:04/07/03 05:51 ID:???
BBQ シリーズの携帯版でーす(mobile)

固有番号を溜め込みます
1) 初めて書き込もうとした人に、お知らせ出すとか、
2) 書き込みお断りを制御したり
3) 携帯関係の統計取ったり

いろいろ出来る予感です
0512留守番 ★
垢版 |
04/07/12 20:47ID:???
基本的な動きとしては

1) key は携帯固有番号
2) 問い合わせ、登録、削除、更新はすべて getなんたら

八個くらい用意すればいいかな?
dat8.dat7.dat6.dat5,dat4.dat3.dat2.dat1key.bbm.2ch.net
dat1 = action(登録、問い合わせ、更新・・・ の作業番号or文字列)
dat2 = .......
0513未承諾広告※ ◆TWARamEjuA
垢版 |
04/07/12 20:52ID:33+xVgDS
そのまえに、
comic4 の F22 を止める → comic4.peko 作成 → 過去ログ移転
かな ★?

38 → 206 もやっちゃいたいような(苦笑)
0516 ◆BFzK/mtqM2
垢版 |
04/07/12 23:10ID:IYRDi+yu
bbs.cgiがsubject.txtを握ったまま死ぬのかな?
0517◆ANGLERlqvM
垢版 |
04/07/12 23:17ID:f58T6II8
ここまで来ると次の段階を考える必要があるのかな。。。
singleで行くのか、4.10Rにするのか。
0519動け動けウゴウゴ2ちゃんねる
垢版 |
04/07/12 23:24ID:LAcM4R37
リブート隊の報告でで再起動したにしては速すぎるって事は、
panic→自動リブートだったのかな?

きちんとpanic→RebootしてくれるのがACPI-OFF効果なら、
それはそれで有り難いんだけど、素直に喜んで良い物か…(w
0522519
垢版 |
04/07/12 23:28ID:LAcM4R37
>>520
ん?どゆことでしょ?
説明して頂けると助かります。
0528 ◆QANoNotan.
垢版 |
04/07/12 23:35ID:Ruwgv4Bw
subject.txtが消えただけではなかったです
0529 ◆BFzK/mtqM2
垢版 |
04/07/12 23:35ID:IYRDi+yu
>>527
実際にIEではtopにはアクセスできたし、、、
かちゅでは、subjectを拾いに行くところで、サーバ移転したかも?がでた。
0530◆ANGLERlqvM
垢版 |
04/07/12 23:38ID:f58T6II8
まぁ、logに何が残ってるのかが、
気になるところです。
0531▲ 某ソレ511
垢版 |
04/07/12 23:38ID:uZzkc+Hq
>>529
> 746 名前:( ゚w゚ )y━・~~~ビョア ◆byoa/e2bpg [] 投稿日:04/07/12 23:05 ID:HpezRJjy
> なおった・・・いや移転って出るけど移転先がでない?
> うーむ?

いえ、その前のレス〜このレスがあるので移転って出る状態の前につながらない状態があったと判断しましたでし。
まぁ、>>526 でuptimeがリセットされてるのでrebootがあったっぽいと言うのは確定かな、、と
0533 ◆BFzK/mtqM2
垢版 |
04/07/12 23:45ID:IYRDi+yu
uptimeはhpptdが再起動してもリセットされます。

という事は、httpd再起動時にbbs.cgiあたりがsubject.txtを放さずにそのままってことかもね
0534動け動けウゴウゴ2ちゃんねる
垢版 |
04/07/12 23:57ID:LAcM4R37
>>533
あー、あれってhttpdのUptime見てるんですか。
シェルからやるuptimeの方を加工してるのかと思ってました。

つーことは、、新たなる問題発生の予感?(w
0535 ◆BFzK/mtqM2
垢版 |
04/07/13 00:06ID:1CY2KtJw
>>534
ちがった、uptimeから作ってた。
という事は、再起動かかったのかな?
0536root ★
垢版 |
04/07/13 00:22ID:???
帰宅。

まだスレやメール見てないけど、自分でリブートがかかったのかな。< ex7
0538root ★
垢版 |
04/07/13 00:30ID:???
ざっとチェック。
確かに、リブートがかかった形跡はありました。

でも、panicとかそういうメッセージは残っていない模様。
今までとは死に方が違うから、原因は別か。

しばらく経過観察か。クラッシュダンプをとる設定をしておいたほうがよさそうかも。

ACPIを止めることそのものは、ビンゴの模様。
http://www.sfc.wide.ad.jp/~ash/diary/?date=200402
0539root ★
垢版 |
04/07/13 00:35ID:???
>>504 >>512
了解。いろいろ使おうというかんじですかね。

これから >>513 の上2行の作業やります。
0540root ★
垢版 |
04/07/13 00:50ID:???
/etc/rc.confにdumpdev="/dev/da0s1b"を追加して、

# /etc/rc.d/dumpon start
kernel dumps on /dev/da0s1b

とやっておいた。< ex7
これで普通にpanicしたら、クラッシュダンプがとられるはず。
0541root ★
垢版 |
04/07/13 03:00ID:???
comicのmemoriesへのコピー、完了しました。

以下のDNSサーバの変更をお願いします。

(現在)
+comic4.2ch.net:38.114.144.180

(変更後)
+comic4.2ch.net:38.114.137.227
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況