X



トップページ運用情報
1001コメント248KB

【Project peko】2ch特化型サーバ構築作戦 Part13

レス数が950を超えています。1000を超えると書き込みができなくなります。
0001reffi@報告人 ★
垢版 |
04/05/28 02:23ID:???
uma作戦とpeko作戦について語るスレです。
サーバの新ロケーション、PIEに関する話題もこちらで。

現在の主要なテーマは
・he.net上のoyster鯖のPIEへの移転(ほぼ完了)
・各種バグフィックス
となります。

MRTGによる統計情報: http://mumumu.mu/mrtg/
2ちゃんねる/PINKちゃんねる 稼動中のサーバ一覧: http://mumumu.mu/serverlist.html

PINKちゃんねるで現在進行中のama作戦については、こちらで。

【Project ama】PINKちゃんねる特化型サーバ構築作戦 Part2
http://qb3.2ch.net/test/read.cgi/operate/1082721809/l50

前スレ
【Project peko】2ch特化型サーバ構築作戦 Part12
http://qb5.2ch.net/test/read.cgi/operate/1084429098/

過去ログ一覧
Part1 http://qb3.2ch.net/operate/kako/1052/10529/1052923573.html
Part2 http://qb3.2ch.net/operate/kako/1062/10621/1062137886.html
Part3 http://qb3.2ch.net/operate/kako/1068/10680/1068017802.html
Part4 http://qb3.2ch.net/operate/kako/1074/10741/1074124767.html
Part5 http://qb3.2ch.net/operate/kako/1076/10761/1076162131.html
Part6 http://qb3.2ch.net/operate/kako/1076/10764/1076413123.html
Part7 http://qb3.2ch.net/operate/kako/1076/10767/1076733846.html
Part8 http://qb3.2ch.net/test/read.cgi/operate/1078972549/l50
Part9 http://qb3.2ch.net/test/read.cgi/operate/1080298357/l50
Part10 http://qb3.2ch.net/test/read.cgi/operate/1082125059/l50
Part11 http://qb5.2ch.net/test/read.cgi/operate/1084429098/
0870root ★
垢版 |
04/06/04 21:56ID:???
>>869
おっ。

で、とりあえずわかったことは、
mod_mem_cacheの効果は、静的コンテンツに対しては「絶大」だということすね。< c/comic4
0872 ◆HETAREzfq.
垢版 |
04/06/04 23:22ID:0MFkN6RN
【PC】インテルのPCI Express対応チップセット「915、925」は6月21日登場
http://money3.2ch.net/test/read.cgi/bizplus/1086268956/

来年の今ごろ、安い鯖でU320SCSI-2chなんてのが使えるようになってればええですねー
(グラボ用の穴に速いSCSIカードを挿せるようになったりとか)
0873見習い▲ ★
垢版 |
04/06/05 15:14ID:???
end of he.net

Dear Guys,

As far as I can tell he.net is completely shut down now.
中略
We have moved successfully, and our future is entirely up to us.

Otsu deshita

Jim
0874未承諾広告 ◆TWARamEjuA
垢版 |
04/06/05 15:38ID:6NvffquV
> We have moved successfully, and our future is entirely up to us.
何となく重いお言葉。。。
ほんにおつですおつです y ¡Ánimo muchacho!
0876見習い▲ ★
垢版 |
04/06/05 17:12ID:???
Jim (17:10) :
Suma-san has a problem though disc 4 has an error.
0878root ★
垢版 |
04/06/05 17:26ID:???
>>876
<Fri Jun 4 18:21:42 2004>
Slot4 Drive ALERT: Bad Block Encountered - 1CE604B1 (311)
LG:0 NOTICE: Slot4 Starting Media Scan
<Fri Jun 4 21:58:29 2004>
LG:0 NOTICE: Media Scan of Slot4 Completed
<Fri Jun 4 21:58:29 2004>
Slot4 NOTICE:Media Scan Bad Block Recovered-0x1CE604B1
0879root ★
垢版 |
04/06/05 17:30ID:???
>>878 がログです。

不良ブロックがみつかったためメディアスキャンがかかり、
不良ブロックは一応リカバーされている模様です。

現在Suma側からはすべてのディスクが正常に見えます。
すぐの対応は必要なさそうですが、要注意かと。
0882サザン ★
垢版 |
04/06/05 22:50ID:???
すごい数のアクセス、

ごっそり持っていかれてるようで
0885未承諾広告 ◆TWARamEjuA
垢版 |
04/06/05 23:25ID:6NvffquV
oyster901(live8,9) の影響を受けているのかな?とも勘ぐってみたり。(その逆かも?)
0889root ★
垢版 |
04/06/06 14:30ID:???
Suma の #4 ディスクで再度エラーが上がった模様。
ホットスペアのディスクに切り替えるオペレーションをこれからやります。
0890動け動けウゴウゴ2ちゃんねる
垢版 |
04/06/06 14:57ID:uTVAXuk9
>>889
壊れるの早いですね・・・IDEってこんなものですか?
それともメーカーとかロットとかのアレですか?

保障期間とかあるのかなヾ('-')ノ
0891動け動けウゴウゴ2ちゃんねる
垢版 |
04/06/06 15:32ID:ijqweQJb
RAID5ってハードウェア的な障害には強くなりますけど
「pc2間違って消しちゃいました」みたいな事故には無力ですよね
0892root ★
垢版 |
04/06/06 17:10ID:???
#4 => #3 (以前交換してhot spareになっていたもの)へのデータコピー完了。
902を立ち上げてもらうよう手配します。
0895root ★
垢版 |
04/06/06 18:04ID:???
JimさんとQしましたが、どうも素直に立ち上がらないようなので、
現地の明日以降に対応の見込みです。

Sumaそのものは正常なので、データは大丈夫なはず。

ところで、live8ば
0896root ★
垢版 |
04/06/06 18:04ID:???
あ、暴発。

live8はバンキシャかな。
0898root ★
垢版 |
04/06/06 18:09ID:???
>>897
お、あがったか。
みてきます。
0899root ★
垢版 |
04/06/06 18:12ID:???
大丈夫みたいすね。

#4 ドライブを交換してもらうように、Jimさんに手配しました。
0902よっぱらい
垢版 |
04/06/06 23:56ID:02Y2aDE4
つーか(゚O゚)あ!パッチに拘る理由が知りたいなぐへへ、
0903root ★
垢版 |
04/06/07 00:07ID:???
さて、無碍にswapさせないだけではうまくないと。
今の戦力では、やっぱり限界なのかな。
0905 ◆BFzK/mtqM2
垢版 |
04/06/07 00:12ID:GXSYx5nF
httpdを定期的にリブートして、メモリ開放させるって荒業はどうかな?
0906root ★
垢版 |
04/06/07 00:25ID:???
>>905
それはつまり、MaxRequestsPerChildをすごく少なくするということかしら。
(一時期試して確かに効果あったけど、、、)
0907 ◆BFzK/mtqM2
垢版 |
04/06/07 00:29ID:GXSYx5nF
i.i2ch.netは、毎時 httpdをrestartさせている。
激重になった時に、それで復活したので、多少は効果あるのかな〜と思って。
0908 ◆BFzK/mtqM2
垢版 |
04/06/07 00:32ID:GXSYx5nF
MemTotal: 1550360 kB
MemFree: 73548 kB

/usr/sbin/apachectl graceful をした後

MemTotal: 1550360 kB
MemFree: 217156 kB
0909root ★
垢版 |
04/06/07 01:14ID:???
ありそうすね。

【漫画アニメ系】comic4が重い重い重い重い重い重い×5
http://qb5.2ch.net/test/read.cgi/operate/1086507653/590

590 名前:root ★[sage] 投稿日:04/06/07 01:12 ID:???
サーバ数: 384 => 256
MaxRequestsPerChild 1000 => 100

にしてみた。

swapは相変わらず禁止のまま。
0910root ★
垢版 |
04/06/07 01:20ID:???
うまくいってそうな予感。
>>900 のリンク先にもそんな話があるような。
0911 ◆BFzK/mtqM2
垢版 |
04/06/07 01:25ID:GXSYx5nF
おつです。
しばらくはこれで様子見ですかね。
0912未承諾広告 ◆TWARamEjuA
垢版 |
04/06/07 15:13ID:A1/DlsmB
そういえば、 oyster243.peko.2ch.net (oyster243.maido3.com) では、現状 uptime 計測は行っていませんですよね?
0915未承諾広告 ◆TWARamEjuA
垢版 |
04/06/07 17:48ID:A1/DlsmB
902 が止まってたみたいですね(過去形)Mon Jun 7 16:42:13 - Mon Jun 7 17:06:04(JST)
LA もちょと高かったみたい。

またぶっこ抜きだったのかな?
0916root ★
垢版 |
04/06/07 18:17ID:???
>>915
kernel panicして、自力で立ち上がったもより。
0918 ◆HETAREzfq.
垢版 |
04/06/07 21:12ID:+LudWbay
さて、不安定な原因がhardだと仮定して、Jimさんが忙しくそちら方面であまり動けない、ということなら
Jimさんをさしおいてこちらがおせっかいを焼いてもひょっとしていいのかなぁ?と考えてしまう。。。

Polyの日本語サイトのメアドが日本語可だったら
「完成品の2200A、2201S及びEasy Orderの2200Sの中身のマザボはどれよ?」
「それらにマザボメーカで出しているBIOSを突っ込んでも平気か?」
と訊くだけなら訊いておいたほうがあとでいろいろやりやすいと思うけど、どうかなぁ??
0921root ★
垢版 |
04/06/09 00:03ID:???
>>920
おもしろいすね。これだけで、こんなに限界上がるですか。
0922未承諾広告 ◆TWARamEjuA
垢版 |
04/06/10 19:49ID:bT8MK52F
oyster902 また墜ちちゃったみたいですね。
リブート要請はしておくべきでしょうか?
0923未承諾広告 ◆TWARamEjuA
垢版 |
04/06/10 19:58ID:bT8MK52F
>>922
ひとまず要請出してみます、
0924動け動けウゴウゴ2ちゃんねる
垢版 |
04/06/10 21:42ID:OEGVyCcm
こちらでいいのかな?
news10がoyster902ではなく、he.netを向いてるんですが‥‥。

$ dig news10.2ch.net a

;; ANSWER SECTION:
news10.2ch.net. 3m6s IN A 65.19.155.154

0926未承諾広告 ◆TWARamEjuA
垢版 |
04/06/10 23:39ID:bT8MK52F
さすがに ISP では何も出来ないかと思われ(w

$ dig @ns1.maido3.com news10.2ch.net a

; <<>> DiG 8.3 <<>> @ns1.maido3.com news10.2ch.net a
; (1 server found)
;; res options: init recurs defnam dnsrch
;; got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 4
;; flags: qr aa rd; QUERY: 1, ANSWER: 1, AUTHORITY: 2, ADDITIONAL: 2
;; QUERY SECTION:
;; news10.2ch.net, type = A, class = IN

;; ANSWER SECTION:
news10.2ch.net. 5M IN A 65.19.155.154

;; AUTHORITY SECTION:
2ch.net. 5M IN NS ns1.maido3.com.
2ch.net. 5M IN NS ns2.maido3.com.

;; ADDITIONAL SECTION:
ns1.maido3.com. 3D IN A 206.223.148.254
ns2.maido3.com. 3D IN A 206.223.147.254

news10.peko.2ch.net も未設定なのでいずれは変更されるでしょう(^-^)
0928未承諾広告 ◆TWARamEjuA
垢版 |
04/06/10 23:50ID:bT8MK52F
>>927
Do not disturb. ちゃうちゃう
Do not mind. (^-^)
0932root ★
垢版 |
04/06/11 23:32ID:???
>>924-927
tv5の追加とともに、DNSの変更を依頼しておくです。
いずれもmemoriesをポイントします。

以下、よろしくお願いします。

(旧)
+news10.2ch.net:65.19.155.154

(新)
+news10.2ch.net:38.114.137.227
+tv5.2ch.net:38.114.137.227
0949動け動けウゴウゴ2ちゃんねる
垢版 |
04/06/17 02:21ID:4Ye//vy1
ns1.maido3.comとns2.maido3.comって両方ともPIEだよね。
PIEが落ちるとsports2にも繋がらないってのはアレだから、
もう一個コンテンツサーバ設置できないかなー
0950動け動けウゴウゴ2ちゃんねる
垢版 |
04/06/17 11:59ID:hiBznBU7
NSレコードとAレコードのTTLを長くすれば
そこまでしなくても良いかも。

dig @ns1.maido3.com 2ch.net ns

;; ANSWER SECTION:
2ch.net.  5M IN NS  ns1.maido3.com.
2ch.net.  5M IN NS  ns2.maido3.com.
0951root ★
垢版 |
04/06/17 12:13ID:???
>>950
これ(2ch.netのNSのTTL)が300secなのはたしかにいまいちすね。
maido3.comのNS(下記)のように、glueと同じ259200がいいと思われ。

$ dig +norec -t ns maido3.com @ns1.maido3.com.

; <<>> DiG 9.3.0beta4 <<>> +norec -t ns maido3.com @ns1.maido3.com.
;; global options: printcmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 52168
;; flags: qr aa; QUERY: 1, ANSWER: 2, AUTHORITY: 0, ADDITIONAL: 2

;; QUESTION SECTION:
;maido3.com. IN NS

;; ANSWER SECTION:
maido3.com. 259200 IN NS ns1.maido3.com.
maido3.com. 259200 IN NS ns2.maido3.com.

;; ADDITIONAL SECTION:
ns1.maido3.com. 259200 IN A 206.223.148.254
ns2.maido3.com. 259200 IN A 206.223.147.254

;; Query time: 218 msec
;; SERVER: 206.223.148.254#53(ns1.maido3.com.)
;; WHEN: Thu Jun 17 12:12:17 2004
;; MSG SIZE rcvd: 96
0952root ★
垢版 |
04/06/17 12:14ID:???
ここにも貼っておこうと。

read.cgi再開発スレ
http://qb5.2ch.net/test/read.cgi/operate/1087199303/49
49 名前:root ★[] 投稿日:04/06/17 12:04 ID:???
>>16 で言及した、
mmap()を使用しないread.cgiをgame6サーバに実験的に入れてみた。
これでしばらく実験してみるということで。
0954root ★
垢版 |
04/06/18 03:44ID:???
>>952
というわけで、以下を入れてみた。

read.cgi再開発スレ
http://qb5.2ch.net/test/read.cgi/operate/1087199303/52

52 名前:root ★[] 投稿日:04/06/18 03:43 ID:???
20日以上動いていたgame6が、read.cgiを上げたら半日で死にました。
mmap()ではなかったと。

ということで、
live8(read.cgiを動かしている)とcomic4(携帯の負荷に耐えている)で実績のある、
以下の設定を追加してみた。

(従来)
<IfModule prefork.c>
StartServers 64
MinSpareServers 5
MaxSpareServers 32
ServerLimit 256
MaxClients 256
MaxRequestsPerChild 0
</IfModule>

(現在)
<IfModule prefork.c>
StartServers 64
MinSpareServers 5
MaxSpareServers 32
ServerLimit 256
MaxClients 256
MaxRequestsPerChild 100000 <= 変更
MaxMemFree 2048 <= 追加
</IfModule>
0955見習い▲ ★
垢版 |
04/06/18 03:46ID:???
>>954
そこを追加したり変更したりすると
どんな期待が持てたりするんですか?
0956root ★
垢版 |
04/06/18 03:54ID:???
>>955
MaxRequestsPerChild は、ここで書いた回数だけリクエストを処理すると、
httpdプロセスが再起動します。これで、メモリが開放されることが期待できます。
c.2ch.netではこれを入れたおかげで、異常なスワップ消費によるハングアップ
(例のswap_pagerエラー)が出なくなりました。

MaxMemFreeは、Apacheのメモリアロケータが保持することができる
メモリを制限するものです。これで、httpdがどんどんメモリをつかんでしまうことを
抑制します。これもc.2ch.netのチューニングでわかったノウハウです。

これを入れた上で、read.cgiを動かしはじめたです。< live8/live9

参考: http://ns1.php.gr.jp/pipermail/php-users/2004-May/022181.html
0960動け動けウゴウゴ2ちゃんねる
垢版 |
04/06/18 11:01ID:z4OarPbl
まだハードのせいにしてごまかそうとしているとは恐れ入った。
Jimさんも「日本人ってこんなんばっかし」とあきれ顔。
0961root ★
垢版 |
04/06/18 11:39ID:???
comic4は、/home (掲示板システム)のディスクI/Oの詰まりが原因でした。
datキャッシュと携帯との遅いI/Oの影響がもろに出たかんじ。

できるだけこうならないようにチューニングはしているのですが、
何らかのタイミングで詰まった模様。
ということで、掲示板以外のI/O処理(バックアップ等)を一時的にとめます。
0962root ★
垢版 |
04/06/18 11:53ID:???
>>959
そういえばと思い出して、tipコマンドでつないでいざDDBに落とそうとしたら、
options DDBとoptions BREAK_TO_DEBUGGERが
game6で有効になっていなかったことに気づきました。

仕方なく通常のリブート要請して改めてチェックしてみたところ、通常の
ログインプロンプトも来ないようです(gettyは動かしている)。

シリアルケーブルが抜けている状態かもしれません。
別途確認してみます。
0963root ★
垢版 |
04/06/18 11:54ID:???
ということで、リモートからデバッガに落とせない状態なので、
いったんgame6のread.cgiを止めます。
0966▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
垢版 |
04/06/19 14:42ID:GKr3D8q3
なんか自分で>>964を読んでいてもわけわかめですわ。スマソ。

いわゆる2chが投入している複数鯖を介している各種システムが
システムクラッシュを起こすような悪さをしていないか、ということ。

read.cgiをとめている状態ならば安定していることを考慮すると、
read,cgiでコールしていてdat直読みでコールしていない関数の
いづれかが犯人かもしれないってことです。
0967▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
垢版 |
04/06/19 14:45ID:GKr3D8q3
>>966
とはいえ、read.cgiにシステムクラッシュを引き起こす
致命的なバグが潜んでいる可能性もありえますがね。

その説でいくとわかっていることは
「mmap()は犯人ではなかった」ということだけ。
0968動け動けウゴウゴ2ちゃんねる
垢版 |
04/06/19 16:31ID:XtAKxDb2
>>967
今明らかになっているのは、
http://qb5.2ch.net/test/read.cgi/operate/1087199303/53
にあるように、apache-2.0.xのCGI周りにメモりリークの問題がある
ということだけ。この問題は、最悪のケースで、CGIの出力4096バ
イトごとに32バイトずつのメモリがリークするというもの。

なので、apacheの設定変更で改善の兆しが見えるということは、
メモりリークの影響がシステム陥落の引き金の一つになっている
らしいことはうっすらと見えてきた。

read.cgiを有効にしていると、これまたシステム全体が落ちやすくなる。
ということは、read.cgiも引き金の一つのようだ。ただし、read.cgiを
動かしただけで落ちるわけじゃないので、read.cgiが直接システムを
落としているわけではない。古いread.cgiのソースを見る限り、
read.cgiはDATファイルをmmap()し、要求された部分をhtmlソースと
して出力するCGIプログラムで、特徴としては、実行終了までDAT
ファイルをmmap()し続けるというあたり。つまり、プロセス終了まで
の間、仮想メモリをDATファイルサイズ以上握りっぱなしになる。
なので、処理中のread.cgiプロセスが溜まると、仮想メモリの消費
量が増える。

fox.cgiもたしか仮想メモリを消費しまくるものだったように記憶している。

以上から乱暴に予想すると、FreeBSDの仮想メモリ周りにバグが
いるんじゃないかな。実メモリが不足し始めるあたりで落ちている
のかも。……とすると、mmap()版と非mmap()版のread.cgiの影響
はシステムへの負荷のかけ具合という点でやや違いがある可能
性はある。
0969見習い▲ ★
垢版 |
04/06/19 16:49ID:???
>実メモリが不足し始めるあたりで落ちている

これは肌で感じました。
レス数が950を超えています。1000を超えると書き込みができなくなります。

ニューススポーツなんでも実況